Ući
Sve računalne tajne za početnike i profesionalce
  • Za početnike: razlike između softverskih proizvoda programskog sustava 1C: Enterprise
  • Program 1s 8.3 demo verzija. Mobilna aplikacija "UNF" NOVO
  • Postavljanje 1C upravljanja naše tvrtke od nule
  • Warface besplatna registracija
  • Registracija u igri World Of Tanks – što trebate znati?
  • Starcraft II Strategija i taktika
  • Sco formula. Statistički parametri. Prosječno linearno i kvadratno odstupanje

    Sco formula.  Statistički parametri.  Prosječno linearno i kvadratno odstupanje

    Približna metoda za procjenu varijabilnosti serije varijacija je određivanje granice i amplitude, ali se vrijednosti varijante unutar serije ne uzimaju u obzir. Glavna općeprihvaćena mjera varijabilnosti kvantitativnog obilježja unutar niza varijacija je standardna devijacija (σ - sigma). Što je standardna devijacija veća, to je veći stupanj fluktuacije ove serije.

    Metoda izračuna standardne devijacije uključuje sljedeće korake:

    1. Pronađite aritmetičku sredinu (M).

    2. Utvrditi odstupanja pojedinih opcija od aritmetičke sredine (d=V-M). U medicinskoj statistici odstupanja od prosjeka označavaju se s d (deviate). Zbroj svih odstupanja je nula.

    3. Kvadratirajte svako odstupanje d 2.

    4. Pomnožite kvadrate odstupanja s odgovarajućim frekvencijama d 2 *p.

    5. Nađi zbroj umnožaka å(d 2 *p)

    6. Izračunajte standardnu ​​devijaciju pomoću formule:

    Kada je n veći od 30 ili kada je n manji ili jednak 30, gdje je n broj svih opcija.

    Vrijednost standardne devijacije:

    1. Standardna devijacija karakterizira širenje varijante u odnosu na prosječnu vrijednost (tj. varijabilnost niza varijacija). Što je sigma veća, to je veći stupanj raznolikosti ove serije.

    2. Standardna devijacija koristi se za komparativnu procjenu stupnja podudarnosti aritmetičke sredine s nizom varijacija za koji je izračunata.

    Varijacije masovnih pojava pokoravaju se zakonu normalne raspodjele. Krivulja koja predstavlja ovu distribuciju izgleda kao glatka simetrična krivulja u obliku zvona (Gaussova krivulja). Prema teoriji vjerojatnosti, u pojavama koje se pokoravaju zakonu normalne distribucije, postoji strogi matematički odnos između vrijednosti aritmetičke sredine i standardne devijacije. Teorijska distribucija varijante u homogenom nizu varijacija pridržava se pravila tri sigme.

    Ako su u sustavu pravokutnih koordinata na apscisnu os nanesene vrijednosti kvantitativnog obilježja (varijante), a na ordinatnu os učestalost pojavljivanja varijante u nizu varijacija, tada su varijante s većim i manjim vrijednosti su ravnomjerno smještene na stranama aritmetičke sredine.



    Utvrđeno je da uz normalnu raspodjelu svojstva:

    68,3% varijantnih vrijednosti je unutar M±1s

    95,5% varijantnih vrijednosti je unutar M±2s

    99,7% varijantnih vrijednosti je unutar M±3s

    3. Standardna devijacija omogućuje vam određivanje normalnih vrijednosti za kliničke i biološke parametre. U medicini se interval M±1s obično uzima kao normalni raspon za fenomen koji se proučava. Odstupanje procijenjene vrijednosti od aritmetičke sredine za više od 1 s ukazuje na odstupanje proučavanog parametra od norme.

    4. U medicini se pravilo tri sigme koristi u pedijatriji za individualnu procjenu stupnja tjelesnog razvoja djece (metoda sigma odstupanja), za izradu standarda za dječju odjeću.

    5. Standardna devijacija je neophodna za karakterizaciju stupnja različitosti svojstva koje se proučava i za izračunavanje pogreške aritmetičke sredine.

    Vrijednost standardne devijacije obično se koristi za usporedbu varijabilnosti serija iste vrste. Ako se usporede dvije serije s različitim karakteristikama (visina i težina, prosječno trajanje bolničkog liječenja i bolničke smrtnosti itd.), tada je izravna usporedba sigma veličina nemoguća. , jer standardna devijacija je imenovana vrijednost izražena apsolutnim brojevima. U tim slučajevima koristite koeficijent varijacije (Cv), što je relativna vrijednost: postotni omjer standardne devijacije i aritmetičke sredine.

    Koeficijent varijacije izračunava se pomoću formule:

    Što je koeficijent varijacije veći , veća je varijabilnost ove serije. Smatra se da koeficijent varijacije veći od 30% ukazuje na kvalitativnu heterogenost populacije.

    U statističkom testiranju hipoteza, kada se mjeri linearni odnos između slučajnih varijabli.

    Standardna devijacija:

    Standardna devijacija(procjena standardne devijacije slučajne varijable Pod, zidovi oko nas i strop, x u odnosu na svoje matematičko očekivanje temeljeno na nepristranoj procjeni njegove varijance):

    gdje je disperzija; - Pod, zidovi oko nas i strop, ja element selekcije; - veličina uzorka; - aritmetička sredina uzorka:

    Treba napomenuti da su obje procjene pristrane. U općem slučaju nemoguće je konstruirati nepristranu procjenu. Međutim, procjena temeljena na nepristranoj procjeni varijance je dosljedna.

    Pravilo tri sigme

    Pravilo tri sigme() - gotovo sve vrijednosti normalno distribuirane slučajne varijable leže u intervalu. Strože – s pouzdanošću ne manjom od 99,7%, vrijednost normalno distribuirane slučajne varijable leži u navedenom intervalu (pod uvjetom da je vrijednost istinita i da nije dobivena kao rezultat obrade uzorka).

    Ako je prava vrijednost nepoznata, onda ne bismo trebali koristiti, nego pod, zidove oko nas i strop, s. Tako se pravilo tri sigme pretvara u pravilo tri poda, zidova oko nas i stropa, s .

    Tumačenje vrijednosti standardne devijacije

    Velika vrijednost standardne devijacije pokazuje veliki raspon vrijednosti u prikazanom skupu s prosječnom vrijednošću skupa; mala vrijednost, prema tome, pokazuje da su vrijednosti u skupu grupirane oko srednje vrijednosti.

    Na primjer, imamo tri skupa brojeva: (0, 0, 14, 14), (0, 6, 8, 14) i (6, 6, 8, 8). Sva tri skupa imaju srednje vrijednosti jednake 7, odnosno standardne devijacije jednake 7, 5 i 1. Posljednji skup ima malu standardnu ​​devijaciju, budući da su vrijednosti u skupu grupirane oko srednje vrijednosti; prvi skup ima najveću vrijednost standardne devijacije - vrijednosti unutar skupa jako odstupaju od prosječne vrijednosti.

    U općem smislu, standardna devijacija se može smatrati mjerom nesigurnosti. Na primjer, u fizici se standardna devijacija koristi za određivanje pogreške niza uzastopnih mjerenja neke veličine. Ova je vrijednost vrlo važna za određivanje vjerodostojnosti fenomena koji se proučava u usporedbi s vrijednošću koju predviđa teorija: ako se prosječna vrijednost mjerenja jako razlikuje od vrijednosti predviđenih teorijom (velika standardna devijacija), tada treba ponovno provjeriti dobivene vrijednosti ili način njihova dobivanja.

    Praktična upotreba

    U praksi, standardna devijacija vam omogućuje da odredite koliko se vrijednosti u skupu mogu razlikovati od prosječne vrijednosti.

    Klima

    Pretpostavimo da postoje dva grada s istom prosječnom maksimalnom dnevnom temperaturom, ali se jedan nalazi na obali, a drugi u unutrašnjosti. Poznato je da gradovi koji se nalaze na obali imaju mnogo različitih maksimalnih dnevnih temperatura koje su niže od gradova u unutrašnjosti. Dakle, standardna devijacija maksimalnih dnevnih temperatura za obalni grad bit će manja nego za drugi grad, unatoč činjenici da je prosječna vrijednost te vrijednosti ista, što u praksi znači da je vjerojatnost da će maksimalna temperatura zraka na bilo koji dan u godini bit će veća razlika od prosječne vrijednosti, veća za grad koji se nalazi u unutrašnjosti.

    Sport

    Pretpostavimo da postoji nekoliko nogometnih momčadi koje su ocijenjene prema nekom skupu parametara, na primjer, broj postignutih i primljenih golova, šanse za postizanje pogotka itd. Najvjerojatnije je da će najbolja momčad u ovoj skupini imati bolje vrijednosti na više parametara. Što je manja standardna devijacija tima za svaki od prikazanih parametara, to je rezultat tima predvidljiviji; takvi timovi su uravnoteženi. S druge strane, momčad s velikom standardnom devijacijom teško je predvidjeti rezultat, što se pak objašnjava neravnotežom, primjerice, jaka obrana, ali slab napad.

    Korištenje standardne devijacije parametara tima omogućuje, u jednom ili drugom stupnju, predviđanje rezultata utakmice između dva tima, procjenjujući snage i slabosti timova, a time i odabrane metode borbe.

    Tehnička analiza

    vidi također

    Književnost

    * Borovikov, V. STATISTIKA. Umjetnost analize podataka na računalu: Za profesionalce / V. Borovikov. - St. Petersburg. : Peter, 2003. - 688 str. - ISBN 5-272-00078-1.

    Disperzija je aritmetička sredina kvadrata odstupanja svake vrijednosti atributa od ukupnog prosjeka. Ovisno o izvornim podacima, varijanca može biti neponderirana (jednostavna) ili ponderirana.

    Varijanca se izračunava pomoću sljedećih formula:

    · za negrupirane podatke

    · za grupirane podatke

    Postupak za izračunavanje ponderirane varijance:

    1. odrediti aritmetički ponderirani prosjek

    2. utvrđuju se odstupanja varijante od prosjeka

    3. kvadrirati odstupanje svake opcije od prosjeka

    4. pomnožite kvadrate odstupanja s težinama (frekvencijama)

    5. rezimirati dobivene produkte

    6. dobiveni iznos se podijeli sa zbrojem ljestvica

    Formula za određivanje varijance može se pretvoriti u sljedeću formulu:

    Jednostavan

    Postupak za izračunavanje varijance je jednostavan:

    1. odrediti aritmetičku sredinu

    2. kvadrirati aritmetičku sredinu

    3. kvadrirajte svaku opciju u redu

    4. pronađite opciju zbroja kvadrata

    5. zbroj kvadrata podijeliti njihovim brojem, tj. odrediti srednji kvadrat

    6. odrediti razliku između srednjeg kvadrata karakteristike i kvadrata srednje vrijednosti

    Također, formula za određivanje ponderirane varijance može se pretvoriti u sljedeću formulu:

    oni. disperzija je jednaka razlici između prosjeka kvadrata vrijednosti atributa i kvadrata aritmetičke sredine. Pri korištenju transformirane formule eliminira se dodatni postupak za izračunavanje odstupanja pojedinih vrijednosti karakteristike od x i eliminira se pogreška u izračunu povezana sa zaokruživanjem odstupanja

    Disperzija ima niz svojstava, od kojih neka olakšavaju izračun:

    1) varijanca konstantne vrijednosti je nula;

    2) ako su sve varijante vrijednosti atributa smanjene za isti broj, tada se varijanca neće smanjiti;

    3) ako su sve varijante vrijednosti atributa smanjene za isti broj puta (put), tada će se varijanca smanjiti za faktor

    Standardna devijacija S- predstavlja kvadratni korijen varijance:

    · za negrupirane podatke:

    · za serije varijacija:

    Raspon varijacije, linearna srednja vrijednost i standardna devijacija nazivaju se veličinama. Imaju iste mjerne jedinice kao i pojedinačne karakteristične vrijednosti.

    Varijanca i standardna devijacija najčešće su korištene mjere varijacije. To se objašnjava činjenicom da su uključeni u većinu teorema teorije vjerojatnosti, koja služi kao temelj matematičke statistike. Osim toga, varijanca se može rastaviti na sastavne elemente, koji omogućuju procjenu utjecaja različitih čimbenika koji određuju varijaciju svojstva.

    Izračun pokazatelja varijacije za banke grupirane prema profitnoj marži prikazan je u tablici.

    Iznos dobiti, milijun rubalja. Broj banaka izračunati pokazatelji
    3,7 - 4,6 (-) 4,15 8,30 -1,935 3,870 7,489
    4,6 - 5,5 5,05 20,20 - 1,035 4,140 4,285
    5,5 - 6,4 5,95 35,70 - 0,135 0,810 0,109
    6,4 - 7,3 6,85 34,25 +0,765 3,825 2,926
    7,3 - 8,2 7,75 23,25 +1,665 4,995 8,317
    Ukupno: 121,70 17,640 23,126

    Prosječna linearna i standardna devijacija pokazuju koliko vrijednost karakteristike u prosjeku fluktuira među jedinicama i populacijom koja se proučava. Dakle, u ovom slučaju, prosječna fluktuacija dobiti je: prema prosječnom linearnom odstupanju, 0,882 milijuna rubalja; standardnom devijacijom - 1,075 milijuna rubalja. Standardna devijacija uvijek je veća od srednje linearne devijacije. Ako je distribucija karakteristike blizu normalne, tada postoji odnos između S i d: S=1,25d, odnosno d=0,8S. Standardna devijacija pokazuje kako se većina jedinica populacije nalazi u odnosu na aritmetičku sredinu. Bez obzira na oblik distribucije, 75 vrijednosti atributa spada u interval x 2S, a najmanje 89 od svih vrijednosti spada u interval x 3S (teorem P.L. Chebysheva).

    Prosječna vrijednost- ovo je opći pokazatelj statističke populacije koji eliminira pojedinačne razlike u vrijednostima statističkih veličina, omogućujući vam da međusobno usporedite različite populacije.

    postoji 2 razreda prosječne vrijednosti: i .

    Strukturni prosjeci uključuju moda I medijan, ali se najčešće koristi prosjeci snage različite vrste.

    Prosjeci snage

    Prosjeci snage mogu biti jednostavan I ponderiran.

    Jednostavan prosjek izračunati ako ih ima dva ili više negrupiran statističke veličine raspoređene slučajnim redoslijedom prema sljedećoj općoj formuli:

    Prosječne težine izračunato po grupirani statističke vrijednosti pomoću sljedeće opće formule:

    Gdje su X vrijednosti pojedinačnih statističkih vrijednosti ili sredina intervala grupiranja;
    m je eksponent čija vrijednost određuje sljedeće vrste prosjeka snage:
    pri m = -1;
    pri m = 0;
    kada je m = 1;
    pri m = 2;
    pri m = 3.

    Koristeći općenite formule za jednostavne i ponderirane prosjeke za različite eksponente m, dobivamo posebne formule za svaki tip, o kojima ćemo detaljnije raspravljati u nastavku.

    Aritmetička sredina

    Aritmetička sredina- ovo je najčešće korištena prosječna vrijednost koja se dobiva zamjenom m=1 u opću formulu. Aritmetička sredina jednostavan ima sljedeći oblik:

    Gdje su X vrijednosti količina za koje se mora izračunati prosječna vrijednost; N je ukupan broj X vrijednosti (broj jedinica u populaciji koja se proučava).

    Na primjer, student je položio 4 ispita i dobio sljedeće ocjene: 3, 4, 4 i 5. Izračunajmo prosječnu ocjenu pomoću jednostavne formule aritmetičke sredine: (3+4+4+5)/4 = 16/4 = 4.

    Aritmetička sredina ponderiran ima sljedeći oblik:

    Gdje je f broj veličina s istom vrijednošću X (frekvencija).

    Na primjer, student je položio 4 ispita i dobio sljedeće ocjene: 3, 4, 4 i 5. Izračunajmo prosječnu ocjenu pomoću formule ponderirane aritmetičke sredine: (3*1 + 4*2 + 5*1)/4 = 16/4 = 4.

    Ako su X vrijednosti navedene kao intervali, tada se sredine X intervala koriste za izračune, koje su definirane kao poluzbroj gornje i donje granice intervala. A ako interval X nema donju ili gornju granicu (otvoreni interval), tada da biste ga pronašli, koristite raspon (razlika između gornje i donje granice) susjednog intervala X.

    Na primjer, poduzeće ima 10 zaposlenika s do 3 godine iskustva, 20 s 3 do 5 godina iskustva, 5 zaposlenika s više od 5 godina iskustva. Zatim izračunavamo prosječni radni staž zaposlenika koristeći formulu ponderirane aritmetičke sredine, uzimajući kao X sredinu duljine radnog staža (2, 4 i 6 godina):
    (2*10+4*20+6*5)/(10+20+5) = 3,71 godina.

    Najčešće se koristi aritmetički prosjek, ali ponekad je potrebno koristiti druge vrste prosjeka. Razmotrimo dalje takve slučajeve.

    Harmonijska sredina

    Harmonijska sredina koristi se kada izvorni podaci ne sadrže frekvencije f za pojedinačne vrijednosti X, već se prikazuju kao njihov umnožak Xf. Označivši Xf=w, izražavamo f=w/X i, zamjenom ovih oznaka u formulu za aritmetički ponderirani prosjek, dobivamo formulu za harmonijski ponderirani prosjek:

    Stoga se težinski harmonijski prosjek koristi kada su frekvencije f nepoznate, a w=Xf poznato. U slučajevima kada se sve w = 1, odnosno pojedinačne vrijednosti X pojavljuju jednom, primjenjuje se formula prosječnog harmonijskog prosta:

    Na primjer, automobil je išao od točke A do točke B brzinom 90 km/h, a natrag brzinom 110 km/h. Za određivanje prosječne brzine primjenjujemo formulu za prosječnu harmonijsku jednostavnu, jer je u primjeru navedena udaljenost w 1 =w 2 (udaljenost od točke A do točke B je ista kao od točke B do A), što je jednak umnošku brzine (X) i vremena (f). Prosječna brzina = (1+1)/(1/90+1/110) = 99 km/h.

    Geometrijska sredina

    Geometrijska sredina koristi se u određivanju prosječnih relativnih promjena, kao što je objašnjeno u temi Dinamički nizovi. Geometrijski prosjek daje najtočniji rezultat usrednjavanja ako je zadatak pronaći vrijednost X koja bi bila jednako udaljena od maksimalne i minimalne vrijednosti X.

    Na primjer, između 2005. i 2008 indeks inflacije u Rusiji je bio: 2005. - 1,109; 2006. godine - 1.090; 2007. godine - 1.119; 2008. godine - 1.133. Budući da je indeks inflacije relativna promjena (dinamički indeks), prosječnu vrijednost treba izračunati pomoću geometrijske sredine: (1,109*1,090*1,119*1,133)^(1/4) = 1,1126, odnosno za razdoblje od 2005. do 2008. godišnje su cijene rasle prosječno 11,26%. Pogrešan izračun korištenjem aritmetičke sredine dao bi netočan rezultat od 11,28%.

    Glavni trg

    Glavni trg koristi se u slučajevima kada početne vrijednosti X mogu biti i pozitivne i negativne, na primjer, pri izračunavanju prosječnih odstupanja.

    Glavna primjena kvadratnog prosjeka je mjerenje varijacije X vrijednosti, o čemu će biti riječi.

    Prosječna kubna

    Prosječna kubna koristi se iznimno rijetko, primjerice, pri izračunu indeksa siromaštva za zemlje u razvoju (TIN-1) i za razvijene (TIN-2), koje predlaže i izračunava UN.

    Strukturni prosjeci

    Na najčešće korištene strukturni prosjek uključuju i .

    Statistički način rada

    Statistički način rada je najčešće ponavljana vrijednost X u statističkoj populaciji.

    Ako je zadan X diskretno, tada se mod određuje bez izračuna kao vrijednost značajke s najvećom frekvencijom. U statističkoj populaciji postoje 2 ili više modusa, tada se uzima u obzir bimodalni(ako postoje dva načina) ili multimodalni(ako postoji više od dva modusa), a to ukazuje na heterogenost populacije.

    Primjerice, tvrtka zapošljava 16 osoba: 4 osobe imaju 1 godinu iskustva, 3 osobe imaju 2 godine iskustva, 5 imaju 3 godine iskustva i 4 osobe imaju 4 godine iskustva. Dakle, modalno iskustvo Mo = 3 godine, budući da je učestalost ove vrijednosti maksimalna (f = 5).

    Ako je zadan X u jednakim razmacima, tada se modalni interval prvo definira kao interval s najvećom frekvencijom f. Unutar ovog intervala, uvjetna vrijednost moda nalazi se pomoću formule:

    Gdje je Mo moda;
    X NMo – donja granica modalnog intervala;
    h Mo je raspon modalnog intervala (razlika između njegove gornje i donje granice);
    f Mo – frekvencija modalnog intervala;
    f Mo-1 – frekvencija intervala koji prethodi modalnom;
    f Mo+1 – frekvencija intervala koji slijedi nakon modalnog.

    Na primjer, poduzeće ima 10 zaposlenika s do 3 godine iskustva, 20 s 3 do 5 godina iskustva, 5 zaposlenika s više od 5 godina iskustva. Izračunajmo modalno radno iskustvo u modalnom intervalu od 3 do 5 godina: Mo = 3 + 2*(20-10)/(2*20-10-5) = 3,8 (godina).

    Ako je raspon intervala h različit, tada je umjesto frekvencija f potrebno koristiti gustoće intervala, izračunate dijeljenjem frekvencija f s rasponom intervala h.

    Statistički medijan

    Statistički medijan– to je vrijednost veličine X koja statističku populaciju poredanu uzlaznim ili silaznim redoslijedom dijeli na 2 jednaka dijela. Kao rezultat, jedna polovica ima vrijednost veću od medijana, a druga polovica ima vrijednost manju od medijana.

    Ako je zadan X diskretno, zatim za određivanje medijana, sve vrijednosti su numerirane od 0 do N uzlaznim redoslijedom, tada će medijan za paran broj N ležati u sredini između X s brojevima 0,5N i (0,5N+1), a za neparni broj N odgovarat će vrijednosti X s brojem 0,5(N+1) .

    Primjerice, postoje podaci o dobi izvanrednih studenata u grupi od 10 ljudi – X: 18, 19, 19, 20, 21, 23, 23, 25, 28, 30 godina. Ovi podaci su već poredani uzlaznim redoslijedom, a njihov broj N=10 je paran, tako da će medijan biti između X s brojevima 0,5*10=5 i (0,5*10+1)=6, koji odgovaraju vrijednostima X 5 = 21 i X 6 =23, zatim medijan: Me = (21+23)/2 = 22 (godine).

    Ako je X zadan u obliku jednakim intervalima, zatim se prvo odredi medijan interval (interval u kojem jedna polovica frekvencija f završava, a druga polovica počinje), u kojem se uvjetna vrijednost medijana nalazi pomoću formule:

    Gdje je Me medijan;
    X NMe – donja granica srednjeg intervala;
    h Me – raspon srednjeg intervala (razlika između njegove gornje i donje granice);
    f Me – frekvencija srednjeg intervala;
    f Me-1 – zbroj frekvencija intervala koji prethode medijanu.

    U prethodno razmatranom primjeru, pri izračunu modalne duljine radnog staža (poduzeće ima 10 zaposlenika s do 3 godine iskustva, 20 s 3 do 5 godina iskustva, 5 zaposlenika s više od 5 godina iskustva), izračunavamo medijan radni staž. Polovica ukupnog broja radnika je (10+20+5)/2 = 17,5 i nalazi se u intervalu od 3 do 5 godina, au prvom intervalu do 3 godine je samo 10 radnika, au prva dva - (10+20) =30, što je više od 17,5, znači da je interval od 3 do 5 godina medijan. Unutar njega određujemo uvjetnu vrijednost medijana: Me = 3+2*(0,5*30-10)/20 = 3,5 (godina).

    Kao i u slučaju mode, kod određivanja medijana, ako je raspon intervala h različit, tada je umjesto frekvencija f potrebno koristiti gustoće intervala, izračunate dijeljenjem frekvencija f s rasponom intervala h.

    Indikatori varijacije

    Varijacija je razlika u vrijednostima X vrijednosti za pojedine jedinice statističke populacije. Za proučavanje snage varijacije izračunava se sljedeće indikatori varijacije: , , , , .

    Raspon varijacije

    Raspon varijacije je razlika između maksimalnih i minimalnih vrijednosti X dostupnih u statističkoj populaciji koja se proučava:

    Nedostatak H je što pokazuje samo maksimalnu razliku u X vrijednostima i ne može mjeriti snagu varijacije u cijeloj populaciji.

    Prosječno linearno odstupanje

    Prosječno linearno odstupanje je prosječni modul odstupanja vrijednosti X od aritmetičke sredine. Može se izračunati pomoću formule aritmetičke sredine jednostavan- dobivamo :

    Na primjer, student je položio 4 ispita i dobio sljedeće ocjene: 3, 4, 4 i 5. = 4. Izračunajmo jednostavnu prosječnu linearnu devijaciju: L = (|3-4|+|4-4|+|4 -4|+| 5-4|)/4 = 0,5.

    Ako su izvorni podaci X grupirani (postoje frekvencije f), tada se prosječno linearno odstupanje izračunava pomoću formule aritmetičke sredine ponderiran- dobivamo :

    Vratimo se na primjer studenta koji je položio 4 ispita i dobio sljedeće ocjene: 3, 4, 4 i 5. = 4 i = 0,5. Izračunajmo ponderirano prosječno linearno odstupanje: L = (|3-4|*1+|4-4|*2+|5-4|*1)/4 = 0,5.

    Linearni koeficijent varijacije

    Linearni koeficijent varijacije je omjer prosječnog linearnog odstupanja i aritmetičke sredine:

    Pomoću linearnog koeficijenta varijacije možete usporediti varijacije različitih populacija jer, za razliku od prosječnog linearnog odstupanja, njegova vrijednost ne ovisi o mjernim jedinicama X.

    U primjeru koji razmatramo o studentu koji je položio 4 ispita i dobio sljedeće ocjene: 3, 4, 4 i 5, linearni koeficijent varijacije bit će 0,5/4 = 0,125 ili 12,5%.

    Disperzija

    Disperzija je prosječni kvadrat odstupanja vrijednosti X od aritmetičke sredine. Disperzija se može izračunati pomoću formule aritmetičke sredine jednostavan- dobivamo jednostavna varijanca:

    U nama već poznatom primjeru o studentu koji je položio 4 ispita i dobio ocjene: 3, 4, 4 i 5, = 4. Tada je varijanca jednostavna D = ((3-4) 2 +(4-4) 2 +(4-4) 2 +(5-4) 2)/4 = 0,5.

    Ako su izvorni podaci X grupirani (postoje frekvencije f), tada se varijanca izračunava pomoću formule aritmetičke sredine ponderiran- dobivamo ponderirana varijanca:

    U primjeru koji razmatramo o studentu koji je položio 4 ispita i dobio sljedeće ocjene: 3, 4, 4 i 5, izračunavamo ponderiranu varijancu: D = ((3-4) 2 *1+(4-4) 2 *2+(5 -4) 2 *1)/4 = 0,5.

    Ako transformirate formulu varijance (otvorite zagrade u brojniku, podijelite pojam po pojam s nazivnikom i dajte slične), tada možete dobiti drugu formulu za izračun kao razliku između srednjih kvadrata i kvadratne srednje vrijednosti:

    Još ga je lakše pronaći standardna devijacija, ako je varijanca unaprijed izračunata kao njen kvadratni korijen:

    U primjeru o učeniku, u kojem je gore, nalazimo standardnu ​​devijaciju kao njen kvadratni korijen: .

    Kvadratni koeficijent varijacije

    Kvadratni koeficijent varijacije je najpopularnija relativna mjera varijacije:

    Vrijednost kriterija Kvadratni koeficijent varijacije V je 0,333 ili 33,3%, odnosno ako je V manji ili jednak 0,333, varijacija se smatra slabom, a ako je veća od 0,333, smatra se jakom. U slučaju jake varijacije, uzima se u obzir proučavana statistička populacija heterogena, a prosječna vrijednost je netipično i ne može se koristiti kao opći pokazatelj ove populacije.

    U primjeru o studentu, u kojem je iznad, nalazimo kvadratni koeficijent varijacije V = 0,707/4 = 0,177, što je manje od kriterijske vrijednosti 0,333, što znači da je varijacija slaba i iznosi 17,7%.

    Kvadratni korijen varijance naziva se standardna devijacija od srednje vrijednosti, koja se izračunava na sljedeći način:

    Elementarna algebarska transformacija formule standardne devijacije dovodi je do sljedećeg oblika:

    Ova se formula često pokazuje prikladnijom u praksi izračuna.

    Standardna devijacija, kao i prosječna linearna devijacija, pokazuje koliko u prosjeku određene vrijednosti neke karakteristike odstupaju od svoje prosječne vrijednosti. Standardna devijacija uvijek je veća od srednje linearne devijacije. Između njih postoji sljedeći odnos:

    Znajući ovaj omjer, možete koristiti poznate pokazatelje za određivanje nepoznatog, na primjer, ali (ja izračunaj a i obrnuto. Standardna devijacija mjeri apsolutnu veličinu varijabilnosti karakteristike i izražava se u istim mjernim jedinicama kao i vrijednosti karakteristike (rubalje, tone, godine itd.). To je apsolutna mjera varijacije.

    Za alternativni znakovi, na primjer, prisutnost ili odsutnost visokog obrazovanja, osiguranje, formule za disperziju i standardnu ​​devijaciju su sljedeće:

    Prikažimo izračun standardne devijacije prema podacima diskretne serije koja karakterizira distribuciju studenata jednog od sveučilišnih fakulteta prema dobi (tablica 6.2).

    Tablica 6.2.

    Rezultati pomoćnih izračuna dani su u stupcima 2-5 tablice. 6.2.

    Prosječna dob učenika, godina, određena je formulom ponderirane aritmetičke sredine (stupac 2):

    Kvadratna odstupanja pojedine dobi učenika od prosjeka sadržana su u stupcima 3-4, a umnošci kvadrata odstupanja i pripadajućih frekvencija sadržani su u stupcu 5.

    Varijancu dobi učenika, godina, nalazimo pomoću formule (6.2):

    Tada je o = l/3,43 1,85 *oda, t j . Svaka određena vrijednost dobi učenika odstupa od prosjeka za 1,85 godina.

    Koeficijent varijacije

    U svojoj apsolutnoj vrijednosti, standardna devijacija ne ovisi samo o stupnju varijacije karakteristike, već io apsolutnim razinama opcija i prosjeku. Stoga je nemoguće izravno usporediti standardne devijacije varijacijskih serija s različitim prosječnim razinama. Da biste mogli napraviti takvu usporedbu, trebate pronaći udio prosječnog odstupanja (linearnog ili kvadratnog) u aritmetičkom prosjeku, izražen u postocima, tj. izračunati relativne mjere varijacije.

    Linearni koeficijent varijacije izračunati po formuli

    Koeficijent varijacije određuje se sljedećom formulom:

    U koeficijentima varijacije eliminira se ne samo neusporedivost povezana s različitim jedinicama mjerenja svojstva koje se proučava, već i neusporedivost koja nastaje zbog razlika u vrijednosti aritmetičkih sredina. Osim toga, pokazatelji varijacije karakteriziraju homogenost populacije. Populacija se smatra homogenom ako koeficijent varijacije ne prelazi 33%.

    Prema tablici. 6.2 i gore dobivenih rezultata izračuna, određujemo koeficijent varijacije, %, prema formuli (6.3):

    Ako koeficijent varijacije prelazi 33%, to ukazuje na heterogenost populacije koja se proučava. Dobivena vrijednost u našem slučaju ukazuje na to da je populacija učenika po dobi homogena po sastavu. Stoga je važna funkcija generaliziranja pokazatelja varijacije procjena pouzdanosti prosjeka. Manje c1, a2 i V, što je rezultirajući skup pojava homogeniji i dobiveni prosjek pouzdaniji. Prema "pravilu tri sigme" koje razmatra matematička statistika, u normalno raspodijeljenim serijama ili njima bliskim serijama, odstupanja od aritmetičke sredine koja ne prelaze ±3 pojavljuju se u 997 slučajeva od 1000. Dakle, znajući x i a, možete dobiti opću početnu ideju o seriji varijacija. Ako je, na primjer, prosječna plaća zaposlenika u poduzeću 25 000 rubalja, a a je jednako 100 rubalja, tada s vjerojatnošću blizu sigurnosti možemo reći da plaće zaposlenika poduzeća variraju unutar raspona (25 000 ± ± 3 x 100 ) tj. od 24.700 do 25.300 rubalja.