Tulla sisään
Kaikki tietokoneen salaisuudet aloittelijoille ja ammattilaisille
  • Aloittelevalle käyttäjälle: erot 1C:Enterprise-ohjelmajärjestelmän ohjelmistotuotteiden välillä
  • Ohjelma 1s 8.3 demoversio. Mobiilisovellus "UNF" UUSI
  • Yrityksemme 1C-hallinnan perustaminen tyhjästä
  • Warface ilmainen rekisteröinti
  • Rekisteröityminen World Of Tanks -peliin – mitä sinun tulee tietää?
  • Starcraft II:n strategia ja taktiikka
  • Sco kaava. Tilastolliset parametrit. Keskimääräinen lineaarinen ja neliöpoikkeama

    Sco kaava.  Tilastolliset parametrit.  Keskimääräinen lineaarinen ja neliöpoikkeama

    Likimääräinen menetelmä variaatiosarjan vaihtelun arvioimiseksi on rajan ja amplitudin määrittäminen, mutta sarjan muunnelman arvoja ei oteta huomioon. Yleisin yleisesti hyväksytty kvantitatiivisen ominaisuuden vaihtelun mitta variaatiosarjassa on keskihajonta (σ - sigma). Mitä suurempi keskihajonta, sitä suurempi on tämän sarjan vaihteluaste.

    Keskihajonnan laskentamenetelmä sisältää seuraavat vaiheet:

    1. Etsi aritmeettinen keskiarvo (M).

    2. Määritä yksittäisten vaihtoehtojen poikkeamat aritmeettisesta keskiarvosta (d=V-M). Lääketieteessä poikkeamat keskiarvosta merkitään d:llä (poikkeama). Kaikkien poikkeamien summa on nolla.

    3. Neliöi jokainen poikkeama d 2.

    4. Kerro poikkeamien neliöt vastaavilla taajuuksilla d 2 *p.

    5. Etsi tulojen summa å(d 2 *p)

    6. Laske standardipoikkeama kaavalla:

    Kun n on suurempi kuin 30 tai kun n on pienempi tai yhtä suuri kuin 30, missä n on kaikkien vaihtoehtojen lukumäärä.

    Keskihajonnan arvo:

    1. Keskihajonta kuvaa muunnelman hajoamista suhteessa keskiarvoon (eli variaatiosarjan vaihteluun). Mitä suurempi sigma, sitä suurempi on tämän sarjan monimuotoisuus.

    2. Keskihajonnan avulla arvioidaan vertailevasti aritmeettisen keskiarvon vastaavuusastetta variaatiosarjaan, jolle se on laskettu.

    Massailmiöiden vaihtelut noudattavat normaalijakauman lakia. Tätä jakaumaa edustava käyrä näyttää sileältä kellon muotoiselta symmetriseltä käyrältä (Gaussin käyrä). Todennäköisyysteorian mukaan ilmiöissä, jotka noudattavat normaalijakauman lakia, aritmeettisen keskiarvon ja keskihajonnan välillä on tiukka matemaattinen suhde. Homogeenisen variaatiosarjan variantin teoreettinen jakauma noudattaa kolmen sigman sääntöä.

    Jos suorakaiteen muotoisessa koordinaattijärjestelmässä kvantitatiivisen ominaisuuden (muunnelmien) arvot piirretään abskissa-akselille ja variaatiosarjan muunnelman esiintymistiheys piirretään ordinaatta-akselille, niin variantit, joissa on suurempi ja pienempi arvot sijaitsevat tasaisesti aritmeettisen keskiarvon sivuilla.



    On todettu, että ominaisuuden normaalijakaumalla:

    68,3 % varianttiarvoista on M±1s sisällä

    95,5 % varianttiarvoista on M±2s sisällä

    99,7 % varianttiarvoista on M±3s sisällä

    3. Keskihajonnan avulla voit määrittää normaaliarvot kliinisille ja biologisille parametreille. Lääketieteessä väli M±1s otetaan yleensä tutkittavan ilmiön normaalialueeksi. Arvioidun arvon poikkeama aritmeettisesta keskiarvosta yli 1 s osoittaa tutkitun parametrin poikkeaman normista.

    4. Lääketieteessä kolmen sigman sääntöä käytetään pediatriassa lasten fyysisen kehityksen yksilölliseen arviointiin (sigmapoikkeamamenetelmä), lastenvaatteiden standardien kehittämiseen.

    5. Keskihajonta on tarpeen tutkittavan ominaisuuden monimuotoisuuden karakterisoimiseksi ja aritmeettisen keskiarvon virheen laskemiseksi.

    Keskihajonnan arvoa käytetään yleensä vertaamaan samantyyppisten sarjojen vaihtelua. Jos verrataan kahta sarjaa, joilla on erilaiset ominaisuudet (pituus ja paino, sairaalahoidon keskimääräinen kesto ja sairaalakuolleisuus jne.), sigman kokojen suora vertailu on mahdotonta , koska keskihajonta on nimetty arvo, joka ilmaistaan ​​absoluuttisina lukuina. Käytä näissä tapauksissa variaatiokerroin (Cv), joka on suhteellinen arvo: keskihajonnan prosentuaalinen suhde aritmeettiseen keskiarvoon.

    Variaatiokerroin lasketaan kaavalla:

    Mitä suurempi variaatiokerroin , mitä suurempi tämän sarjan vaihtelu on. Uskotaan, että yli 30 %:n variaatiokerroin osoittaa populaation laadullisen heterogeenisyyden.

    Hypoteesien tilastollisessa testauksessa, kun mitataan satunnaismuuttujien välistä lineaarista suhdetta.

    Vakiopoikkeama:

    Standardipoikkeama(arvio satunnaismuuttujan Lattia, ympärillämme olevat seinät ja katto keskihajonnasta, x suhteessa sen matemaattiseen odotukseen, joka perustuu sen varianssin puolueettomaan arvioon):

    missä on dispersio; - Lattia, seinät ympärillämme ja katto, i valinnan th elementti; - otoskoko; - otoksen aritmeettinen keskiarvo:

    On huomattava, että molemmat arviot ovat puolueellisia. Yleisessä tapauksessa on mahdotonta muodostaa puolueetonta arviota. Puolueettomaan varianssiestimaattiin perustuva arvio on kuitenkin johdonmukainen.

    Kolmen sigman sääntö

    Kolmen sigman sääntö() - melkein kaikki normaalijakauman satunnaismuuttujan arvot ovat välissä. Tarkemmin sanottuna - vähintään 99,7 %:n varmuudella normaalijakautuneen satunnaismuuttujan arvo on määritetyllä aikavälillä (edellyttäen, että arvo on tosi eikä sitä ole saatu näytteen käsittelyn tuloksena).

    Jos todellista arvoa ei tunneta, meidän ei pitäisi käyttää, vaan lattiaa, ympärillämme olevia seiniä ja kattoa, s. Siten kolmen sigman sääntö muuttuu kolmen kerroksen säännöksi, seinät ympärillämme ja katto, s .

    Keskihajonnan arvon tulkinta

    Suuri keskihajonnan arvo osoittaa suuren arvojen leviämisen esitetyssä joukossa joukon keskiarvon kanssa; pieni arvo, vastaavasti, osoittaa, että joukon arvot on ryhmitelty keskiarvon ympärille.

    Meillä on esimerkiksi kolme numerojoukkoa: (0, 0, 14, 14), (0, 6, 8, 14) ja (6, 6, 8, 8). Kaikkien kolmen joukon keskiarvot ovat 7 ja standardipoikkeamat vastaavasti 7, 5 ja 1. Viimeisellä joukolla on pieni keskihajonta, koska joukon arvot on ryhmitelty keskiarvon ympärille; ensimmäisellä sarjalla on suurin keskihajonnan arvo - joukon arvot poikkeavat suuresti keskiarvosta.

    Yleisesti ottaen standardipoikkeamaa voidaan pitää epävarmuuden mittana. Esimerkiksi fysiikassa keskihajontaa käytetään jonkin suuren peräkkäisten mittausten sarjan virheen määrittämiseen. Tämä arvo on erittäin tärkeä määritettäessä tutkittavan ilmiön uskottavuutta verrattuna teorian ennustamaan arvoon: jos mittausten keskiarvo poikkeaa suuresti teorian ennustamista arvoista (suuri keskihajonta), sitten saadut arvot tai menetelmä niiden saamiseksi on tarkistettava uudelleen.

    Käytännöllinen käyttö

    Käytännössä keskihajonnan avulla voit määrittää, kuinka paljon joukon arvot voivat poiketa keskiarvosta.

    Ilmasto

    Oletetaan, että kahdessa kaupungissa on sama keskimääräinen vuorokauden enimmäislämpötila, mutta toinen sijaitsee rannikolla ja toinen sisämaassa. Tiedetään, että rannikolla sijaitsevissa kaupungeissa on monia erilaisia ​​maksimipäivälämpötiloja, jotka ovat alhaisempia kuin sisämaassa sijaitsevissa kaupungeissa. Siksi rannikkokaupungin vuorokauden maksimilämpötilojen keskihajonta on pienempi kuin toisen kaupungin huolimatta siitä, että tämän arvon keskiarvo on sama, mikä käytännössä tarkoittaa, että todennäköisyys, että korkein ilman lämpötila mikä tahansa päivä vuodesta on korkeampi kuin keskiarvo, korkeampi sisämaassa sijaitsevassa kaupungissa.

    Urheilu

    Oletetaan, että on useita jalkapallojoukkueita, jotka on luokiteltu joillakin parametreilla, esimerkiksi tehtyjen ja päästettyjen maalien lukumäärällä, maalintekomahdollisuuksilla jne. On todennäköistä, että tämän ryhmän parhaalla joukkueella on paremmat arvot useammalla parametrilla. Mitä pienempi joukkueen keskihajonta kullekin esitetylle parametrille on, sitä ennakoitavampi on joukkueen tulos; tällaiset joukkueet ovat tasapainoisia. Toisaalta suuren keskihajonnan omaavan joukkueen tulosta on vaikea ennustaa, mikä puolestaan ​​selittyy epätasapainolla, esimerkiksi vahvalla puolustuksella mutta heikolla hyökkäyksellä.

    Joukkueparametrien keskihajonnan käyttö mahdollistaa tavalla tai toisella kahden joukkueen välisen ottelun tuloksen ennustamisen arvioimalla joukkueiden vahvuudet ja heikkoudet ja siten valitut taistelutavat.

    Tekninen analyysi

    Katso myös

    Kirjallisuus

    * Borovikov, V. TILASTOT. Tietojen analysoinnin taidetta tietokoneella: Ammattilaisille / V. Borovikov. - Pietari. : Peter, 2003. - 688 s. - ISBN 5-272-00078-1.

    Dispersio on kunkin attribuutin arvon neliöityjen poikkeamien aritmeettinen keskiarvo kokonaiskeskiarvosta. Lähdetiedoista riippuen varianssi voi olla painottamaton (yksinkertainen) tai painotettu.

    Varianssi lasketaan seuraavilla kaavoilla:

    · ryhmittämättömille tiedoille

    · ryhmitellyille tiedoille

    Painotetun varianssin laskentamenetelmä:

    1. määrittää aritmeettinen painotettu keskiarvo

    2. määritetään muunnelman poikkeamat keskiarvosta

    3. neliötä kunkin vaihtoehdon poikkeama keskiarvosta

    4. kerro poikkeamien neliöt painoilla (taajuuksilla)

    5. Tee yhteenveto tuloksena olevista tuotteista

    6. saatu määrä jaetaan asteikkojen summalla

    Varianssin määrityskaava voidaan muuntaa seuraavaksi kaavaksi:

    Yksinkertainen

    Varianssin laskentamenettely on yksinkertainen:

    1. määrittää aritmeettinen keskiarvo

    2. neliöi aritmeettinen keskiarvo

    3. neliöi jokainen rivin vaihtoehto

    4. Etsi neliöiden summa -vaihtoehto

    5. jaa neliöiden summa niiden lukumäärällä, ts. määrittää keskineliön

    6. määritä ominaisuuden keskineliön ja keskiarvon neliön välinen ero

    Myös painotetun varianssin määrityskaava voidaan muuntaa seuraavaksi kaavaksi:

    nuo. dispersio on yhtä suuri kuin attribuutin neliöarvojen keskiarvon ja aritmeettisen keskiarvon neliön välinen ero. Käytettäessä muunnettua kaavaa eliminoituu lisämenettely ominaisuuden yksittäisten arvojen poikkeamien laskemiseksi x:stä ja poikkeamien pyöristämiseen liittyvä laskuvirhe poistetaan.

    Dispersiolla on useita ominaisuuksia, joista osa helpottaa laskemista:

    1) vakioarvon varianssi on nolla;

    2) jos kaikkia attribuuttiarvojen muunnelmia vähennetään samalla numerolla, varianssi ei pienene;

    3) jos kaikkia attribuuttiarvojen muunnelmia pienennetään saman verran (kertaa), niin varianssi pienenee kertoimella

    Keskihajonta S- edustaa varianssin neliöjuurta:

    · ryhmittämättömille tiedoille:

    · variaatiosarjalle:

    Vaihtelun vaihteluväli, lineaarinen keskiarvo ja keskihajonta on nimetty suureiksi. Niillä on samat mittayksiköt kuin yksittäisillä ominaisarvoilla.

    Varianssi ja keskihajonta ovat yleisimmin käytetyt variaatiomitat. Tämä selittyy sillä, että ne sisältyvät useimpiin todennäköisyysteorian teoreemoihin, jotka toimivat matemaattisten tilastojen perustana. Lisäksi varianssi voidaan hajottaa sen komponenttielementeiksi, jolloin voidaan arvioida erilaisten tekijöiden vaikutusta, jotka määräävät ominaisuuden vaihtelun.

    Pankkien variaatioindikaattoreiden laskeminen voittomarginaalin mukaan ryhmiteltynä on esitetty taulukossa.

    Voiton määrä, miljoonaa ruplaa. Pankkien lukumäärä laskettuja indikaattoreita
    3,7 - 4,6 (-) 4,15 8,30 -1,935 3,870 7,489
    4,6 - 5,5 5,05 20,20 - 1,035 4,140 4,285
    5,5 - 6,4 5,95 35,70 - 0,135 0,810 0,109
    6,4 - 7,3 6,85 34,25 +0,765 3,825 2,926
    7,3 - 8,2 7,75 23,25 +1,665 4,995 8,317
    Kaikki yhteensä: 121,70 17,640 23,126

    Keskimääräinen lineaarinen ja keskihajonta osoittavat, kuinka paljon ominaisuuden arvo vaihtelee keskimäärin yksiköiden ja tutkittavan perusjoukon välillä. Joten tässä tapauksessa keskimääräinen voiton vaihtelu on: keskimääräisen lineaarisen poikkeaman mukaan 0,882 miljoonaa ruplaa; keskihajonnan mukaan - 1,075 miljoonaa ruplaa. Keskihajonta on aina suurempi kuin keskimääräinen lineaarinen poikkeama. Jos ominaisuuden jakauma on lähellä normaalia, niin S:n ja d:n välillä on suhde: S=1,25d tai d=0,8S. Keskihajonta osoittaa, kuinka suurin osa perusjoukon yksiköistä sijaitsee suhteessa aritmeettiseen keskiarvoon. Jakauman muodosta riippumatta 75 attribuutin arvoa kuuluu väliin x 2S ja vähintään 89 kaikista arvoista väliin x 3S (P.L. Chebyshev'n lause).

    keskiarvo- Tämä on tilastollisen populaation yleinen indikaattori, joka eliminoi yksittäiset erot tilastollisten määrien arvoissa, jolloin voit verrata erilaisia ​​populaatioita keskenään.

    Olemassa 2 luokkaa keskiarvot: ja .

    Rakenteelliset keskiarvot sisältävät muoti Ja mediaani, mutta useimmiten käytetty tehon keskiarvot erilaisia ​​tyyppejä.

    Tehon keskiarvot

    Tehon keskiarvot voivat olla yksinkertainen Ja painotettu.

    Yksinkertainen keskiarvo lasketaan, jos niitä on kaksi tai useampi ryhmittämätön tilastolliset suureet satunnaisessa järjestyksessä seuraavan yleisen kaavan mukaan:

    Painotettu keskiarvo laskenut ryhmitelty tilastolliset arvot seuraavalla yleisellä kaavalla:

    missä X on yksittäisten tilastoarvojen arvot tai ryhmittelyvälien keskikohta;
    m on eksponentti, jonka arvo määrittää seuraavan tehokeskiarvojen tyypit:
    kohdassa m = -1;
    m = 0;
    kun m = 1;
    m = 2;
    m = 3.

    Käyttämällä yleisiä kaavoja yksinkertaisille ja painotetuille keskiarvoille eri eksponenteille m, saamme kunkin tyypin erityiset kaavat, joita käsitellään yksityiskohtaisesti jäljempänä.

    Aritmeettinen keskiarvo

    Aritmeettinen keskiarvo- tämä on yleisimmin käytetty keskiarvo, joka saadaan korvaamalla m=1 yleiseen kaavaan. Aritmeettinen keskiarvo yksinkertainen on seuraavanlainen muoto:

    missä X ovat niiden määrien arvot, joille keskiarvo on laskettava; N on X-arvojen kokonaismäärä (yksiköiden lukumäärä tutkittavassa populaatiossa).

    Esimerkiksi opiskelija läpäisi 4 koetta ja sai seuraavat arvosanat: 3, 4, 4 ja 5. Lasketaan keskiarvo yksinkertaisella aritmeettisella keskiarvokaavalla: (3+4+4+5)/4 = 16/4 = 4.

    Aritmeettinen keskiarvo painotettu on seuraavanlainen muoto:

    Missä f on niiden suureiden lukumäärä, joilla on sama arvo X (taajuus).

    Esimerkiksi opiskelija läpäisi 4 tenttiä ja sai seuraavat arvosanat: 3, 4, 4 ja 5. Lasketaan keskimääräinen pistemäärä painotetun aritmeettisen keskiarvon kaavalla: (3*1 + 4*2 + 5*1)/4 = 16/4 = 4.

    Jos X-arvot on määritetty intervalleiksi, laskelmissa käytetään X-välien keskipisteitä, jotka määritellään välin ylä- ja alarajojen puolisummaksi. Ja jos intervallilla X ei ole ala- tai ylärajaa (avoin väli), niin sen löytämiseksi käytä viereisen intervallin X aluetta (erotus ylä- ja alarajan välillä).

    Esimerkiksi yrityksessä on 10 työntekijää, joilla on enintään 3 vuoden kokemus, 20 työntekijää 3–5 vuoden kokemuksella ja 5 työntekijää yli 5 vuoden kokemuksella. Sitten lasketaan työntekijöiden keskimääräinen palvelusaika painotetun aritmeettisen keskiarvon kaavalla ottamalla X:ksi palvelusvälien (2, 4 ja 6 vuotta) keskipiste:
    (2*10+4*20+6*5)/(10+20+5) = 3,71 vuotta.

    Aritmeettista keskiarvoa käytetään useimmiten, mutta joskus on tarpeen käyttää muun tyyppisiä keskiarvoja. Pohditaanpa tällaisia ​​tapauksia tarkemmin.

    Harmoninen keskiarvo

    Harmoninen keskiarvo käytetään, kun lähdetieto ei sisällä yksittäisten X-arvojen taajuuksia f, vaan se esitetään niiden tulona Xf. Kun Xf=w on määritetty, ilmaisemme f=w/X, ja korvaamalla nämä merkinnät aritmeettisen painotetun keskiarvon kaavaan, saamme harmonisen painotetun keskiarvon kaavan:

    Näin ollen painotettua harmonista keskiarvoa käytetään, kun taajuudet f ovat tuntemattomia ja w=Xf tunnetaan. Tapauksissa, joissa kaikki w = 1, eli X:n yksittäiset arvot esiintyvät kerran, käytetään keskimääräistä harmonista alkukaavaa:

    Esimerkiksi auto kulki pisteestä A paikkaan B nopeudella 90 km/h ja takaisin nopeudella 110 km/h. Keskinopeuden määrittämiseen sovelletaan keskimääräisen harmonisen yksinkertaisen kaavaa, koska esimerkissä on annettu etäisyys w 1 =w 2 (etäisyys pisteestä A pisteeseen B on sama kuin pisteestä B paikkaan A), joka on yhtä suuri kuin nopeuden (X) ja ajan (f) tulo. Keskinopeus = (1+1)/(1/90+1/110) = 99 km/h.

    Geometrinen keskiarvo

    Geometrinen keskiarvo käytetään keskimääräisten suhteellisten muutosten määrittämisessä, kuten aiheesta Dynaamiset sarjat käsitellään. Geometrinen keskiarvo antaa tarkimman keskiarvotuloksen, jos tehtävänä on löytää X:n arvo, joka olisi yhtä kaukana sekä X:n maksimi- että minimiarvosta.

    Esimerkiksi vuosina 2005-2008 inflaatioindeksi Venäjällä oli: vuonna 2005 - 1,109; vuonna 2006 - 1 090; vuonna 2007 - 1 119; vuonna 2008 - 1 133. Koska inflaatioindeksi on suhteellinen muutos (dynaaminen indeksi), keskiarvo on laskettava geometrisen keskiarvon avulla: (1,109*1,090*1,119*1,133)^(1/4) = 1,1126 eli vuodesta 2005 alkaen vuoteen 2008 vuosittain hinnat nousivat keskimäärin 11,26 %. Virheellinen laskelma aritmeettisella keskiarvolla antaisi virheellisen tuloksen 11,28 %.

    Keskimääräinen neliö

    Keskimääräinen neliö käytetään tapauksissa, joissa X:n alkuarvot voivat olla sekä positiivisia että negatiivisia, esimerkiksi keskimääräisiä poikkeamia laskettaessa.

    Neliöllisen keskiarvon tärkein sovellus on mitata X-arvojen vaihtelua, josta keskustellaan.

    Keskimääräinen kuutio

    Keskimääräinen kuutio Sitä käytetään erittäin harvoin esimerkiksi laskettaessa YK:n ehdottamia ja laskemia kehitysmaiden (TIN-1) ja kehittyneiden maiden (TIN-2) köyhyysindeksejä.

    Rakenteelliset keskiarvot

    Useimmin käytettyyn rakenteellinen keskiarvo sisältää ja .

    Tilastollinen tila

    Tilastollinen tila on X:n useimmin toistuva arvo tilastollisessa perusjoukossa.

    Jos X annetaan huomaamattomasti, silloin tila määritetään ilman laskentaa korkeimman taajuuden ominaisuuden arvoksi. Tilastopopulaatiossa on 2 tai useampia muotoja, silloin se otetaan huomioon bimodaalinen(jos tilaa on kaksi) tai multimodaalinen(jos moodia on enemmän kuin kaksi), ja tämä osoittaa populaation heterogeenisyyden.

    Esimerkiksi yritys työllistää 16 henkilöä: heistä 4:llä 1 vuoden kokemus, 3:lla 2 vuoden kokemus, 5:llä 3 vuoden kokemus ja 4:llä 4 vuoden kokemus. Siten modaalinen kokemus Mo = 3 vuotta, koska tämän arvon esiintymistiheys on maksimi (f = 5).

    Jos X annetaan tasaisin väliajoin, niin modaaliväli määritellään ensin intervalliksi, jolla on suurin taajuus f. Tämän aikavälin sisällä tilan ehdollinen arvo löydetään kaavalla:

    Missä Mo on muoti;
    X NMo – modaalivälin alaraja;
    h Mo on modaalivälin alue (sen ylä- ja alarajojen välinen ero);
    f Mo – modaalivälin taajuus;
    f Mo-1 – modaalia edeltävän aikavälin taajuus;
    f Mo+1 – modaalia seuraavan intervallin taajuus.

    Esimerkiksi yrityksessä on 10 työntekijää, joilla on enintään 3 vuoden kokemus, 20 työntekijää 3–5 vuoden kokemuksella ja 5 työntekijää yli 5 vuoden kokemuksella. Lasketaan modaalityökokemus modaalivälillä 3-5 vuotta: Mo = 3 + 2*(20-10)/(2*20-10-5) = 3,8 (vuotta).

    Jos intervallialue h on erilainen, niin taajuuksien f sijasta on tarpeen käyttää intervallitiheyksiä, jotka lasketaan jakamalla taajuudet f intervallin h alueella.

    Tilastollinen mediaani

    Tilastollinen mediaani– tämä on suuren X arvo, joka jakaa nousevaan tai laskevaan järjestykseen järjestetyn tilastollisen perusjoukon kahteen yhtä suureen osaan. Seurauksena on, että toisella puoliskolla on mediaania suurempi arvo ja toisen puoliskon arvo on pienempi kuin mediaani.

    Jos X annetaan huomaamattomasti, sitten mediaanin määrittämiseksi kaikki arvot numeroidaan nollasta N:ään nousevassa järjestyksessä, silloin parillisen luvun N mediaani on keskellä X:n lukujen 0,5N ja (0,5N+1) välissä, ja parittoman luvun N mediaani vastaa X:n arvoa numerolla 0,5(N+1) .

    Esimerkiksi osa-aikaisten opiskelijoiden iästä on tietoa 10 hengen ryhmässä - X: 18, 19, 19, 20, 21, 23, 23, 25, 28, 30 vuotta. Nämä tiedot ovat jo nousevassa järjestyksessä ja niiden lukumäärä N=10 on parillinen, joten mediaani tulee olemaan X:n välillä numeroilla 0.5*10=5 ja (0.5*10+1)=6, jotka vastaavat arvoja X 5 = 21 ja X 6 = 23, sitten mediaani: Me = (21+23)/2 = 22 (vuosia).

    Jos X on annettu muodossa yhtäläisin välein, sitten ensin määritetään mediaaniväli (väli, jossa puolet taajuuksista f päättyy ja toinen puolikas alkaa), jossa mediaanin ehdollinen arvo löydetään kaavalla:

    Missä Minä on mediaani;
    X НМе – mediaanivälin alaraja;
    h Ме – mediaanivälin alue (sen ylä- ja alarajojen välinen ero);
    f Ме – mediaanivälin taajuus;
    f Ме-1 – mediaania edeltävien intervallien taajuuksien summa.

    Aiemmin käsitellyssä esimerkissä laskettaessa modaalista palvelusaikaa (yrityksessä on 10 työntekijää enintään 3 vuoden kokemuksella, 20 työntekijää 3-5 vuoden kokemuksella, 5 työntekijää yli 5 vuoden kokemuksella) lasketaan mediaani. palvelun pituus. Puolet työntekijöiden kokonaismäärästä on (10+20+5)/2 = 17,5 ja on välillä 3-5 vuotta, ja ensimmäisellä 3 vuoden välissä on vain 10 työntekijää ja kahdella ensimmäisellä - (10+20) =30, mikä on enemmän kuin 17,5, tarkoittaa, että väli 3-5 vuotta on mediaani. Sen sisällä määritetään mediaanin ehdollinen arvo: Me = 3+2*(0,5*30-10)/20 = 3,5 (vuotta).

    Aivan kuten moodin tapauksessa, mediaania määritettäessä, jos välien alue h on erilainen, niin taajuuksien f sijasta on käytettävä intervallitiheyksiä, jotka lasketaan jakamalla taajuudet f intervallin h alueella.

    Vaihtelun indikaattorit

    Variaatio on ero X-arvojen arvojen välillä tilastollisen perusjoukon yksittäisille yksiköille. Muutoksen voimakkuuden tutkimiseksi lasketaan seuraavat vaihtelun indikaattoreita: , , , , .

    Vaihtelualue

    Vaihtelualue on ero X:n maksimi- ja vähimmäisarvojen välillä, jotka ovat saatavilla tutkittavassa tilastojoukossa:

    H:n haittana on, että se näyttää vain suurimman eron X-arvoissa eikä voi mitata vaihtelun voimakkuutta koko populaatiossa.

    Keskimääräinen lineaarinen poikkeama

    Keskimääräinen lineaarinen poikkeama on X-arvojen aritmeettisesta keskiarvosta poikkeamien keskimääräinen moduuli. Se voidaan laskea aritmeettisen keskiarvon kaavalla yksinkertainen- saamme :

    Esimerkiksi opiskelija läpäisi 4 koetta ja sai seuraavat arvosanat: 3, 4, 4 ja 5. = 4. Lasketaan yksinkertainen keskimääräinen lineaarinen poikkeama: L = (|3-4|+|4-4|+|4 -4|+|5-4|)/4 = 0,5.

    Jos lähdetiedot X on ryhmitelty (on frekvenssit f), keskimääräinen lineaarinen poikkeama lasketaan aritmeettisen keskiarvon kaavalla painotettu- saamme :

    Palataanpa esimerkkiin opiskelijasta, joka läpäisi 4 tenttiä ja sai seuraavat arvosanat: 3, 4, 4 ja 5. = 4 ja = 0,5. Lasketaan painotettu keskimääräinen lineaarinen poikkeama: L = (|3-4|*1+|4-4|*2+|5-4|*1)/4 = 0,5.

    Lineaarinen variaatiokerroin

    Lineaarinen variaatiokerroin on keskimääräisen lineaarisen poikkeaman suhde aritmeettiseen keskiarvoon:

    Lineaarisen variaatiokertoimen avulla voit verrata eri populaatioiden vaihtelua, sillä toisin kuin keskimääräinen lineaarinen poikkeama, sen arvo ei riipu mittayksiköistä X.

    Tarkasteltavassa esimerkissä opiskelijasta, joka läpäisi 4 tenttiä ja sai seuraavat arvosanat: 3, 4, 4 ja 5, lineaarinen variaatiokerroin on 0,5/4 = 0,125 tai 12,5 %.

    Dispersio

    Dispersio on X-arvojen aritmeettisesta keskiarvosta poikkeamien keskimääräinen neliö. Dispersio voidaan laskea käyttämällä aritmeettisen keskiarvon kaavaa yksinkertainen- saamme yksinkertainen varianssi:

    Meille jo tutussa esimerkissä opiskelijasta, joka suoritti 4 tenttiä ja sai arvosanat: 3, 4, 4 ja 5, = 4. Tällöin varianssi on yksinkertainen D = ((3-4) 2 +(4-4) 2 +(4-4) 2 +(5-4) 2)/4 = 0,5.

    Jos alkuperäiset tiedot X on ryhmitelty (on frekvenssejä f), niin varianssi lasketaan aritmeettisen keskiarvon kaavalla painotettu- saamme varianssipainotettu:

    Tarkasteltavassa esimerkissä opiskelijasta, joka läpäisi 4 tenttiä ja sai seuraavat arvosanat: 3, 4, 4 ja 5, laskemme painotetun varianssin: D = ((3-4) 2 *1+(4-4) 2 *2+(5-4)2*1)/4 = 0,5.

    Jos muunnat varianssikaavan (avaa sulut osoittajaan, jaa termi termiltä nimittäjällä ja anna samanlaiset), niin saat toisen kaavan sen laskemiseksi keskineliöiden ja neliön keskiarvon erotuksena:

    Se on vielä helpompi löytää keskihajonta, jos varianssi on ennalta laskettu sen neliöjuurena:

    Yllä olevasta opiskelijaa koskevasta esimerkistä löydämme keskihajonnan sen neliöjuurena: .

    Neliöllinen variaatiokerroin

    Neliöllinen variaatiokerroin on suosituin suhteellinen vaihtelun mitta:

    Kriteerin arvo Neliöllinen variaatiokerroin V on 0,333 tai 33,3 %, eli jos V on pienempi tai yhtä suuri kuin 0,333, vaihtelua pidetään heikkona ja jos se on suurempi kuin 0,333, sitä pidetään vahvana. Jos vaihtelu on voimakasta, otetaan huomioon tutkittu tilastollinen populaatio heterogeeninen, ja keskiarvo on epätyypillinen eikä sitä voida käyttää yleisenä indikaattorina tästä populaatiosta.

    Opiskelijaa koskevasta esimerkistä, jossa yllä , löydämme neliöllisen variaatiokertoimen V = 0,707/4 = 0,177, joka on pienempi kuin kriteerin arvo 0,333, mikä tarkoittaa, että vaihtelu on heikko ja yhtä suuri kuin 17,7 %.

    Varianssin neliöjuurta kutsutaan keskihajonnan keskiarvosta, joka lasketaan seuraavasti:

    Keskihajonnan kaavan alkeisalgebrallinen muunnos johtaa sen seuraavaan muotoon:

    Tämä kaava osoittautuu usein kätevämmäksi laskentakäytännössä.

    Keskihajonta, kuten keskimääräinen lineaarinen poikkeama, osoittaa, kuinka paljon ominaisuuden tietyt arvot keskimäärin poikkeavat keskiarvostaan. Keskihajonta on aina suurempi kuin keskimääräinen lineaarinen poikkeama. Niiden välillä on seuraava suhde:

    Kun tiedät tämän suhteen, voit käyttää tunnettuja indikaattoreita määrittääksesi esimerkiksi tuntemattoman, mutta (I laskea a ja päinvastoin. Keskihajonta mittaa ominaisuuden vaihtelun absoluuttista kokoa ja ilmaistaan ​​samoissa mittayksiköissä kuin ominaisuuden arvot (rupla, tonni, vuosi jne.). Se on absoluuttinen vaihtelun mitta.

    varten vaihtoehtoisia merkkejä, esimerkiksi korkea-asteen koulutuksen, vakuutuksen olemassaolo tai puuttuminen, hajonta- ja keskihajonnan kaavat ovat seuraavat:

    Esitetään yhden yliopiston tiedekunnan opiskelijoiden ikäjakaumaa kuvaavan diskreetin sarjan tietojen keskihajonnan laskenta (taulukko 6.2).

    Taulukko 6.2.

    Apulaskelmien tulokset on esitetty taulukon sarakkeissa 2-5. 6.2.

    Opiskelijan keski-ikä, vuotta, määräytyy painotetun aritmeettisen keskiarvon kaavalla (sarake 2):

    Opiskelijan yksittäisen iän neliölliset poikkeamat keskiarvosta ovat sarakkeissa 3-4 ja neliöityjen poikkeamien tulot ja vastaavat frekvenssit ovat sarakkeessa 5.

    Löydämme opiskelijoiden iän, vuosien varianssin kaavalla (6.2):

    Silloin o = l/3,43 1,85 *oda, ts. Jokainen opiskelijan iän tietty arvo poikkeaa keskiarvosta 1,85 vuotta.

    Variaatiokerroin

    Absoluuttisessa arvossaan standardipoikkeama ei riipu pelkästään ominaisuuden vaihteluasteesta, vaan myös optioiden absoluuttisista tasoista ja keskiarvosta. Siksi on mahdotonta suoraan verrata variaatiosarjojen keskihajontoja erilaisten keskitasojen kanssa. Jotta tällainen vertailu voidaan tehdä, sinun on löydettävä keskimääräisen poikkeaman (lineaarinen tai neliöllinen) osuus aritmeettisesta keskiarvosta prosentteina ilmaistuna, ts. laskea suhteelliset vaihtelumitat.

    Lineaarinen variaatiokerroin lasketaan kaavalla

    Variaatiokerroin määritetään seuraavalla kaavalla:

    Variaatiokertoimissa ei eliminoitu pelkästään tutkittavan ominaisuuden eri mittayksiköihin liittyvä epävertailu, vaan myös aritmeettisten keskiarvojen eroista johtuva epävertailu. Lisäksi vaihteluindikaattorit kuvaavat väestön homogeenisuutta. Populaatio katsotaan homogeeniseksi, jos variaatiokerroin ei ylitä 33 %.

    Taulukon mukaan. 6.2 ja yllä saaduista laskentatuloksista määritämme variaatiokertoimen, %, kaavan (6.3) mukaisesti:

    Jos variaatiokerroin ylittää 33 %, tämä osoittaa tutkittavan populaation heterogeenisyyden. Meidän tapauksessamme saatu arvo osoittaa, että opiskelijapopulaatio iän mukaan on koostumukseltaan homogeeninen. Siten vaihteluindikaattoreiden yleistämisen tärkeä tehtävä on arvioida keskiarvojen luotettavuutta. Vähemmän c1, a2 ja V, mitä homogeenisempi tuloksena oleva ilmiösarja ja sitä luotettavampi tuloksena oleva keskiarvo. Matemaattisten tilastojen tarkasteleman "kolmen sigman säännön" mukaan normaalijakautuneissa tai niitä lähellä olevissa sarjoissa poikkeamia aritmeettisesta keskiarvosta, joka ei ylitä ±3:a, esiintyy 997 tapauksessa 1000:sta. X ja a, saat yleisen alustavan käsityksen variaatiosarjasta. Jos esimerkiksi työntekijän keskipalkka yrityksessä on 25 000 ruplaa ja a on 100 ruplaa, niin lähes varmuudella voidaan sanoa, että yrityksen työntekijöiden palkat vaihtelevat (25 000) ± ± 3 x 100 ) so. 24 700 - 25 300 ruplaa.