Lai ienāktu
Visi datoru noslēpumi iesācējiem un profesionāļiem
  • Iesācējam: atšķirības starp 1C:Enterprise programmu sistēmas programmatūras produktiem
  • Programmas 1s 8.3 demonstrācijas versija. Mobilā aplikācija "UNF" JAUNS
  • Mūsu uzņēmuma 1C pārvaldības iestatīšana no nulles
  • Warface bezmaksas reģistrācija
  • Reģistrācija spēlē World Of Tanks – kas jums jāzina?
  • Starcraft II stratēģija un taktika
  • Sco formula. Statistiskie parametri. Vidējā lineārā un kvadrātiskā novirze

    Sco formula.  Statistiskie parametri.  Vidējā lineārā un kvadrātiskā novirze

    Aptuvenā metode variāciju sērijas mainīguma novērtēšanai ir noteikt robežu un amplitūdu, bet varianta vērtības sērijas ietvaros netiek ņemtas vērā. Galvenais vispārpieņemtais kvantitatīvā raksturlieluma mainīguma rādītājs variāciju sērijā ir standarta novirze (σ — sigma). Jo lielāka ir standarta novirze, jo lielāka ir šīs sērijas svārstību pakāpe.

    Standarta novirzes aprēķināšanas metode ietver šādas darbības:

    1. Atrodi vidējo aritmētisko (M).

    2. Noteikt atsevišķu iespēju novirzes no vidējā aritmētiskā (d=V-M). Medicīnas statistikā novirzes no vidējā ir apzīmētas kā d (novirze). Visu noviržu summa ir nulle.

    3. Katru novirzi d 2 kvadrātā.

    4. Reiziniet noviržu kvadrātus ar atbilstošajām frekvencēm d 2 *p.

    5. Atrodiet produktu summu å(d 2 *p)

    6. Aprēķiniet standarta novirzi, izmantojot formulu:

    Ja n ir lielāks par 30 vai ja n ir mazāks vai vienāds ar 30, kur n ir visu opciju skaits.

    Standarta novirzes vērtība:

    1. Standartnovirze raksturo varianta izkliedi attiecībā pret vidējo vērtību (t.i., variāciju rindas mainīgumu). Jo lielāka ir sigma, jo augstāka ir šīs sērijas daudzveidības pakāpe.

    2. Standartnovirzi izmanto, lai salīdzinoši novērtētu vidējā aritmētiskā atbilstības pakāpi variāciju rindai, kurai tā aprēķināta.

    Masu parādību variācijas pakļaujas normālā sadalījuma likumam. Līkne, kas attēlo šo sadalījumu, izskatās kā gluda zvanveida simetriska līkne (Gausa līkne). Saskaņā ar varbūtības teoriju parādībās, kas atbilst normālā sadalījuma likumam, pastāv stingra matemātiska sakarība starp vidējā aritmētiskā un standarta novirzes vērtībām. Varianta teorētiskais sadalījums viendabīgā variāciju sērijā atbilst trīs sigmu likumam.

    Ja taisnstūra koordinātu sistēmā uz abscisu ass tiek uzzīmētas kvantitatīvās pazīmes (variantu) vērtības un uz ordinātu ass tiek attēlota varianta rašanās biežums variāciju sērijā, tad varianti ar lielāku un mazāku vērtības ir vienmērīgi izvietotas vidējā aritmētiskā malās.



    Ir konstatēts, ka ar normālu pazīmes sadalījumu:

    68,3% variantu vērtību ir M±1s robežās

    95,5% variantu vērtību ir M±2s robežās

    99,7% variantu vērtību ir M±3s robežās

    3. Standarta novirze ļauj noteikt klīnisko un bioloģisko parametru normālās vērtības. Medicīnā intervālu M±1s parasti uzskata par pētāmās parādības normālo diapazonu. Aprēķinātās vērtības novirze no vidējā aritmētiskā par vairāk nekā 1s liecina par pētāmā parametra novirzi no normas.

    4. Medicīnā trīs sigmu likumu izmanto pediatrijā individuālai bērnu fiziskās attīstības līmeņa novērtēšanai (sigmas novirzes metode), bērnu apģērbu standartu izstrādei.

    5. Standartnovirze nepieciešama, lai raksturotu pētāmā raksturlieluma dažādības pakāpi un aprēķinātu vidējā aritmētiskā kļūda.

    Standartnovirzes vērtību parasti izmanto, lai salīdzinātu viena veida sēriju mainīgumu. Ja salīdzina divas sērijas ar atšķirīgām īpašībām (augums un svars, vidējais stacionārās ārstēšanas ilgums un mirstība slimnīcā utt.), tad tieša sigmu izmēru salīdzināšana nav iespējama. , jo standartnovirze ir nosaukta vērtība, kas izteikta absolūtos skaitļos. Šajos gadījumos izmantojiet variācijas koeficients (Cv), kas ir relatīvā vērtība: standartnovirzes procentuālā attiecība pret vidējo aritmētisko.

    Variācijas koeficientu aprēķina pēc formulas:

    Jo lielāks variācijas koeficients , jo lielāka ir šīs sērijas mainīgums. Tiek uzskatīts, ka variācijas koeficients, kas lielāks par 30%, norāda uz populācijas kvalitatīvo neviendabīgumu.

    Hipotēžu statistiskajā pārbaudē, mērot lineāro sakarību starp nejaušajiem mainīgajiem.

    Standarta novirze:

    Standarta novirze(gadījuma lieluma Grīdas, sienas ap mums un griesti standartnovirzes aprēķins, x attiecībā pret tā matemātisko cerību, pamatojoties uz objektīvu tās dispersijas aplēsi):

    kur ir dispersija; - Grīda, sienas ap mums un griesti, i atlases elements; - izlases lielums; - izlases vidējais aritmētiskais:

    Jāatzīmē, ka abas aplēses ir neobjektīvas. Vispārīgā gadījumā nav iespējams izveidot objektīvu tāmi. Tomēr aprēķins, kas balstīts uz objektīvu dispersijas novērtējumu, ir konsekvents.

    Trīs sigmu noteikums

    Trīs sigmu noteikums() - gandrīz visas normāli sadalītā gadījuma lieluma vērtības atrodas intervālā. Stingrāk - ar ne mazāku kā 99,7% ticamību normāli sadalīta gadījuma lieluma vērtība atrodas norādītajā intervālā (ar nosacījumu, ka vērtība ir patiesa un nav iegūta parauga apstrādes rezultātā).

    Ja patiesā vērtība nav zināma, tad jāizmanto nevis grīda, sienas ap mums un griesti, s. Tādējādi trīs sigmu noteikums tiek pārveidots par trīs stāvu, sienas ap mums un griestiem, s .

    Standartnovirzes vērtības interpretācija

    Liela standarta novirzes vērtība parāda lielu vērtību izplatību uzrādītajā komplektā ar kopas vidējo vērtību; maza vērtība attiecīgi parāda, ka vērtības komplektā ir sagrupētas ap vidējo vērtību.

    Piemēram, mums ir trīs skaitļu kopas: (0, 0, 14, 14), (0, 6, 8, 14) un (6, 6, 8, 8). Visām trim kopām ir vidējās vērtības, kas vienādas ar 7, un standarta novirzes, attiecīgi, ir vienādas ar 7, 5 un 1. Pēdējā komplektā ir neliela standarta novirze, jo kopas vērtības ir sagrupētas ap vidējo vērtību; pirmajai kopai ir vislielākā standarta novirzes vērtība - vērtības komplektā ievērojami atšķiras no vidējās vērtības.

    Vispārīgā nozīmē standarta novirzi var uzskatīt par nenoteiktības mēru. Piemēram, fizikā standarta novirzi izmanto, lai noteiktu kāda daudzuma secīgu mērījumu sērijas kļūdu. Šī vērtība ir ļoti svarīga, lai noteiktu pētāmās parādības ticamību salīdzinājumā ar teorijas prognozēto vērtību: ja mērījumu vidējā vērtība ļoti atšķiras no teorijas prognozētajām vērtībām (liela standartnovirze), tad vēlreiz jāpārbauda iegūtās vērtības vai to iegūšanas metode.

    Praktiska lietošana

    Praksē standarta novirze ļauj noteikt, cik daudz vērtības komplektā var atšķirties no vidējās vērtības.

    Klimats

    Pieņemsim, ka ir divas pilsētas ar vienādu vidējo maksimālo diennakts temperatūru, bet viena atrodas piekrastē, bet otra - iekšzemē. Ir zināms, ka pilsētās, kas atrodas piekrastē, ir daudz dažādu maksimālo dienas temperatūru, kas ir zemāka nekā pilsētās, kas atrodas iekšzemē. Tāpēc piekrastes pilsētas maksimālo diennakts temperatūru standartnovirze būs mazāka nekā otrajai pilsētai, neskatoties uz to, ka šīs vērtības vidējā vērtība ir vienāda, kas praksē nozīmē, ka varbūtība, ka maksimālā gaisa temperatūra plkst. jebkura konkrētā gada diena būs augstāka, atšķiras no vidējās vērtības, augstāka pilsētai, kas atrodas iekšzemē.

    Sports

    Pieņemsim, ka ir vairākas futbola komandas, kuras tiek vērtētas pēc kāda parametru kopuma, piemēram, gūto un ielaisto vārtu skaits, vārtu gūšanas iespējas utt. Visticamāk, ka šīs grupas labākajai komandai būs labākas vērtības. par vairākiem parametriem. Jo mazāka ir komandas standarta novirze katram no uzrādītajiem parametriem, jo ​​prognozējamāks ir komandas rezultāts, šādas komandas ir līdzsvarotas. Savukārt komandai ar lielu standartnovirzi ir grūti prognozēt rezultātu, kas savukārt skaidrojams ar nelīdzsvarotību, piemēram, spēcīga aizsardzība, bet vājš uzbrukums.

    Komandu parametru standartnovirzes izmantošana ļauj vienā vai otrā pakāpē prognozēt divu komandu spēles rezultātu, novērtējot komandu stiprās un vājās puses un līdz ar to arī izvēlētās cīņas metodes.

    Tehniskā analīze

    Skatīt arī

    Literatūra

    * Borovikovs, V. STATISTIKA. Datu analīzes māksla datorā: Profesionāļiem / V. Borovikovs. - Sanktpēterburga. : Pēteris, 2003. - 688 lpp. - ISBN 5-272-00078-1.

    Izkliede ir katras atribūta vērtības kvadrātu noviržu vidējais aritmētiskais no kopējās vidējās vērtības. Atkarībā no avota datiem dispersija var būt nesvērta (vienkārša) vai svērta.

    Dispersiju aprēķina, izmantojot šādas formulas:

    · negrupētiem datiem

    · grupētiem datiem

    Svērtās dispersijas aprēķināšanas procedūra:

    1. noteikt vidējo aritmētisko svērto

    2. noteiktas varianta novirzes no vidējā

    3. kvadrātā katras iespējas novirzi no vidējā

    4. reiziniet noviržu kvadrātus ar svariem (frekvencēm)

    5. apkopojiet iegūtos produktus

    6. iegūto summu dala ar skalu summu

    Formulu dispersijas noteikšanai var pārvērst šādā formulā:

    Vienkārši

    Dispersijas aprēķināšanas procedūra ir vienkārša:

    1. noteikt vidējo aritmētisko

    2. kvadrātā vidējo aritmētisko

    3. katru rindas opciju apzīmē kvadrātā

    4. atrast kvadrātu summas opciju

    5. kvadrātu summu dala ar to skaitu, t.i. noteikt vidējo kvadrātu

    6. nosaka atšķirību starp raksturlieluma vidējo kvadrātu un vidējā kvadrātu

    Arī svērtās dispersijas noteikšanas formulu var pārvērst šādā formulā:

    tie. dispersija ir vienāda ar starpību starp atribūta vidējo vērtību kvadrātā un aritmētiskā vidējā kvadrātu. Izmantojot pārveidoto formulu, tiek novērsta papildu procedūra raksturlieluma atsevišķu vērtību noviržu aprēķināšanai no x un tiek novērsta kļūda aprēķinā, kas saistīta ar noviržu noapaļošanu.

    Dispersijai ir vairākas īpašības, no kurām dažas atvieglo aprēķināšanu:

    1) konstantas vērtības dispersija ir nulle;

    2) ja visi atribūtu vērtību varianti tiek samazināti par vienādu skaitli, tad dispersija nesamazināsies;

    3) ja visi atribūtu vērtību varianti tiek samazināti par vienādu reižu skaitu (reizes), tad dispersija samazināsies par koeficientu

    Standarta novirze S- apzīmē dispersijas kvadrātsakni:

    · negrupētiem datiem:

    · variāciju sērijai:

    Izmaiņu diapazons, lineārais vidējais un standartnovirze tiek nosaukts par lielumiem. Tām ir tādas pašas mērvienības kā individuālajām raksturīgām vērtībām.

    Variance un standarta novirze ir visplašāk izmantotie variācijas mēri. Tas izskaidrojams ar to, ka tie ir iekļauti lielākajā daļā varbūtību teorijas teorēmu, kas kalpo par matemātiskās statistikas pamatu. Turklāt dispersiju var sadalīt tās komponentos, ļaujot novērtēt dažādu faktoru ietekmi, kas nosaka pazīmes variāciju.

    Izmaiņu rādītāju aprēķins bankām, kas sagrupētas pēc peļņas normas, parādīts tabulā.

    Peļņas summa, miljoni rubļu. Banku skaits aprēķinātie rādītāji
    3,7 - 4,6 (-) 4,15 8,30 -1,935 3,870 7,489
    4,6 - 5,5 5,05 20,20 - 1,035 4,140 4,285
    5,5 - 6,4 5,95 35,70 - 0,135 0,810 0,109
    6,4 - 7,3 6,85 34,25 +0,765 3,825 2,926
    7,3 - 8,2 7,75 23,25 +1,665 4,995 8,317
    Kopā: 121,70 17,640 23,126

    Vidējā lineārā un standarta novirze parāda, cik lielā mērā raksturlieluma vērtība vidēji svārstās starp vienībām un pētāmo populāciju. Tātad šajā gadījumā vidējās peļņas svārstības ir: pēc vidējās lineārās novirzes 0,882 miljoni rubļu; pēc standarta novirzes - 1,075 miljoni rubļu. Standarta novirze vienmēr ir lielāka par vidējo lineāro novirzi. Ja raksturlieluma sadalījums ir tuvs normālam, tad pastāv saistība starp S un d: S=1,25d vai d=0,8S. Standarta novirze parāda, kā lielākā daļa populācijas vienību atrodas attiecībā pret vidējo aritmētisko. Neatkarīgi no sadalījuma formas 75 atribūta vērtības ietilpst intervālā x 2S, un vismaz 89 no visām vērtībām ietilpst intervālā x 3S (P. L. Čebiševa teorēma).

    vidējā vērtība- tas ir vispārīgs statistiskās populācijas rādītājs, kas novērš individuālās atšķirības statistisko lielumu vērtībās, ļaujot salīdzināt dažādas populācijas savā starpā.

    Pastāv 2 klases vidējās vērtības: un .

    Strukturālie vidējie rādītāji ietver mode Un mediāna, bet visbiežāk izmanto jaudas vidējie rādītāji dažādi veidi.

    Jaudas vidējie rādītāji

    Vidējie jaudas rādītāji var būt vienkārši Un svērtais.

    Vienkāršs vidējais aprēķina, ja ir divi vai vairāk negrupēts statistiskie lielumi, kas sakārtoti nejaušā secībā pēc šādas vispārīgas formulas:

    Vidējais svērtais aprēķināja sagrupēti statistiskās vērtības, izmantojot šādu vispārīgo formulu:

    kur X ir atsevišķu statistisko vērtību vērtības vai grupēšanas intervālu vidus;
    m ir eksponents, kura vērtība nosaka sekojošo jaudas vidējo vērtību veidi:
    pie m = -1;
    pie m = 0;
    kad m = 1;
    pie m = 2;
    pie m = 3.

    Izmantojot vispārīgas formulas vienkāršiem un svērtajiem vidējiem rādītājiem dažādiem eksponentiem m, mēs iegūstam katra veida īpašas formulas, kas tiks sīkāk aplūkotas turpmāk.

    Vidējais aritmētiskais

    Vidējais aritmētiskais- šī ir visbiežāk lietotā vidējā vērtība, ko iegūst, vispārīgajā formulā aizstājot m=1. Vidējais aritmētiskais vienkārši ir šāda forma:

    kur X ir to daudzumu vērtības, kuriem jāaprēķina vidējā vērtība; N ir kopējais X vērtību skaits (vienību skaits pētāmajā populācijā).

    Piemēram, skolēns nokārtoja 4 eksāmenus un saņēma šādas atzīmes: 3, 4, 4 un 5. Aprēķināsim vidējo punktu skaitu, izmantojot vienkāršu aritmētisko vidējo formulu: (3+4+4+5)/4 = 16/4 = 4.

    Vidējais aritmētiskais svērtais ir šāda forma:

    Kur f ir daudzumu skaits ar vienādu vērtību X (biežums).

    Piemēram, skolēns nokārtoja 4 eksāmenus un saņēma šādas atzīmes: 3, 4, 4 un 5. Aprēķināsim vidējo punktu skaitu, izmantojot vidējo svērto aritmētisko formulu: (3*1 + 4*2 + 5*1)/4 = 16/4 = 4.

    Ja X vērtības ir norādītas kā intervāli, tad aprēķiniem tiek izmantoti X intervālu viduspunkti, kas tiek definēti kā intervāla augšējās un apakšējās robežas pussumma. Un, ja intervālam X nav apakšējās vai augšējās robežas (atvērtais intervāls), tad, lai to atrastu, izmantojiet blakus esošā intervāla X diapazonu (starpība starp augšējo un apakšējo robežu).

    Piemēram, uzņēmumā strādā 10 darbinieki ar pieredzi līdz 3 gadiem, 20 ar stāžu no 3 līdz 5 gadiem, 5 darbinieki ar vairāk nekā 5 gadu pieredzi. Pēc tam mēs aprēķinām darbinieku vidējo darba stāžu, izmantojot vidējo svērto aritmētisko formulu, par X ņemot darba stāža intervālu viduspunktu (2, 4 un 6 gadi):
    (2*10+4*20+6*5)/(10+20+5) = 3,71 gadi.

    Visbiežāk tiek izmantots vidējais aritmētiskais, taču ir gadījumi, kad nepieciešams izmantot cita veida vidējos. Apskatīsim šādus gadījumus tālāk.

    Harmoniskais vidējais

    Harmoniskais vidējais tiek izmantots, ja avota datos nav frekvenču f atsevišķām X vērtībām, bet tie tiek parādīti kā to reizinājums Xf. Apzīmējot Xf=w, izsakām f=w/X un, aizstājot šos apzīmējumus vidējā aritmētiskā svērtā formulā, iegūstam harmoniskā svērtā vidējā formula:

    Tādējādi vidējo svērto harmonisko vērtību izmanto, ja frekvences f nav zināmas un w=Xf ir zināmas. Gadījumos, kad visas w = 1, tas ir, atsevišķas X vērtības rodas vienreiz, tiek piemērota vidējā harmoniskā galvenā formula:

    Piemēram, automašīna brauca no punkta A uz punktu B ar ātrumu 90 km/h un atpakaļ ar ātrumu 110 km/h. Lai noteiktu vidējo ātrumu, izmantojam vidējās harmonikas vienkāršās formulas, jo piemērā ir dots attālums w 1 =w 2 (attālums no punkta A līdz punktam B ir tāds pats kā no B līdz A), kas ir vienāds ar ātruma (X) un laika (f) reizinājumu. Vidējais ātrums = (1+1)/(1/90+1/110) = 99 km/h.

    Ģeometriskais vidējais

    Ģeometriskais vidējais izmanto, lai noteiktu vidējās relatīvās izmaiņas, kā tas ir apspriests tēmā Dinamiskās rindas. Ģeometriskais vidējais dod visprecīzāko vidējo rezultātu, ja uzdevums ir atrast X vērtību, kas būtu vienādā attālumā gan no X maksimālās, gan minimālās vērtības.

    Piemēram, no 2005. līdz 2008. gadam inflācijas indekss Krievijā bija: 2005. gadā - 1,109; 2006.gadā - 1090; 2007.gadā - 1119; 2008. gadā - 1133. Tā kā inflācijas indekss ir relatīvas izmaiņas (dinamiskais indekss), vidējā vērtība jāaprēķina, izmantojot ģeometrisko vidējo: (1,109*1,090*1,119*1,133)^(1/4) = 1,1126, tas ir, par periodu no 2005. līdz 2008. gadam cenas ik gadu pieauga vidēji par 11,26%. Kļūdains aprēķins, izmantojot vidējo aritmētisko, dotu nepareizu rezultātu 11,28%.

    Vidējais kvadrāts

    Vidējais kvadrāts izmanto gadījumos, kad X sākotnējās vērtības var būt gan pozitīvas, gan negatīvas, piemēram, aprēķinot vidējās novirzes.

    Kvadrātiskā vidējā lieluma galvenais pielietojums ir X vērtību variācijas mērīšana, kas tiks apspriesta.

    Vidējais kub

    Vidējais kub tiek izmantots ārkārtīgi reti, piemēram, aprēķinot nabadzības indeksus jaunattīstības valstīm (TIN-1) un attīstītajām valstīm (TIN-2), ko ierosinājusi un aprēķina ANO.

    Strukturālie vidējie rādītāji

    Uz visbiežāk lietotajiem strukturālais vidējais iekļaut un .

    Statistikas režīms

    Statistikas režīms ir visbiežāk atkārtotā X vērtība statistiskajā populācijā.

    Ja ir dots X diskrēti, tad režīms tiek noteikts bez aprēķina kā objekta vērtība ar visaugstāko frekvenci. Statistiskajā populācijā ir 2 vai vairāk režīmi, tad tas tiek ņemts vērā bimodāls(ja ir divi režīmi) vai multimodāls(ja ir vairāk nekā divi režīmi), un tas norāda uz populācijas neviendabīgumu.

    Piemēram, uzņēmumā strādā 16 cilvēki: 4 no tiem ir 1 gada pieredze, 3 cilvēkiem ir 2 gadu pieredze, 5 ir 3 gadi, bet 4 cilvēkiem ir 4 gadu pieredze. Tādējādi modālā pieredze Mo = 3 gadi, jo šīs vērtības biežums ir maksimālais (f = 5).

    Ja ir dots X vienādos intervālos, tad modālais intervāls vispirms tiek definēts kā intervāls ar augstāko frekvenci f. Šajā intervālā režīma nosacītā vērtība tiek atrasta, izmantojot formulu:

    Kur Mo ir mode;
    X NMo – modālā intervāla apakšējā robeža;
    h Mo ir modālā intervāla diapazons (starpība starp tā augšējo un apakšējo robežu);
    f Mo – modālā intervāla frekvence;
    f Mo-1 – intervāla biežums pirms modālā;
    f Mo+1 – modālajam sekojošā intervāla biežums.

    Piemēram, uzņēmumā strādā 10 darbinieki ar pieredzi līdz 3 gadiem, 20 ar stāžu no 3 līdz 5 gadiem, 5 darbinieki ar vairāk nekā 5 gadu pieredzi. Aprēķināsim modālā darba pieredzi modālā intervālā no 3 līdz 5 gadiem: Mo = 3 + 2*(20-10)/(2*20-10-5) = 3,8 (gadi).

    Ja intervālu h diapazons ir atšķirīgs, tad frekvenču f vietā ir jāizmanto intervālu blīvumi, kas aprēķināti, dalot frekvences f ar intervāla h diapazonu.

    Statistiskā mediāna

    Statistiskā mediāna– šī ir daudzuma X vērtība, kas augošā vai dilstošā secībā sakārtotu statistisko kopu sadala 2 vienādās daļās. Rezultātā vienas puses vērtība ir lielāka par vidējo, bet otrai pusei ir vērtība, kas ir mazāka par vidējo.

    Ja ir dots X diskrēti, tad, lai noteiktu mediānu, visas vērtības ir numurētas no 0 līdz N augošā secībā, tad mediāna pāra skaitļa N atradīsies pa vidu starp X ar skaitļiem 0,5N un (0,5N+1), un nepāra skaitļa N tā atbildīs X vērtībai ar skaitli 0,5(N+1) .

    Piemēram, ir dati par nepilna laika studentu vecumu 10 cilvēku grupā - X: 18, 19, 19, 20, 21, 23, 23, 25, 28, 30 gadi. Šie dati jau ir sakārtoti augošā secībā, un to skaits N=10 ir pāra, tātad mediāna būs starp X ar skaitļiem 0.5*10=5 un (0.5*10+1)=6, kas atbilst vērtībām X 5 = 21 un X 6 = 23, tad mediāna: Me = (21+23)/2 = 22 (gadi).

    Ja formā norādīts X vienādos intervālos, tad vispirms tiek noteikts mediānas intervāls (intervāls, kurā beidzas viena puse no frekvencēm f un sākas otra puse), kurā mediānas nosacīto vērtību nosaka, izmantojot formulu:

    Kur Es ir mediāna;
    X НМе – vidējā intervāla apakšējā robeža;
    h Ме – vidējā intervāla diapazons (starpība starp tā augšējo un apakšējo robežu);
    f Ме – vidējā intervāla biežums;
    f Ме-1 – intervālu frekvenču summa pirms mediānas.

    Iepriekš aplūkotajā piemērā, aprēķinot modālo darba stāžu (uzņēmumā strādā 10 darbinieki ar stāžu līdz 3 gadiem, 20 ar stāžu no 3 līdz 5 gadiem, 5 darbinieki ar stāžu vairāk par 5 gadiem), aprēķina mediānu. darba stāžs. Puse no kopējā strādājošo skaita ir (10+20+5)/2 = 17,5 un ir intervālā no 3 līdz 5 gadiem, un pirmajā intervālā līdz 3 gadiem ir tikai 10 strādnieki, bet pirmajos divos. - (10+20) =30, kas ir vairāk nekā 17,5, nozīmē, ka intervāls no 3 līdz 5 gadiem ir mediāna. Tās iekšpusē nosakām mediānas nosacīto vērtību: Me = 3+2*(0,5*30-10)/20 = 3,5 (gadi).

    Tāpat kā režīma gadījumā, nosakot mediānu, ja intervālu h diapazons ir atšķirīgs, tad frekvenču f vietā ir jāizmanto intervālu blīvumi, kas aprēķināti, dalot frekvences f ar intervāla h diapazonu.

    Variācijas rādītāji

    Variācija ir starpība starp X vērtību vērtībām atsevišķām statistiskās populācijas vienībām. Lai izpētītu variācijas stiprumu, tiek aprēķināti šādi variācijas rādītāji: , , , , .

    Variāciju diapazons

    Variāciju diapazons ir atšķirība starp X maksimālo un minimālo vērtību, kas pieejama pētāmajā statistiskajā populācijā:

    H trūkums ir tāds, ka tas parāda tikai maksimālo X vērtību atšķirību un nevar izmērīt variācijas stiprumu visā populācijā.

    Vidējā lineārā novirze

    Vidējā lineārā novirze ir vidējais modulis X vērtību novirzēm no vidējā aritmētiskā. To var aprēķināt, izmantojot vidējo aritmētisko formulu vienkārši- saņemam :

    Piemēram, skolēns nokārtoja 4 eksāmenus un saņēma šādas atzīmes: 3, 4, 4 un 5. = 4. Aprēķināsim vienkāršu vidējo lineāro novirzi: L = (|3-4|+|4-4|+|4 -4|+| 5-4|)/4 = 0,5.

    Ja avota dati X ir sagrupēti (ir frekvences f), tad vidējo lineāro novirzi aprēķina, izmantojot vidējo aritmētisko formulu svērtais- saņemam :

    Atgriezīsimies pie piemēra par skolēnu, kurš nokārtoja 4 eksāmenus un saņēma šādas atzīmes: 3, 4, 4 un 5. = 4 un = 0,5. Aprēķināsim vidējo svērto lineāro novirzi: L = (|3-4|*1+|4-4|*2+|5-4|*1)/4 = 0,5.

    Lineārais variācijas koeficients

    Lineārais variācijas koeficients ir vidējās lineārās novirzes attiecība pret vidējo aritmētisko:

    Izmantojot lineāro variācijas koeficientu, var salīdzināt dažādu populāciju variācijas, jo atšķirībā no vidējās lineārās novirzes tās vērtība nav atkarīga no mērvienībām X.

    Aplūkojamajā piemērā par skolēnu, kurš nokārtojis 4 eksāmenus un saņēmis šādas atzīmes: 3, 4, 4 un 5, lineārais variācijas koeficients būs 0,5/4 = 0,125 jeb 12,5%.

    Izkliede

    Izkliede ir X vērtību noviržu vidējais kvadrāts no vidējā aritmētiskā. Izkliedi var aprēķināt, izmantojot vidējo aritmētisko formulu vienkārši- saņemam vienkārša dispersija:

    Mums jau pazīstamajā piemērā par skolēnu, kurš nokārtoja 4 eksāmenus un saņēma atzīmi: 3, 4, 4 un 5, = 4. Tad dispersija ir vienkārša D = ((3-4) 2 +(4-4) 2 +(4-4) 2 +(5-4) 2)/4 = 0,5.

    Ja sākotnējie dati X ir sagrupēti (ir biežumi f), tad dispersiju aprēķina, izmantojot vidējo aritmētisko formulu svērtais- saņemam dispersijas svērtais:

    Aplūkojamajā piemērā par skolēnu, kurš nokārtojis 4 eksāmenus un saņēmis šādas atzīmes: 3, 4, 4 un 5, mēs aprēķinām svērto dispersiju: ​​D = ((3-4) 2 *1+(4-4) 2 *2+(5-4)2*1)/4 = 0,5.

    Ja pārveidojat dispersijas formulu (atveriet iekavas skaitītājā, sadaliet vārdu pa vārdam ar saucēju un dodiet līdzīgus), tad varat iegūt citu formulu, lai to aprēķinātu kā starpību starp vidējo kvadrātu un vidējo kvadrātu:

    To ir pat vieglāk atrast standarta novirze, ja dispersija ir iepriekš aprēķināta kā tās kvadrātsakne:

    Iepriekš minētajā piemērā par studentu mēs atrodam standarta novirzi kā kvadrātsakni no tās: .

    Kvadrātiskais variācijas koeficients

    Kvadrātiskais variācijas koeficients ir vispopulārākais relatīvais variācijas mērs:

    Kritērija vērtība Kvadrātiskais variācijas koeficients V ir 0,333 vai 33,3%, tas ir, ja V ir mazāks vai vienāds ar 0,333, variācija tiek uzskatīta par vāju, un, ja tā ir lielāka par 0,333, tā tiek uzskatīta par spēcīgu. Spēcīgu variāciju gadījumā tiek ņemta vērā pētītā statistiskā populācija neviendabīgs, un vidējā vērtība ir netipiski un to nevar izmantot kā vispārēju šīs populācijas rādītāju.

    Piemērā par studentu, kurā iepriekš , mēs atrodam variācijas kvadrātisko koeficientu V = 0,707/4 = 0,177, kas ir mazāks par kritērija vērtību 0,333, kas nozīmē, ka variācija ir vāja un vienāda ar 17,7%.

    Dispersijas kvadrātsakni sauc par standarta novirzi no vidējās vērtības, ko aprēķina šādi:

    Standartnovirzes formulas elementāra algebriskā transformācija noved pie šādas formas:

    Bieži vien šī formula aprēķinu praksē izrādās ērtāka.

    Standarta novirze, tāpat kā vidējā lineārā novirze, parāda, cik vidēji konkrētās raksturlieluma vērtības atšķiras no to vidējās vērtības. Standarta novirze vienmēr ir lielāka par vidējo lineāro novirzi. Starp tām pastāv šādas attiecības:

    Zinot šo attiecību, jūs varat izmantot zināmos rādītājus, lai noteiktu nezināmo, piemēram, bet (I aprēķināt a un otrādi. Standarta novirze mēra raksturlieluma mainīguma absolūto lielumu un tiek izteikta tādās pašās mērvienībās kā raksturlieluma vērtības (rubļi, tonnas, gadi utt.). Tas ir absolūts variācijas mērs.

    Priekš alternatīvas zīmes, piemēram, augstākās izglītības esamība vai neesamība, apdrošināšana, dispersijas un standartnovirzes formulas ir šādas:

    Parādīsim standartnovirzes aprēķinu pēc diskrētas rindas datiem, kas raksturo studentu sadalījumu vienā no augstskolas fakultātēm pēc vecuma (6.2. tabula).

    6.2. tabula.

    Papildaprēķinu rezultāti ir doti tabulas 2.-5.ailē. 6.2.

    Skolēna vidējo vecumu, gadi, nosaka pēc vidējās svērtās aritmētiskās formulas (2. aile):

    Skolēna individuālā vecuma novirzes kvadrātā no vidējā ir ietvertas 3.-4.ailē, bet noviržu kvadrātā produkti un atbilstošās frekvences ir ietvertas 5.ailē.

    Atrodam skolēnu vecuma, gadu dispersiju, izmantojot formulu (6.2):

    Tad o = l/3,43 1,85 *oda, t.i. Katra konkrēta skolēna vecuma vērtība atšķiras no vidējā par 1,85 gadiem.

    Variācijas koeficients

    Absolūtajā vērtībā standarta novirze ir atkarīga ne tikai no raksturlieluma variācijas pakāpes, bet arī no opciju absolūtajiem līmeņiem un vidējā. Tāpēc nav iespējams tieši salīdzināt variāciju rindu standartnovirzes ar dažādiem vidējiem līmeņiem. Lai varētu veikt šādu salīdzinājumu, jāatrod vidējās novirzes (lineārās vai kvadrātiskās) daļa aritmētiskajā vidējā, izteikta procentos, t.i. aprēķināt relatīvie variācijas rādītāji.

    Lineārais variācijas koeficients aprēķina pēc formulas

    Variācijas koeficients nosaka pēc šādas formulas:

    Variācijas koeficientos tiek novērsta ne tikai nesalīdzināmība, kas saistīta ar dažādām pētāmā raksturlieluma mērvienībām, bet arī nesalīdzināmība, kas rodas vidējo aritmētisko vērtību atšķirību dēļ. Turklāt variācijas rādītāji raksturo populācijas viendabīgumu. Populāciju uzskata par viendabīgu, ja variācijas koeficients nepārsniedz 33%.

    Saskaņā ar tabulu. 6.2 un iepriekš iegūtos aprēķinu rezultātus, variācijas koeficientu, %, nosaka pēc formulas (6.3):

    Ja variācijas koeficients pārsniedz 33%, tas norāda uz pētāmās populācijas neviendabīgumu. Mūsu gadījumā iegūtā vērtība liecina, ka skolēnu populācija pēc vecuma ir viendabīga pēc sastāva. Tādējādi svarīga variācijas rādītāju vispārināšanas funkcija ir novērtēt vidējo vērtību ticamību. Jo mazāk c1, a2 un V, jo viendabīgāka ir iegūtā parādību kopa un ticamāks ir iegūtais vidējais rādītājs. Atbilstoši matemātiskās statistikas aplūkotajam “trīs sigmu likumam”, normāli sadalītās vai tām tuvās rindās novirzes no vidējā aritmētiskā, kas nepārsniedz ±3., rodas 997 gadījumos no 1000. Tātad, zinot X un a, jūs varat iegūt vispārēju sākotnējo priekšstatu par variāciju sēriju. Ja, piemēram, darbinieka vidējā alga uzņēmumā ir 25 000 rubļu, un a ir 100 rubļu, tad ar varbūtību, kas ir tuvu pārliecībai, varam teikt, ka uzņēmuma darbinieku algas svārstās robežās (25 000 ± ± 3 x 100 ) t.i. no 24 700 līdz 25 300 rubļiem.