Да вляза
Всички компютърни тайни за начинаещи и професионалисти
  • За начинаещ потребител: разлики между софтуерните продукти на програмната система 1C:Enterprise
  • Програма 1s 8.3 демо версия. Мобилно приложение "UNF" НОВО
  • Създаване на 1C управление на нашата компания от нулата
  • Warface безплатна регистрация
  • Регистрация в играта World Of Tanks – какво трябва да знаете?
  • Стратегия и тактика на Starcraft II
  • Формула на Ско. Статистически параметри. Средно линейно и квадратично отклонение

    Формула на Ско.  Статистически параметри.  Средно линейно и квадратично отклонение

    Приблизителен метод за оценка на променливостта на вариационна серия е да се определи границата и амплитудата, но стойностите на варианта в серията не се вземат предвид. Основната общоприета мярка за променливостта на количествена характеристика в рамките на вариационна серия е стандартно отклонение (σ - сигма). Колкото по-голямо е стандартното отклонение, толкова по-висока е степента на флуктуация на тази серия.

    Методът за изчисляване на стандартното отклонение включва следните стъпки:

    1. Намерете средното аритметично (M).

    2. Определяне на отклоненията на отделните варианти от средноаритметичното (d=V-M). В медицинската статистика отклоненията от средната стойност се означават с d (deviate). Сумата от всички отклонения е нула.

    3. Квадратирайте всяко отклонение d 2.

    4. Умножете квадратите на отклоненията по съответните честоти d 2 *p.

    5. Намерете сбора на произведенията å(d 2 *p)

    6. Изчислете стандартното отклонение по формулата:

    Когато n е по-голямо от 30 или когато n е по-малко или равно на 30, където n е броят на всички опции.

    Стойност на стандартното отклонение:

    1. Стандартното отклонение характеризира разпространението на варианта спрямо средната стойност (т.е. променливостта на серията от варианти). Колкото по-голяма е сигмата, толкова по-висока е степента на разнообразие на тази серия.

    2. Стандартното отклонение се използва за сравнителна оценка на степента на съответствие на средната аритметична стойност с вариационната серия, за която е изчислена.

    Вариациите на масовите явления се подчиняват на закона за нормалното разпределение. Кривата, представяща това разпределение, изглежда като гладка симетрична крива с форма на камбана (крива на Гаус). Според теорията на вероятностите при явления, които се подчиняват на закона за нормалното разпределение, съществува строга математическа зависимост между стойностите на средното аритметично и стандартното отклонение. Теоретичното разпределение на вариант в хомогенна вариационна серия се подчинява на правилото на трите сигми.

    Ако в система от правоъгълни координати стойностите на количествена характеристика (варианти) са нанесени на абсцисната ос, а честотата на поява на вариант в вариационна серия е нанесена на ординатната ос, тогава вариантите с по-големи и по-малки стойностите са равномерно разположени отстрани на средноаритметичната стойност.



    Установено е, че при нормално разпределение на признака:

    68,3% от стойностите на варианта са в рамките на M±1s

    95,5% от стойностите на варианта са в рамките на M±2s

    99,7% от стойностите на варианта са в рамките на M±3s

    3. Стандартното отклонение ви позволява да установите нормални стойности за клинични и биологични параметри. В медицината интервалът M±1s обикновено се приема като нормален диапазон за изследваното явление. Отклонението на изчислената стойност от средноаритметичната с повече от 1s показва отклонение на изследвания параметър от нормата.

    4. В медицината правилото на трите сигми се използва в педиатрията за индивидуална оценка на нивото на физическо развитие на децата (метод на сигма отклонение), за разработване на стандарти за детско облекло

    5. Стандартното отклонение е необходимо за характеризиране на степента на разнообразие на изследваната характеристика и за изчисляване на грешката на средната аритметична стойност.

    Стойността на стандартното отклонение обикновено се използва за сравняване на променливостта на серии от същия тип. Ако се сравнят две серии с различни характеристики (ръст и тегло, средна продължителност на болнично лечение и болнична смъртност и др.), тогава директното сравнение на сигма размерите е невъзможно , защото стандартното отклонение е наименована стойност, изразена в абсолютни числа. В тези случаи използвайте коефициент на вариация (Cv), което е относителна стойност: процентното съотношение на стандартното отклонение към средното аритметично.

    Коефициентът на вариация се изчислява по формулата:

    Колкото по-висок е коефициентът на вариация , толкова по-голяма е променливостта на тази серия. Смята се, че коефициент на вариация над 30% показва качествената хетерогенност на популацията.

    При статистическо тестване на хипотези, когато се измерва линейна зависимост между случайни променливи.

    Стандартно отклонение:

    Стандартно отклонение(оценка на стандартното отклонение на случайната променлива Под, стените около нас и таванът, хспрямо неговото математическо очакване въз основа на безпристрастна оценка на неговата дисперсия):

    къде е дисперсията; - Подът, стените около нас и таванът, азелемент на селекцията; - размер на извадката; - средно аритметично от извадката:

    Трябва да се отбележи, че и двете оценки са пристрастни. В общия случай е невъзможно да се изгради безпристрастна оценка. Въпреки това оценката, базирана на безпристрастната оценка на дисперсията, е последователна.

    Правилото на трите сигми

    Правилото на трите сигми() - почти всички стойности на нормално разпределена случайна променлива лежат в интервала. По-стриктно - с не по-малко от 99,7% доверие, стойността на нормално разпределена случайна променлива се намира в посочения интервал (при условие, че стойността е вярна и не е получена в резултат на обработка на извадката).

    Ако истинската стойност е неизвестна, тогава не трябва да използваме, а пода, стените около нас и тавана, с. Така правилото на трите сигми се трансформира в правилото на трите етажа, стените около нас и тавана, с .

    Интерпретация на стойността на стандартното отклонение

    Голяма стойност на стандартното отклонение показва голямо разпространение на стойностите в представения набор със средната стойност на набора; малка стойност, съответно, показва, че стойностите в набора са групирани около средната стойност.

    Например, имаме три набора от числа: (0, 0, 14, 14), (0, 6, 8, 14) и (6, 6, 8, 8). И трите набора имат средни стойности, равни на 7, и стандартни отклонения, съответно равни на 7, 5 и 1. Последният набор има малко стандартно отклонение, тъй като стойностите в набора са групирани около средната стойност; първият набор има най-голямата стойност на стандартното отклонение - стойностите в рамките на набора се различават значително от средната стойност.

    В общ смисъл стандартното отклонение може да се счита за мярка за несигурност. Например във физиката стандартното отклонение се използва за определяне на грешката на поредица от последователни измервания на някакво количество. Тази стойност е много важна за определяне на правдоподобността на изследваното явление в сравнение със стойността, предвидена от теорията: ако средната стойност на измерванията се различава значително от стойностите, предвидени от теорията (голямо стандартно отклонение), тогава получените стойности или методът за получаването им трябва да бъдат проверени отново.

    Практическа употреба

    На практика стандартното отклонение ви позволява да определите колко стойностите в набор могат да се различават от средната стойност.

    Климат

    Да предположим, че има два града с еднаква средна максимална дневна температура, но единият е разположен на брега, а другият във вътрешността. Известно е, че градовете, разположени на брега, имат много различни максимални дневни температури, които са по-ниски от градовете, разположени във вътрешността. Следователно стандартното отклонение на максималните дневни температури за крайбрежен град ще бъде по-малко, отколкото за втория град, въпреки факта, че средната стойност на тази стойност е същата, което на практика означава, че вероятността максималната температура на въздуха на всеки ден от годината ще бъде по-висока разлика от средната стойност, по-висока за град, разположен във вътрешността на страната.

    спорт

    Да приемем, че има няколко футболни отбора, които са оценени по някакъв набор от параметри, например брой отбелязани и допуснати голове, шансове за гол и т.н. Най-вероятно е най-добрият отбор в тази група да има по-добри стойности по повече параметри. Колкото по-малко е стандартното отклонение на екипа за всеки от представените параметри, толкова по-предвидим е резултатът на отбора; такива екипи са балансирани. От друга страна, отбор с голямо стандартно отклонение трудно може да предвиди резултата, което от своя страна се обяснява с дисбаланс, например силна защита, но слаба атака.

    Използването на стандартното отклонение на параметрите на отбора позволява в една или друга степен да се прогнозира резултатът от мач между два отбора, като се оценяват силните и слабите страни на отборите и следователно избраните методи на борба.

    Технически анализ

    Вижте също

    Литература

    * Боровиков, В.СТАТИСТИКА. Изкуството на анализ на данни на компютър: За професионалисти / В. Боровиков. - Санкт Петербург. : Петър, 2003. - 688 с. - ISBN 5-272-00078-1.

    дисперсияе средноаритметичната стойност на квадратните отклонения на всяка стойност на атрибут от общата средна стойност. В зависимост от изходните данни дисперсията може да бъде непретеглена (проста) или претеглена.

    Дисперсията се изчислява по следните формули:

    · за негрупирани данни

    · за групирани данни

    Процедурата за изчисляване на претеглената дисперсия:

    1. определяне на среднопретеглената аритметична стойност

    2. определят се отклонения на варианта от средното

    3. повдигнете на квадрат отклонението на всяка опция от средната стойност

    4. умножете квадратите на отклоненията по тегла (честоти)

    5. обобщете получените продукти

    6. получената сума се разделя на сумата от везните

    Формулата за определяне на дисперсията може да се преобразува в следната формула:

    просто

    Процедурата за изчисляване на дисперсията е проста:

    1. определям средноаритметичното

    2. повдигнете на квадрат средното аритметично

    3. квадрат всяка опция в реда

    4. опция за намиране на сумата от квадрати

    5. разделете сумата на квадратите на техния брой, т.е. определяне на средния квадрат

    6. определяне на разликата между средния квадрат на характеристиката и квадрата на средната стойност

    Освен това формулата за определяне на претеглената дисперсия може да се преобразува в следната формула:

    тези. дисперсията е равна на разликата между средната стойност на квадратите на атрибута и квадрата на средната аритметична стойност. При използване на трансформираната формула се елиминира допълнителната процедура за изчисляване на отклоненията на индивидуалните стойности на характеристика от x и се елиминира грешката в изчислението, свързана със закръгляването на отклоненията

    Дисперсията има редица свойства, някои от които улесняват изчисляването:

    1) дисперсията на постоянна стойност е нула;

    2) ако всички варианти на стойностите на атрибута са намалени с едно и също число, тогава дисперсията няма да намалее;

    3) ако всички варианти на стойностите на атрибута са намалени с еднакъв брой пъти (кратно), тогава дисперсията ще намалее с фактор

    Стандартно отклонение S- представлява корен квадратен от дисперсията:

    · за негрупирани данни:

    · за вариационната серия:

    Диапазонът на вариация, линейната средна стойност и стандартното отклонение са именувани величини. Те имат същите мерни единици като отделните характерни стойности.

    Дисперсията и стандартното отклонение са най-широко използваните мерки за вариация. Това се обяснява с факта, че те са включени в повечето теореми на теорията на вероятностите, която служи като основа на математическата статистика. В допълнение, дисперсията може да бъде разложена на нейните съставни елементи, което позволява да се оцени влиянието на различни фактори, които определят вариацията на черта.

    Изчисляването на вариационните показатели за банките, групирани по норма на печалба, е показано в таблицата.

    Размер на печалбата, милиони рубли. Брой банки изчислени показатели
    3,7 - 4,6 (-) 4,15 8,30 -1,935 3,870 7,489
    4,6 - 5,5 5,05 20,20 - 1,035 4,140 4,285
    5,5 - 6,4 5,95 35,70 - 0,135 0,810 0,109
    6,4 - 7,3 6,85 34,25 +0,765 3,825 2,926
    7,3 - 8,2 7,75 23,25 +1,665 4,995 8,317
    Обща сума: 121,70 17,640 23,126

    Средното линейно и стандартно отклонение показват доколко стойността на дадена характеристика се колебае средно между единиците и изследваната популация. И така, в този случай средното колебание в печалбата е: според средното линейно отклонение, 0,882 милиона рубли; със стандартно отклонение - 1,075 милиона рубли. Стандартното отклонение винаги е по-голямо от средното линейно отклонение. Ако разпределението на характеристиката е близко до нормалното, тогава има връзка между S и d: S=1.25d, или d=0.8S. Стандартното отклонение показва как по-голямата част от единиците на съвкупността са разположени спрямо средната аритметична стойност. Независимо от формата на разпределението, 75 стойности на атрибута попадат в интервала x 2S и най-малко 89 от всички стойности попадат в интервала x 3S (теорема на P.L. Chebyshev).

    средна стойност- това е общ показател за статистическа популация, който елиминира индивидуалните разлики в стойностите на статистическите величини, което ви позволява да сравнявате различни популации помежду си.

    Съществува 2 класасредни стойности: и .

    Средните структурни стойности включват модаИ Медиана, но най-често се използва средни мощностиразлични видове.

    Средни мощности

    Средните мощности могат да бъдат простоИ претеглени.

    Обикновено средноизчислено, ако има две или повече негрупиранстатистически величини, подредени в случаен ред съгласно следната обща формула:

    Среднопретеглена стойностизчислено от групиранистатистически стойности, използвайки следната обща формула:

    Където X са стойностите на отделните статистически стойности или средата на груповите интервали;
    m е показател, чиято стойност определя следното видове средни мощности:
    при m = -1;
    при m = 0;
    когато m = 1;
    при m = 2;
    при m = 3.

    Използвайки общи формули за прости и претеглени средни за различни експоненти m, получаваме конкретни формули от всеки тип, които ще бъдат разгледани подробно по-долу.

    Средноаритметично

    Средноаритметично- това е най-често използваната средна стойност, която се получава чрез заместване на m=1 в общата формула. Средноаритметично простоима следната форма:

    Където X са стойностите на количествата, за които трябва да се изчисли средната стойност; N е общият брой на X стойностите (броят единици в изследваната популация).

    Например студент е издържал 4 изпита и е получил следните оценки: 3, 4, 4 и 5. Нека изчислим средния резултат, като използваме простата формула за средна аритметична стойност: (3+4+4+5)/4 = 16/4 = 4.

    Средноаритметично претеглениима следната форма:

    Където f е броят на величините с еднаква стойност X (честота).

    Например студент е издържал 4 изпита и е получил следните оценки: 3, 4, 4 и 5. Нека изчислим средния резултат, използвайки формулата за средноаритметично претеглено: (3*1 + 4*2 + 5*1)/4 = 16/4 = 4.

    Ако стойностите на X са посочени като интервали, тогава средните точки на интервалите X се използват за изчисления, които се определят като полусумата на горната и долната граница на интервала. И ако интервалът X няма долна или горна граница (отворен интервал), тогава, за да го намерите, използвайте диапазона (разликата между горната и долната граница) на съседния интервал X.

    Например едно предприятие има 10 служители с опит до 3 години, 20 с опит от 3 до 5 години, 5 служители с опит над 5 години. След това изчисляваме средната продължителност на трудовия стаж на служителите, като използваме формулата за среднопретеглена аритметична стойност, като за X приемаме средната точка на продължителността на служебните интервали (2, 4 и 6 години):
    (2*10+4*20+6*5)/(10+20+5) = 3,71 години.

    Най-често се използва средната аритметична стойност, но има моменти, когато е необходимо да се използват други видове средни стойности. Нека разгледаме по-нататък такива случаи.

    Средно хармонично

    Средно хармоничносе използва, когато изходните данни не съдържат честоти f за отделни X стойности, а се представят като техния продукт Xf. След като обозначихме Xf=w, изразяваме f=w/X и замествайки тези обозначения във формулата за средноаритметично претеглено, получаваме формулата за хармонично претеглено средно:

    Така претеглената хармонична средна стойност се използва, когато честотите f са неизвестни и w=Xf е известно. В случаите, когато всички w = 1, т.е. отделните стойности на X се срещат веднъж, се прилага средната хармонична проста формула:

    Например кола се е движила от точка А до точка Б със скорост 90 км/ч, а обратно със скорост 110 км/ч. За да определим средната скорост, прилагаме формулата за средната хармонична проста, тъй като в примера е дадено разстоянието w 1 =w 2 (разстоянието от точка А до точка В е същото като от точка В до А), което е равно на произведението на скоростта (X) и времето (f). Средна скорост = (1+1)/(1/90+1/110) = 99 км/ч.

    Средна геометрична

    Средна геометричнаизползвани при определяне на средните относителни промени, както е обсъдено в темата Динамични серии. Геометричната средна дава най-точния резултат от осредняването, ако задачата е да се намери стойност на X, която би била еднакво отдалечена както от максималната, така и от минималната стойност на X.

    Например между 2005 и 2008 г инфлационен индексв Русия е: през 2005 г. - 1,109; през 2006 г. - 1 090; през 2007 г. - 1 119; през 2008 г. - 1 133 бр. Тъй като индексът на инфлация е относителна промяна (динамичен индекс), средната стойност трябва да се изчисли с помощта на средната геометрична: (1,109*1,090*1,119*1,133)^(1/4) = 1,1126, т.е. за периода от 2005 г. до 2008 г. годишно цените нарастват средно с 11,26%. Грешно изчисление, използващо средно аритметично, би дало неправилен резултат от 11,28%.

    Среден квадрат

    Среден квадратизползва се в случаите, когато първоначалните стойности на X могат да бъдат както положителни, така и отрицателни, например при изчисляване на средни отклонения.

    Основното приложение на квадратичната средна стойност е за измерване на вариацията на стойностите X, които ще бъдат обсъдени.

    Среден куб

    Среден кубсе използва изключително рядко, например при изчисляване на индексите на бедност за развиващите се страни (TIN-1) и за развитите (TIN-2), предложени и изчислени от ООН.

    Структурни средни

    Към най-често използваните структурна среднавключват и .

    Статистически режим

    Статистически режиме най-често повтарящата се стойност на X в статистическа популация.

    Ако е дадено X дискретно, тогава режимът се определя без изчисление като стойност на признака с най-висока честота. В статистическа съвкупност има 2 или повече режима, тогава се разглежда бимодален(ако има два режима) или мултимодален(ако има повече от два режима) и това показва хетерогенността на популацията.

    Например във фирмата работят 16 души: 4 от тях с 1 година опит, 3 души с 2 години опит, 5 души с 3 години опит и 4 души с 4 години опит. По този начин модалният опит Mo = 3 години, тъй като честотата на тази стойност е максимална (f = 5).

    Ако е дадено X на равни интервали, тогава модалният интервал първо се дефинира като интервала с най-висока честота f. В рамките на този интервал условната стойност на режима се намира по формулата:

    Където Мо е модата;
    X NMo – долна граница на модалния интервал;
    h Mo е диапазонът на модалния интервал (разликата между горната и долната му граница);
    f Mo – честота на модалния интервал;
    f Mo-1 – честота на интервала, предхождащ модалния;
    f Mo+1 – честота на интервала, следващ модалния.

    Например едно предприятие има 10 служители с опит до 3 години, 20 с опит от 3 до 5 години, 5 служители с опит над 5 години. Нека изчислим модалния трудов стаж в модалния интервал от 3 до 5 години: Mo = 3 + 2*(20-10)/(2*20-10-5) = 3,8 (години).

    Ако обхватът на интервалите h е различен, тогава вместо честотите f е необходимо да се използват интервални плътности, изчислени чрез разделяне на честотите f на обхвата на интервала h.

    Статистическа медиана

    Статистическа медиана– това е стойността на величината X, която разделя подредена във възходящ или низходящ ред статистическа съвкупност на 2 равни части. В резултат на това едната половина има стойност, по-голяма от медианата, а другата половина има стойност, по-малка от медианата.

    Ако е дадено X дискретно, тогава за определяне на медианата всички стойности са номерирани от 0 до N във възходящ ред, тогава медианата за четно число N ще лежи по средата между X с числа 0,5N и (0,5N+1), а за нечетно число N ще съответства на стойността на X с число 0,5(N+1) .

    Така например има данни за възрастта на задочниците в група от 10 души – Х: 18, 19, 19, 20, 21, 23, 23, 25, 28, 30 години. Тези данни вече са подредени във възходящ ред и техният брой N=10 е четен, така че медианата ще бъде между X с числа 0,5*10=5 и (0,5*10+1)=6, които съответстват на стойностите X 5 = 21 и X 6 =23, тогава медианата: Me = (21+23)/2 = 22 (години).

    Ако X е дадено във формата равни интервали, тогава първо се определя средният интервал (интервалът, в който едната половина от честотите f завършва и другата половина започва), в който условната стойност на медианата се намира по формулата:

    Където Me е медианата;
    X НМе – долна граница на медианния интервал;
    h Ме – диапазонът на медианния интервал (разликата между горната и долната му граница);
    f Ме – честота на медианния интервал;
    f Ме-1 – сума от честотите на интервалите, предхождащи медианата.

    В разгледания по-горе пример, когато изчисляваме модалния трудов стаж (предприятието има 10 служители с до 3 години опит, 20 с 3 до 5 години опит, 5 служители с повече от 5 години опит), изчисляваме медианата продължителност на услуга. Половината от общия брой на работниците е (10+20+5)/2 = 17,5 и е в интервала от 3 до 5 години, като в първия интервал до 3 години има само 10 работници, а в първите два - (10+20) =30, което е повече от 17,5, означава, че интервалът от 3 до 5 години е медианата. Вътре в него определяме условната стойност на медианата: Me = 3+2*(0,5*30-10)/20 = 3,5 (години).

    Точно както в случая на режим, при определяне на медианата, ако обхватът на интервалите h е различен, тогава вместо честотите f е необходимо да се използват интервални плътности, изчислени чрез разделяне на честотите f на обхвата на интервала h.

    Вариационни индикатори

    Вариацияе разликата в стойностите на X стойностите за отделните единици на статистическата съвкупност. За да се изследва силата на вариацията, се изчислява следното индикатори за вариация: , , , , .

    Диапазон на вариация

    Диапазон на вариацияе разликата между максималните и минималните стойности на X, налични в изследваната статистическа популация:

    Недостатъкът на H е, че показва само максималната разлика в стойностите на X и не може да измери силата на вариация в цялата популация.

    Средно линейно отклонение

    Средно линейно отклонениее средният модул на отклоненията на стойностите X от средната аритметична стойност. Може да се изчисли по формулата за средно аритметично просто- получаваме :

    Например студент е издържал 4 изпита и е получил следните оценки: 3, 4, 4 и 5. = 4. Нека изчислим простото средно линейно отклонение: L = (|3-4|+|4-4|+|4 -4|+| 5-4|)/4 = 0,5.

    Ако изходните данни X са групирани (има честоти f), тогава средното линейно отклонение се изчислява с помощта на формулата за средна аритметична стойност претеглени- получаваме :

    Да се ​​върнем към примера със студент, който е издържал 4 изпита и е получил следните оценки: 3, 4, 4 и 5. = 4 и = 0,5. Нека изчислим среднопретегленото линейно отклонение: L = (|3-4|*1+|4-4|*2+|5-4|*1)/4 = 0,5.

    Линеен коефициент на вариация

    Линеен коефициент на вариацияе отношението на средното линейно отклонение към средното аритметично:

    Използвайки линейния коефициент на вариация, можете да сравните вариацията на различни популации, тъй като, за разлика от средното линейно отклонение, стойността му не зависи от мерните единици X.

    В разглеждания пример за студент, който е издържал 4 изпита и е получил следните оценки: 3, 4, 4 и 5, линейният коефициент на вариация ще бъде 0,5/4 = 0,125 или 12,5%.

    дисперсия

    дисперсияе средният квадрат на отклоненията на стойностите X от средната аритметична стойност. Дисперсията може да се изчисли с помощта на формулата за средна аритметична стойност просто- получаваме проста вариация:

    Във вече познатия ни пример за студент, който е издържал 4 изпита и е получил оценки: 3, 4, 4 и 5, = 4. Тогава дисперсията е проста D = ((3-4) 2 +(4-4) 2 +(4-4) 2 +(5-4) 2)/4 = 0,5.

    Ако първоначалните данни X са групирани (има честоти f), тогава дисперсията се изчислява с помощта на формулата за средно аритметично претеглени- получаваме дисперсия претеглена:

    В разглеждания пример за студент, който е издържал 4 изпита и е получил следните оценки: 3, 4, 4 и 5, изчисляваме претеглената дисперсия: D = ((3-4) 2 *1+(4-4) 2 *2+(5 -4) 2 *1)/4 = 0,5.

    Ако преобразувате формулата на дисперсията (отворете скобите в числителя, разделете термин по член на знаменателя и дадете подобни), тогава можете да получите друга формула за изчисляването й като разликата между средните квадрати и средната квадратна стойност:

    Дори е по-лесно да се намери стандартно отклонение, ако дисперсията е предварително изчислена като квадратен корен от нея:

    В примера за ученика, в който по-горе, намираме стандартното отклонение като корен квадратен от него: .

    Квадратичен коефициент на вариация

    Квадратичен коефициент на вариацияе най-популярната относителна мярка за вариация:

    Стойност на критерияКвадратният коефициент на вариация V е 0,333 или 33,3%, тоест, ако V е по-малко или равно на 0,333, вариацията се счита за слаба, а ако е по-голяма от 0,333, се счита за силна. В случай на силна вариация се взема предвид изследваната статистическа съвкупност разнородни, а средната стойност е нетипичени не може да се използва като общ показател за тази популация.

    В примера за ученик, в който по-горе намираме квадратичния коефициент на вариация V = 0,707/4 = 0,177, което е по-малко от стойността на критерия от 0,333, което означава, че вариацията е слаба и равна на 17,7%.

    Корен квадратен от дисперсията се нарича стандартно отклонение от средната стойност, което се изчислява, както следва:

    Елементарна алгебрична трансформация на формулата за стандартно отклонение я води до следния вид:

    Тази формула често се оказва по-удобна в изчислителната практика.

    Стандартното отклонение, подобно на средното линейно отклонение, показва колко средно специфични стойности на дадена характеристика се отклоняват от тяхната средна стойност. Стандартното отклонение винаги е по-голямо от средното линейно отклонение. Между тях има следната връзка:

    Познавайки това съотношение, можете да използвате известните индикатори, за да определите неизвестното, например, но (аз изчислете а и обратно. Стандартното отклонение измерва абсолютния размер на променливостта на дадена характеристика и се изразява в същите мерни единици като стойностите на характеристиката (рубли, тонове, години и т.н.). Това е абсолютна мярка за вариация.

    За алтернативни знаци, например наличие или липса на висше образование, осигуровки, формулите за дисперсия и стандартно отклонение са следните:

    Нека да покажем изчисляването на стандартното отклонение според данните от дискретна серия, характеризираща разпределението на студентите в един от университетските факултети по възраст (Таблица 6.2).

    Таблица 6.2.

    Резултатите от спомагателните изчисления са дадени в колони 2-5 на табл. 6.2.

    Средната възраст на ученика, години, се определя по формулата за средноаритметично претеглено (колона 2):

    Квадратните отклонения на индивидуалната възраст на ученика от средната се съдържат в колони 3-4, а произведенията на квадратните отклонения и съответните честоти се съдържат в колона 5.

    Намираме дисперсията на възрастта на учениците, години, използвайки формула (6.2):

    Тогава o = l/3,43 1,85 *oda, т.е. Всяка конкретна стойност на възрастта на ученика се отклонява от средната с 1,85 години.

    Коефициентът на вариация

    В своята абсолютна стойност стандартното отклонение зависи не само от степента на вариация на характеристиката, но и от абсолютните нива на опциите и средната стойност. Следователно е невъзможно директно да се сравнят стандартните отклонения на вариационни серии с различни средни нива. За да можете да направите такова сравнение, трябва да намерите дела на средното отклонение (линейно или квадратично) в средното аритметично, изразено като процент, т.е. изчисли относителни мерки на вариация.

    Линеен коефициент на вариация изчислено по формулата

    Коефициентът на вариация определя се по следната формула:

    В коефициентите на вариация се елиминира не само несравнимостта, свързана с различни единици за измерване на изследваната характеристика, но и несравнимостта, която възниква поради разликите в стойността на средните аритметични стойности. В допълнение, показателите за вариация характеризират хомогенността на съвкупността. Популацията се счита за хомогенна, ако коефициентът на вариация не надвишава 33%.

    Според таблицата. 6.2 и резултатите от изчисленията, получени по-горе, определяме коефициента на вариация,%, съгласно формула (6.3):

    Ако коефициентът на вариация надвишава 33%, това показва хетерогенността на изследваната популация. Получената стойност в нашия случай показва, че съвкупността от ученици по възраст е хомогенна по състав. По този начин важна функция на обобщаващите индикатори за вариация е да се оцени надеждността на средните стойности. По-малкото c1, a2 и V, толкова по-хомогенен е резултатният набор от явления и толкова по-надеждна е получената средна стойност. Съгласно „правилото на трите сигми“, разглеждано от математическата статистика, в нормално разпределени или близки до тях серии, отклонения от средната аритметична стойност, които не надвишават ±3, се срещат в 997 случая от 1000. Така, знаейки, х и a, можете да получите обща първоначална представа за серията вариации. Ако например средната заплата на служител в една компания е 25 000 рубли, а a е равна на 100 рубли, тогава с вероятност, близка до сигурност, можем да кажем, че заплатите на служителите на компанията варират в диапазона (25 000 ± ± 3 x 100 ), т.е. от 24 700 до 25 300 рубли.