İçeri gel
Yeni başlayanlar ve profesyoneller için tüm bilgisayar sırları
  • Acemi bir kullanıcı için: 1C:Enterprise program sisteminin yazılım ürünleri arasındaki farklar
  • Program 1s 8.3 demo sürümü. Mobil uygulama "UNF" YENİ
  • Şirketimizin 1C yönetimini sıfırdan kurmak
  • Warface'e ücretsiz kayıt
  • World Of Tanks oyununa kayıt – bilmeniz gerekenler nelerdir?
  • Starcraft II Stratejisi ve Taktikleri
  • Sco formülü. İstatistiksel parametreler. Ortalama doğrusal ve kare sapma

    Sco formülü.  İstatistiksel parametreler.  Ortalama doğrusal ve kare sapma

    Bir varyasyon serisinin değişkenliğini değerlendirmeye yönelik yaklaşık bir yöntem, limiti ve genliği belirlemektir ancak seri içindeki varyantın değerleri dikkate alınmaz. Bir varyasyon serisi içindeki niceliksel bir özelliğin değişkenliğinin genel olarak kabul edilen ölçüsü: standart sapma (σ - sigma). Standart sapma ne kadar büyük olursa, bu serinin dalgalanma derecesi de o kadar yüksek olur.

    Standart sapmayı hesaplama yöntemi aşağıdaki adımları içerir:

    1. Aritmetik ortalamayı (M) bulun.

    2. Bireysel seçeneklerin aritmetik ortalamadan (d=V-M) sapmalarını belirleyin. Tıbbi istatistiklerde ortalamadan sapmalar d (sapma) olarak belirtilir. Tüm sapmaların toplamı sıfırdır.

    3. Her sapmanın karesini alın d 2.

    4. Sapmaların karelerini karşılık gelen d 2 *p frekanslarıyla çarpın.

    5. å(d 2 *p) çarpımlarının toplamını bulun

    6. Aşağıdaki formülü kullanarak standart sapmayı hesaplayın:

    n, 30'dan büyük olduğunda veya n, 30'dan küçük veya ona eşit olduğunda; burada n, tüm seçeneklerin sayısıdır.

    Standart sapma değeri:

    1. Standart sapma, varyantın ortalama değere (yani varyasyon serisinin değişkenliğine) göre yayılmasını karakterize eder. Sigma ne kadar büyük olursa bu serinin çeşitlilik derecesi de o kadar yüksek olur.

    2. Standart sapma, aritmetik ortalamanın hesaplandığı varyasyon serisine uygunluk derecesinin karşılaştırmalı bir değerlendirmesi için kullanılır.

    Kütle olaylarının varyasyonları normal dağılım yasasına uyar. Bu dağılımı temsil eden eğri düzgün, çan şeklinde simetrik bir eğriye (Gauss eğrisi) benzer. Olasılık teorisine göre normal dağılım yasasına uyan olaylarda aritmetik ortalama ile standart sapma değerleri arasında sıkı bir matematiksel ilişki vardır. Homojen bir varyasyon serisindeki bir varyantın teorik dağılımı üç sigma kuralına uyar.

    Dikdörtgen koordinat sisteminde niceliksel bir özelliğin (varyantların) değerleri apsis ekseninde çizilirse ve bir varyasyon serisindeki bir değişkenin ortaya çıkma sıklığı ordinat ekseninde çizilirse, o zaman daha büyük ve daha küçük olan değişkenler değerler aritmetik ortalamanın yanlarında eşit olarak bulunur.



    Özelliğin normal dağılımı ile aşağıdakiler tespit edilmiştir:

    Varyant değerlerinin %68,3'ü M±1s dahilindedir

    Varyant değerlerinin %95,5'i M±2s dahilindedir

    Varyant değerlerinin %99,7'si M±3s dahilindedir

    3. Standart sapma, klinik ve biyolojik parametreler için normal değerler belirlemenizi sağlar. Tıpta M±1s aralığı genellikle incelenen fenomen için normal aralık olarak alınır. Tahmini değerin aritmetik ortalamadan 1 saniyeden fazla sapması, çalışılan parametrenin normdan saptığını gösterir.

    4. Tıpta, üç sigma kuralı pediatride çocukların fiziksel gelişim düzeyinin bireysel değerlendirilmesi (sigma sapma yöntemi), çocuk giyim standartlarının geliştirilmesi için kullanılır.

    5. Standart sapma, incelenen özelliğin çeşitlilik derecesini karakterize etmek ve aritmetik ortalama hatasını hesaplamak için gereklidir.

    Standart sapmanın değeri genellikle aynı türden serilerin değişkenliğini karşılaştırmak için kullanılır. Farklı özelliklere sahip iki seri karşılaştırıldığında (boy ve kilo, ortalama hastanede tedavi süresi ve hastane mortalitesi vb.), sigma boyutlarının doğrudan karşılaştırılması mümkün değildir. , Çünkü standart sapma mutlak sayılarla ifade edilen adlandırılmış bir değerdir. Bu durumlarda kullanın varyasyon katsayısı (Cv), göreceli bir değerdir: standart sapmanın aritmetik ortalamaya yüzde oranı.

    Değişim katsayısı aşağıdaki formül kullanılarak hesaplanır:

    Değişim katsayısı ne kadar yüksek olursa , Bu serinin değişkenliği o kadar büyük olur. % 30'dan fazla bir varyasyon katsayısının popülasyonun niteliksel heterojenliğini gösterdiğine inanılmaktadır.

    Hipotezlerin istatistiksel olarak test edilmesinde, rastgele değişkenler arasındaki doğrusal bir ilişki ölçülürken.

    Standart sapma:

    Standart sapma(rastgele değişken Zemin, etrafımızdaki duvarlar ve tavanın standart sapmasının tahmini, X varyansının tarafsız bir tahminine dayanan matematiksel beklentisine göre):

    dağılım nerede; - Zemin, etrafımızdaki duvarlar ve tavan, Ben seçimin inci unsuru; - örnek boyut; - numunenin aritmetik ortalaması:

    Her iki tahminin de taraflı olduğunu belirtmek gerekir. Genel durumda tarafsız bir tahmin yapmak mümkün değildir. Ancak tarafsız varyans tahminine dayalı tahmin tutarlıdır.

    Üç sigma kuralı

    Üç sigma kuralı() - normal olarak dağıtılan bir rastgele değişkenin neredeyse tüm değerleri aralıkta yer alır. Daha kesin olarak - %99,7'den az olmayan bir güvenle, normal olarak dağıtılan bir rastgele değişkenin değeri, belirtilen aralıkta yer alır (değerin doğru olması ve numune işlemenin bir sonucu olarak elde edilmemesi koşuluyla).

    Gerçek değeri bilinmiyorsa o zaman Zemini, etrafımızdaki duvarları ve tavanı kullanmamalıyız. S. Böylece üç sigma kuralı üç kat kuralına, etrafımızdaki duvarlara ve tavana dönüşür. S .

    Standart sapma değerinin yorumlanması

    Standart sapmanın büyük bir değeri, sunulan setteki değerlerin, setin ortalama değeri ile geniş bir yayılımını gösterir; buna göre küçük bir değer, kümedeki değerlerin ortadaki değer etrafında gruplandığını gösterir.

    Örneğin üç sayı kümemiz var: (0, 0, 14, 14), (0, 6, 8, 14) ve (6, 6, 8, 8). Her üç kümenin de ortalama değerleri 7'ye ve standart sapmaları sırasıyla 7, 5 ve 1'e eşittir. Son kümenin küçük bir standart sapması vardır, çünkü kümedeki değerler ortalama değer etrafında gruplandırılmıştır; ilk set en büyük standart sapma değerine sahiptir - setin içindeki değerler ortalama değerden büyük ölçüde farklıdır.

    Genel anlamda standart sapma bir belirsizlik ölçüsü olarak düşünülebilir. Örneğin fizikte standart sapma, bir niceliğin ardışık ölçümlerinin hatasını belirlemek için kullanılır. Bu değer, teori tarafından tahmin edilen değerle karşılaştırıldığında incelenen olgunun makullüğünü belirlemek için çok önemlidir: ölçümlerin ortalama değeri teorinin tahmin ettiği değerlerden büyük ölçüde farklıysa (büyük standart sapma), daha sonra elde edilen değerler veya bunları elde etme yöntemi yeniden kontrol edilmelidir.

    Pratik kullanım

    Uygulamada standart sapma, bir kümedeki değerlerin ortalama değerden ne kadar farklı olabileceğini belirlemenizi sağlar.

    İklim

    Diyelim ki aynı ortalama maksimum günlük sıcaklığa sahip iki şehir var, ancak biri sahilde, diğeri ise iç kesimlerde. Kıyıda yer alan şehirlerin birçok farklı maksimum gündüz sıcaklığına sahip olduğu ve iç kesimlerde bulunan şehirlerden daha düşük olduğu bilinmektedir. Bu nedenle, bu değerin ortalama değeri aynı olmasına rağmen, bir kıyı kenti için maksimum günlük sıcaklıkların standart sapması, ikinci şehre göre daha az olacaktır; bu, pratikte maksimum hava sıcaklığının aynı bölgede olma ihtimali anlamına gelir. yılın herhangi bir gününde ortalama değerden farklı olarak iç kesimlerde bulunan bir şehir için daha yüksek olacaktır.

    Spor

    Atılan ve yenen gol sayısı, gol şansı vb. gibi bazı parametrelere göre derecelendirilen birkaç futbol takımının olduğunu varsayalım. Bu gruptaki en iyi takımın daha iyi değerlere sahip olması muhtemeldir. daha fazla parametre üzerinde. Sunulan parametrelerin her biri için takımın standart sapması ne kadar küçük olursa, takımın sonucu o kadar öngörülebilir olur; bu tür takımlar dengelidir. Öte yandan, standart sapması büyük olan bir takımın sonucunu tahmin etmek zordur ve bu da dengesizlikle açıklanır; örneğin güçlü bir savunma ama zayıf bir atak.

    Takım parametrelerinin standart sapmasını kullanmak, iki takım arasındaki bir maçın sonucunu bir dereceye kadar tahmin etmeyi, takımların güçlü ve zayıf yönlerini ve dolayısıyla seçilen dövüş yöntemlerini değerlendirmeyi mümkün kılar.

    Teknik Analiz

    Ayrıca bakınız

    Edebiyat

    * Borovikov, V.İSTATİSTİK. Bilgisayarda veri analizi sanatı: Profesyoneller için / V. Borovikov. - St.Petersburg. : Peter, 2003. - 688 s. - ISBN 5-272-00078-1.

    Dağılım her bir nitelik değerinin genel ortalamadan sapmalarının karelerinin aritmetik ortalamasıdır. Kaynak verilere bağlı olarak varyans, ağırlıklandırılmamış (basit) veya ağırlıklı olabilir.

    Varyans aşağıdaki formüller kullanılarak hesaplanır:

    · gruplanmamış veriler için

    · gruplandırılmış veriler için

    Ağırlıklı varyansı hesaplama prosedürü:

    1. Aritmetik ağırlıklı ortalamayı belirleyin

    2. Varyantın ortalamadan sapmaları belirlenir

    3. Her seçeneğin ortalamadan sapmasının karesi

    4. Sapmaların karelerini ağırlıklarla (frekanslar) çarpın

    5. Ortaya çıkan ürünleri özetleyin

    6. Ortaya çıkan miktar terazilerin toplamına bölünür

    Varyansı belirleme formülü aşağıdaki formüle dönüştürülebilir:

    Basit

    Varyansı hesaplama prosedürü basittir:

    1. aritmetik ortalamayı belirleyin

    2. aritmetik ortalamanın karesi

    3. Satırdaki her seçeneğin karesini alın

    4. Karelerin toplamını bulma seçeneği

    5. Karelerin toplamını sayılarına bölün, yani. ortalama kareyi belirle

    6. Karakteristiğin ortalama karesi ile ortalamanın karesi arasındaki farkı belirleyin

    Ayrıca ağırlıklı varyansın belirlenmesine yönelik formül aşağıdaki formüle dönüştürülebilir:

    onlar. dağılım, özelliğin kare değerlerinin ortalaması ile aritmetik ortalamanın karesi arasındaki farka eşittir. Dönüştürülen formülü kullanırken, bir özelliğin bireysel değerlerinin x'ten sapmalarını hesaplamak için ek prosedür ortadan kaldırılır ve sapmaların yuvarlanması ile ilgili hesaplamadaki hata ortadan kaldırılır

    Dispersiyonun bir dizi özelliği vardır ve bunlardan bazıları hesaplamayı kolaylaştırır:

    1) sabit bir değerin varyansı sıfırdır;

    2) nitelik değerlerinin tüm çeşitleri aynı sayı kadar azaltılırsa varyans azalmayacaktır;

    3) nitelik değerlerinin tüm varyantları aynı sayıda (kat) azaltılırsa, varyans bir faktör kadar azalacaktır

    Standart sapma- varyansın karekökünü temsil eder:

    · gruplanmamış veriler için:

    · varyasyon serisi için:

    Değişim aralığı, doğrusal ortalama ve standart sapma nicelik olarak adlandırılır. Bireysel karakteristik değerlerle aynı ölçü birimlerine sahiptirler.

    Varyans ve standart sapma en yaygın kullanılan varyasyon ölçümleridir. Bu, matematiksel istatistiğin temelini oluşturan olasılık teorisinin çoğu teoreminde yer almalarıyla açıklanmaktadır. Ek olarak varyans, bir özelliğin varyasyonunu belirleyen çeşitli faktörlerin etkisini değerlendirmeyi mümkün kılan bileşen öğelerine ayrıştırılabilir.

    Kâr marjına göre gruplandırılmış bankalar için değişim göstergelerinin hesaplanması tabloda gösterilmektedir.

    Kâr miktarı, milyon ruble. Banka sayısı hesaplanan göstergeler
    3,7 - 4,6 (-) 4,15 8,30 -1,935 3,870 7,489
    4,6 - 5,5 5,05 20,20 - 1,035 4,140 4,285
    5,5 - 6,4 5,95 35,70 - 0,135 0,810 0,109
    6,4 - 7,3 6,85 34,25 +0,765 3,825 2,926
    7,3 - 8,2 7,75 23,25 +1,665 4,995 8,317
    Toplam: 121,70 17,640 23,126

    Ortalama doğrusal ve standart sapma, bir özelliğin değerinin birimler ve incelenen popülasyon arasında ortalama olarak ne kadar dalgalandığını gösterir. Yani bu durumda kârdaki ortalama dalgalanma şu şekildedir: ortalama doğrusal sapmaya göre 0,882 milyon ruble; standart sapmaya göre - 1.075 milyon ruble. Standart sapma her zaman ortalama doğrusal sapmadan daha büyüktür. Karakteristiğin dağılımı normale yakınsa S ile d arasında bir ilişki vardır: S=1,25d veya d=0,8S. Standart sapma, popülasyon birimlerinin büyük bir kısmının aritmetik ortalamaya göre nasıl konumlandığını gösterir. Dağılımın şekli ne olursa olsun, özelliğin 75 değeri x 2S aralığına düşer ve tüm değerlerden en az 89'u x 3S aralığına düşer (P.L. Chebyshev teoremi).

    ortalama değer- bu, istatistiksel büyüklüklerin değerlerindeki bireysel farklılıkları ortadan kaldıran ve farklı popülasyonları birbiriyle karşılaştırmanıza olanak tanıyan istatistiksel bir popülasyonun genel bir göstergesidir.

    Var 2 sınıf ortalama değerler: ve .

    Yapısal ortalamalar şunları içerir: moda Ve medyan, ancak en sık kullanılan güç ortalamalarıçeşitli türleri.

    Güç ortalamaları

    Güç ortalamaları şunlar olabilir: basit Ve ağırlıklı.

    Basit ortalama iki veya daha fazla varsa hesaplanır gruplanmamış Aşağıdaki genel formüle göre rastgele sırada düzenlenmiş istatistiksel nicelikler:

    Ağırlıklı ortalama tarafından hesaplandı gruplandırılmış aşağıdaki genel formülü kullanan istatistiksel değerler:

    X'in bireysel istatistiksel değerlerin değerleri veya gruplama aralıklarının ortası olduğu durumlarda;
    m, değeri aşağıdakileri belirleyen bir üstür güç ortalamaları türleri:
    m = -1'de;
    m = 0'da;
    m = 1 olduğunda;
    m = 2'de;
    m = 3'te.

    Farklı m üsleri için basit ve ağırlıklı ortalamalar için genel formüller kullanarak, her tür için aşağıda ayrıntılı olarak tartışılacak olan özel formüller elde ederiz.

    Aritmetik ortalama

    Aritmetik ortalama- Bu, genel formülde m=1 yerine geçerek elde edilen, en sık kullanılan ortalama değerdir. Aritmetik ortalama basit aşağıdaki forma sahiptir:

    X, ortalama değerin hesaplanması gereken miktarların değerleridir; N, X değerlerinin toplam sayısıdır (incelenen popülasyondaki birimlerin sayısı).

    Örneğin bir öğrenci 4 sınavı geçmiş ve şu notları almıştır: 3, 4, 4 ve 5. Basit aritmetik ortalama formülünü kullanarak ortalama puanı hesaplayalım: (3+4+4+5)/4 = 16/4 = 4.

    Aritmetik ortalama ağırlıklı aşağıdaki forma sahiptir:

    Burada f, X (frekans) değeri aynı olan büyüklüklerin sayısıdır.

    Örneğin bir öğrenci 4 sınavı geçmiş ve şu notları almıştır: 3, 4, 4 ve 5. Ortalama puanı ağırlıklı aritmetik ortalama formülünü kullanarak hesaplayalım: (3*1 + 4*2 + 5*1)/4 = 16/4 = 4.

    X değerleri aralık olarak belirtilirse, aralığın üst ve alt sınırlarının yarı toplamı olarak tanımlanan hesaplamalar için X aralıklarının orta noktaları kullanılır. Ve eğer X aralığının bir alt veya üst sınırı yoksa (açık aralık), o zaman onu bulmak için, bitişik X aralığının aralığını (üst ve alt sınır arasındaki fark) kullanın.

    Örneğin bir işletmede 3 yıla kadar deneyime sahip 10, 3 ila 5 yıl arasında deneyime sahip 20, 5 yıldan fazla deneyime sahip 5 çalışan bulunmaktadır. Daha sonra, hizmet aralıklarının (2, 4 ve 6 yıl) orta noktasını X olarak alarak, ağırlıklı aritmetik ortalama formülünü kullanarak çalışanların ortalama hizmet süresini hesaplıyoruz:
    (2*10+4*20+6*5)/(10+20+5) = 3,71 yıl.

    Aritmetik ortalama en sık kullanılır, ancak diğer ortalama türlerinin kullanılmasının gerekli olduğu zamanlar da vardır. Bu tür durumları daha ayrıntılı olarak ele alalım.

    Harmonik ortalama

    Harmonik ortalama kaynak verisi bireysel X değerleri için f frekanslarını içermediğinde ancak bunların Xf çarpımı olarak sunulduğunda kullanılır. Xf=w olarak belirledikten sonra f=w/X'i ifade ederiz ve bu gösterimleri aritmetik ağırlıklı ortalama formülünde değiştirerek harmonik ağırlıklı ortalama formülünü elde ederiz:

    Bu nedenle, f frekansları bilinmediğinde ve w=Xf bilindiğinde ağırlıklı harmonik ortalama kullanılır. Tüm w = 1'in, yani X'in bireysel değerlerinin bir kez meydana geldiği durumlarda, ortalama harmonik asal formül uygulanır:

    Örneğin bir araba A noktasından B noktasına 90 km/saat hızla gidip geri 110 km/saat hızla gidiyordu. Ortalama hızı belirlemek için basit ortalama harmonik formülünü uygularız, çünkü örnekte w 1 =w 2 mesafesi verilmiştir (A noktasından B noktasına olan mesafe, B'den A'ya olan mesafeyle aynıdır), bu şu şekildedir: hız (X) ve zamanın (f) çarpımına eşittir. Ortalama hız = (1+1)/(1/90+1/110) = 99 km/saat.

    Geometrik ortalama

    Geometrik ortalama Dinamik seriler konusunda tartışıldığı gibi ortalama bağıl değişikliklerin belirlenmesinde kullanılır. Görev, X'in hem maksimum hem de minimum değerlerinden eşit uzaklıkta olacak bir X değeri bulmaksa, geometrik ortalama en doğru ortalama sonucunu verir.

    Örneğin 2005-2008 yılları arasında enflasyon endeksi Rusya'da: 2005'te - 1.109; 2006'da - 1.090; 2007'de - 1.119; 2008'de - 1.133. Enflasyon endeksi göreceli bir değişim (dinamik endeks) olduğundan, ortalama değerin geometrik ortalama kullanılarak hesaplanması gerekir: (1.109*1.090*1.119*1.133)^(1/4) = 1.1126, yani 2005 yılından itibaren. 2008 yılına kadar yıllık fiyatlar ortalama %11,26 arttı. Aritmetik ortalama kullanılarak yapılan hatalı bir hesaplama %11,28 oranında yanlış sonuç verecektir.

    Ortalama kare

    Ortalama kareörneğin ortalama sapmaları hesaplarken, X'in başlangıç ​​değerlerinin hem pozitif hem de negatif olabildiği durumlarda kullanılır.

    İkinci dereceden ortalamanın ana uygulaması, tartışılacak olan X değerlerinin değişimini ölçmektir.

    Ortalama kübik

    Ortalama kübikörneğin BM tarafından önerilen ve hesaplanan, gelişmekte olan ülkeler (TIN-1) ve gelişmiş ülkeler (TIN-2) için yoksulluk endekslerinin hesaplanmasında son derece nadiren kullanılır.

    Yapısal ortalamalar

    En sık kullanılanlara yapısal ortalama ve .

    İstatistiksel mod

    İstatistiksel mod istatistiksel bir popülasyonda X'in en sık tekrarlanan değeridir.

    X verilirse gizlice Daha sonra mod, özelliğin en yüksek frekansa sahip değeri olarak hesaplama yapılmadan belirlenir. İstatistiksel bir popülasyonda 2 veya daha fazla mod vardır, bu durumda dikkate alınır. iki modlu(iki mod varsa) veya çok modlu(ikiden fazla mod varsa) ve bu, popülasyonun heterojenliğini gösterir.

    Örneğin şirkette 16 kişi çalışıyor: 4'ü 1 yıllık tecrübeye sahip, 3 kişi 2 yıllık tecrübeye sahip, 5'i 3 yıllık tecrübeye sahip ve 4 kişi de 4 yıllık tecrübeye sahip. Böylece modal deneyim Mo=3 yıl olduğundan bu değerin frekansı maksimumdur (f=5).

    X verilirse eşit aralıklarla, daha sonra modal aralık ilk olarak en yüksek frekansa f sahip aralık olarak tanımlanır. Bu aralık dahilinde modun koşullu değeri aşağıdaki formül kullanılarak bulunur:

    Mo'nun moda olduğu yer;
    X NMo – modal aralığın alt sınırı;
    h Mo, modal aralığın aralığıdır (üst ve alt sınırları arasındaki fark);
    f Mo – modal aralığın frekansı;
    f Mo-1 – modal olandan önceki aralığın frekansı;
    f Mo+1 – modal olanı takip eden aralığın frekansı.

    Örneğin bir işletmede 3 yıla kadar deneyime sahip 10, 3 ila 5 yıl arasında deneyime sahip 20, 5 yıldan fazla deneyime sahip 5 çalışan bulunmaktadır. Modal iş deneyimini 3 ila 5 yıl arasındaki modal aralıkta hesaplayalım: Mo = 3 + 2*(20-10)/(2*20-10-5) = 3,8 (yıl).

    H aralıklarının aralığı farklıysa, f frekansları yerine, f frekanslarının h aralığı aralığına bölünmesiyle hesaplanan aralık yoğunluklarının kullanılması gerekir.

    İstatistiksel medyan

    İstatistiksel medyan– bu, artan veya azalan sırada sıralanan bir istatistiksel popülasyonu 2 eşit parçaya bölen X miktarının değeridir. Sonuç olarak bir yarısı medyandan büyük, diğer yarısı medyandan küçük bir değere sahiptir.

    X verilirse gizlice, daha sonra medyanı belirlemek için tüm değerler 0'dan N'ye kadar numaralandırılır. artan sırada ise, çift sayı N için medyan, 0,5N ve (0,5N+1) sayılarına sahip X'in ortasında yer alacak ve tek sayı N için, 0,5(N+1) sayısına sahip X'in değerine karşılık gelecektir. .

    Örneğin, 10 kişilik bir gruptaki yarı zamanlı öğrencilerin yaşlarına ilişkin veriler var - X: 18, 19, 19, 20, 21, 23, 23, 25, 28, 30 yıl. Bu veriler zaten artan sırada sıralanmıştır ve sayıları N=10 çifttir, dolayısıyla medyan, değerlere karşılık gelen 0,5*10=5 ve (0,5*10+1)=6 sayılarıyla X arasında olacaktır. X 5 = 21 ve X 6 =23, ardından medyan: Me = (21+23)/2 = 22 (yıl).

    Eğer X formda verilmişse eşit aralıklar, daha sonra ilk önce medyan aralığı belirlenir (frekansların yarısının bittiği ve diğer yarısının başladığı aralık), burada medyanın koşullu değeri aşağıdaki formül kullanılarak bulunur:

    Me'nin medyan olduğu yer;
    X НМе – medyan aralığının alt sınırı;
    h Mе – medyan aralığının aralığı (üst ve alt sınırları arasındaki fark);
    f Mе – medyan aralığın frekansı;
    f Ме-1 – medyandan önceki aralıkların frekanslarının toplamı.

    Daha önce tartışılan örnekte, modal hizmet uzunluğunu hesaplarken (kurumun 3 yıla kadar deneyime sahip 10 çalışanı, 3 ila 5 yıl deneyime sahip 20 çalışanı, 5 yıldan fazla deneyime sahip 5 çalışanı vardır), medyanı hesaplıyoruz Hizmet süresi. Toplam işçi sayısının yarısı (10+20+5)/2 = 17,5 olup 3 ile 5 yıl aralığında olup, 3 yıla kadar olan ilk aralıkta sadece 10, ilk ikisinde ise sadece 10 işçi bulunmaktadır. - (10+20) =30, yani 17,5'tan büyük, 3 ile 5 yıl arasındaki aralığın ortanca olduğu anlamına gelir. İçinde medyanın koşullu değerini belirliyoruz: Me = 3+2*(0,5*30-10)/20 = 3,5 (yıl).

    Mod durumunda olduğu gibi, medyanı belirlerken, h aralık aralığı farklıysa, f frekansları yerine, f frekanslarını h aralığı aralığına bölerek hesaplanan aralık yoğunluklarını kullanmak gerekir.

    Değişim göstergeleri

    varyasyon istatistiksel popülasyonun bireysel birimleri için X değerlerinin değerlerindeki farktır. Değişimin gücünü incelemek için aşağıdakiler hesaplanır: varyasyon göstergeleri: , , , , .

    Varyasyon aralığı

    Varyasyon aralığı incelenen istatistiksel popülasyonda mevcut X'in maksimum ve minimum değerleri arasındaki farktır:

    H'nin dezavantajı yalnızca X değerlerindeki maksimum farkı göstermesi ve popülasyonun tamamındaki varyasyonun gücünü ölçememesidir.

    Ortalama doğrusal sapma

    Ortalama doğrusal sapma X değerlerinin aritmetik ortalamadan sapmalarının ortalama modülüdür. Aritmetik ortalama formülü kullanılarak hesaplanabilir basit- aldık :

    Örneğin bir öğrenci 4 sınavı geçmiş ve şu notları almıştır: 3, 4, 4 ve 5. = 4. Basit ortalama doğrusal sapmayı hesaplayalım: L = (|3-4|+|4-4|+|4 -4|+| 5-4|)/4 = 0,5.

    Kaynak verileri X gruplandırılmışsa (f frekansları vardır), o zaman ortalama doğrusal sapma aritmetik ortalama formülü kullanılarak hesaplanır. ağırlıklı- aldık :

    4 sınavı geçip şu notları alan bir öğrenci örneğine dönelim: 3, 4, 4 ve 5. = 4 ve = 0,5. Ağırlıklı ortalama doğrusal sapmayı hesaplayalım: L = (|3-4|*1+|4-4|*2+|5-4|*1)/4 = 0,5.

    Doğrusal varyasyon katsayısı

    Doğrusal varyasyon katsayısı ortalama doğrusal sapmanın aritmetik ortalamaya oranıdır:

    Doğrusal varyasyon katsayısını kullanarak farklı popülasyonların varyasyonunu karşılaştırabilirsiniz çünkü ortalama doğrusal sapmanın aksine değeri X ölçüm birimlerine bağlı değildir.

    4 sınavı geçen ve şu notları alan bir öğrenciyle ilgili söz konusu örnekte: 3, 4, 4 ve 5, doğrusal değişim katsayısı 0,5/4 = 0,125 veya %12,5 olacaktır.

    Dağılım

    Dağılım X değerlerinin aritmetik ortalamadan sapmalarının ortalama karesidir. Dağılım aritmetik ortalama formülü kullanılarak hesaplanabilir basit- aldık basit varyans:

    4 sınavı geçip not alan bir öğrenciyle ilgili zaten aşina olduğumuz örnekte: 3, 4, 4 ve 5, = 4. Bu durumda varyans basittir D = ((3-4) 2 +(4-4) 2 +(4- 4) 2 +(5-4) 2)/4 = 0,5.

    Orijinal veriler X gruplandırılırsa (f frekansları vardır), o zaman varyans aritmetik ortalama formülü kullanılarak hesaplanır. ağırlıklı- aldık varyans ağırlıklı:

    4 sınavı geçen ve şu notları alan bir öğrenciyle ilgili örnekte: 3, 4, 4 ve 5, ağırlıklı varyansı hesaplıyoruz: D = ((3-4) 2 *1+(4-4) 2 *2+(5 -4) 2 *1)/4 = 0,5.

    Varyans formülünü dönüştürürseniz (paydaki parantezleri açın, terimi paydaya göre terime bölün ve benzerlerini verin), o zaman bunu ortalama kareler ile kare ortalama arasındaki fark olarak hesaplamak için başka bir formül elde edebilirsiniz:

    Bulmak daha da kolay standart sapma, eğer varyans bunun karekökü olarak önceden hesaplanırsa:

    Yukarıdaki öğrenciyle ilgili örnekte standart sapmayı bunun karekökü olarak buluyoruz: .

    İkinci dereceden varyasyon katsayısı

    İkinci dereceden varyasyon katsayısı varyasyonun en popüler göreceli ölçüsüdür:

    Kriter değeriİkinci dereceden varyasyon katsayısı V 0,333 veya %33,3'tür; yani, V 0,333'ten küçük veya ona eşitse varyasyon zayıf kabul edilir ve 0,333'ten büyükse güçlü olarak kabul edilir. Güçlü varyasyon olması durumunda, incelenen istatistiksel popülasyon dikkate alınır heterojen ve ortalama değer atipik ve bu nüfusun genel bir göstergesi olarak kullanılamaz.

    Yukarıdaki öğrenciyle ilgili örnekte, ikinci dereceden varyasyon katsayısı V = 0,707/4 = 0,177'yi buluyoruz; bu, 0,333'lük kriter değerinden daha küçüktür, bu da varyasyonun zayıf ve %17,7'ye eşit olduğu anlamına gelir.

    Varyansın kareköküne ortalamadan standart sapma adı verilir ve şu şekilde hesaplanır:

    Standart sapma formülünün temel cebirsel dönüşümü onu aşağıdaki forma götürür:

    Bu formülün genellikle hesaplama uygulamalarında daha kullanışlı olduğu ortaya çıkar.

    Standart sapma, tıpkı ortalama doğrusal sapma gibi, bir özelliğin belirli değerlerinin ortalama değerlerinden ne kadar saptığını gösterir. Standart sapma her zaman ortalama doğrusal sapmadan daha büyüktür. Aralarında şu ilişki vardır:

    Bu oranı bildiğinizde, örneğin bilinmeyeni belirlemek için bilinen göstergeleri kullanabilirsiniz, ancak (BEN a'yı hesaplayın ve bunun tersini yapın. Standart sapma, bir özelliğin değişkenliğinin mutlak boyutunu ölçer ve özelliğin değerleriyle (ruble, ton, yıl vb.) aynı ölçü birimleriyle ifade edilir. Mutlak bir varyasyon ölçüsüdür.

    İçin alternatif işaretler, örneğin yüksek öğrenimin olup olmaması, sigortalılık, dağılım ve standart sapma formülleri şu şekildedir:

    Üniversite fakültelerinden birinde öğrencilerin yaşa göre dağılımını karakterize eden ayrı bir serinin verilerine göre standart sapmanın hesaplanmasını gösterelim (Tablo 6.2).

    Tablo 6.2.

    Yardımcı hesaplamaların sonuçları tablonun 2-5 sütunlarında verilmiştir. 6.2.

    Bir öğrencinin ortalama yaşı (yıl), ağırlıklı aritmetik ortalama formülü (sütun 2) ile belirlenir:

    Öğrencinin bireysel yaşının ortalamadan karesel sapmaları 3-4. sütunlarda, sapmaların kareleri ve karşılık gelen frekansların çarpımı ise 5. sütunda yer almaktadır.

    Öğrencilerin yaşının, yıllarının varyansını formül (6.2) kullanarak buluyoruz:

    O halde o = l/3.43 1.85 *oda, yani. Öğrencinin yaşının her bir özel değeri ortalamadan 1,85 yıl sapmaktadır.

    Değişim katsayısı

    Mutlak değerinde standart sapma, yalnızca özelliğin varyasyon derecesine değil, aynı zamanda seçeneklerin mutlak seviyelerine ve ortalamaya da bağlıdır. Bu nedenle varyasyon serilerinin standart sapmalarını farklı ortalama düzeylerle doğrudan karşılaştırmak mümkün değildir. Böyle bir karşılaştırma yapabilmek için ortalama sapmanın (doğrusal veya ikinci dereceden) aritmetik ortalama içindeki yüzde olarak ifade edilen payını bulmanız gerekir; hesaplamak göreceli değişim ölçüleri.

    Doğrusal varyasyon katsayısı formülle hesaplanır

    Değişim katsayısı aşağıdaki formülle belirlenir:

    Değişim katsayılarında, yalnızca incelenen özelliğin farklı ölçüm birimleriyle ilişkili karşılaştırılamazlık değil, aynı zamanda aritmetik ortalamaların değerindeki farklılıklar nedeniyle ortaya çıkan karşılaştırılamazlık da ortadan kaldırılır. Ayrıca varyasyon göstergeleri popülasyonun homojenliğini karakterize eder. Varyasyon katsayısı %33'ü geçmiyorsa popülasyon homojen kabul edilir.

    Tabloya göre. 6.2 ve yukarıda elde edilen hesaplama sonuçlarına göre, değişim katsayısını, %, formül (6.3)'e göre belirleriz:

    Varyasyon katsayısı %33'ü aşarsa, bu, incelenen popülasyonun heterojenliğini gösterir. Bizim durumumuzda elde edilen değer, öğrenci popülasyonunun yaşa göre kompozisyon bakımından homojen olduğunu göstermektedir. Bu nedenle, değişim göstergelerini genelleştirmenin önemli bir işlevi ortalamaların güvenilirliğini değerlendirmektir. Daha az c1, a2 ve V, Sonuçta ortaya çıkan olgu kümesi ne kadar homojense ve sonuçta ortaya çıkan ortalama da o kadar güvenilir olur. Matematiksel istatistiklerin dikkate aldığı “üç sigma kuralına” göre normal dağılım gösteren veya onlara yakın serilerde aritmetik ortalamadan ±3'ü geçmeyen sapmalar 1000 vakanın 997'sinde meydana gelir. X ve a, varyasyon serisi hakkında genel bir başlangıç ​​fikri edinebilirsiniz. Örneğin, bir şirketteki bir çalışanın ortalama maaşı 25.000 ruble ise ve a 100 rubleye eşitse, o zaman kesinliğe yakın bir olasılıkla şirket çalışanlarının ücretlerinin (25.000) aralığında dalgalandığını söyleyebiliriz. ± ± 3 x 100 ) yani. 24.700 ila 25.300 ruble.