Entrar
Todos os segredos de informática para iniciantes e profissionais
  • Para um usuário iniciante: diferenças entre produtos de software do sistema do programa 1C:Enterprise
  • Versão demo do programa 1s 8.3. Aplicativo móvel "UNF" NOVO
  • Configurando o gerenciamento 1C da nossa empresa do zero
  • Registro gratuito do Warface
  • Cadastro no jogo World Of Tanks – o que você precisa saber?
  • Estratégia e táticas de Starcraft II
  • Fórmula Sco. Parâmetros estatísticos. Desvio médio linear e quadrado

    Fórmula Sco.  Parâmetros estatísticos.  Desvio médio linear e quadrado

    Um método aproximado para avaliar a variabilidade de uma série de variação é determinar o limite e a amplitude, mas os valores da variante dentro da série não são levados em consideração. A principal medida geralmente aceita da variabilidade de uma característica quantitativa dentro de uma série de variação é desvio padrão (σ - sigma). Quanto maior for o desvio padrão, maior será o grau de flutuação desta série.

    O método de cálculo do desvio padrão inclui as seguintes etapas:

    1. Encontre a média aritmética (M).

    2. Determine os desvios das opções individuais em relação à média aritmética (d=V-M). Nas estatísticas médicas, os desvios da média são designados como d (desvio). A soma de todos os desvios é zero.

    3. Eleve ao quadrado cada desvio d 2.

    4. Multiplique os quadrados dos desvios pelas frequências correspondentes d 2 *p.

    5. Encontre a soma dos produtos å(d 2 *p)

    6. Calcule o desvio padrão usando a fórmula:

    Quando n for maior que 30, ou quando n for menor ou igual a 30, onde n é o número de todas as opções.

    Valor do desvio padrão:

    1. O desvio padrão caracteriza a dispersão da variante em relação ao valor médio (ou seja, a variabilidade da série de variação). Quanto maior o sigma, maior o grau de diversidade desta série.

    2. O desvio padrão é utilizado para avaliação comparativa do grau de correspondência da média aritmética com a série de variação para a qual foi calculada.

    As variações dos fenômenos de massa obedecem à lei da distribuição normal. A curva que representa esta distribuição parece uma curva simétrica suave em forma de sino (curva gaussiana). Segundo a teoria da probabilidade, nos fenômenos que obedecem à lei da distribuição normal, existe uma relação matemática estrita entre os valores da média aritmética e do desvio padrão. A distribuição teórica de uma variante em uma série de variação homogênea obedece à regra dos três sigma.

    Se em um sistema de coordenadas retangulares os valores de uma característica quantitativa (variantes) são traçados no eixo das abcissas, e a frequência de ocorrência de uma variante em uma série de variação é traçada no eixo das ordenadas, então variantes com maior e menor os valores estão localizados uniformemente nas laterais da média aritmética.



    Foi estabelecido que com uma distribuição normal da característica:

    68,3% dos valores variantes estão dentro de M±1s

    95,5% dos valores variantes estão dentro de M±2s

    99,7% dos valores variantes estão dentro de M±3s

    3. O desvio padrão permite estabelecer valores normais para parâmetros clínicos e biológicos. Na medicina, o intervalo M±1s é geralmente considerado a faixa normal para o fenômeno que está sendo estudado. O desvio do valor estimado da média aritmética em mais de 1s indica um desvio do parâmetro estudado da norma.

    4. Na medicina, a regra dos três sigma é utilizada em pediatria para avaliação individual do nível de desenvolvimento físico das crianças (método do desvio sigma), para o desenvolvimento de padrões para roupas infantis

    5. O desvio padrão é necessário para caracterizar o grau de diversidade da característica em estudo e para calcular o erro da média aritmética.

    O valor do desvio padrão é normalmente utilizado para comparar a variabilidade de séries do mesmo tipo. Se forem comparadas duas séries com características diferentes (altura e peso, duração média do tratamento hospitalar e mortalidade hospitalar, etc.), então uma comparação direta dos tamanhos sigma é impossível , porque o desvio padrão é um valor nomeado expresso em números absolutos. Nestes casos, utilize coeficiente de variação (Cv), que é um valor relativo: a razão percentual entre o desvio padrão e a média aritmética.

    O coeficiente de variação é calculado usando a fórmula:

    Quanto maior o coeficiente de variação , maior será a variabilidade desta série. Acredita-se que um coeficiente de variação superior a 30% indica a heterogeneidade qualitativa da população.

    Em testes estatísticos de hipóteses, ao medir uma relação linear entre variáveis ​​aleatórias.

    Desvio padrão:

    Desvio padrão(estimativa do desvio padrão da variável aleatória Piso, das paredes ao nosso redor e do teto, x em relação à sua expectativa matemática com base em uma estimativa imparcial de sua variância):

    onde está a dispersão; - O chão, as paredes ao nosso redor e o teto, eu o elemento da seleção; - tamanho da amostra; - média aritmética da amostra:

    Deve-se notar que ambas as estimativas são tendenciosas. No caso geral, é impossível construir uma estimativa imparcial. No entanto, a estimativa baseada na estimativa de variância imparcial é consistente.

    Regra dos três sigma

    Regra dos três sigma() - quase todos os valores de uma variável aleatória normalmente distribuída estão no intervalo. Mais estritamente - com pelo menos 99,7% de confiança, o valor de uma variável aleatória normalmente distribuída está no intervalo especificado (desde que o valor seja verdadeiro e não obtido como resultado do processamento da amostra).

    Se o verdadeiro valor for desconhecido, então não devemos usar, mas sim o Piso, as paredes ao nosso redor e o teto, é. Assim, a regra dos três sigma se transforma na regra dos três Piso, paredes ao nosso redor e teto, é .

    Interpretação do valor do desvio padrão

    Um grande valor do desvio padrão mostra uma grande dispersão dos valores do conjunto apresentado com o valor médio do conjunto; um valor pequeno, portanto, mostra que os valores do conjunto estão agrupados em torno do valor médio.

    Por exemplo, temos três conjuntos de números: (0, 0, 14, 14), (0, 6, 8, 14) e (6, 6, 8, 8). Todos os três conjuntos possuem valores médios iguais a 7, e desvios padrão, respectivamente, iguais a 7, 5 e 1. O último conjunto possui um pequeno desvio padrão, pois os valores do conjunto estão agrupados em torno do valor médio; o primeiro conjunto tem o maior valor de desvio padrão - os valores dentro do conjunto divergem muito do valor médio.

    De um modo geral, o desvio padrão pode ser considerado uma medida de incerteza. Por exemplo, em física, o desvio padrão é usado para determinar o erro de uma série de medições sucessivas de alguma quantidade. Este valor é muito importante para determinar a plausibilidade do fenômeno em estudo em comparação com o valor previsto pela teoria: se o valor médio das medições difere muito dos valores previstos pela teoria (grande desvio padrão), então os valores obtidos ou o método para obtê-los devem ser verificados novamente.

    Uso pratico

    Na prática, o desvio padrão permite determinar o quanto os valores de um conjunto podem diferir do valor médio.

    Clima

    Suponha que existam duas cidades com a mesma temperatura média máxima diária, mas uma está localizada no litoral e a outra no interior. Sabe-se que as cidades localizadas no litoral apresentam temperaturas máximas diurnas diferentes, mais baixas do que as cidades localizadas no interior. Portanto, o desvio padrão das temperaturas máximas diárias para uma cidade costeira será menor do que para a segunda cidade, apesar de o valor médio deste valor ser o mesmo, o que na prática significa que a probabilidade de que a temperatura máxima do ar em qualquer dia do ano será maior e diferente do valor médio, maior para uma cidade localizada no interior.

    Esporte

    Vamos supor que existam vários times de futebol que são avaliados com base em algum conjunto de parâmetros, por exemplo, o número de gols marcados e sofridos, chances de gol, etc. É mais provável que o melhor time deste grupo tenha melhores valores. em mais parâmetros. Quanto menor for o desvio padrão da equipe para cada um dos parâmetros apresentados, mais previsível será o resultado da equipe; tais equipes são equilibradas. Por outro lado, uma equipa com um grande desvio padrão tem dificuldade em prever o resultado, o que por sua vez é explicado por um desequilíbrio, por exemplo, uma defesa forte mas um ataque fraco.

    A utilização do desvio padrão dos parâmetros das equipes permite, de uma forma ou de outra, prever o resultado de uma partida entre duas equipes, avaliando os pontos fortes e fracos das equipes e, portanto, os métodos de luta escolhidos.

    Análise técnica

    Veja também

    Literatura

    * Borovikov, V. ESTATISTICAS. A arte da análise de dados em um computador: Para profissionais / V. Borovikov. - São Petersburgo. : Pedro, 2003. - 688 p. - ISBN 5-272-00078-1.

    Dispersãoé a média aritmética dos desvios quadrados do valor de cada atributo em relação à média geral. Dependendo dos dados de origem, a variação pode ser não ponderada (simples) ou ponderada.

    A variância é calculada usando as seguintes fórmulas:

    · para dados desagrupados

    · para dados agrupados

    O procedimento para calcular a variação ponderada:

    1. determinar a média aritmética ponderada

    2. São determinados os desvios da variante em relação à média

    3. elevar ao quadrado o desvio de cada opção em relação à média

    4. multiplique os quadrados dos desvios pelos pesos (frequências)

    5. resuma os produtos resultantes

    6. o valor resultante é dividido pela soma das escalas

    A fórmula para determinar a variância pode ser convertida na seguinte fórmula:

    Simples

    O procedimento para calcular a variância é simples:

    1. determine a média aritmética

    2. elevar ao quadrado a média aritmética

    3. eleve ao quadrado cada opção na linha

    4. encontre a opção da soma dos quadrados

    5. divida a soma dos quadrados pelo seu número, ou seja, determinar o quadrado médio

    6. determine a diferença entre o quadrado médio da característica e o quadrado da média

    Além disso, a fórmula para determinar a variância ponderada pode ser convertida na seguinte fórmula:

    aqueles. a dispersão é igual à diferença entre a média dos valores quadrados do atributo e o quadrado da média aritmética. Ao usar a fórmula transformada, o procedimento adicional para calcular os desvios dos valores individuais de uma característica de x é eliminado e o erro no cálculo associado ao arredondamento dos desvios é eliminado

    A dispersão tem várias propriedades, algumas das quais facilitam o cálculo:

    1) a variância de um valor constante é zero;

    2) se todas as variantes de valores de atributos forem reduzidas no mesmo número, a variância não diminuirá;

    3) se todas as variantes de valores de atributos forem reduzidas no mesmo número de vezes (dobradas), então a variância diminuirá em um fator

    Desvio padrão- representa a raiz quadrada da variância:

    · para dados desagrupados:

    · para as séries de variação:

    A faixa de variação, média linear e desvio padrão são denominadas quantidades. Eles têm as mesmas unidades de medida que os valores característicos individuais.

    A variância e o desvio padrão são as medidas de variação mais utilizadas. Isso se explica pelo fato de estarem incluídos na maioria dos teoremas da teoria das probabilidades, que serve de base à estatística matemática. Além disso, a variância pode ser decomposta em seus elementos componentes, permitindo avaliar a influência de diversos fatores que determinam a variação de uma característica.

    O cálculo dos indicadores de variação dos bancos agrupados por margem de lucro é apresentado na tabela.

    Valor do lucro, milhões de rublos. Número de bancos indicadores calculados
    3,7 - 4,6 (-) 4,15 8,30 -1,935 3,870 7,489
    4,6 - 5,5 5,05 20,20 - 1,035 4,140 4,285
    5,5 - 6,4 5,95 35,70 - 0,135 0,810 0,109
    6,4 - 7,3 6,85 34,25 +0,765 3,825 2,926
    7,3 - 8,2 7,75 23,25 +1,665 4,995 8,317
    Total: 121,70 17,640 23,126

    A média linear e o desvio padrão mostram o quanto o valor de uma característica oscila em média entre as unidades e a população em estudo. Portanto, neste caso, a flutuação média do lucro é: de acordo com o desvio linear médio, 0,882 milhões de rublos; por desvio padrão - 1,075 milhões de rublos. O desvio padrão é sempre maior que o desvio linear médio. Se a distribuição da característica estiver próxima do normal, então existe uma relação entre S e d: S=1,25d, ou d=0,8S. O desvio padrão mostra como a maior parte das unidades populacionais está localizada em relação à média aritmética. Independentemente da forma da distribuição, 75 valores do atributo caem no intervalo x 2S, e pelo menos 89 de todos os valores caem no intervalo x 3S (teorema de P.L. Chebyshev).

    valor médio- este é um indicador geral de uma população estatística que elimina diferenças individuais nos valores das quantidades estatísticas, permitindo comparar diferentes populações entre si.

    Existe 2 aulas valores médios: e .

    As médias estruturais incluem moda E mediana, mas mais frequentemente usado médias de potência Vários tipos.

    Médias de potência

    As médias de potência podem ser simples E pesada.

    Média simples calculado se houver dois ou mais desagrupado Quantidades estatísticas organizadas em ordem aleatória de acordo com a seguinte fórmula geral:

    Média ponderada calculado por agrupado valores estatísticos usando a seguinte fórmula geral:

    Onde X são os valores dos valores estatísticos individuais ou do meio dos intervalos de agrupamento;
    m é um expoente, cujo valor determina o seguinte tipos de médias de potência:
    em m = -1 ;
    em m = 0;
    quando m = 1;
    em m = 2;
    em m = 3.

    Utilizando fórmulas gerais de médias simples e ponderadas para diferentes expoentes m, obtemos fórmulas particulares de cada tipo, que serão discutidas detalhadamente a seguir.

    Média aritmética

    Média aritmética- este é o valor médio mais utilizado, obtido substituindo m=1 na fórmula geral. Média aritmética simples tem o seguinte formato:

    Onde X são os valores das grandezas para as quais o valor médio deve ser calculado; N é o número total de valores de X (o número de unidades na população em estudo).

    Por exemplo, um aluno foi aprovado em 4 provas e recebeu as seguintes notas: 3, 4, 4 e 5. Vamos calcular a nota média usando a fórmula da média aritmética simples: (3+4+4+5)/4 = 16/4 = 4.

    Média aritmética pesada tem o seguinte formato:

    Onde f é o número de quantidades com o mesmo valor X (frequência).

    Por exemplo, um aluno foi aprovado em 4 provas e obteve as seguintes notas: 3, 4, 4 e 5. Vamos calcular a nota média usando a fórmula da média aritmética ponderada: (3*1 + 4*2 + 5*1)/4 = 16/4 = 4.

    Se os valores X forem especificados como intervalos, os pontos médios dos intervalos X serão usados ​​​​para cálculos, que são definidos como a meia soma dos limites superior e inferior do intervalo. E se o intervalo X não tiver um limite inferior ou superior (intervalo aberto), então, para encontrá-lo, use o intervalo (a diferença entre o limite superior e inferior) do intervalo adjacente X.

    Por exemplo, uma empresa possui 10 funcionários com até 3 anos de experiência, 20 com 3 a 5 anos de experiência, 5 funcionários com mais de 5 anos de experiência. Em seguida calculamos o tempo médio de serviço dos colaboradores através da fórmula da média aritmética ponderada, tomando como X o ponto médio dos intervalos de tempo de serviço (2, 4 e 6 anos):
    (2*10+4*20+6*5)/(10+20+5) = 3,71 anos.

    A média aritmética é a mais utilizada, mas há momentos em que é necessário utilizar outros tipos de médias. Vamos considerar esses casos mais detalhadamente.

    Média harmônica

    Média harmônicaé usado quando os dados de origem não contêm frequências f para valores individuais de X, mas são apresentados como seu produto Xf. Tendo designado Xf=w, expressamos f=w/X, e, substituindo essas notações na fórmula da média aritmética ponderada, obtemos a fórmula da média harmônica ponderada:

    Assim, a média harmônica ponderada é utilizada quando as frequências f são desconhecidas e w=Xf é conhecido. Nos casos em que todos w = 1, ou seja, valores individuais de X ocorrem uma vez, a fórmula dos primos harmônicos médios é aplicada:

    Por exemplo, um carro viajava do ponto A ao ponto B a uma velocidade de 90 km/h e voltava a uma velocidade de 110 km/h. Para determinar a velocidade média, aplicamos a fórmula do harmônico médio simples, pois no exemplo é dada a distância w 1 =w 2 (a distância do ponto A ao ponto B é a mesma que de B a A), que é igual ao produto da velocidade (X) e do tempo ( f). Velocidade média = (1+1)/(1/90+1/110) = 99 km/h.

    Média geométrica

    Média geométrica usado na determinação de mudanças relativas médias, conforme discutido no tópico Séries dinâmicas. A média geométrica fornece o resultado de média mais preciso se a tarefa for encontrar um valor de X que seja equidistante dos valores máximo e mínimo de X.

    Por exemplo, entre 2005 e 2008 índice de inflação na Rússia foi: em 2005 - 1.109; em 2006 - 1.090; em 2007 - 1.119; em 2008 - 1.133. Como o índice de inflação é uma variação relativa (índice dinâmico), o valor médio deve ser calculado pela média geométrica: (1,109*1,090*1,119*1,133)^(1/4) = 1,1126, ou seja, para o período a partir de 2005 até 2008, os preços anuais cresceram em média 11,26%. Um cálculo errado utilizando a média aritmética daria um resultado incorreto de 11,28%.

    Quadrado médio

    Quadrado médio utilizado nos casos em que os valores iniciais de X podem ser positivos e negativos, por exemplo, no cálculo de desvios médios.

    A principal aplicação da média quadrática é medir a variação dos valores de X, o que será discutido.

    Cúbico médio

    Cúbico médioé usado muito raramente, por exemplo, no cálculo dos índices de pobreza para países em desenvolvimento (TIN-1) e para países desenvolvidos (TIN-2), propostos e calculados pela ONU.

    Médias estruturais

    Para os mais usados média estrutural incluir e .

    Modo estatístico

    Modo estatísticoé o valor de X repetido com mais frequência em uma população estatística.

    Se X for dado discretamente, então o modo é determinado sem cálculo como o valor do recurso com a frequência mais alta. Numa população estatística existem 2 ou mais modas, então considera-se bimodal(se houver dois modos) ou multimodal(se houver mais de dois modais), e isso indica a heterogeneidade da população.

    Por exemplo, a empresa emprega 16 pessoas: 4 delas têm 1 ano de experiência, 3 pessoas têm 2 anos de experiência, 5 têm 3 anos de experiência e 4 pessoas têm 4 anos de experiência. Assim, experiência modal Mo = 3 anos, pois a frequência deste valor é máxima (f = 5).

    Se X for dado em intervalos iguais, então o intervalo modal é primeiro definido como o intervalo com a maior frequência f. Dentro deste intervalo, o valor condicional da moda é encontrado usando a fórmula:

    Onde Mo é moda;
    X NMo – limite inferior do intervalo modal;
    h Mo é o intervalo do intervalo modal (a diferença entre seus limites superior e inferior);
    f Mo – frequência do intervalo modal;
    f Mo-1 – frequência do intervalo anterior ao modal;
    f Mo+1 – frequência do intervalo seguinte ao modal.

    Por exemplo, uma empresa possui 10 funcionários com até 3 anos de experiência, 20 com 3 a 5 anos de experiência, 5 funcionários com mais de 5 anos de experiência. Vamos calcular a experiência profissional modal no intervalo modal de 3 a 5 anos: Mo = 3 + 2*(20-10)/(2*20-10-5) = 3,8 (anos).

    Se a faixa de intervalos h for diferente, então em vez de frequências f é necessário usar densidades de intervalo, calculadas dividindo as frequências f pela faixa do intervalo h.

    Mediana estatística

    Mediana estatística– este é o valor da quantidade X, que divide uma população estatística ordenada em ordem crescente ou decrescente em 2 partes iguais. Como resultado, metade tem um valor maior que a mediana e a outra metade tem um valor menor que a mediana.

    Se X for dado discretamente, então para determinar a mediana, todos os valores são numerados de 0 a N em ordem ascendente, então a mediana para um número par N ficará no meio entre X com números 0,5N e (0,5N+1), e para um número ímpar N corresponderá ao valor de X com número 0,5(N+1) .

    Por exemplo, existem dados sobre a idade dos estudantes a tempo parcial num grupo de 10 pessoas - X: 18, 19, 19, 20, 21, 23, 23, 25, 28, 30 anos. Esses dados já estão ordenados em ordem crescente, e seu número N=10 é par, então a mediana ficará entre X com os números 0,5*10=5 e (0,5*10+1)=6, que correspondem aos valores X 5 = 21 e X 6 =23, então a mediana: Me = (21+23)/2 = 22 (anos).

    Se X for dado na forma intervalos iguais, então primeiro é determinado o intervalo mediano (o intervalo em que termina metade das frequências f e começa a outra metade), no qual o valor condicional da mediana é encontrado usando a fórmula:

    Onde Me é a mediana;
    X НМе – limite inferior do intervalo mediano;
    h Ме – o intervalo do intervalo mediano (a diferença entre seus limites superior e inferior);
    f Ме – frequência do intervalo mediano;
    f Ме-1 – soma das frequências dos intervalos anteriores à mediana.

    No exemplo discutido anteriormente, ao calcular o tempo de serviço modal (a empresa possui 10 funcionários com até 3 anos de experiência, 20 com 3 a 5 anos de experiência, 5 funcionários com mais de 5 anos de experiência), calculamos a mediana tempo de serviço. Metade do total de trabalhadores é (10+20+5)/2 = 17,5 e está no intervalo de 3 a 5 anos, sendo que no primeiro intervalo até 3 anos são apenas 10 trabalhadores, e nos dois primeiros - (10+20) =30, que é maior que 17,5, significa que o intervalo de 3 a 5 anos é a mediana. Dentro dela determinamos o valor condicional da mediana: Me = 3+2*(0,5*30-10)/20 = 3,5 (anos).

    Assim como no caso da moda, na determinação da mediana, se o intervalo de intervalos h for diferente, então em vez de frequências f é necessário utilizar densidades de intervalo, calculadas dividindo as frequências f pelo intervalo do intervalo h.

    Indicadores de variação

    Variaçãoé a diferença nos valores dos valores X para unidades individuais da população estatística. Para estudar a força da variação, são calculados os seguintes indicadores de variação: , , , , .

    Faixa de variação

    Faixa de variaçãoé a diferença entre os valores máximo e mínimo de X disponíveis na população estatística em estudo:

    A desvantagem de H é que ele mostra apenas a diferença máxima nos valores de X e não pode medir a força da variação em toda a população.

    Desvio linear médio

    Desvio linear médioé o módulo médio dos desvios dos valores de X da média aritmética. Pode ser calculado usando a fórmula da média aritmética simples- Nós temos :

    Por exemplo, um aluno foi aprovado em 4 provas e recebeu as seguintes notas: 3, 4, 4 e 5. = 4. Vamos calcular o desvio linear médio simples: L = (|3-4|+|4-4|+|4 -4|+| 5-4|)/4 = 0,5.

    Se os dados iniciais X estiverem agrupados (há frequências f), então o desvio linear médio é calculado usando a fórmula da média aritmética pesada- Nós temos :

    Voltemos ao exemplo de um aluno que passou em 4 provas e obteve as seguintes notas: 3, 4, 4 e 5. = 4 e = 0,5. Vamos calcular o desvio linear médio ponderado: L = (|3-4|*1+|4-4|*2+|5-4|*1)/4 = 0,5.

    Coeficiente de variação linear

    Coeficiente de variação linearé a razão entre o desvio linear médio e a média aritmética:

    Utilizando o coeficiente de variação linear, é possível comparar a variação de diferentes populações porque, diferentemente do desvio linear médio, seu valor não depende das unidades de medida X.

    No exemplo em questão sobre um aluno que passou em 4 exames e obteve as seguintes notas: 3, 4, 4 e 5, o coeficiente de variação linear será 0,5/4 = 0,125 ou 12,5%.

    Dispersão

    Dispersãoé o quadrado médio dos desvios dos valores de X da média aritmética. A dispersão pode ser calculada usando a fórmula da média aritmética simples- Nós temos variação simples:

    No exemplo que já conhecemos de um aluno que passou em 4 provas e recebeu notas: 3, 4, 4 e 5, = 4. Então a variância é simples D = ((3-4) 2 +(4-4) 2 +(4-4) 2 +(5-4) 2)/4 = 0,5.

    Se os dados originais X estiverem agrupados (existem frequências f), então a variância é calculada usando a fórmula da média aritmética pesada- Nós temos variância ponderada:

    No exemplo em questão sobre um aluno que passou em 4 exames e obteve as seguintes notas: 3, 4, 4 e 5, calculamos a variância ponderada: D = ((3-4) 2 *1+(4-4) 2 *2+(5 -4) 2 *1)/4 = 0,5.

    Se você transformar a fórmula de variância (abrir os parênteses no numerador, dividir termo por termo pelo denominador e fornecer outros semelhantes), poderá obter outra fórmula para calculá-la como a diferença entre a média quadrada e a média quadrada:

    É ainda mais fácil de encontrar desvio padrão, se a variância for pré-calculada como sua raiz quadrada:

    No exemplo do aluno, acima, encontramos o desvio padrão como a raiz quadrada dele: .

    Coeficiente de variação quadrático

    Coeficiente de variação quadráticoé a medida relativa de variação mais popular:

    Valor do critério O coeficiente de variação quadrático V é 0,333 ou 33,3%, ou seja, se V for menor ou igual a 0,333 a variação é considerada fraca, e se for maior que 0,333 é considerada forte. Em caso de forte variação, a população estatística estudada é considerada heterogêneo, e o valor médio é atípico e não pode ser utilizado como um indicador geral desta população.

    No exemplo de um aluno, acima, encontramos o coeficiente de variação quadrático V = 0,707/4 = 0,177, que é menor que o valor do critério de 0,333, o que significa que a variação é fraca e igual a 17,7%.

    A raiz quadrada da variância é chamada de desvio padrão da média, que é calculado da seguinte forma:

    Uma transformação algébrica elementar da fórmula do desvio padrão leva-a à seguinte forma:

    Esta fórmula muitas vezes acaba sendo mais conveniente na prática de cálculo.

    O desvio padrão, assim como o desvio linear médio, mostra o quanto, em média, os valores específicos de uma característica se desviam de seu valor médio. O desvio padrão é sempre maior que o desvio linear médio. Existe a seguinte relação entre eles:

    Conhecendo esta relação, você pode usar os indicadores conhecidos para determinar o desconhecido, por exemplo, mas (EU calcule a e vice-versa. O desvio padrão mede o tamanho absoluto da variabilidade de uma característica e é expresso nas mesmas unidades de medida que os valores da característica (rublos, toneladas, anos, etc.). É uma medida absoluta de variação.

    Para sinais alternativos, por exemplo, a presença ou ausência de ensino superior, seguros, as fórmulas de dispersão e desvio padrão são as seguintes:

    Mostremos o cálculo do desvio padrão de acordo com os dados de uma série discreta que caracteriza a distribuição dos alunos de uma das faculdades da universidade por idade (Tabela 6.2).

    Tabela 6.2.

    Os resultados dos cálculos auxiliares são apresentados nas colunas 2 a 5 da tabela. 6.2.

    A idade média de um aluno, anos, é determinada pela fórmula da média aritmética ponderada (coluna 2):

    Os desvios quadrados da idade individual do aluno em relação à média estão contidos nas colunas 3-4, e os produtos dos desvios quadrados e as frequências correspondentes estão contidos na coluna 5.

    Encontramos a variância da idade dos alunos, anos, usando a fórmula (6.2):

    Então o = l/3,43 1,85 *oda, ou seja, Cada valor específico da idade de um aluno se desvia da média em 1,85 anos.

    O coeficiente de variação

    No seu valor absoluto, o desvio padrão depende não só do grau de variação da característica, mas também dos níveis absolutos das opções e da média. Portanto, é impossível comparar diretamente os desvios-padrão das séries de variação com diferentes níveis médios. Para poder fazer tal comparação, é necessário encontrar a participação do desvio médio (linear ou quadrático) na média aritmética, expressa em porcentagem, ou seja, calcular medidas relativas de variação.

    Coeficiente de variação linear calculado pela fórmula

    O coeficiente de variação determinado pela seguinte fórmula:

    Nos coeficientes de variação, elimina-se não só a incomparabilidade associada às diferentes unidades de medida da característica em estudo, mas também a incomparabilidade que surge devido às diferenças no valor das médias aritméticas. Além disso, os indicadores de variação caracterizam a homogeneidade da população. A população é considerada homogênea se o coeficiente de variação não ultrapassar 33%.

    De acordo com a tabela. 6.2 e os resultados dos cálculos obtidos acima, determinamos o coeficiente de variação, %, conforme fórmula (6.3):

    Se o coeficiente de variação ultrapassar 33%, isso indica a heterogeneidade da população estudada. O valor obtido no nosso caso indica que a população de alunos por idade é homogênea em composição. Assim, uma função importante da generalização dos indicadores de variação é avaliar a confiabilidade das médias. Quanto menos c1, a2 e V, quanto mais homogêneo for o conjunto de fenômenos resultante e mais confiável for a média resultante. De acordo com a “regra dos três sigma” considerada pela estatística matemática, em séries normalmente distribuídas ou próximas a elas, desvios da média aritmética não superiores a ±3 ocorrem em 997 casos em 1000. Assim, sabendo X e a, você pode ter uma ideia inicial geral da série de variações. Se, por exemplo, o salário médio de um funcionário de uma empresa for 25.000 rublos e a for igual a 100 rublos, então com uma probabilidade próxima da certeza, podemos dizer que os salários dos funcionários da empresa flutuam dentro da faixa (25.000 ± ± 3 x 100), ou seja, de 24.700 a 25.300 rublos.