Desvio padrão

Da Thinkfn

Em probabilidade e Estatística, o desvio padrão é a medida mais comum da dispersão estatística. O desvio-padrão define-se como a raiz quadrada da variância. É definido desta forma de maneira a dar-nos uma medida da dispersão que seja:

  1. um número não negativo;
  2. use as mesmas unidades de medida que os nossos dados.

Faz-se uma distinção entre o desvio padrão σ (sigma) do total de uma população ou de uma variável aleatória, e o desvio padrão s de um sub-conjunto em amostra.

O termo desvio padrão foi introduzido na estatística por Karl Pearson no seu livro de 1894: "Sobre a dissecção de curvas de frequência assimétricas".

Definição e cálculo

Desvio padrão de uma variável aleatória

O desvio padrão de uma variável aleatória X é definido como:

\sigma = \sqrt{\operatorname{E}((X-\operatorname{E}(X))^2)} = \sqrt{\operatorname{E}(X^2) - (\operatorname{E}(X))^2}

onde E(X) é o valor esperado de X.

Nem todas as variáveis aleatórias possuem desvio padrão, desde que esses valores esperados não precisam existir. Por exemplo, o desvio padrão de uma variável que flui em uma distribuição de Cauchy é indefinida.

Se uma variável aleatória X toma os valores x1,...,xN (que são números reais) com igual probabilidade, então seu desvio padrão pode ser computada como segue. Primeiro, a média de X, \overline{x}, é definida como:

\overline{x} = \frac{1}{N}\sum_{i=1}^N x_i = \frac{x_1+x_2+\cdots+x_N}{N}

(veja notação sigma). Depois, o desvio padrão simplifica-se em:

\sigma = \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \overline{x})^2}

Quando os dados estão agrupados(frequência) temos:

\sigma =\,\sqrt{{\frac{1}{\sum_fi} \sum_{i=1}^N ((x_i - \overline{x})^2}fi)}

Cálculo

Por outras palavras, o desvio padrão de uma variável aleatória uniformizada discreta X pode ser calculado como:

  1. Para cada valor x_i calcula-se a diferença x_i - \overline{x} entre x_i e o valor médio \overline{x}.
  2. Calcula-se o quadrado dessa diferença.
  3. Encontra-se a soma das diferenças dos quadrados.
  4. Divide-se este resultado pelo número de valores usados menos 1 (n-1). Esta quantidade é a variância σ².
  5. O desvio padão é a raiz quadrada desse resultado.

Propriedades

De uma distribuição normal unimodal, simétrica, de afunilamento médio (ou mesocúrtica) podemos dizer o seguinte:

  • 68% dos valores encontram-se a uma distância da média inferior a um desvio padrão.
  • 95% dos valores encontram-se a uma distância da média inferior a duas vezes o desvio padrão.
  • 99,7% dos valores encontram-se a uma distância da média inferior a três vezes o desvio padrão.

Esta informação é conhecida como a regra dos "68-95-99,7".

Ver também


Smallwikipedialogo.png

Esta página usa conteúdo da Wikipedia. O artigo original estava em Desvio_padrão. Tal como o Think Finance neste artigo, o texto da Wikipedia está disponível segundo a GNU Free Documentation License.