Distribuição hipergeométrica

Da Thinkfn

Em teoria das probabilidades e estatística, a distribuição hipergeométrica é uma distribuição de probabilidade discreta que descreve o número de sucessos numa sequência de n extracções de uma população finita, sem reposição.

Seja N um conjunto tal que existem K elementos classificados como sucesso e N-K elementos classificados como insucesso. Um conjunto de n elementos é seleccionado, aleatoriamente e sem reposição, do conjunto de N elementos.

A variável aleatória X denota o número de sucessos na amostra. Então, X tem distribuição hipergeométrica e


 P(X=x|N,K,n) = {{{K \choose x} {{N-K} \choose {n-x}}}\over {N \choose n}}


onde x= 0,1,2,...,min(K,n) e onde {a \choose b} refere-se ao coeficiente binomial, o número de combinações possíveis ao seleccionar b elementos de um total a.

O valor esperado da variável aleatória X é dado por


E[X]=n\bigg({K \over N}\bigg)


e a sua variância


Var[X]=\bigg(\frac{N-n}{N-1}\bigg)(n)\bigg(\frac{K}{N}\bigg)\bigg( 1-\frac{K}{N}\bigg).


Quando o tamanho da população é muito maior do que a amostra (isto é, N é muito maior que n) a distribuição hipergeométrica é razoavelmente bem aproximada pela distribuição binomial com parâmetros n (número de tentativas) e p = K / N (probabilidade de sucesso numa tentativa única).


Exemplo

Um jogo de loteria consiste em selecionar seis dezenas do conjunto de cem dezenas de 00 a 99, com uma bola para cada dezena e sem reposição. Num volante (cartão aposta) o jogador pode escolher de 6 a 12 dezenas. Qual é a probabilidade de acertar-se a quina (5 dezenas) marcando-se 10 dezenas no volante?

Temos:

  • N: total de dezenas, N = 100
  • n: total de dezenas sorteadas, n = 6
  • K: total de dezenas escolhidas, K = 10
  • X: total de sucessos, queremos X = 5


 P(X=5|100,10,6) = {{{10 \choose 5} {{100-10} \choose {6-5}}}\over {100 \choose 6}} = {{{30.240} * {90}}\over {858.277.728.000}} = 0,000003171


A probabilidade de se acertar a quina é de aproximadamente 0,0003%.



Smallwikipedialogo.png

Esta página usa conteúdo da Wikipedia. O artigo original estava em Distribuição hipergeométrica. Tal como o Think Finance neste artigo, o texto da Wikipedia está disponível segundo a GNU Free Documentation License.