Cadeias de Markov

Da Thinkfn

Em matemática, a cadeia de Markov é um caso particular de processo estocástico. Com tempo discreto. E apresentando a propriedade de Markov, chamada assim em homenagem ao matemático Andrei Andreyevich Markov. A definição desta propriedade, também chamada de memória markoviana, é que os estados anteriores são irrelevantes para a predição dos estados seguintes, desde que o estado actual seja conhecido.

Note que também existem cadeias de Markov de estado contínuo.

Uma cadeia de Markov é uma seqüencia X1, X2, X3, ... de variáveis aleatórias. O escopo destas variáveis, isto é, o conjunto de valores que elas podem assumir, é chamado de espaço de estados, onde Xn denota o estado do processo no tempo n. Se a distribuição de probabilidade condicional de Xn+1 nos estados passados é uma função apenas de Xn, então:

 \Pr(X_{n+1}=x|X_0, X_1, X_2, \ldots, X_n) = \Pr(X_{n+1}=x|X_n), \,

onde x é algum estado do processo. A identidade acima define a propriedade de Markov.

Uma maneira simples de visualizar um tipo específico de cadeia de Markov é através de uma máquina de estados finitos. Se você está no estado y no tempo n, então a probabilidade de que você se mova para o estado x no tempo n + 1 não depende de n, e somente depende do estado actual y em que você está. Assim em qualquer tempo n, uma cadeia de Markov finita pode ser caracterizada por uma matriz de probabilidades cujo elemento (x, y) é dado por  \Pr(X_{n+1}=x|X_n=y) \, e é independente do tempo n. Estes tipos de cadeia de Markov finitas e discretas podem também ser descritas por meio de um grafo dirigido, onde cada aresta é rotulada com as probabilidade de transição de um estado a outro sendo estes estados representados como os nós conectados pelas arestas.

Andrey Markov obteve os primeiros resultados para estes processos em 1906. Uma generalização para espaços de estados infinitos contáveis foi dada por Kolmogorov em 1936. Cadeias de Markov estão relacionadas ao movimento Browniano e à hipótese ergódica, dois importantes tópicos da física nos primeiros anos do século XX, mas a motivação de Markov para o desenvolvimento da teoria parece ter sido estender a teoria dos números grandes para eventos dependentes.

Cadeias de Markov em espaços de estados discretos

Um espaço de estados é representável por uma matriz. Chamada de matriz de transição, com o (i, j)-ésimo elemento igual a

P_{ij} = \Pr(X_{n+1}=j\mid X_n=i) \,

Para um espaço de estados discretos, as integrações na probabilidade de transição de k passos são somatórios, e podem ser calculados como a k-ésima potência da matriz de transição. Isto é, se P é a matriz de transição para um passo, então Pk é a matriz de transição para a transição de k passos.

A distribuição estacionária é o vetor que satisfaz à equação

 \pi^{T}\mathbf{P} = \pi^{T},

onde \pi^{T} é a matriz transposta de \pi. Em outras palavras, a distribuição estacionária \pi é o autovetor esquerdo da matriz de transição, associado com o autovalor 1.

Como conseqüencia, nem a existência nem a unicidade de distribuição estacionária é garantida para uma matriz de transição qualquer P. Contudo, se P é irredutível e aperiódica, então existe uma distribuição estacionária \pi. Além disso, Pk converge para uma matriz na qual cada linha é a (transposta da) distribuição estacionária \pi^T, que é dada por

\lim_{k\rightarrow\infty}\mathbf{P}^k=\mathbf{1}\pi^T,

onde \mathbf{1} é o vetor coluna com todas as entradas iguais a 1. Isto é estabelecido pelo Teorema de Perron-Frobenius.

Isto siginifica que se nós simularmos ou observamos uma caminhada aleatória com matriz de transição P, então a probabilidade de longo prazo de que o indivíduo que faz a caminhada esteja em um certo estado é independente do estado em que a caminha começou, e é definida pela distribuição estacionária. A caminhada aleatória "ignora" o passado. Em suma, cadeias de Markov são o passo seguinte depois dos processos sem memória (isto é, uma seqüencia de variáveis aleatórias independentes distribuidas uniformemente).

Uma matriz de transição que é positiva (isto é, todo o elemento da matriz é positivo) é irredutível e aperiódica. Uma matriz é uma matriz estocástica se e somente se é uma matriz de probabilidades de transição de uma cadeia de Markov.

Um caso especial de probabilidade de transição independente do passado é conhecido como o esquema de Bernoulli. Um esquema de Bernoulli com somente dois estados possíveis é conhecido como um processo de Bernoulli.

Referências

  • A.A. Markov. "Rasprostranenie zakona bol'shih chisel na velichiny, zavisyaschie drug ot druga". Izvestiya Fiziko-matematicheskogo obschestva pri Kazanskom universitete, 2-ya seriya, tom 15, pp 135-156, 1906.
  • A.A. Markov. "Extension of the limit theorems of probability theory to a sum of variables connected in a chain". reimpresso no Apêndice B de: R. Howard. Dynamic Probabilistic Systems, volume 1: Markov Chains. John Wiley and Sons, 1971.
  • Leo Breiman. Probability. Edição original publicada pela Addison-Wesley em 1968; reimpressa pela Society for Industrial and Applied Mathematics em 1992. ISBN 0-89871-296-3. (ver Capítulo 7.)
  • J.L. Doob. Stochastic Processes. New York: John Wiley and Sons, 1953. ISBN 0-471-52369-0.

Ligações externas


Smallwikipedialogo.png

Esta página usa conteúdo da Wikipedia. O artigo original estava em Cadeias_de_Markov. Tal como o Think Finance neste artigo, o texto da Wikipedia está disponível segundo a GNU Free Documentation License.