Análise de caminho – Wikipédia, a enciclopédia livre
Em estatística, a análise de caminho é usada para descrever as dependências direcionadas entre um conjunto de variáveis. Isso inclui modelos equivalentes a qualquer forma de análise de regressão múltipla, análise fatorial, análise de correlação canônica, análise discriminante, bem como famílias mais gerais de modelos na análise de variância multivariada e análises de covariância (MANOVA, ANOVA, ANCOVA).
Além de ser pensada como uma forma de regressão múltipla com foco na causalidade, a análise de caminho pode ser vista como um caso especial de modelagem de equações estruturais – uma na qual apenas indicadores únicos são empregados para cada uma das variáveis do modelo causal. Ou seja, a análise de caminho é uma modelagem de equações estruturais com um modelo estrutural, mas sem modelo de medição. Outros termos usados para se referir à análise de caminho incluem modelagem causal, análise de estruturas de covariância e modelos de variáveis latentes.
A análise de caminho é considerada por Judea Pearl como um ancestral direto das técnicas de inferência causal.[1]
História
[editar | editar código-fonte]A análise de caminho foi desenvolvida por volta de 1918 pelo geneticista Sewall Wright, que escreveu sobre isso mais extensivamente na década de 1920.[2] Desde então, tem sido aplicada a uma vasta gama de áreas de modelagem complexa, incluindo biologia, psicologia, sociologia e econometria.[3]
Modelagem de caminho
[editar | editar código-fonte]Normalmente, os modelos de caminho consistem em variáveis independentes e dependentes representadas graficamente por caixas ou retângulos. Variáveis que são independentes, e não variáveis dependentes, são chamadas de 'exógenas'. Graficamente, essas caixas de variáveis exógenas ficam nas bordas externas do modelo e têm apenas setas de ponta única saindo delas. Nenhuma seta de ponta única aponta para variáveis exógenas. As variáveis que são apenas variáveis dependentes, ou são variáveis independentes e dependentes, são denominadas 'endógenas'. Graficamente, as variáveis endógenas têm pelo menos uma seta de ponta única apontando para elas.
No modelo abaixo, as duas variáveis exógenas (Ex1 e Ex2) são modeladas como sendo correlacionadas conforme representado pela seta de duas pontas. Ambas as variáveis têm efeitos diretos e indiretos (através de En 1) sobre En2 (as duas variáveis/fatores dependentes ou 'endógenos'). Na maioria dos modelos do mundo real, as variáveis endógenas também podem ser afetadas por variáveis e fatores externos ao modelo (efeitos externos, incluindo erro de medição). Esses efeitos são representados pelo "e" ou termos de erro no modelo.
Regras de rastreamento de caminho
[editar | editar código-fonte]A fim de calcular validamente a relação entre quaisquer duas caixas no diagrama, Wright propôs um conjunto simples de regras de rastreamento de caminho,[4] para calcular a correlação entre duas variáveis. A correlação é igual à soma da contribuição de todas as vias pelas quais as duas variáveis estão conectadas. A força de cada um desses caminhos contribuintes é calculada como o produto dos coeficientes de caminho ao longo dessa caminho.
As regras para rastreamento de caminho são:
- Você pode traçar para trás uma seta e depois avançar ao longo da próxima, ou avançar de uma variável para outra, mas nunca para frente e depois para trás. Outra maneira de pensar nessa regra é que você nunca pode passar de uma ponta de flecha para outra ponta de flecha.
- Você pode passar por cada variável apenas uma vez em uma determinada cadeia de caminhos.
- Não mais do que uma seta bidirecional pode ser incluída em cada cadeia de caminhos.
Rastreamento de caminho em modelos não padronizados
[editar | editar código-fonte]Se as variáveis modeladas não foram padronizadas, uma regra adicional permite que as covariâncias esperadas sejam calculadas desde que não existam caminhos conectando variáveis dependentes a outras variáveis dependentes.
Ver também
[editar | editar código-fonte]- Rede bayesiana
- Causalidade
- Modelo oculto de Markov
- Modelo de variável latente
- Modelo de equação estrutural
Referências
- ↑ Pearl, Judea (maio de 2018). The Book of Why. New York: Basic Books. ISBN 978-0-465-09760-9
- ↑ Wright, S. (1921). «Correlation and causation». J. Agricultural Research. 20: 557–585
- ↑ Dodge, Y. (2003) The Oxford Dictionary of Statistical Terms. OUP. ISBN 0-19-920613-9
- ↑ Wright, S. (1934). «The method of path coefficients». Annals of Mathematical Statistics. 5 (3): 161–215. doi:10.1214/aoms/1177732676