Análise multivariada da variância – Wikipédia, a enciclopédia livre

Em estatística, a análise multivariada da variância ou MANOVA (do inglês multivariate analysis of variance) é um procedimento para comparação de médias amostrais multivariadas. Como um procedimento multivariado, é usada quando há duas ou mais variáveis dependentes e é tipicamente seguida por testes de significância envolvendo variáveis dependentes individuais separadamente.[1] A análise multivariada da variância ajuda a responder:[2]

  1. As mudanças na variável independente ou nas variáveis independentes têm efeitos significantes nas variáveis dependentes?
  2. Quais são as relações entre as variáveis dependentes?
  3. Quais são as relações entre as variáveis independentes?

Relação com a análise de variância (ANOVA)

[editar | editar código-fonte]

A análise multivariada da variância é uma forma generalizada da análise de variância univariada (ANOVA), embora, diferentemente desta, a análise multivariada da variância use a covariância entre variáveis dependentes ao testar a significância estatística das diferenças de média.[1]

Onde aparecem somas de quadrados na análise univariada da variância, aparecem matrizes positivas definidas na análise multivariada. As entradas na diagonal são os mesmos tipos de somas de quadrados que aparecem na análise univariada. As entradas fora da diagonal são as somas dos produtos correspondentes. Sob pressupostos de normalidade sobre as distribuições de erro, a contraparte da soma dos quadrados devido ao erro tem uma distribuição de Wishart.

A análise multivariada da variância é baseada no produto da matriz de variância do modelo, , pelo inverso da matriz de variância do erro, , ou . A hipótese de que implica que o produto .[3] Considerações de invariância implicam que a estatística da análise multivariada da variância deve ser uma medida de magnitude da decomposição em valores singulares deste produto de matriz, mas não há uma única escolha devido à natureza multidimensional da hipótese alternativa.

As estatísticas mais comuns são resumos baseados nas raízes (ou autovalores) da matriz :[4][5]

  • Lambda de Wilks: com distribuição lambda de Wilks;
  • Traço de Pillai–Bartlett: ;[6]
  • Traço de Lawley–Hotelling: ;
  • Maior raiz de Roy: .

Há discussão sobre os méritos de cada uma, ainda que a estatística da maior raiz leve apenas a um limite sobre a significância que não é geralmente de interesse prático.[1] Uma complicação posterior é que, exceto para a maior raiz de Roy, a distribuição destas estatísticas sob a hipótese nula não é direta e pode apenas ser aproximada, exceto em alguns poucos casos de baixas dimensões.[7] Um algoritmo para a distribuição da maior raiz de Roy sob a hipótese foi derivado e a distribuição sob a alternativa tem sido estudada.[8][9]

A aproximação mais conhecida para o lambda de Wilks foi derivada pelo matemático indiano Calyampudi Radhakrishna Rao.

No caso de dois grupos, todas as estatísticas são equivalentes e o teste reduz ao T² de Hotelling.

Correlação de variáveis dependentes

[editar | editar código-fonte]

A potência da análise multivariada de variância é afetada pelas correlações das variáveis dependentes e pelos tamanhos de efeito associados com aquelas variáveis. Por exemplo, quando há dois grupos e duas variáveis dependentes, a potência da análise multivariada da variância é a mais baixa quando a correlação é igual à razão do tamanho de efeito padronizado menor pelo maior.[10]

  1. a b c Warne, R.T. (1 de janeiro de 2014). «A primer on multivariate analysis of variance (MANOVA) for behavioral scientists». Practical Assessment, Research and Evaluation. 19: 1–10 
  2. Paul), Stevens, James (James (2009). Applied multivariate statistics for the social sciences 5th ed. New York: Routledge. ISBN 9780805859010. OCLC 237880550 
  3. Carey, Gregory (1998). Multivariate Analysis of Variance (MANOVA): I. Theory (PDF). Boston: Academic Press. Consultado em 9 de fevereiro de 2018 
  4. Garson, G. David (2015). Multivariate GLM, MANOVA, and MANCOVA (PDF). Asheboro, Carolina do Norte: Statistical Associates. Consultado em 9 de fevereiro de 2018 
  5. «MANOVA - Stata Annotated Output». Institute for Digital Research and Education, University of California at Los Angeles. 2011. Consultado em 9 de fevereiro de 2018 
  6. «MANOVA Basic Concepts | Real Statistics Using Excel». www.real-statistics.com (em inglês). Consultado em 9 de fevereiro de 2018 
  7. «Multivariate statistical process monitoring and control». CAMO Software (em inglês). Consultado em 9 de fevereiro de 2018 
  8. «Distribution of the largest root of a matrix for Roy's test in multivariate analysis of variance». Journal of Multivariate Analysis (em inglês). 143: 467–471. 1 de janeiro de 2016. ISSN 0047-259X. doi:10.1016/j.jmva.2015.10.007 
  9. Johnstone, I. M.; Nadler, B. (1 de março de 2017). «Roy's largest root test under rank-one alternatives». Biometrika (em inglês). 104 (1). ISSN 0006-3444. doi:10.1093/biomet/asw060 
  10. Frane, Andrew V. (26 de março de 2015). «Power and Type I Error Control for Univariate Comparisons in Multivariate Two-Group Designs». Multivariate Behavioral Research. Consultado em 9 de fevereiro de 2018