Test Wilcoxona dla par obserwacji – Wikipedia, wolna encyklopedia
Test Wilcoxona dla par obserwacji – nieparametryczna alternatywa dla testu t-Studenta dla przypadku dwóch równolicznych prób dających się połączyć w pary. Często używa się tego testu do porównywania danych zebranych przed i po eksperymencie w celu zbadania, czy nastąpiła istotna statystycznie zmiana.
Porównanie z testem t-Studenta
[edytuj | edytuj kod]O ile test t-Studenta sprawdza hipotezę zerową o równości średnich arytmetycznych w odpowiadających im populacjach, test Wilcoxona weryfikuje równość median.
Jak test t-Studenta, test Wilcoxona bazuje na różnicach między wartościami cech z porównywanych zbiorów, stąd również wymaga zmiennych na skali interwałowej. W przeciwieństwie jednak do testu t-Studenta nie posiada założeń dotyczących rozkładu próby. Może zatem być używany w sytuacjach, gdy założenia testu t-Studenta nie są spełnione.
Dane
[edytuj | edytuj kod]Załóżmy, że zebraliśmy obserwacji, po dwie dla każdego z n przypadków. Niech będzie indeksem danego przypadku, będzie pierwszą, a drugą obserwacją przypadku
Założenia
[edytuj | edytuj kod]- Niech dla Zakłada się, że różnice są niezależne.
- Każda różnica pochodzi z populacji o identycznym ciągłym rozkładzie, symetryczny względem wspólnej mediany
Wyliczanie statystyki Wilcoxona
[edytuj | edytuj kod]Testowaną hipotezą zerową jest:
Algorytm wyliczania statystyki testu Wilcoxona:
- wyliczenie różnic
- uporządkowanie wartości bezwzględnych
- zrangowanie tak otrzymanego zbioru i oznaczenie rang przez Rangi związane uzyskują wartość średnią.
- zdefiniowanie statystyki jako sumy rang dla których
Niekiedy wykonuje się dalsze kroki:
- Analogicznie obliczana jest statystyka czyli suma rang, dla których
- Statystyka jest obliczana jako:
Właściwości statystyki Wilcoxona
[edytuj | edytuj kod]Właściwości statystyki
- Dla dowolnej liczby
- gdy
Do obliczenia wartości p dla prób o małej liczności (zwykle przyjmuje się ) korzysta się z tablic statystycznych. Dla dużych prób używa się przybliżenia rozkładem normalnym, z parametrami podanymi wyżej.
Historia
[edytuj | edytuj kod]Twórcą testu był Frank Wilcoxon (1892–1965), który zaproponował go w jednym artykule (Wilcoxon, 1945) z innym testem, zwanym obecnie testem Manna-Whitneya (lub testem Wilcoxona dla dwóch prób).
Test Wilcoxona był spopularyzowany przez Siegla (1956) w jego wpływowym podręczniku statystyki nieparametrycznej. Siegel używał symbolu dla wielkości oznaczanej powyżej przez W konsekwencji test czasami jest nazywany testem T Wilcoxona, a statystyka testowa jest podawana jako wartość
Bibliografia
[edytuj | edytuj kod]- Jacek Koronacki, Jan Mielniczuk: Statystyka dla studentów kierunków technicznych i przyrodniczych. Warszawa: WNT, 2001, s. 467–471. ISBN 83-204-2684-7.
- Sidney Siegel: Non-parametric statistics for the behavioral sciences. Nowy York: McGraw-Hill, 1956.
- Frank Wilcoxon: Individual comparisons by ranking methods. Biometrics, 1945, s. 1, 80-83.
Linki zewnętrzne
[edytuj | edytuj kod]- Metoda wyliczania p dla testu Wilcoxona (ang.)
- Przykład zastosowania testu Wilcoxona. faculty.vassar.edu. [zarchiwizowane z tego adresu (2017-06-04)]. (ang.)
- Wersja testu online. faculty.vassar.edu. [zarchiwizowane z tego adresu (2008-02-18)]. (ang.)
Implementacje
[edytuj | edytuj kod]- ALGLIB zawiera implementację testu Wilcoxona w C++, C#, Delphi, Visual Basicu itp.