Testy parametryczne i nieparametryczne

CZERWIEC 2024| LJK | ~650 słów


Kryteria podziału testów są różne. Testy różnic - i testy związków. Testy kierunkowe - i bezkierunkowe. Istnieje też podział na testy parametryczne i nieparametryczne. Mogłoby się wydawać, że ten podział zależy od treści hipotezy zerowej (czy dotyczy konkretnego parametru, czy też nie), ale sedno podziału tkwi zupełnie gdzieś indziej.


Wprowadzenie

Jak pewnie wiesz, klasyczne testy statystyczne to maszynki do mielenia danych. Jak każda maszynka, do prawidłowego zadziałania wymaga ona materiału odpowiedniej jakości. Po to, aby w ogóle uruchomić się, lub dobrze zadziałać. Testy statystyczne są pod tym względem bardzo podobne. Cyferki, które są bazie są dla takiego testu tym, czym surowy materiał dla maszynki do mielenia mięsa. Jest przeznaczona do mielenia mięsa, ale zmieli też i warzywa. Kamieni już nie zmieli. Podobnie zachowują się testy. Test nie wie, co symbolizują dane, którymi karmi go badacz. Te jedynki i dwójki mogą reprezentować zarówno ilościową zmienną np. liczbę rodzeństwa, albo zmienną jakościową np. płeć. Z tego powodu, zanim uruchomi się test statystyczny, należy sprawdzić czy dane są odpowiedniej jakości. Czy test, który gdzieś wewnątrz mechanizmu oblicza średnią arytmetyczną, otrzyma dane ilościowe - bo tylko taki typ zmiennej uprawnia do zastosowania testu.

Proces sprawdzania jakości danych nazywa się założeniami testu. Założenia różnych testów są siłą rzeczy różne. Mogą być mniej lub bardziej specyficzne. Na przykład test chi-kwadrat wymaga, aby dane miały jakościowy charakter - i to wszystko. Inny znany test, test t-Studenta dla dwóch prób niezależnych (ang. two-sample t-test independent) ma całą listę wymagań - nie tylko wymaga, aby jedna ze zmiennych była ilościowa, ale również żąda, aby wartości tej zmiennej ilościowej pojawiały się zgodnie z częstością rozkładu normalnego (tj. aby rozkład zmiennej był rozkładem normalnym) i to w obu kategoriach zmiennej jakościowej na raz. To z kolei bardzo duże wymaganie. Czym zatem różni się jeden test od drugiego? Przecież nie może chodzić tylko i wyłącznie o liczbę założeń.


Parametryczność i nieparametryczność testu

I tu wchodzi pewien typ podziału testów pod względem oczekiwań wobec danych. Ten podział przebiega wzdłuż tego, czy dany test wymaga, aby rozkład zmiennej (lub zmiennych) był określonej postaci. Pisząc :"określonej postaci", mam na myśli dokładną postać funkcyjną. Nie chodzi tu posiadanie konkretnej własności takiej jak symetria czy jednomodalność (posiadanie jednej mody) a konkretny wzór rozkład łączący wartości zmiennej z szansami ich wystąpienia. Najczęściej możesz spotkać się z rozkładem normalnym, ale to nie jest jedyny opisany rozkład, jest ich całe mnóstwo - eksponencjalny, Pareto, itd.

Poniższa grafika przedstawia kilka popularnych testów statystycznych przydzielonych do jednej z dwóch kategorii


 

W ten sposób testy parametryczne to takie, które żądają, aby rozkłady zmiennych były konkretne, precyzyjnie określone. W przeciwieństwie do nich testy nieparametryczne nie żądają konkretnej postaci rozkładu. Nie znaczy to jednak, w ogóle nie mają żadnych założeń i można do ich maszynek włożyć dane dowolnego typu i kształtu.


Test U Manna-Whitney'a jako przykład testu nieparametrycznego z założeniami

Świetnym przykładem tego, że traktowanie testu nieparametrycznego jako pozbawionego założeń może prowadzić do błędnych wniosków, jest test U-Manna-Whitney'a. Jest to zamiennik testu t-Studenta dla dwóch grup niezależnych, gdy badacz ma wyrzuty sumienia z powodu zastosowania testu pierwszego wyboru. - Masz małą liczebność próby? Zastosuj test U Manna-Whitney'a. - Masz nierównoliczne grupy? Zastosuj test U Manna-Whitney'a. - Problem z normalnością zmiennej? Zastosuj test U Manna-Whitney'a.

W ten sposób badacz uczy się bezwarunkowego odruchu. Nie trzeba dodawać, że w statystyce bezwarunkowe odruchy nie są najlepszymi odruchami. Wszystko dlatego, że test U-Manna-Whitney'a bywa zamiennikiem testu t-Studenta dla dwóch grup niezależnych, o ile stopień rozproszenia danych jest zbliżony (tj. wariancje są homogeniczne). W przeciwnym wypadku odpowiada jedynie na pytanie, czy szansa na zaobserwowanie wyższych wartości zmiennej zależnej z jednej kategorii od wartości tej samej zmiennej z drugiej kategorii jest taka sama jak szansa na zaobserwowanie wyższych wartości (w odwrotnej kolejności kategorii). Ponieważ czuję, że kompletnie nie wychodzi mi słowny opis matematycznego zapisu P(X > Y) = P(X < Y) (a tak dokładnie brzmi hipoteza zerowa tego testu), dla jasności posłużę się przykładem.

Szansa na zaobserwowanie wyższej empatii u kobiet niż u mężczyzn jest taka sama jak szansa na zaobserwowanie wyższej empatii u mężczyzn niż u kobiet - tak brzmiałaby hipoteza zerowa testu U-Manna Whitney'a w badaniach nad związkami empatii i płci. To zupełnie inna para kaloszy niż średnie nasilenie zmiennej empatia u kobiet jest równe średniemu nasileniu zmiennej empatia u mężczyzn.

Brak komentarzy: