Kurtoza w sosie własnym

SPIS TREŚCI:

PARAMETR KSZTAŁTU - Kurtozę zaliczamy do statystyk opisowych porządkujących zebrane dane i organizujące sposób ich przedstawienia. To pojedyncza liczba, która przenosi informację o rozkładzie, zupełnie inną niż średnia, odchylenie standardowe i wariancja czy skośność. Poprawna interpretacja kurtozy uwzględnia sytuację zarówno w szczycie rozkładu, jak i w ogonach rozkładu, dlatego mówi się, że kurtoza jest parametrem kształtu. 

ANATOMIA ROZKŁADU - Aby to dobrze zrozumieć i jednocześnie nie popełnić błędu zmieszania kurtozy z wariancją, musimy przypomnieć sobie pojęcia związane z rozkładem: szczyt, ramiona i ogony oraz to, że mamy dokładnie jednostkowe pole pod krzywą.

Jeśli pamiętasz składowe rozkładu (szczyt, ramiona i ogony), to szczyt to ten zakres wartości cechy, która relatywnie trafia się częściej niż pozostałe wartości. W ogonach rozkładu znajdują się obserwacje odstające (outliery). Tą masą rozkładu można sterować tworząc rozkłady dowolnego kształtu i dowolnych własności. Jeśli uformujemy z niej krzywą dzwonową, to otrzymamy rozkład normalny. Możemy teraz tę masy ścisnąć i wyciągnąć ku górze. Otrzymamy wówczas rozkład nieco bardziej smukły niż rozkład normalny. Możemy też nacisnąć od góry i otrzymamy rozkład nieco bardziej wypłaszczony

Wszystko, co robimy z rozkładem, znajdzie odzwierciedlenie w szansach wartości. W pierwszym przypadku, gdy wyciągniemy szczyt ku górze, to wartości cechy z przedziału wokół szczytu staną się jeszcze bardziej prawdopodobne niż w rozkładzie normalnym (w normalnym, to zgodnie z regułą trzech sigma to jest 68%). Natomiast jeśli spłaszczymy rozkład, to zwiększymy szansę wystąpienia wartości bardziej odległych od średniej.

Przy czym, operowanie masą rozkładu może nie wpływać na odchylenie standardowe. Innymi słowami, jesteśmy w stanie tak lepić tę masę, że odchylenie standardowe zostanie takie samo, ale zmieni się parametr kształtu – kurtoza.

KURTOZA I WARIANCJA — to dwa oddzielne parametry. Kurtoza jest wskaźnikiem kształtu, natomiast wariancja jest wskaźnikiem zmienności (rozproszenia). Ujemna kurtoza wcale nie oznacza większej wariancji, a dodatnia kurtoza nie pociąga zmniejszonej zmienności cechy.

Aby pokazać brak związku wariancji i kurtozy trzeba znaleźć takie dwa rozkłady, które nie różnią się tym pierwszym, ale różnią kurtozą. Na poniższym rysunku krzywa dzwonowa to oczywiście krzywa rozkładu normalnego. Średnia wynosi μ = 0.5. Odchylenie standardowe wynosi około 0,29 (dokładnie: pierwiastek z 1/12). Prostokątny kształt to rozkład jednostajny. Jego wartość oczekiwana również wynosi 0,5. Odchylenie standardowe również wynosi pierwiastek z 1/12. Mamy więc dwa rozkłady, których dwie miary rozproszenia są sobie równe. Natomiast kurtoza rozkładu normalnego wynosi 0, zaś kurtozy rozkładu jednostajnego wynosi -6/5.

Gdyby kurtoza i wariancja pokazywały tę samą informację, to powinny być sobie równe, a nie są.

Wiele podręczników do statystyki przedstawia kurtozę tylko jako miarę koncentracji obserwacji wokół średniej. Czyli, że kurtoza podaje informację jedynie o tym, czy obserwacje są skupione wokół wartości średniej, czy są bardziej rozbiegane wokół średniej - oczywiście, wszystko w porównaniu do rozkładu normalnego. Małe rozbieganie manifestuje się wysokim szczytem. Duże rozbieganie to bardziej płaski szczyt. Ale to tylko tylko połowa prawdy. Druga połowa to prawda o obecności obserwacji ekstremalnych.

ROZKŁADY MEZO-, LEPTO- I PLATYKURTYCZNE — Kurtoza różnicuje rozkłady na takie, które mają ujemną i dodatnią wartość tego parametru i na rozkłady, które mają zerową kurtozę, których przykładem jest rozkład normalny.

ROZKŁAD MEZOKURTYCZNY — Mezokurtyczny rozkład ma kurtozę równą zero, a przykładem takiego rozkładu jest rozkład normalny. Około 68% jego masy skoncentrowaną łagodnie wokół średniej. Coraz dalej od szczytu ciągną się ogony z jednej i z drugiej strony. To oznacza, że obserwacje odstające (outliery) mają prawo pojawiać się z określoną częstością. Jeśli rozkład cechy jest porównywany do rozkładu normalnego, to również musi outlierom dawać szansę wystąpienia, taką jak jak w rozkładzie normalnym.

ROZKŁAD LEPTOKURTYCZNY — Jeśli kurtoza jest dodatnia, to rozkład nazywa się rozkładem leptokurtycznym. Oznacza to, że wartości interesującej nas cechy są skoncentrowane wokół średniej oraz istnieje większa szansa pojawienia się z ogonów, czyli outlierów (tutaj ważne jest to słowo "oraz").

Słowo lepto można skojarzyć z teorią konstytucjonalną Kretchmera, gdzie jednym z typów budowy ciała jest leptosomatyk - osoba o wąskiej klatce piersiowej i smukłej sylwetce. Lucky Luke, Abraham Lincoln i Kate Moss - tylko każdej z tych osób należy wręczyć siaty z ciężkimi zakupami do obu rąk (aby zaznaczyć obserwacje odstające).

ROZKŁAD PLATYKURTYCZNY — Jeśli kurtoza jest ujemna (mniejsza od zera), to rozkład jest rozkładem platykurtycznym. Masa rozkładu rozlewa się Wartości zmiennej są rozrzucone wokół średniej oraz mamy mniejsze prawdopodobieństwo spotkania wartości ekstremalnych.

W wielu czynnościach występuje faza plateau, gdzie wysiłek wkładany w wykonywanie tejże czynności nie przynosi już zysków podobnych do tych z początku.

ROZKŁAD NORMALNY a ROZKŁADY LEPTO- I PLATYKURTYCZNE — Złóżmy razem na jednym rysunku relację między poszczególnymi typami rozkładów a rozkładem normalnym.


Ten rysunek pokazuje, jak zachowują się rozkłady leptokurtyczne względem rozkładu normalnego (którego kurtoza wynosi zero) i to jest lewa część rysunku. Po prawej stronie widać rozkład platykurtyczny.

PRZYKŁAD LEPTO- I PLATYKURTYCZNEJ INTELIGENCJI — Aby lepiej poznać zagadnienia związane z kurtozą, przemyślmy dwa przypadki, w którym inteligencja będzie raz rozkładem leptokurtycznym, a raz – platokurtycznym. Przyjmuje się, że wyniki inteligencji w populacji zdarzają się zgodnie rozkładem normalnym, co jest nieco nadużyciem, ale będzie to tylko przykład.

Leptokurtyczność to wyciągnięcie szczytu do góry i spłynięcie masy do ogonów. Gdyby rozkład inteligencji był leptokurtyczny, byłoby wówczas więcej osób obniżonym ilorazie inteligencji, ale też więcej Musków, Jobsów i Curiów. Częściej niż w rozkładzie normalnym pojawiałyby się osoby o umiarkowanym ilorazie.

Platokurtyczność rozkładu inteligencji przełożyłaby się na częstszą obecność osób o umiarkowanej inteligencji. Jednocześnie byłoby mniej niż teraz osób o obniżonej inteligencji i podwyższonej inteligencji.

KURTOZA NARZĘDZIEM DIAGNOSTYKI NORMALNOŚCI — Jak już wiemy, rozkłady często porównujemy do jednego zajmującego szczególne miejsce w różnych naukach, a mianowicie do rozkładu normalnego. Do dyspozycji jest kilka narzędzi np. graficzne lub liczbowe. Kurtoza należy do tych drugich, do statystyk opisowych. Ciężko jednak oczekiwać, że kurtoza obliczona w badaniu zawsze wyjdzie zero. Potrzebujemy reguły kciuka, dzięki której będziemy mogli wiedzieć, że na konkretną wartość kurtozy możemy machnąć ręką.

Ogólnie przyjmuje się, że jeśli otrzymasz wartość kurtozy, która znajdzie się w przedziale od -2 do +2, to wówczas możesz bezpiecznie założyć, że Twój rozkład jest pod względem kurtozy zbliżony do rozkładu normalnego.

2 komentarze:

Unknown pisze...

...to jest najlepiej wytłumaczona Kurtoza,
jaką kiedykolwiek spotkałem w necie ;-D

Anonimowy pisze...

Ciekawie wytłumaczone. Nie mogę jednak dojść, skąd w przykładzie bierze się 1/12?
Pozdrawiam,
P. Kazior