Wykres kwantylowy (qqplot) [Interpretacja]

Wykres kwantylowy to układ kropek na płaskiej kartce, które w idealnej sytuacji powinny tworzyć prostą. To proste narzędzie świetnie nadaje się do wizualnej oceny tego, czy rozkład Twojej zmiennej jest podobny do dowolnego rozkładu teoretycznego (najczęściej rozkładu normalnego).

SPIS TREŚCI:

KWANTYLE — są wartościami badanej cechy, które dzielą zebrane dane na równe części. Żeby je wyznaczyć, program najpierw porządkuje próbę w kolejności – najczęściej rosnącej. Kwantyle są nazywane miarami pozycyjnymi, ponieważ rekrutują się z uszeregowanych wartości, gdzie liczy się pozycja w kolejce. Dzielą się kwantyle empiryczne (te, które uzyskuje się z próby) oraz teoretyczne (które wynikają z postaci rozkładu danego wzorem matematycznym).

Jeśli zaś pamiętasz to oprócz tego, co otrzymany podczas analizy danych, jest jeszcze cały świat teoretycznych bytów. Są rozkłady empiryczne, czyli takie które otrzymał badacz, oraz rozkłady teoretyczne. Podobnie i kwantyle mają dwie odmiany: empiryczną i teoretyczną. Dwoista natura czyni z nich bardzo dobre narzędzie diagnostyczne do oceny, czy rozkład empiryczny jest podobny do rozkładu teoretycznego – wykres kwantylowy, który wykorzystuje zarówno kwantyle empiryczne, jak i teoretyczne.

Kwantyle teoretyczne to są takie punkty, które wyznaczają kawałek pola zakreślonego między poziomą osią OX a krzywą nazywaną gęstością rozkładu.

CZYM JEST KWANTYL? — Kwantyl dowolnego rzędu p to takie miejsce na osi poziomej OX, na lewo od którego leży p% rozkładu.

Kwantyl rzędu 0,01 oznacza taką wartość cechy, na lewo od której mamy 1% całego pola. I w drugą stronę, kwantyl rzędu 0,15 wynosi -1. Na lewo od -1 znajduje się 15% rozkładu. Wszystko to dzieje się w okolicznościach rozkładu normalnego standardowego.

RZĄD KWANTYLA MIĘDZY ZEREM A JEDNOŚCIĄ - Ponieważ mówimy o polach i o procentach, to rząd kwantyla jest liczbą, która zawiera się tylko i wyłącznie w przedziale od zera do jeden. Nie ma kwantyla rzędu -1. Oznaczałoby to, że szukamy takiej wartości cechy, na lewo od której znajduje się -1 procent pola, a to fizycznie niemożliwe. Powierzchnia pola nie może być ujemną liczbą.

PRZYKŁAD KWANTYLA — Na poniższym rysunku mamy kwantyl pewnego rzędu.

W rozkładzie standardowym normalnym kwantyl rzędu 0,32 wynosi -0,46. Zgodnie z definicją kwantyla na lewo od -0,46 znajduje się 32% rozkładu.

Narysujmy wszystkie kwantyle rozkładu normalnego standardowego:

Kolejność kwantyli i to, w jakiej odległości są od siebie, powoduje, że dla każdego rozkładu jest ten układ niepowtarzalny i funkcjonuje jak linie papilarne, które podobnie jak dla każdego człowieka są niepowtarzalne dla każdego rozkładu. Dzięki temu kwantyle stanowią podstawę dobrego narzędzia diagnostycznego, w którym otrzymany rozkład empiryczny może być porównany do dowolnego teoretycznego rozkładu.

Najczęściej wykres kwantylowy służy do sprawdzenia, czy rozkład otrzymany przez badacza jest rozkładem normalnym, stąd też kwantyle rozkładu normalnego.

Wykres kwantylowy to wykres o dwóch osiach. Na osi poziomej znajdują się zwykle kwantyle empiryczne rozkładu cechy - te, które uzyskałeś lub uzyskałaś w swoim badaniu. Na osi pionowej będą umieszczone kwantyle rozkładu teoretycznego - tego, do którego chcesz porównać uzyskany przez siebie rozkład.

IDEALNY WYKRES KWANTYLOWY – Jeśli wartości zmiennej, której szansami rządzi rozkład normalny powinien wyglądać tak:

Punkty układają się równo wzdłuż prostej. Dzieje się tak, że kwantyle rozkładu normalnego odpowiadają sobie nawzajem. To jednak sytuacja idealna, natomiast w rzeczywistym świecie trudno uchronić się od losowości, więc taki wykres może wyglądać następująco:

Wykres kwantylowy, który wskazuje na znaczne odstępstwa od rozkładu normalnego może wyglądać na przykład tak:

Brak komentarzy: