Statystyka w psychologii: Rozkład statystyki opisowej i testowej.

Mówiłam już o rozkładach - jako takich. Rozkładach cechy. Może być próbie lub w populacji i jest to wówczas sposób na zaprezentowanie tego, jak często zdarzają się poszczególne wartości danej cechy (czasy reakcji, poziomy wykształcenia, itepe, itede).

To teraz będzie o rozkładzie statystyki z próby i rozkładzie cechy w próbie. Szczerze mówiąc, nie wiem, czemu jest takie rozróżnienie.

Zwykle z kontekstu wiadomo, o co chodzi, a jak nie wiadomo, to trzeba dopytać. Po angielsku mamy zgrabniejsze pojęcia. Odpowiednikiem rozkładu statystyki z próby jest sampling distribution. A rozkład cechy w próbie to jest na przykład empirical distribution. Prawda, że inaczej brzmi? A w języku polskim wprowadza się rozróżnienie na podstawie przedimków (z oraz w) i można w najlepsze czatować na pomyłkę.

Najpierw jednak uporządkujmy sobie pojęcie: statystyka. Statystyka to: (a) nazwa działu matematyki zajmująca się m.in. metodami zbierania i analizy danych (czyli nazwa dziedziny nauki), (b) nazwa przedmiotu (choć często też są to ”metody statystyczne” albo coś w stylu 'zaawansowane techniki analizy danych') ale też statystyka to (c) po prostu obliczony wskaźnik.
Jedno słowo mogą mieć różne znaczenia i bywa, że nie wiedząc, o które chodzi, to się mocno mieszamy.

Jeśli znaczenie pojęcia statystyka ogranicza się jedynie do dziedziny nauki, to można mieć misz-masz w głowie, … no, bo co to jest rozkład biologii?

Tak, wracając do obliczonego wskaźnika... statystyki.

Wiem, że można czepiać się, ale muszę baaardzo uprościć, aby potem można było wejść na wyższy poziom,... czyli bardziej zagłębić się w tematy statystyczne.

Pisząc obliczony wskaźnik, wyobraź sobie taki przykład: średnia z próby (klasyka przykładów to średnia ocen), odchylenie standardowe z próby. Tak, tak, to, co daje się liczyć na próbie zwie się statystyką.

Jeśli liczysz cokolwiek na próbie, to taki wskaźnik możesz spokojnie nazwać statystyką. Teraz są dwie drogi do wyboru: statystyka opisowa lub statystyka testowa. Jaka jest różnica?

Różnica między statystyką opisową a statystyką testową.
To, co jest liczone z udziałem obserwacji w celu podsumowania informacji to są zwykle statystyki opisowe. Mediana, moda, średnia, kurtoza, skośność...

Pamiętaj, cokolwiek liczymy na próbie, to na pewno to będzie statystyka. Tyle, że albo opisowa (gdy przedstawiasz sumaryczne dane), albo testowa (gdy robisz test).

Jest też bardzo obszerny post o tym, czym jest statystyka testowa. KLIK

Różność wyników w zależności od tego, jak próba trafiła się.
Najważniejsze teraz: jeśli to cokolwiek jest liczone na próbie, to znaczy, że w zależności od zebranej próby będzie miało inną wartość.

Cokolwiek = wzór, do którego wkładamy wyniki przebadanych osób.

Powiedzmy taka średnia. Mając siedem klas w jednym roczniku, masz 7 średnich z ocen, po jednym dla każdej klasy. A skoro tak, to możemy sobie już zrobić podsumowanie częstości występowania wartości średnich (no, akurat na 7 średnich to będzie mało porywające zajęcie). To podsumowanie zrobimy w postaci histogramu.

Chciałabym wszystko przedstawić w postaci jednego rysunku - tego po lewej. Zrobię to krok po kroku, a na końcu pokażę go jeszcze raz. Mam nadzieję, że w ten sposób będzie łatwiej Tobie zrozumieć pojęcie rozkładu (cechy) w próbie oraz pojęcie rozkładu (statystyki) z próby.

Pinezki będą oznaczać poszczególne partie dużego rysunku. Są one przedmiotem omówienia. Na koniec poskładam to wszystko do kupy i obrazek z lewej powinien być dużo bardziej zrozumiały.

Tak, jak już zapowiedziałam, na warsztat biorę starą dobrą średnią. To po prostu klasyczny przykład, do którego najczęściej można się odwołać a potrzebny był mi wzór, ale to to tylko szablon – wszystkie pozostałe statystyki działają tak samo.

0. Najpierw zobaczymy sobie rozkład wyników cechy w populacji. Zwykle przyjmuje się, że całej populacji nie można zbadać, choć czasami można go wyznaczyć dokładnie, bo np. populacja jest mała (rozkład wyników z matury wśród osób chorujących na bardzo rzadką chorobę genetyczną). Możemy też z wcześniejszych badań posiadać wiedzę o tym, jak wyniki rozkładają się w populacji. Tak czy inaczej, powiedzmy, że mam rozkład wyników pewnej cechy w populacji. Cecha ta jest zmienną ciągłą. Jej rozkład też jest ciągły i ma dwa garby.

Gdyby było tak cudownie, że wszyscy zawsze dajemy radę przebadać całą populację pod kątem wybranej cechy, to skończyłabym posta. Ale tak różowo nie ma, więc najczęściej mamy tylko (i aż) próbę i próbujemy na podstawie tej próby szacować to, co nas interesuje. Bywa, że interesuje nas cały rozkład, czyli chcielibyśmy odkryć fioletowego węża z dwoma garbami, a bywa, że chcemy szacować tylko pewien parametr takiego rozkładu, np. średnią, medianę, odchylenie standardowe. Jeśli przeprowadzasz test statystyczny (w duchu frekwentystycznym, co na 2019 r. jest typowym podejściem), to na danej próbie będziesz szukać wartości statystyki testowej.

1. Zbieramy dane. Mamy pierwszą próbę. Histogram wyników wygląda mniej więcej w ten sposób.

W tej pierwszej wylosowanej próbie średnia badanej zmiennej wynosi 3,57. Indeks dolny przy iksie x̄_numer oznacza numer tej próby.

2. Robimy to samo badanie, znowu maglujemy trzydziestoosobową grupę. Wrzucamy dane w SPSS-a (albo w cokolwiek innego) i oglądamy. W drugiej próbie wylosowane obserwacje mają taki oto histogram częstości tej cechy.

Ja może przypomnę taką banalną własności: dla jednej próby jest jedna średnia x̄. Nie może być dla jednej grupy dwie średnie w tej samej zmiennej.

Czynność wykonywania tego samego badania, zbierania wyników i oglądania średniej wykonujemy jeszcze dziewięćset dziewięćdziesiąt osiem razy. Bo dwa już mamy, więc 2+998 daje tysiąc.

4. Kiedy przeprowadzę tysięczne badanie, to mam tysięczną próbę i tysięczną średnią. Wynosi ona x̄₁₀₀₀ = 5,89.

5. A zatem mam tysiąc średnich – każda z nich pochodzi z przebadanej próby, a prób było tysiąc (jak tysiąc grup, tysiąc klas, tysiąc kół różańcowych, tysiąc zespołów...). Można z tym coś zrobić.

6. Skoro mamy bardzo duży zbiór różnych średnich, wobec tego nic nie stoi na przeszkodzie - zróbmy sobie histogram tego tysiąca średnich. Zobaczymy jakie są częstości poszczególnych wartości średnich.

7. Z tego histogramu wynika, że pierwsza średnia wpada w przedział takich średnich, które zdarzają się często. Tak samo jest z drugą średnia x₂. Tysiączna średnia x̄₁₀₀₀ jest średnią występującą rzadziej.

8. A teraz dla zaawansowanych – powinno Wam gdzieś pobrzękiwać Centralne Twierdzenie Graniczne. Dlaczego? Dlatego, że ten czerwony histogram powinien przypominać dzwon Gaussa.

Co musiałoby się stać, aby jeszcze bardziej przypominał rozkład normalny?
a) Zwiększyć liczbę średnich? Na przykład z 1000 do 1001.
b) Zwiększyć liczbę obserwacji w obrębie jednej średniej? Na przykład z 30 do 31.

...Dowiemy się w następnym odcinku ;-) Gdybyśmy tam spojrzeli wiedzielibyśmy, że z n ---> nieskończoności rozkład średnich zbliżałby się do rozkładu normalnego. Uwaga: nie chodzi o zwiększanie liczby średnich tylko ilości obserwacji, które stanowią podstawę do obliczenia średnich.

Więcej o Centralnym Twierdzeniu Granicznym tutaj: KLIK

Ale jak to? Mówi ono, że statystyka z próby, jaką jest średnia, będą coraz bardziej przypominać rozkład normalny. Od czego zależy to przypominanie? Od liczebności pojedynczych prób. Czyli, im więcej osób badanych zbadamy, tym bardziej taki prostokątowy wykres będzie zbliżać się do gładkiej krzywej dzwonowej Gaussa.

Teraz, pozbieramy wszystko do kupy i naszym oczom ukazuje się pełny obraz:

Zawsze dopytaj o co chodzi, to nie jest oczywiste, zważywszy na to, że są statystyki opisowe (średnia, mediana, odchylenie standardowe) i testowe. W końcu skazaniec siada na krześle elektryczny czy drewnianym?

Podsumowanie będzie w formie tabeli:

Brakuje mi dobrego przykładu do ostatniego wiersza. Jeśli coś przyjdzie mi do głowy, to wtedy uzupełnię ;-)

Cześć! Dzięki za przeczytanie mojego posta. Przy okazji, mam do Ciebie małą prośbę - siedzę tu, po drugiej stronie monitora i nie widzę, czy podobała Ci się treść artykułu, czy może znużyła, może jest tego za dużo, albo było za długie (Too Long Didn't Read, TLDR). Przygotowałam kilka możliwych reakcji - proszę, podziel się swoimi odczuciami, ponieważ nie mam okazji bezpośrednio Ciebie zapytać, a jestem bardzo ciekawa. Przyda mi się to do planowania i pisania kolejnych postów. Jeszcze raz dzięki za uwagę i do zobaczenia :-) Ps. Możesz wybrać więcej niż jedną odpowiedź:-)

2 komentarze:

AntekL1 pisze...: Cześć,
Może do tabelki na końcu artykułu użyć "szpilek" - tak, jak był porównywany wykres słupkowy i histogram, tylko tu wysokość szpilek jest ograniczona "obwiednią" ??

Jestem ZAFASCYNOWANY Twoim blogiem! Jako fizykowi wdrukowano wręcz mi anty-bayes'a (vide: prof. Kajetan Wróblewski o historii pomiarów prędkości światła, gdzie każda kolejna wartość zbliżała się asymptotycznie do rzeczywistości, a odstające pomiary negowano ["efekt szuflady"]. Profesor uważa, że NIE należy brać pod uwagę poprzednich wyników, a Bayes (o ile dobrze zrozumiałem) myślał odwrotnie: wręcz: startujemy od intuicji, a potem :
dane wpływają na parametry (a NIE: zakładamy sztywne parametry)

Serdeczne pozdrowienia - Antek
PS: Chcę się podpisać jako "antekL1", ale nie wiem, czy mi się uda :(; 9 października 2020 08:21
Lilianna Jarmakowska-Kostrzanowska pisze...: Cześć AntekL1 :-)

Ten post jest w trakcie "przepisywania" i niedługo wstawię jego nową wersję, ale dzięki wielkie za podpowiedź, spróbuję ją wykorzystać. Miło mi też czytać Twoje słowa - staram się, aby treści były podane przystępnym językiem.

Muszę doczytać tę historię pomiarów prędkości, żeby się bardziej wypowiedzieć. Natomiast Bayes... przy czym pisząc Bayes mam na myśli wszystkich tych, którzy rozwijali jego myśl po jego śmierci... z grubsza masz rację. Parametr nie jest sztywną liczbą, za to dane wpływają na parametr - "wpływają" w sensie modyfikacji rozkładu parametru. Więcej możesz zobaczyć w poście o prawdopodobieństwie i parametrze, a w ciągu najbliższych miesięcy pojawi się dział ze statystyką bayesowską.

pozdrowienia i jeszcze raz dziękuję za czytanie bloga :-)
Lili JK; 10 października 2020 07:59

Prześlij komentarz

Strony

Rozkład statystyki opisowej i testowej.

2 komentarze:

Mechanika testów klasycznych

Ważne

Łączna liczba wyświetleń