Miary tendencji centralnej (średnia, mediana, moda).

Analizowanie zebranej próby obserwacja po obserwacji byłoby czasochłonne, żmudne, zasobożerne i nieefektywne. Nudne, bezsensowne i jałowe. A i tak ślizgalibyśmy się cały czas po powierzchni. Mam nadzieję, że tym samym jasne stało się dla Was, co czeka badacza który wiersz po wierszu chciałby dowiedzieć się czegoś o badanej cesze w zebranej populacji. Przydałaby się jakaś maszynka, do której włożylibyśmy próbę, a która wyplułaby informację zawartą w próbie - bez konieczności oglądania każdej obserwacji z osobna. Właśnie po to są różne miary, nie tylko tendencji centralnej. Są najczęściej pojedyncze liczby, które agregują informację o cesze z całej próby. Liczby te nazywamy statystykami opisowymi i można je podzielić na cztery grupy - miary tendencji centralnej, miary rozproszenia i miary kształtu. Ten post jest o tej pierwszej grupie - miarach tendencji centralnej.

Tendencja centralna skupia się na scharakteryzowaniu typowego egzemplarza w danych. 
Przykład - kiedy prababcia pyta Cię, co to jest hipster, to opiszesz jej typowego hipstera. Powiedz to jest ktoś, kto ubiera się w spodnie-rurki i mądre koszulki, ma brodę (mężczyźni) i wielkie okulary. I generalnie jest na nie, kiedy większość jest na tak. Generalnie, babciu, są to młodzi, bogaci z dobrych rodzin, mieszkający na amerykańskich przedmieściach.
Tak działa tendencja centralna - chodzi o wczucie się w próbę. A profesjonalnie mówiąc, chodzi o środek ciężkości próby. Miary tendencji centralnej odpowiadają na pytanie: jaki jest typowy egzemplarz. Mamy wiele sposobów, aby skonsumować to pytanie - najpopularniejsze trzy z nich to: moda, mediana i średnia.

Moda
Moda ma wiele nazw: dominanta, wartość dominująca, modalna, wartość modalna. Najprostsza definicja mody brzmi: najczęściej występująca wartość.
Definicja ta idealnie sprawdza się dla zmiennych nominalnych, typu: płeć (jaka płeć przeważa w próbie?), wyznanie (o jakiej najczęściej religii są osoby z próby) czy fakt przeżycia (w mojej próbie więcej osób przeżyło niż nieprzeżyło).
Ta statystyka, zwana modą, może przyjmować wartości liczbowe i tekstowe. To niekoniecznie musi być "kobieta", "buddysta" i "żyje". To może być "średnie", 34,56 oraz pi i pół. W przypadku zmiennej nominalnej moda oznacza najczęściej występującą wartość i jeśli są dwie wartości np. "katolicy" i "buddyści", którzy występują tyle samo razy, to mamy dwie mody. Jeśli wszystkie wartości zmiennej występują tyle samo razy, to masz dwa wyjścia: albo uznać, że wszystkie wartości są modami (to nie czyni Twojej próby wyjątkową) albo żadna (to również nie czyni Twojej próby wyjątkową).

Nieco inaczej jest dla zmiennych mierzonych na skali mocniejszej niż nominalna. Zobaczmy dla skali porządkowej. Zmienną jest dochód w rodzinie podzielony na trzy kategorie: niewielki dochód, średni dochód i duży dochód.


Wykres słupkowy liczebności zmiennej Dochód w pewnej próbie (Rys. LJK)


Kategorie niski i duży dochód mają taką samą liczebność (n = 35). Najmniej osób określiło swój dochód jako średni. Mamy tutaj dwie mody, bo dwie wartości występują jednakowo często: to jest niski i duży dochód.
A teraz spójrzmy jeszcze raz. Tutaj mamy dużo osób, które dochód określiło jako niski (n=55), nieco mniej (n=35) mamy osób, które określiło dochód jako duży (n=35). Ile mód mamy?

Wykres słupkowy liczebności zmiennej Dochód w pewnej próbie (Rys. LJK)
Mamy dwie mody. Dlaczego? Przecież dla zmiennej nominalnej to byłaby jedna - niski dochód. Ale tutaj mamy dwie - bo są dwie górki.
Na powyższym przykładzie widać inne traktowanie mody dla zmiennych nominalnych i dla całej reszty. To wynika z tego, że moda tak naprawdę oznacza liczebną dominację jednej wartości nad pozostałymi - w pewnym lokalnym otoczeniu. Lokalnym otoczeniem dla obu wartości: niski dochód i duży dochód jest wartość średni dochód, która mniej liczna.
Tworzy to charakterystyczną górkę w liczebnościach. To jest właśnie istota pojęcia moda: wystarczy zdominować sąsiadów, aby być modą. Jeszcze lepiej niż dla zmiennej porządkowej widać to dla zmiennych interwałowych, o ilorazowych już nie wspominając. Zobaczcie - weźmy zmienną ilorazową Waga.

LJK

Tutaj mamy dwie górki - dwie mody. Inaczej niż w przypadku zmiennej nominanej i jej wykresu słupkowego, te górki nie muszą być tej samej wysokości. Ważne, aby były górkami.
To wszystko prowadzi nas do jednego interesującego wniosku: moda jest nie tylko miarą tendencji centralnej, ale także pewną miarą kształtu - ilości górek. Powyżej widać rozkład bimodalny (dwumodalny). Mogą być też rozkłady wielomodalne - o większej ilości mód.
Co to wszystko znaczy? Liczba mód bywa bardzo ważnym źródłem informacji dla badacza. Cecha, która ma dwie mody, to cecha, która ma dwie grupy obserwacji: jedne siedzące w pierwszej górce, drugie siedzące w drugiej górce. Bywa, że fakt bimodalności świadczy o tym, że różne mechanizmy leżą u podłoża zjawiska. Popatrz niżej na przykład z zapadalnością na schizofrenię.

Zależność zapadalności na schizofrenię od wieku (Rys. LJK).
Tak właśnie było z zapadalnością na schizofrenię. Początkowo badacze widzieli, że są dwie mody w wieku zapadania na schizofrenię. Potem jednak okazało się, że przyczyną tego zjawiska jest to, że bardzo duże znaczenie ma płeć. Kobiety zapadają później, a mężczyźni - wcześniej.

Tak działa moda. Niby taka prosta sprawa, ale może przekazać ważne informacje.

Mediana
Najprościej rzecz ujmując, mediana to taki punkt, który dzieli próbę na pół. Połowa obserwacji jest niemniejsza, a połowa obserwacji jest niewiększa.
Aby wyznaczyć medianę, należy najpierw uporządkować próbę pod względem badanej cechy w kolejności od najmniejszej do największej. Z tego wynika, że wypadają nam wszystkie zmienne mierzone na skali nominalnej. Nie da się uporządkować zmiennej takiej jak Wyznanie, Płeć czy Status przeżycia. Ale da się ze zmiennymi, mierzonymi na wyższych poziomach.
Podczas porządkowania mentalnie numerujemy każdą obserwacji w rządku. Profesjonalnie nazywa się to rangowaniem: pierwsza, druga, trzecia... 
Kiedy już uporządkujemy obserwacje, wybieramy środek.
Najłatwiej jest gdy masz nieparzystą liczbę obserwacji w próbie (przebadałaś 5 osób), to wówczas bierzez po prostu środkową obserwację. Jeśli masz parzystą liczbę obserwacji (przebadałaś 10 osób albo 22 osoby, albo 7138 <- daj-ci-boże, jak mawiała moja babcia), to wówczas należy wziąć połowę między środkowymi wartościami.
Np. w próbie mamy obserwacje o wartościach: 4, 7,4, 5,1,4. Po uporządkowaniu jest to 1,4,4,5,7.


Jeśli dołożymy jeszcze jedną obserwacją - o wartości 12, wówczas w uporządkowanej już próbie będziemy mieć: 1,4,4,5,7,12. Środkowe są dwie: 4 i 5. Więc trzeba wziąć obserwacje z środka: obserwację trzecią oraz obserwację czwartą, zsumować i podzielić. W ten sposób mamy 4+5=10, 10:2 = 4.5. Uważaj, aby się nie pomylić w tym.

No, a teraz problemy z liczeniem mediany. I tak jak w przypadku mody, najsłabsza skala, na której można było wykonać czynność obliczania danej statystyki, miała swoje kruczki. Tutaj wiemy, że najsłabszą skalą jest skala porządkowa.
Założmy, że mamy próbę: podstawowe, podstawowe, średnie, wyższe, wyższe. Uporządkowałam je już rosnąco. Kiedy już wiemy kto stoi za kim, to sięgamy po wartość środkową. Jeśli przebadaliśmy niepatrzystą liczbę osób, to środek jest jeden. W moim przypadku jest to liczba 3 odpowiadająca średniemu wykształceniu.
W przypadku, gdy obserwacji jest parzysta liczba, to wówczas mamy mały problem, bo nie da rady policzyć połowy. Powiedzmy, że mamy: podstawowe, podstawowe, średnie, wyższe, wyższe, wyższe.

Dołożyłam jedną osobę o wyższym wykształceniu. Teraz trzecią obserwacją jest średnie, a czwartą jest wyższe. No i jak z tego zrobić średnie i pół? Na ich rangach da się to zrobić: (3+4)/2=3.5 Ale nie na ich wartościach. Wobec tego w takich przypadkach możesz podać dolną medianę (średnie), albo obie (średnie i wyższe). To powinno załatwić sprawę, ale pokazuje, jak niewygodne jest liczenie czegokolwiek na zmiennych, które są porządkowe.

Średnia.
Średnia jest przeciwieństwem mody, jeśli chodzi o stopień wgłębienia się w próbę. O ile moda korzysta z paru obserwacji, to średnia - ze wszystkich na raz. Oczywiście, nie w takim samym stopniu - raczej waży każdą z wartości poprzez to, ile razy wystąpiła.
Średnich jest wiele: arytmetyczna, harmoniczna, geometryczna (i jeszcze kilka). To od dziedziny zależy, która średnia będzie najczęściej używana. W psychologii jest to średnia arytmetyczna. Działa w ten sposób, że najpier lepi obserwacje w całość (to jest w liczniku) i rozdając na nowo każdemu po równo (to jest to, co się dzieje w mianowniku).
Średnia artymetyczna ma bardzo dobre właściwości matematyczne - poza tym, że korzysta z każdej pojedynczej obserwacji.
O tym dlaczego średnia arytmetyczna jest dobrym oszacowaniem prawdziwej wartości parametru w populacji możesz poczytać w poście o estymatorach.
Problemem średniej jest to, że jest wrażliwa na tzw. obserwacje odstające (outliery).
W skrócie: są obserwacje, które mają stosunkowo dużą wartość w porównaniu do całej reszty. Przykładowo ktoś, kto jest bardzo wysoki - zawodowy koszykarz - jest w grupie przedszkolaków obserwacją odstającą. 
Gdybyśmy policzyli średnią arytmetyczną wzrostu grupy przedszkolaków, a potem policzyli średnią wzrostu grupy przedszkolaków wzbogaconej koszykarza, okazałoby się że jego wzrost zniekształca wartość średniej.
(112+115+109)/3=112 cm (przedszkolak)
(112+115+109+224)/4=140 cm (wczesny nastolatek)
140 cm to dużo jak na przedszkolaka. Koszykarz bardzo podbił średnią wzrostu dzieci.

Wszystkie trzy miary badają typowy egzemplarz. Ale każda z nich robi to na własny sposób, co wiąże się zarówno z zaletami, jak i z ograniczeniami. Podsumujmy zady i walety miar tendencji centralnej.

Statystyka Minusy Plusy Skale
Moda nie korzysta z całej próby odporna na obserwacje odstające nominalna, porządkowa, interwałowa, ilorazowa
Mediana
odporna na obserwacje odstające porządkowa, interwałowa, ilorazowa
Średnia wrażliwa na obserwacje odstające korzysta z całej próby interwałowa, ilorazowa

Co to znaczy mieć średnio dwa i pół przyjaciela: zmienne dyskretne a ciągłe.
Liczba przyjaciół jest zmienną mierzoną na skali ilorazowej. Można mieć jednego przyjaciela, można mieć pięć razy więcej przyjaciół, czyli pięć. 
Powiedzenie mam dwa razy więcej przyjaciół niż John ma sens. Co więcej, zero w tej zmiennej Liczba przyjaciół również ma sens, ponieważ można mieć zero przyjaciół. Nie można zejść poniżej zera - nikt nie ma minusowej liczby przyjaciół. Tego nawet nie da się opowiedzieć, co miałoby to znaczyć.
Może okazać się, że w Twojej próbie średnia liczba przyjaciół wynosi 2.76. Ale nikt nie ma dwa i siedziemdziesiąt sześć setnych przyjaciela. To nie ma sensu - pomyślisz - czy coś tu jest nie tak? Nie. To jest normalne zjawisko, które dotyczy zmiennych dyskretnych i obliczania średniej. Zmienne dyskretne to są takie zmienne, których wartości są izolowane od siebie. Liczba przyjaciół jest świetnym przykładem, ponieważ między wartość: jeden przyjaciel a dwóch przyjaciół nie ma półtora przyjaciela.
Między dwie sąsiadujące wartości nie rady wcisnąć trzeciej tak jak w przypadku takich zmiennych jak waga, wzrost, wiek, czas, długość łokcia. Tutaj zawsze między 23,56 cm a 23,57 można wcisnąć 23,565 - i cały przedział innych. Takie zmienne, które maą wartości w przedziałach, nazywane są zmiennymi ciągłymi.
Jak to się ma liczenia średniej? Chodzi o sensowność, o interpretacją wyniku. Fakt, że wartość średniej w Twojej próbie nie ma namacalnego znaczenia nie dyskwalifikuje samej zmiennej w skali pomiarowej. Liczba przyjaciół nadal jest zmienną ilorazową. Ale po prostu wybierz inną miarę tendencji centralnej, zwłaszcza gdy prezentujesz wyniki osobom spoza dziedziny. W przykładzie z liczbą przyjaciół lepszą miarą byłaby moda: w Twojej próbie najczęściej ludzie mają troje przyjaciół.

Kiedy mam zastosować średnią a kiedy modę lub medianę?
Po pierwsze: cel badania. Po drugie: skala pomiarowa zmiennej. Po trzecie: kształt rozkładu. Dużo zależy od innej statystyki - od skośności. Spójrz na wykres częstości (histogram), na rozkład wartości Twojej cechy. Jeśli Twoje dane są symetryczne, wówczas możesz wziąć średnią. Ale jeśli jedno z ramion rozkładu jest wyciągnięte w którąś ze stron, wówczas średnia może nie być najlepszą miarą, więc wybierz medianę.

Rys. Prawostronna skośność Czasu reakcji i to, jak daleko od siebie leżą średnia i mediana (Rys. LJK).
Średnia zjechała bardzo w prawo. W takim przypadku lepiej podawać medianę.
Nawet na zdrowy rozsądek to ma sens. Wyobraź sobie, że idziesz do firmy. 99% pracowników zarabia bardzo mało, a 1% zarabia bardzo dużo. Jeśli zapytasz o średnią i na tej podstawie dokonasz wyboru, to wprawdzie statystyka będzie dobrze policzona, ale Twój entuzjazm będzie nadmierny. Lepiej pytać o medianę, bo wówczas wartości odstajace będą zepchnięte albo na początek, albo na koniec kolejki i uzyskasz wartościową informację.
Jest jeszcze po czwarte: nasza psychologiczna biblia edytorska. To, jak ma wyglądać artykuł naukowy w psychologii, jest dokładnie opisane w Manualu APA, czyli podręczniku publikacyjnym Amerykańskiego Towarzystwa Psychologicznego. Czcionka, wielkość i jej krój, wygląd strony tytułowej, czy pisać "upośledzeni umysłowo" czy "osoby z upośledzeniem umysłowym"? Wszystkie to znajdziesz w tej książce. Rządzi ona również regułami opisu statystycznego, dlatego podstawowym zestawem statystyk jest średnia artymetyczna oraz odchylenie standardowe.

Miary tendencji centralnej to za mało...
Z poprzedniego akapitu wynika, że sama średnia, czy inna miara tendencji centralnej to trochę mało, aby wyrobić sobie zdanie o próbie. Zobacz przykład.

Poniżej wypisałam trzy zbiory. Są to moje ulubione zbiory do pokazywania zasad działania różnych parametrów. Dla wygody, załóżmy, że są to wyniki kolokwium z pewnego przedmiotu przeprowadzonego w trzech grupach studentów.
• A=0,0,0,100,100,100
• B=50,50,50,50,50,50
• C=47,48,49,51,52,53
Średnia Średnia w zbiorze A wynosi 50, ponieważ 0 + 0 + 0 + 100 + 100 + 100 = 300. Liczba elementów w zbiorze A wynosi 6, stąd 300 : 6 = 50. Mówi się, że 0 to tyle, co nic, ale należy zera traktować jako normalne, pełnoprawne obserwacje, które po prostu przyjmują wartość ‘zero’. Czy to jest tutaj dobra miara? Nie, bo tak naprawdę mamy tylko dwie skrajne wartości cechy występujące trzykrotnie. Średnia w zbiorze B i C również wynosi 50.

Mediana Mediana w zbiorze A wynosi 50, ponieważ mamy dwie “środkowe obserwacje”, zatem biorę ich średnią arytmetyczną (0+100)/2=50. Mediana w zbiorze B wynosi (50+50)/2 = 50. Mediana w zbiorze C wynosi (49+51)/2=50. Wszystkie trzy zbiory mają tę samą średnią i medianę.

Moda Moda w zbiorze A albo nie istnieje, albo jest ich dwie - 0 i 100, ponieważ występują tyle samo razy. Moda w zbiorze B jest bardzo widoczna i wynosi 50. Moda w zbiorze C nie występuje, ponieważ każda wartość występuje tylko raz.

Trzy zbiory, ta sama średnia, a tak bardzo różnią się.


Jak widać, można się oszukać, gdy się patrzy tylko i wyłącznie na środek ciężkości próby. To dlatego warto też przyjrzeć się innym miarom, już nie tendencji centralnej, ale choćby miarom rozproszenia.


Cześć! Dzięki za przeczytanie mojego posta. Przy okazji, mam do Ciebie małą prośbę - siedzę tu, po drugiej stronie monitora i nie widzę, czy podobała Ci się treść artykułu, czy może znużyła, może jest tego za dużo, albo było za długie (Too Long Didn't Read, TLDR). Przygotowałam kilka możliwych reakcji - proszę, podziel się swoimi odczuciami, ponieważ nie mam okazji bezpośrednio Ciebie zapytać, a jestem bardzo ciekawa. Przyda mi się to do planowania i pisania kolejnych postów. Jeszcze raz dzięki za uwagę i do zobaczenia :-)

6 komentarzy:

Anonimowy pisze...

Witaj,
czytam z zainteresowaniem Twoje wykłady, ciekawie i przystępnie tłumaczysz, co jest ich dużą zaletą, przytaczane przykłady dobrze ilustrują poszczególne tematy. Mam tylko jedną, małą uwagę - w przykładzie o zamku Owaina, w zależności od sposobu podejścia, jest albo za dużo, albo za mało zer. Może to warto poprawić?
Pozdrawiam

Lilianna Jarmakowska-Kostrzanowska pisze...

Cześć! Poprawiać zawsze warto. Bardzo dziękuję Ci za czytanie, za wnikliwe czytanie i za podpowiadanie :-) Poprawiłam. Wydaje mi się, że teraz to ma ręce & nogi (albo dłuższe ręce & nogi niż wcześniej).

Dziękuję też za miłe słowa - to naprawdę bardzo motywuje do dalszych starań :-)
Pozdrowienia
Lili

Lilianna Jarmakowska-Kostrzanowska pisze...

@Dagmara - Bardzo dziękuję :-) Cieszę się, że się podobało :-) Pozdrowienia!

Anonimowy pisze...

Z przyjemnością się czyta.:) Wszystko opisane w zrozumiały sposób. Będę tu wracać, kiedy coś ze statystyki będzie mi sprawiać trudność. Dziękuję za Pani pracę.:)

Lilianna Jarmakowska-Kostrzanowska pisze...

Dziękuję bardzo za miłe słowa :-)

Anonimowy pisze...

Jest super. Bardzo logicznie. Lubię ten język:))