Moje badanie

Cześć!

Pajda wypełnia ankietę.
Dzisiaj to ja chciałabym Ciebie prosić o pomoc... Nie, nie chodzi o darowiznę. Przynajmniej nie pieniężną. Przygotowuję tekst dotyczący Centralnego Twierdzenia Granicznego (CTG) i chciałabym zbadać, jak szeroko rozpowszechniona jest wiedza na jego temat w tej części populacji, która nie studiowała matematyki. W szczególności celuję w psychologów: studentów dowolnego roku, absolwentów, naukowców i praktyków. Wszyscy, to wszyscy, babcia też. Wobec tego - proszę Cię o darowiznę kilku minut swojego czasu na wypełnienie przygotowanej przez mnie ankiety (tak, ja sama to skleciłam).

Ankieta składa się z 14 pytań, z czego połowa jest o wiek-płeć-status studenta, więc nie masz czego obawiać się - nie robię testu wiedzy na 50 podchwytliwych pytań wielokrotnego wyboru.

To, co - pomożesz? Jeśli masz chwilę, kliknij w baner i zostaniesz przeniesiony do uniwersyteckiego systemu zbierania odpowiedzi.


Rozkład statystyki opisowej i testowej.

Mówiłam już o rozkładach - jako takich. Rozkładach cechy. Może być próbie lub w populacji i jest to wówczas sposób na zaprezentowanie tego, jak często zdarzają się poszczególne wartości danej cechy (czasy reakcji, poziomy wykształcenia, itepe, itede).

To teraz będzie o rozkładzie statystyki z próby i rozkładzie cechy w próbie. Szczerze mówiąc, nie wiem, czemu jest takie rozróżnienie.
Zwykle z kontekstu wiadomo, o co chodzi, a jak nie wiadomo, to trzeba dopytać. Po angielsku mamy zgrabniejsze pojęcia. Odpowiednikiem rozkładu statystyki z próby jest sampling distribution. A rozkład cechy w próbie to jest na przykład empirical distribution. Prawda, że inaczej brzmi? A w języku polskim wprowadza się rozróżnienie na podstawie przedimków (z oraz w) i można w najlepsze czatować na pomyłkę.
Najpierw jednak uporządkujmy sobie pojęcie: statystyka. Statystyka to: (a) nazwa działu matematyki zajmująca się m.in. metodami zbierania i analizy danych (czyli nazwa dziedziny nauki), (b) nazwa przedmiotu (choć często też są to ”metody statystyczne” albo coś w stylu 'zaawansowane techniki analizy danych') ale też statystyka to (c) po prostu obliczony wskaźnik.
Jedno słowo mogą mieć różne znaczenia i bywa, że nie wiedząc, o które chodzi, to się mocno mieszamy.
Jeśli znaczenie pojęcia statystyka ogranicza się jedynie do dziedziny nauki, to można mieć misz-masz w głowie, … no, bo co to jest rozkład biologii?
Tak, wracając do obliczonego wskaźnika... statystyki.
Wiem, że można czepiać się, ale muszę baaardzo uprościć, aby potem można było wejść na wyższy poziom,... czyli bardziej zagłębić się w tematy statystyczne.
Pisząc obliczony wskaźnik, wyobraź sobie taki przykład: średnia z próby (klasyka przykładów to średnia ocen), odchylenie standardowe z próby. Tak, tak, to, co daje się liczyć na próbie zwie się statystyką.
Jeśli liczysz cokolwiek na próbie, to taki wskaźnik możesz spokojnie nazwać statystyką. Teraz są dwie drogi do wyboru: statystyka opisowa lub statystyka testowa. Jaka jest różnica?
Różnica między statystyką opisową a statystyką testową.
To, co jest liczone z udziałem obserwacji w celu podsumowania informacji to są zwykle statystyki opisowe. Mediana, moda, średnia, kurtoza, skośność...
Pamiętaj, cokolwiek liczymy na próbie, to na pewno to będzie statystyka. Tyle, że albo opisowa (gdy przedstawiasz sumaryczne dane), albo testowa (gdy robisz test).
Jest też bardzo obszerny post o tym, czym jest statystyka testowa. KLIK

Różność wyników w zależności od tego, jak próba trafiła się.
Najważniejsze teraz: jeśli to cokolwiek jest liczone na próbie, to znaczy, że w zależności od zebranej próby będzie miało inną wartość.
Cokolwiek = wzór, do którego wkładamy wyniki przebadanych osób.
Powiedzmy taka średnia. Mając siedem klas w jednym roczniku, masz 7 średnich z ocen, po jednym dla każdej klasy. A skoro tak, to możemy sobie już zrobić podsumowanie częstości występowania wartości średnich (no, akurat na 7 średnich to będzie mało porywające zajęcie). To podsumowanie zrobimy w postaci histogramu.

Chciałabym wszystko przedstawić w postaci jednego rysunku - tego po lewej. Zrobię to krok po kroku, a na końcu pokażę go jeszcze raz. Mam nadzieję, że w ten sposób będzie łatwiej Tobie zrozumieć pojęcie rozkładu (cechy) w próbie oraz pojęcie rozkładu (statystyki) z próby.

Pinezki będą oznaczać poszczególne partie dużego rysunku. Są one przedmiotem omówienia. Na koniec poskładam to wszystko do kupy i obrazek z lewej powinien być dużo bardziej zrozumiały.
Tak, jak już zapowiedziałam, na warsztat biorę starą dobrą średnią. To po prostu klasyczny przykład, do którego najczęściej można się odwołać a potrzebny był mi wzór, ale to to tylko szablon – wszystkie pozostałe statystyki działają tak samo.
0. Najpierw zobaczymy sobie rozkład wyników cechy w populacji. Zwykle przyjmuje się, że całej populacji nie można zbadać, choć czasami można go wyznaczyć dokładnie, bo np. populacja jest mała (rozkład wyników z matury wśród osób chorujących na bardzo rzadką chorobę genetyczną). Możemy też z wcześniejszych badań posiadać wiedzę o tym, jak wyniki rozkładają się w populacji. Tak czy inaczej, powiedzmy, że mam rozkład wyników pewnej cechy w populacji. Cecha ta jest zmienną ciągłą. Jej rozkład też jest ciągły i ma dwa garby.

Gdyby było tak cudownie, że wszyscy zawsze dajemy radę przebadać całą populację pod kątem wybranej cechy, to skończyłabym posta. Ale tak różowo nie ma, więc najczęściej mamy tylko (i aż) próbę i próbujemy na podstawie tej próby szacować to, co nas interesuje. Bywa, że interesuje nas cały rozkład, czyli chcielibyśmy odkryć fioletowego węża z dwoma garbami, a bywa, że chcemy szacować tylko pewien parametr takiego rozkładu, np. średnią, medianę, odchylenie standardowe. Jeśli przeprowadzasz test statystyczny (w duchu frekwentystycznym, co na 2019 r. jest typowym podejściem), to na danej próbie będziesz szukać wartości statystyki testowej.


1. Zbieramy dane. Mamy pierwszą próbę. Histogram wyników wygląda mniej więcej w ten sposób.






W tej pierwszej wylosowanej próbie średnia badanej zmiennej wynosi 3,57. Indeks dolny przy iksie x̄numer oznacza numer tej próby. 




2. Robimy to samo badanie, znowu maglujemy trzydziestoosobową grupę. Wrzucamy dane w SPSS-a (albo w cokolwiek innego) i oglądamy. W drugiej próbie wylosowane obserwacje mają taki oto histogram częstości tej cechy.

Ja może przypomnę taką banalną własności: dla jednej próby jest jedna średnia x̄. Nie może być dla jednej grupy dwie średnie w tej samej zmiennej.
Czynność wykonywania tego samego badania, zbierania wyników i oglądania średniej wykonujemy jeszcze dziewięćset dziewięćdziesiąt osiem razy. Bo dwa już mamy, więc 2+998 daje tysiąc.


4. Kiedy przeprowadzę tysięczne badanie, to mam tysięczną próbę i tysięczną średnią. Wynosi ona x̄1000 = 5,89.
5. A zatem mam tysiąc średnich – każda z nich pochodzi z przebadanej próby, a prób było tysiąc (jak tysiąc grup, tysiąc klas, tysiąc kół różańcowych, tysiąc zespołów...). Można z tym coś zrobić.
 
6. Skoro mamy bardzo duży zbiór różnych średnich, wobec tego nic nie stoi na przeszkodzie - zróbmy sobie histogram tego tysiąca średnich. Zobaczymy jakie są częstości poszczególnych wartości średnich.

7. Z tego histogramu wynika, że pierwsza średnia wpada w przedział takich średnich, które zdarzają się często. Tak samo jest z drugą średnia x2. Tysiączna średnia x̄1000 jest średnią występującą rzadziej.
8. A teraz dla zaawansowanych – powinno Wam gdzieś pobrzękiwać Centralne Twierdzenie Graniczne. Dlaczego? Dlatego, że ten czerwony histogram powinien przypominać dzwon Gaussa.
Co musiałoby się stać, aby jeszcze bardziej przypominał rozkład normalny?
a) Zwiększyć liczbę średnich? Na przykład z 1000 do 1001.
b) Zwiększyć liczbę obserwacji w obrębie jednej średniej? Na przykład z 30 do 31.
...Dowiemy się w następnym odcinku ;-) Gdybyśmy tam spojrzeli wiedzielibyśmy, że z n ---> nieskończoności rozkład średnich zbliżałby się do rozkładu normalnego. Uwaga: nie chodzi o zwiększanie liczby średnich tylko ilości obserwacji, które stanowią podstawę do obliczenia średnich.

Więcej o Centralnym Twierdzeniu Granicznym tutaj: KLIK


Ale jak to? Mówi ono, że statystyka z próby, jaką jest średnia, będą coraz bardziej przypominać rozkład normalny. Od czego zależy to przypominanie? Od liczebności pojedynczych prób. Czyli, im więcej osób badanych zbadamy, tym bardziej taki prostokątowy wykres będzie zbliżać się do gładkiej krzywej dzwonowej Gaussa.



Teraz, pozbieramy wszystko do kupy i naszym oczom ukazuje się pełny obraz:



Zawsze dopytaj o co chodzi, to nie jest oczywiste, zważywszy na to, że są statystyki opisowe (średnia, mediana, odchylenie standardowe) i testowe. W końcu skazaniec siada na krześle elektryczny czy drewnianym?

Podsumowanie będzie w formie tabeli:



Brakuje mi dobrego przykładu do ostatniego wiersza. Jeśli coś przyjdzie mi do głowy, to wtedy uzupełnię ;-)



Cześć! Dzięki za przeczytanie mojego posta. Przy okazji, mam do Ciebie małą prośbę - siedzę tu, po drugiej stronie monitora i nie widzę, czy podobała Ci się treść artykułu, czy może znużyła, może jest tego za dużo, albo było za długie (Too Long Didn't Read, TLDR). Przygotowałam kilka możliwych reakcji - proszę, podziel się swoimi odczuciami, ponieważ nie mam okazji bezpośrednio Ciebie zapytać, a jestem bardzo ciekawa. Przyda mi się to do planowania i pisania kolejnych postów. Jeszcze raz dzięki za uwagę i do zobaczenia :-) Ps. Możesz wybrać więcej niż jedną odpowiedź:-)

PCA

Na blogu wisi już post o Analizie Składowych Głównych - jeśli tworzysz kwestionariusz, to znajdziesz tam cenną wskazówkę:

Wystarczy kliknąć w obrazek:


Urodziny






---( @mam nadzieję, że nie zrobiłam żadnego błędu w żadnym języku. Tak, w polskim także @)---.

Sneak peek posta #1

Cześć!

Oto nad czym pracuję przed Świętami :-) Sneak peek (stare: zajawka) posta o rozkładzie cechy w próbie i rozkładzie statystyki z próby.
Komuś się przyda? ;-)


koniec marca 2019


Cześć!
W ostatnich dniach udało mi się mocno podrasować posta o teście chi-kwadrat. Zapraszam do czytania, zwłaszcza, że starałam się wyjaśnić różnicę między zmiennymi zależnymi a niezależnymi. No, cóż - dobrałam dość biologiczny przykład, co może niekoniecznie każdemu podejdzie do gustu, ale akurat w tym przypadku biologia jest świetnym źródłem inspiracji... bo niektórzy coś mają, a inni - nie :-)
Lili.

Skale pomiarowe kwiz

Cześć!

Z okazji wiosny zrobiłam mój pierwszy kwiz (tak, chodzi mi o quiz, ale śmieszniej brzmi i wygląda kwiz). Kwiz dotyczy skal pomiarowych (a jakże).
Jeśli masz ochotę sprawdzić swoją wiedzę w tej sprawie - zapraszam:) A gdybyś chciała/chciał powtórzyć, to wiedza jest tu KLIK.



Jeśli psychotest nie działa, kliknij w obrazek i nastąpi teleport do kwizu. Powodzenia :-)



Cześć! Fajnie, że czytasz mojego bloga, bo przecież go nie piszę dla siebie. Powiedz, czy taki kwiz jest przydatny dla Ciebie? Poniżej masz reakcje. Wybierz jakąś, dając mi znać, co sądzisz o pomyśle robienia kwizów Przyda mi się to projektowania kolejnych takich przedsięwzięć :-). Dzięki z góry :-) Ps. Możesz wybrać więcej niż jedną odpowiedź:-)
Related Posts Plugin for WordPress, Blogger...