Zmienna losowa

SPIS TREŚCI:
  • Po co nam wiedza o zmiennych losowych?
  • Operacjonalizacja zmiennych
  • Skąd biorą się zmienne losowe w psychologii?
  • Jak wyglądają zmienne w SPSS-ie?
  • Wartość oczekiwana i wariancja zmiennej losowej
  • Momenty zmiennej losowej

Każdy badacz, albo student w roli badacza, gdy przygotowuje badanie martwi się o jedno - o zróżnicowanie wyników, wszystko jedno, czy kwestionariusza, próbki śliny, światełek w skanerze fMRI.

Ludzie różnią się między sobą pod wieloma względami. Tymi oczywistymi, które widać, gołym okiem, jak wzrost, waga, wiek. Ale też pod względem tego, czego nie widać, zarówno w środku: ilość krwinek w osoczu, ... oraz pod względem czego, naprawdę nie widać - samooceny, prężności czy skłonności do tworzenia teorii spiskowych.

Wszystko to co napisałam powyżej ma swój matematyczny odpowiednik - zmienną losową. To jeden z przykładów tych pojęć, które wszyscy czują, a kiedy przychodzi do opowiedzenia, czym to jest, zaczyna się robić trudniej, bo wszędzie pcha się ta matematyka.

PO CO NAM WIEDZA O ZMIENNYCH LOSOWYCH? — Zacznijmy od tego, że statystyka zajmuje się zjawiskami, które wykazują zmienność. To znaczy, nie można przewidzieć ze 100% skutecznością, jaki będzie wynik badania (lub bardziej profesjonalnie: doświadczenia losowego). Nie interesują nas zależności znane Tobie z geometrii, typu a2+b2 =c2 czy siedem sposobów na otrzymanie soli w chemii, bo to są zjawiska przewidywalne. W psychologii badamy zjawiska psychologiczne, a potem musimy iść pod regał ze statystyką, aby wiedzieć, co dalej z wynikami zrobić. Zmienna losowa jest tym, czego potrzebujemy, aby dokonywać dalszych obliczeń.

OPERACJONALIZACJA — Cecha psychologiczna przechodzi drogę od bycia zjawiskiem aż do bycia zmienną losową. Ten proces nazywa się operacjonalizacją i nie sposób o nim nie wspomnieć przy okazji tak teoretycznego konstruktu, jakim jest zmienna losowa. Taka jest właśnie nauka, jeśli nie możesz czegoś wyrazić liczbą, to po prostu nie jest nauka, to jest opinia (Heinlein). Dlatego ilekroć psycholog wpadnie na pomysł, aby coś zbadać, na przykład skłonność do tworzenia teorii spiskowych, staje przed pytaniem - jak to zmierzyć? Tym samym wkracza w obszar nauki zwany psychometrią oraz metodologią. To są takie dwie gałęzi psychologii, które uczą, jak zmienić cechę w zmienną poświęcona jest cała gałąź psychologii. Podczas zajęć student psychologii uczy się, jak z tego, co widzi własnymi oczami, zrobić pełnoprawny konstrukt teoretyczny, który można mierzyć, badać, porównywać. Bo badacz, kiedy już dowie się, jak zbadać i mierzyć, to co chce badać i mierzyć, ląduje w świecie zmiennych losowych, ponieważ ludzie będą różnić się pod względem tego, co bada i mierzy. Pamiętaj, że zmienna losowa jest teoretycznym pojęciem, czasem będzie bardzo blisko realnego świata i będzie łatwo sobie wyobrazić jej działanie, a czasami będzie bardzo nieintuicyjna, a Twoja brew pojedzie pod samo czoło.

SKĄD BIORĄ SIĘ ZMIENNE LOSOWE W PSYCHOLOGII? — Są dwie drogi. Pierwsza, ta bardziej intuicyjna, którą już w zasadzie poznałać - po prostu z badań. Twoje badanie mierzy, to co ma mierzyć - pytasz osoby badane o wiek i dajesz do wypełnienia kwestionariusz mierzący lęk. Wiek jest czymś, co różni ludzi. Ludzie różnią się też poziomem lęku. A więc będziesz miała dwie zmienne losowe: wiek oraz lęk.

Druga droga - nieco mniej intuicyjna - to, co mierzysz na zebranej próbie to, też zmienna losowa. Średnia arytmetyczne czy odchylenie standardowe - to są zmienne losowe. Jak można zobaczyć ich losową naturę? Powiedzmy, że przeprowadziłaś te same badania wczoraj i dzisiaj. Kiedy obliczysz średnią na zebranych dzisiaj wynikach, to będzie ona miała inną wartość niż średnia, którą obliczyłaś wczoraj na wczorajszych badaniach. Gdybyś zebrała wyniki jutro, to również otrzymałabyś inną średnią. Jeszcze prostszy przykład: średnie ocen liczone dla poszczególnych klas od a do e w podstawówce są obliczone na podstawie tego samego wzoru, a wyniki są różne. Świadomość tego, że to, co jest obliczane na próbie, również ma status zmiennej losowej przydaje się w zrozumieniu czym jest estymator oraz błąd standardowy.

PROSTY TEST NA ZMIENNĄ LOSOWĄ — Jeśli wzór jest taki sam, a wyniki różne na różnych próbach, to najprawdopodobniej masz do czynienia ze zmienną losową.

DIY: ZMIENNE W SPSSIE — DIY to może za dużo powiedziane. W SPSS-ie zmienne losowe będą najczęściej ułożone kolumnami. W wierszach mamy numery porządkowe kolejnych osób badanych. W kolumnę wpisujemy (albo już mamy bazę) zmienną losową - nazwaną odpowiednio - odpowiednio dla potrzeb badacza.
Kiedy prowadziliśmy badania nad adaptacją kwestionariusza postaw moralnych MFQ, to nazywaliśmy wyniki osób w ten sposób: MFQ_HARM_AVG.
MFQ to skrót kwestionariusza, HARM to po angielsku krzywda (harm). AVG oznacza średnią, ponieważ był to uśredniony wynik z sześciu itemów.
Tak wymyśliliśmy. Szczerze mówiąc, przyczyną była ... wygoda przy analizach. Nazwa jest kompromisem między długością a zawartością informacyjną i u nas ten system sprawdza się. Póki co.

ZMIENNOŚĆ ZMIENNYCH — Jak bardzo musi być coś zmienne, aby być uznane za zmienną? Definicję zmiennej, już nie losowej, jaką znajdziesz w podręcznikach do metodologii, brzmi przynajmniej dwie wartości. Ale to trochę komplikuje sprawę.

Zmienna losowa to konstrukt matematyczny z rachunku prawdopodobieństwa. Matematycy mają przypadłość wynajdywania takich światów, w których dane zjawisko może być uznane za skrajny przypadek. Chodzi o te wszystkie żarty w stylu "chory, chorszy, trup". Coś co jest płaskie jest kuliste - ze współczynnikiem zero, bo zero razy kulistość to zero kulistości, czyli płaskie. I na odwrót, coś co jest kuliste jest płaskie ze współczynnikiem zero. Dlatego dla matematyka nie będzie dziwne, jeśli napiszę, że taka zmienna, która przyjmuje tylko jedną wartość, też jest zmienną losową. Matematyk nazwie ją zdegenerowaną zmienną, po czym wróci do dalszej pracy. Nic interesującego w zmiennych losowych, które są stałe. Prawdopodobnie z tej przyczyny w metodologii badań mamy taką właśnie defiicję - jeśli statystyka zajmuje się tym, co wykazuje zmienność, to rozsądnie nazwać zmienną to, co się zmienia, więc może przyjąć co najmniej dwie wartości.

Dla matematyka taka zmienna z metodologii zawiera się w jego pojęciu zmiennej losowej. Dlatego, że gdybyś zajrzała pod skórę tego pojęcia, okazałoby się, że nie ma tam żadnej mowy o jakiejś zmienności, a definicja zmiennej losowej mówi, że jest to taka funkcja, która przeprowadza sigma ciało borelowskie w liczby rzeczywiste. Ludzkim głosem - zmienna losowa przyporządkowuje liczby do wszystkich możliwych wyników, jakie możesz uzyskać w swoim badaniu. Problem tylko w tym, że nie da jej się po bożemu narysować, tak jak to robiliśmy w liceum.

NIE-ZMIENNA LOSOWA — Dobrze jest wspomnieć, że nie każda funkcja przyporządkowująca liczby do zdarzeń losowych jest zmienną losową. W matematyce spotyka się takie dziwadła, ale prowadząc badania w naukach społecznych trzeba mieć niezłego pecha, aby trafić na taką cechę, która nie może być zmienną losową.

NIEZMIENNA ZMIENNA — A czy taka zmienna, która wprawdzie może mieć różne wartości, ale w naszej próbie trafiły się te same, to też zmienna? Powiedzmy, że zbadałaś same kobiety. Przypuszczam, że ten przykład od razu zdradza wszystko. Płeć jest zmienną w sensie metodologicznym i zmienną losową, ale w naszej próbie jej zmienność jest zerowa. Prawdopodobnie będzie to ot, taka sobie kolumna w bazie, która będzie jeszcze mniej potrzebna niż kolumna z liczbą porządkową.

I znów zanurkujemy w świat teoretycznych konstruktów. Zmienna losowa jest po prostu pojęciem bardzo teoretycznym, którego nie zobaczysz ani teleskopem, ani gołym okiem, ani pod mikroskopem. W nauce tworzymy teoretyczne konstrukty, aby móc dalej poglądać świat rzeczywistym.

WARTOŚĆ OCZEKIWANA I WARIANCJA — Kiedy masz już zmienną losową, warto spytać o takie rzeczy jakwartość oczekiwana i wariancja. Tutaj jedynie pokrótce opowiem, z czym wiążą się te pojęcia, bo do pełnego obrazu brakuje mi rozkładu. Ponieważ post o rozkładzie znajduje się niżej w spisie treści. Chciałoby się móc powiedzieć, że wartość oczekiwana to najczęściej występująca wartość, ale bardzo szybko ktoś podaje wtedy przykład rzutu kostką. Wartość oczekiwana rzutu kostką wynosi 3,5. Raczej bardzo trudno otrzymać taki wynik, nie poddając kostkę jakiejś operacji plastycznej. Skoro już teraz widać duże dziury w takiej interpretacji wartości oczekiwanej, to aby nie zostać z niczym, powiedzmy, że wartość oczekiwana często leży blisko najczęściej spotykanych wartości. Wariancja zaś z kolei jest czymś, co mierzy stopień zmienności wartości.

MOMENTY — Wartość oczekiwana i wariancja to przykłady szerszego pojęcia, zwanego momentami. Są dwie grupy momentów: zwykły i centralne. Jest to matematyczny dowód osobisty zmiennej losowej. Momentów jest bardzo dużo. Aby odróżnić je od siebie numerujemy je poprzez tzw. "rzędy". Mamy więc moment zwykły pierwszego rzędu, i tak się składa, że jest to wartość oczekiwana. Mamy też moment centralny drugiego rzędu i nazywamy go wariancją. Najczęściej interesujemy się tylko czteroma po każdej z tych grup. Z tego, jak zachowują się można wywnioskować wiele informacji o zjawisku, które przecież ta zmienna reprezentuje. Techncznie rzecz biorąc, moment to po prostu kolejny wzór, jaki ćwiczymy na wartościach zmiennej, tym razem jednak musimy jakoś wpleść w niego rozkład tej zmiennej.

CIEKAWOSTKA — W Polsce jest miasto, którego jedna z ulic nosi nazwę Zmienna.

2 komentarze:

Bongol pisze...

Dziękuję za Bloga!
Pomyślałem sobie, że mało jest opracowań pozwalających humanistom wchodzącym w temat statystyki ogarnąć te wszystkie znaczki, które kiedyś będą na kubku...
A może warto zrobić o tym wpis jak to czytać?
Tak kroczek po kroczku ...:)
Trzymaj się!

Lilianna Jarmakowska-Kostrzanowska pisze...

Hmm, zawsze jest pytanie, czy to się do czegoś nada komuś i tłumaczenie nie odbędzie się za bardzo kosztem tejże oto definicji.