Co to znaczy prawdopodobieństwo?

SPIS TREŚCI:
  • Różne definicje pojęcia prawdopodobieństwo
  • Dwie szkoły interpretacji: frekwentystyczna i bayesowska

PRAWDOPODOBIEŃSTWO — Wiele kursów ze statystyki zaczyna właśnie od omówienia tego, czym jest prawdopodobieństwo i można się zdziwić, bo przecież zwykle ludziom statystyka kojarzy się z danymi, ze średnimi i czymś takim, ale prawdopodobieństwo? Dlaczego w ogóle mówić o prawdopodobieństwie?

To dość ważne, bo od tego, jak się umówimy co do rozumienia prawdopodobieństwa, taką statystykę będziemy uprawiać. Co to znaczy: taką statystykę? Czy są różne statystyki? Właśnie tak - są różne szkoły myśli statystycznej. To tylko tak się wydaje, że statystyka to jednolite ciasto, a tymczasem sprawa jest bardziej skomplikowane. Podobnie jak z psychoterapią - wszyscy myślą, że jest jedna psychoterapia. A przecież mamy psychoterapię psychodynamiczną, jest psychoterapia Gestal oraz CBT, czyli poznawczo-behawioralną i jej nowszą odmianę - psychoterapię schematów. Nie inaczej ze statystyką.

Mamy co najmniej dwie szkoły statystyki, które stosują różne narzędzia do analizy danych. Różna stoi za nimi też filozofia. Większość podręczników mówi o jednej, ale teraz jesteśmy na rozstaju dróg i dowiemy się, jakie mamy opcje. A wszystko zaczyna się w miejscu, w którym rozwidla się interpretacja pojęcia "prawdopodobieństwo".

Zadam Tobie pytanie z dwoma możliwymi odpowiedziami, spróbuj odpowiedzieć bez zerkania poniżej. Dwie osoby, A i B, trzymają monetę, złotówkę. Zadaniem jest określić prawdopodobieństwo otrzymania orła. Poniżej znajdują się ich odpowiedzi - która z tych osób jest Tobie bliższa?
a) osoba A powie 1/2, bo wykonała eksperyment rzucania monetą milion razy i w prawie połowie rzutów wypadł orzeł, więc stąd: jedna druga.
b) osoba B powie 1/2, bo myśli tak: moneta wygląda na uczciwą, więc szansa na orła jest taka sama jak szansa na reszkę, więc stąd: jedna druga.

Osoba A rzuca w nieskończoność monetą i patrzy na stosunek liczby orłów do liczby wykonanych rzutów. Ten stosunek zmienia się z rzutu na rzut. Choć jest zmieniającą się względną częstością orłów do ogólnej liczby rzutów, częstość ta zbiega do granicznej wartości. Tę graniczną częstość uznaje się za prawdopodobieństwo orła. Dlatego gdyby rzucać uczciwą monetą nieskończenie wiele razy, to stosunek orłów do rzutów oscylowałby blisko jednej drugiej - coraz bliżej i coraz bliżej tej liczby.

Nie wiem, czy to Wam powiedzieli w szkole, może tak, może nie, a może sami do tego doszliście, ale granica ciągu liczb jest pojedynczą liczbą.

Jak pewnie widzisz, dla osoby A prawdopodobieństwo jest czymś, co zdarzy się we wciąż uciekającym horyzoncie zdarzeń, jakimi są rzuty monetą. Wciąż goni do nieskończoności. Dla osoby B prawdopodobieństwo orła jest kwestią przemyśleń na temat tego, co wie o monecie.

Różnica, czy wybierzemy częstościową interpretację prawdopodobieństwa jakiegoś zdarzenia, czy może jako miarę przekonania o jego zajściu, jest duża. Dlaczego? Dlatego, że ta pierwsza, częstościowa interpretacja, obsługuje tylko powtarzające się zjawiska, takie jak rzuty monetą. Co z prawdopodobieństwem tego, że znajdę partnera? Albo z tym, że jutro spadnie deszcz? Dla częstościowej interpretacji one nie istnieją.

Interpretacja prawdopodobieństwa zmienia całą optykę. Na tym, jak należy rozumieć słowo "prawdopodobny", oparte są dwie szkoły statystyki: częstościową (lub inaczej: frekwentystyczną) i bayesowską. Na studiach z psychologii w większości nauczana jest ta pierwsza: frekwentystyczna. Dlatego liczysz przedziały ufności i masz dwie hipotezy: zerową i alternatywną. Wcale tak być nie musi, ale jeśli skręcisz drogą statystyki frekwentystycznej, to tak to wygląda.

PRZYKŁAD — Powiedzmy, że chcesz poznać średni poziom wzrostu w populacji. Profesjonalnie będziemy nazywać go parametrem.

PODEJŚCIE FREKWENTYSTYCZNE — Jeśli stosujesz szkołę frekwentystyczną, to potraktujesz parametr μ jako stałą liczbę, której prawdziwej wartości szukasz. Gdybyś badał coraz więcej osób, to średnia arytmetyczna wzrostu zbadanych osób x̄, dążyłaby do tej liczby, do prawdziwej wartości parametru Dlatego mamy frekwentystyczne wnioskowanie statystyczne. Tradycyjne, klasyczne, zwyczajowe - więc często pomija się słowo "frekwentystyczne".

PODEJŚCIE BAYESOWSKIE — Jeśli stosujesz szkołę bayesowską, to potraktujesz średni poziom wzrostu w populacji jako zestaw różnych wartości, które mają większą lub mniejszą szansę wystąpienia. Parametr nie jest już pojedynczą liczbą. Szukając prawdziwej wartości w populacji, szukaj takiej, która przekonuje Cię w największym stopniu.

CO TO ZA RÓŻNICA? - Nie zdziwię się, gdy ktoś o to spyta. Po co w ogóle przejmować się interpretacją jakiegoś prawdopodobieństwa? Jakoś te liczby musimy interpretować. One same w sobie są pozbawionymi sensu bytami. Co to oznacza, że szansa na zachorowania na nowotwór wynosi 30%? Może to oznaczać, że trzydzieści na sto osób będzie miał pecha. Wykonano analizy na wielotysięcznych próbach i 0,3 pacjentów dotknęła ta choroba. Ale równie dobrze, to 30% może to wyrażać stopień przekonania, zupełnie taki sam, jak wtedy, gdy mówimy, że zdamy egzamin na 30% - co w gruncie rzeczy oznacza słabe przygotowanie i oczekiwanie, że zadziała szczęście.

Brak komentarzy: