Statystyka klasyczna i bayesowska #storytime

STYCZEŃ 2023| LJK | ~500 słów

PRZED UŻYCIEM TEKSTU PRZECZYTAJ ULOTKĘ LUB ... SKONSULTUJ SIĘ Z AUTOREM — Tekst, który zaraz przeczytasz, jest literacką wersją porównania dwóch szkół statystyki: klasycznej i bayesowskiej. Literacką, więc jego celem jest wzbudzenie ciekawości odbiorcy i oddanie odczuć kogoś, kto przenosi się z jednego sposobu uprawiania statystyki na drugi. Nie jest to typowo podręcznikowe porównanie w tabelce z dwoma kolumnami, więc po ostatniej kropce nie popędzisz od razu robić analizy. Takie posty pojawią się na blogu jakiś czas. Na razie zobacz, jak to jest zmieniać szkołę.


NAPIS NAD WARSZTATEM JEST DUŻY I WYRAŹNY. Zapisano go bezszeryfową czcionką – taką, jaką zwykle używa się, gdy nazwa ma poważnie brzmieć. Ale teraz go nie widać - jest zbyt ciemno i litery giną w mroku. Z ciemności wyłania się Researcher, wchodzi szybkim krokiem do pomieszczenia i od razu zakrywa oczy ręką. Jaskrawo świecące żarówki oślepiają, a to boli. Może dlatego noworodki krzyczą tuż po narodzinach. Zanim oczy przyzwyczają się do światła, mija kilka sekund. Wreszcie powoli wyłaniają się jakieś kształty. Researcher rozgląda się. Warsztat jak warsztat. Jest stół, są narzędzia. Półki wypełnione papierzyskami. Szafy, szuflady i szafki. Wszystko wygląda tak samo, a jakby inaczej.

Gdyby to był jego warsztat, dane – całe naręcza danych – leżałyby przy blacie najbardziej oświetlonego stołu. Na blacie stałaby maszyna, która u góry ma okrągły, plastikowy wsyp, a z tyłu wylot wytworzonego z danych produktu. Z boku ma też wąską szczelinę, w którą wkłada się specjalną matrycę - wzornik pokazujący, jak dane powinny układać się zgodnie z taką czy inną hipotezą. W warsztatach jego typu najczęściej używa się matrycy hipotezy zerowej, która pokazuje układ danych, gdy tylko działa tylko przypadek. Gdy z maszyny wyleci produkt, bierze się takie narzędzie podobne do licznika Geigera i ogląda jak częsty jest to okaz. Ale jego warsztatem napisano ”statystyka klasyczna”. Ten tutaj to warsztat statystyki bayesowskiej.

Wszystko jest tutaj inne. Dane znajdują się w takim samym kontenerze, ale główny blat stołu zajmuje inna maszyna z innymi pokrętłami i jedną dużą korbą. Ilustrowana instrukcja, taka jak z IKEA, pokazuje mechanizm działania maszyny. Z lewej strony znajduje się płytka. Teraz jest pusta. Korbą kręci się, tak aby to, co będzie na płytce wsunęło się do środka maszyny. Następnie zwalnia się przycisk wstrzymujący dane wsypane od góry i z prawej strony wysuwa się płytka, na której leży jakiś poładowany kształt, jakby ulepiony z gliny. Rozkład a priori – odczytuje Researcher.

To, co ma znaleźć się na lewej płytce w ogromnych ilościach leży w szklanych szafach przy biurku. Opis na drzwiach łatwo odczytać – rozkład a priori, uprzednia wiedza badacza. W przezroczystych pojemnikach znajduje się plastyczny materiał, z którym maszyna syntetyzuje dane – rozumuje Researcher i sięga po jeden z pojemników. Wszystkie opatrzono etykietami: informative prior, Gaussian prior. Researcher niby zna niektóre pojęcia, ale do tej pory inaczej z nimi postępował. Na przykład taki Gaussian oznacza rozkład gaussowski, normalny. Cecha miała rozkład normalny, gdy w populacji jej wyniki układały się w pewien szczególny sposób: tych blisko średniej było najwięcej, a im dalej od średniej, tym rzadziej. Nie trzeba go było modyfikować. Dziwne – myśli Researcher. Na jednej półce stoi samotnie pojedyncze pudełko – uniform prior, rozkład jednostajny, wszystkie wartości mają jednakową szansę przytrafienia się. Ach, to w czymś takim Laplace zaklął niewiedzę czy też ignorancję badacza. Researcher chwilę obraca je w palcach i delikatnie odstawia na miejsce.

Zaraz, zaraz – gwałtownie odwraca głowę w kierunku głównego stołu. - A gdzie w tym warsztacie jest signifikantometr, istotnościomierz? Który przyrząd służy do pomiaru istotności statystycznej wyniku? Przegląda jeszcze raz wszystkie narzędzia, przeszukuje szuflady, nie zwracając na to, że grzebie w cudzym. To niemożliwe – stwierdza ze zdziwieniem. – W warsztacie statystyki bayesowskiej nie ma istotności statystycznej.

3 komentarze:

wetalk pisze...

Niezwykle przydatny wpis, dziękuję za niego.

Anonimowy pisze...

Czekamy na więcej!

Ewelina2621 pisze...

Wszystkim osobom zainteresowanym tematem polecam sprawdzić genialną stronę - https://proficompetence.com/ . Czy wiecie jakie są Wasze najmocniejsze cechy osobowości, jakie macie predyspozycje i kompetencje zawodowe?