Parametr i estymator

PARAMETR W POPULACJI — Kiedy badacz zabiera się do badania, stawia sobie za cel poznanie pewnej charakterystycznej liczby opisującej zbiorowość. Może być badania antropometryczne, których celem będzie odkryć jaki jest średni wzrost osób w jakiejś specyficznej populacji (np. Pigmejowie), albo średnia długość palca wskazującego. To może być to badanie medyczne, w którym należy poznać średni liczba komórek rogówki. To w końcu może być naukowe badanie w dziedzinie psychologii i średni poziom potrzeby omknięcia poznawczego. Liczby, liczby, liczby - są wokół nas i nas opisują. Wszyscy ludzie są zgromadzeni w jednym miejscu - na Ziemi. Teoretycznie więc można badać. Szkopuł w tym, że jest ich za dużo. Nie ma tyle czasu, aby wszystkich poddać badaniu. To wymaga zresztą kosztów, jest czasochłonne. Jedni umrą w czasie badania, drudzy się narodzą. Po to właśnie są próby i estymatory. Tak zwykle o parametrze można przeczytać — parametr jest stałą, nieznaną wielkością, charakteryzującą populację, której nie można poznać. Jest liczbą, której mamy nigdy nie poznać. Za to tym, co możemy poznać jest wartość estymatora, po zebraniu próby.

Parametr i estymator to świetna okazja do porozmawiania o tym, że istnieją dwa światy pojęć, których na pierwszy rzut oka nie widać, a które przeplatają się. Przecież to, co obserwujemy w świecie, musimy jakoś opisać językiem statystyki.

TEORIA i EMPIRIA — Chodzi świat konstruktów czysto teoretycznych (to są te, które są mocno abstrakcyjne i znajdują się w podręcznikach) oraz świat konstruktów empirycznych (konkretnych wyników). Mimo abstrakcyjnej natury, konstrukty teoretyczne mają sens, bo znajdują odbicie w świecie rzeczywistym - po prostu nie są namacalne czy konkretne. Za to pozwalają dalej prowadzić wnioski o otaczającym świecie. W dniu, w którym wyabstrahowaliśmy z jednego jabłka, jednej szczapy drewna, jednego dziecka pojęcie 'jeden', otworzyliśmy - dla niektórych puszkę Pandory - drogę do posługiwania się nienamacalnymi pojęciami, na których dobrze wychodzimy. Szkoda, że tych rzeczy nie powiedzieli w szkole na fizyce, że siła, tarcie i grawitacja to nie konkretne przedmioty, tylko model rzeczywistości.

Dobrze to widać na zmiennej losowej i jej konkretnym, empirycznym wyniku. Zmienna losowa to pojęcie czysto teoretyczne. Nie doświadczasz jej na własnej skórze, nie fruwa w powietrzu. A przydaje się, bo dobrze opisuje to, co widzisz, a widzisz, że ludzie się różnią, nawet pogoda nie jest przewidywalna w 100%. Czyli doświadczasz przejawów działania zmiennej losowej, ale nigdy jej na oczy nie widziałaś. Zmienna losowa to pojęcie czysto teoretyczne.

Matematycy mają swój sposób na to. Mówią o zmiennych losowych i ich realizacjach. Na papierze zaznaczają to dużymi literami, kiedy mają na myśli pojęcie teoretyczne, X, a małymi literami, kiedy mówią o jej konkretnym uzyskanym wyniku, x.

Po czym poznać pojęcie teoretyczne, a pojęcie empiryczne? Prosta recepta jest taka: jeśli coś jest obliczone na zebranej próbie, to wówczas jest czymś empirycznym. Zostało uzyskane wskutek doświadczenie, a doświadczenie to inaczej empiria. Mówiąc krótko, jeśli to coś to konkretny, liczbowy wynik i zostało obliczone używając obserwacji, to jest to empiryczne.

Dobrze zdawać sobie z tego sprawę z istnienia dwóch światów, bo dzięki temu mniej łamiemy sobie głowę, gdy próbujemy wyjaśnić, dlaczego średnia rzutu monetą jest niecałkowitą liczbą i wynosi 3,5. Prawidłowości rachunku prawdopodobieństwa odnoszą się do pojęć teoretycznych.

Te dwa światy są osobne, ale niektóre pojęcia wykazują silną tendencję do bilokacji i występują i tu, i tu. Dlatego można zgubić się. Na przykład słowo rozkład ma odmianę teoretyczną oraz odmianę empiryczną. Rozkład teoretyczny to taki, jaki powinien być według tego, co mówi teoria. Rozkład empiryczny to taki, jaki badacz otrzymał po przeprowadzeniu badań. To dlatego rysunki rozkładów niekiedy bardzo się różnią. Jest jeden rozkład teoretyczny jakiejś cechy. I od groma rozkładów empirycznych - tyle, ile było badań.

GARŚĆ PRZYKŁADÓW — Średnia jest też takim dwulicowym stworzeniem: może mieć swoją odmianę teoretyczną, ale wówczas raczej powiemy o wartości oczekiwanej jakiejś zmiennej. Albo odmianę empiryczną (sumujesz wyniki, dzielisz przez liczbę badanych). Wówczas jest jedną z miar tendencji centralnej Twojej próby. Gęstość rozkładu jest pojęciem teoretycznym, nie da się jej uzyskać w drodze zbierania wyników. Histogram jest tworem empirycznym, stworzonym na podstawie.

ROBIĄC MAŁĄ PĘTLĘ — Parametr jest pojęciem teoretycznym, własnością rozkładu Twojej zmiennej losowej, którą badasz. I znów - w statystyce klasycznej jest on stałą liczbą, której prawdziwej wartości nie znamy, a jedynie możemy estymować na podstawie próby. I to nie jest jedyny sposób uprawiania statystyki - ale o tym kiedy indziej.

Brak komentarzy: