21  Wprowadzenie do Wnioskowania Statystycznego: Logika Testowania Hipotez Statystycznych

Wnioskowanie statystyczne to sposób, w jaki wyciągamy wnioski o populacji na podstawie próby. To jak bycie detektywem: nigdy nie mamy wszystkich informacji, ale możemy wyciągać uzasadnione wnioski na podstawie dostępnych dowodów.

Podstawowa Logika

Wyobraź sobie, że podejrzewasz, iż moneta może być nieuczciwa. Jak sprawdzić takie przypuszczenie?

  1. Zbierz Dowody:
    • Wykonaj wiele rzutów monetą
    • Zapisz wyniki
    • Sprawdź, czy są zgodne z tym, czego oczekiwałbyś od uczciwej monety
  2. Podejmij Decyzję:
    • Jeśli wyniki wyglądają normalnie → kontynuuj założenie, że moneta jest uczciwa
    • Jeśli wyniki wyglądają bardzo nietypowo → podejrzewaj, że moneta jest nieuczciwa
Kluczowe Kroki Testowania Hipotez Statystycznych (ogólny schemat)
  1. Wstępne Podejrzenie/Pytanie Badawcze
    • Podejrzewamy istnienie pewnego efektu/związku/różnicy
    • To ukierunkowuje nasze badanie i analizę
  2. Zbieranie Danych
    • Gromadzimy odpowiednią ilość danych
    • Wielkość próby zależy od oczekiwanego efektu i wymaganej precyzji
  3. Obserwacja Wyników
    • Obserwujemy i podsumowujemy nasze dane
    • Szukamy istotnych wzorców w danych
  4. System Hipotez
    • H₀: brak efektu/brak różnicy (“status quo”)
    • H₁: efekt istnieje (jedno- lub dwustronny)
    • Wybór kierunku zależy od pytania badawczego
  5. Podejście Wartości p
    • Rozważamy: jak prawdopodobne są nasze wyniki (lub bardziej skrajne) jeśli H₀ jest prawdziwa?
    • Wybieramy odpowiedni model probabilistyczny w zależności od typu danych
    • Obliczamy to prawdopodobieństwo (wartość p)
  6. Podejmowanie Decyzji
    • Porównujemy wartość p z poziomem istotności (zazwyczaj α = 0.05)
    • Mała wartość p sugeruje, że wyniki są mało prawdopodobne przy H₀
  7. Wniosek
    • Jeśli p ≤ α, odrzucamy H₀
    • Wnioskujemy o dowodach przeciwko hipotezie zerowej
    • Rozważamy znaczenie praktyczne
Podstawowa Logika Testowania Hipotez Statystycznych: Analiza Zdolności ESP

Problem Badawczy: Testowanie Deklaracji o Posiadaniu Zdolności Pozazmysłowych

Osoba twierdzi, że posiada zdolności ESP (percepcję pozazmysłową, tzw. szósty zmysł), które pozwalają jej przewidywać wyniki rzutów monetą. Aby naukowo przetestować to twierdzenie, projektujemy eksperyment, w którym moneta jest rzucana 100 razy, a osoba musi przewidzieć każdy wynik przed rzutem.

Osoba osiąga sukces w 70 na 100 przewidywań. Jednak istnieje subtelne, ale kluczowe zastrzeżenie: wysoki współczynnik sukcesu może wskazywać zarówno na zdolności ESP, JAK I na nieuczciwą monetę.

Definiowanie Prawdopodobieństwa Bazowego i Oczekiwanej Skuteczności

Jeśli osoba jedynie zgaduje (brak ESP), każde przewidywanie jest równoważne losowemu zgadywaniu z prawdopodobieństwem sukcesu 0.5. Jeśli rzeczywiście posiada zdolności ESP, spodziewalibyśmy się współczynnika sukcesu przekraczającego 0.5. To stanowi podstawę naszego badania statystycznego.

Ustanawianie Systemu Hipotez Statystycznych

Ustalamy dwie konkurencyjne hipotezy:

  1. Hipoteza Zerowa (H₀): Przewidywania opierają się na losowym zgadywaniu przy użyciu uczciwej monety (p = 0.5)
  2. Hipoteza Alternatywna (H₁): Albo osoba posiada zdolności ESP, ALBO moneta jest nieuczciwa (p > 0.5)

Wybór Między Testami Jedno- i Dwustronnymi

W testowaniu hipotez musimy zdecydować, czy testujemy efekt w jednym czy obu kierunkach:

Test Jednostronny (Nasz Obecny Przypadek):

  • Testuje efekt tylko w jednym kierunku (tutaj: lepszy niż przypadek)
  • Większa moc wykrywania określonego efektu kierunkowego
  • Odpowiedni, gdy interesuje nas tylko jeden kierunek
  • Przykład: Interesuje nas tylko wynik lepszy niż przypadkowy, nie gorszy

Test Dwustronny (Alternatywne Podejście):

  • Testuje efekt w obu kierunkach (zarówno lepszy jak i gorszy niż przypadek)
  • Mniejsza moc, ale bardziej kompleksowy
  • Odpowiedni, gdy każde odchylenie od hipotezy zerowej jest interesujące
  • Przykład: Testowanie, czy moneta jest nieuczciwa w kierunku orła LUB reszki

Wybór Modelu Probabilistycznego: Rozkład Dwumianowy

Nasz test ESP pasuje do modelu prawdopodobieństwa dwumianowego, ponieważ:

  • Każde przewidywanie jest niezależne
  • Każde przewidywanie ma dokładnie dwa możliwe wyniki (poprawne/niepoprawne)
  • Prawdopodobieństwo sukcesu pozostaje stałe (0.5 przy H₀)
  • Zliczamy całkowitą liczbę sukcesów w ustalonej liczbie prób

Dla naszego przykładu obliczamy: P(X \geq 70) = \sum_{k=70}^{100} \binom{100}{k}(0.5)^k(0.5)^{100-k}

Obliczanie i Interpretacja Wartości p

Wartość p pomaga nam ocenić, jak zaskakujące byłyby nasze wyniki, gdyby H₀ była prawdziwa:

  • Mierzy prawdopodobieństwo uzyskania 70 lub więcej poprawnych przewidywań na 100 prób przez czysty przypadek
  • Bardzo mała wartość p sugeruje, że taki sukces byłby rzadki przy losowym zgadywaniu
  • Konwencjonalny próg 0.05 oznacza, że wymagamy wyników, które wystąpiłyby przypadkowo rzadziej niż w 5% przypadków

Reguły Decyzyjne i Potencjalne Błędy w Testowaniu ESP

  1. Błąd Typu I (Fałszywie Pozytywny):
    • Stwierdzenie, że ktoś ma ESP, gdy miał po prostu szczęście
    • Ograniczamy to ryzyko do 5% poprzez poziom istotności
    • To jak błędne potwierdzenie zdolności ESP
  2. Błąd Typu II (Fałszywie Negatywny):
    • Niewychwycenie rzeczywistych zdolności ESP, lub faktu, że moneta jest obciążona
    • Bardziej prawdopodobny przy:
      • Współczynniku “sukcesu” (prawdopodobieństwo “sukcesu”) niewiele powyżej 0.5
      • Małej liczbie prób
      • Rygorystycznych poziomach istotności
Obliczenie Wartości p dla Przykładu ESP

Szczegóły Obliczeniowe

Dla naszego testu ESP z 70 sukcesami na 100 prób, obliczamy:

P(X \geq 70) = \sum_{k=70}^{100} \binom{100}{k}(0.5)^k(0.5)^{100-k} \approx 0.0000393

Oznacza to, że przy hipotezie zerowej (czyste zgadywanie):

  • Prawdopodobieństwo uzyskania 70 lub więcej poprawnych przewidywań przez przypadek wynosi około 0.00393%
  • Tak skrajne wyniki wystąpiłyby przypadkowo tylko około 4 razy na 100,000 prób
  • Jest to znacznie poniżej konwencjonalnego poziomu istotności 0.05 (5%)

Decyzja Statystyczna

Ponieważ nasza wartość p (0.0000393) jest znacznie mniejsza niż α = 0.05:

  • Odrzucamy hipotezę zerową
  • Wnioskujemy, że istnieją silne dowody statystyczne przeciwko “losowemu zgadywaniu”
  • Wynik jest uznawany za “wysoce istotny statystycznie”

Ostrożna Interpretacja

Mimo że nasz wynik jest istotny statystycznie, powinniśmy rozważyć:

  • Istotność statystyczna nie dowodzi istnienia ESP (moneta może być nieuczciwa?)
  • Eksperyment powinien być powtarzalny w kontrolowanych warunkach