7.1 Hipoteza statystyczna i testowanie hipotez

Weryfikacja hipotez statystycznych służy do odpowiadania na pytania o własności rozkładu zmiennej w populacji, na przykład: „czy średnia zmiennej losowej X w populacji ma wartość k?” albo „czy zmienne X i Y w populacji są stochastycznie niezależne?”.

Hipoteza to oparte na wiedzy przypuszczenie na jakiś temat.

Aby przypuszczenie stało się hipotezą, musi być sprawdzalne - to główny warunek.

Hipoteza statystyczna to stwierdzenie dotyczące rozkładu populacji. Może dotyczyć albo jej postaci funkcyjnej (czyli jaki rozkład ma populacja statystyczna – np. rozkład normalny, dwumianowy itp.) albo wartości parametrów (najczęściej średniej lub frakcji (proporcji)).

Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu prawdopodobieństwa „rządzącego” zjawiskiem, które nas interesuje. Rozważamy pewien ustalony rozkład prawdopodobieństwa P. Pytamy, czy opisuje on poprawnie przebieg doświadczenia losowego.

Testowanie hipotez statystycznych rozpoczyna się od sformułowania układu hipotez statystycznych.

Pierwszym krokiem w testowaniu hipotez jest postawienie dwóch konkurujących ze sobą hipotez. Te dwie hipotezy nazywane są hipotezą zerową i hipotezą alternatywną.

Celem testowania hipotezy jest sprawdzenie, czy istnieje wystarczająca ilość dowodów przeciwko hipotezie zerowej.

Innymi słowy, aby sprawdzić, czy jest wystarczająco dużo dowodów, aby odrzucić hipotezę zerową. Jeśli nie ma wystarczających dowodów, nie odrzucamy hipotezy zerowej.

Decyzja w procedurze testowania hipotez:

  • odrzucić hipotezę zerową albo …
  • nie odrzucić hipotezy zerowej.

Ogólna zasada jest następująca: powinniśmy odrzucić hipotezę, jeśli rezultaty doświadczenia okażą się sprzeczne z przewidywaniami wynikającymi z modelu. Specyfika modeli probabilistycznych polega jednak na tym, że potrafimy przewidzieć tylko prawdopodobieństwo poszczególnych wyników. Zmodyfikujemy więc ogólną regułę Powinniśmy odrzucić hipotezę, jeśli wynik doświadczenia jest bardzo mało prawdopodobny, to znaczy model przewiduje dany wynik z małym prawdopodobieństwem. Innymi słowy, wybieramy pewien zbiór \(K \subseteq S_X\) (\(S_X =\) zbiór wartości zmiennej \(X\)) taki, że \(P(X \in K) \le \alpha\), gdzie \(\alpha\) jest odpowiednio „małą” liczbą, zwaną poziomem istotności. Jeśli w wyniku doświadczenia stwierdzimy, że zaszło zdarzenie „\(X \in K\)”, to powinniśmy zwątpić w poprawność naszego modelu, czyli „odrzucić postawioną przez nas hipotezę statystyczną”. Zbiór K nazywamy obszarem krytycznym testu, zaś cała procedura nosi nazwę testu istotności.

Testowanie hipotezy, że kobiety spędzają więcej czasu na oglądaniu telewizji niż mężczyźni. Załóżmy, że w badaniu wzięło udział 70 mężczyzn i 60 kobiet. Średni czas oglądania wynosił 120 minut dziennie dla mężczyzn i 150 minut dla kobiet. Na pierwszy rzut oka różnice są oczywiste, a wyniki potwierdzają hipotezę. Jednak taki wynik można uzyskać przypadkowo, nawet jeśli nie ma różnic w populacji. W związku z tym pojawia się pytanie - czy jest uzasadnione twierdzenie, że generalnie kobiety spędzają średnio więcej czasu na oglądaniu telewizji niż mężczyźni? Jakie jest prawdopodobieństwo, że tak jest? Czy różnica jest istotna statystycznie?

Metodę testowania hipotez statystycznych opracowali Jerzy Neyman (polski statystyk) i Egon Pearson (Brytyjczyk).

Hipoteza zerowa

Hipoteza zerowa jest zwykle oznaczana jako H0. Hipoteza zerowa określa „status quo”.

Zakłada się, że ta hipoteza jest prawdziwa, dopóki nie ma dowodów na to, że jest inaczej.

Hipoteza alternatywna

Hipoteza alternatywna jest zwykle oznaczana jako H1. Nazywa się ją również hipotezą badawczą.

Hipoteza alternatywna to taka, w której badacze przewidują wpływ zmiennej objaśniającej na zmienną objaśnianą. Preferowana jest nowa teoria zamiast starej (hipoteza zerowa).

UWAGA. Nie możemy powiedzieć, że „przyjmujemy hipotezę alternatywną”? Powodem jest to, że zakładamy, że hipoteza zerowa jest prawdziwa i próbujemy sprawdzić, czy są przeciwko niej dowody. Dlatego wniosek powinien dotyczyć H0 (a nie H1).


Metodę testowania hipotez wykorzystuje się m.in. w badaniach eksperymentalnych. Dla przykładu:

W badaniach eksperymentalnych badacz rozdziela badanych na dwie grupy i robi z członkami jednej grupy coś, na przykład podaje lek, czego nie robi w drugiej grupie.

Następnie, porównuje się wyniki dla grupy leczonej i kontrolnej. Jeśli wyniki są różne, badacz stara się dojść do wniosku, z pewnym stopniem pewności, że różnica (grupa eksperymentalna vs. grupa kontrolna) jest na tyle duża, aby przypisać ją systematycznej różnicy w grupach (tj. efektowi leczenia) w przeciwieństwie do czegoś innego niż leczenie (tj. błąd statystyczny).

W badaniu klinicznym nowego leku, nasze pytanie badawcze może dotyczyć: „Czy nowy lek jest skuteczniejszy (tj. zmniejsza śmiertelność) niż placebo (“sugar pill”)?” Możemy zdefiniować nasze hipotezy następująco:

  • H0: Średnia śmiertelność nie różni się między grupami leczonymi (nowy lek) i kontrolnymi (grupa placebo - tzw. „pigułka cukrowa”);
  • H1: Średnia śmiertelność różni się między grupami leczonymi i kontrolnymi.

Hipotezy badawcze odnoszą się do związków podejrzewanych w całej populacji będącej przedmiotem zainteresowania.

7.1.0.1 Błędy podczas weryfikacji hipotez

Podczas testowania hipotez statystycznych można popełnić błąd, akceptując błędną lub odrzucając prawidłową hipotezę.

Chcemy w jakiś sposób kontrolować poziom tego błędu, który badacz akceptuje w teście statystycznym, w tym celu wprowadzamy pojęcie poziomów istotności (np. 0.05).

Poziom istotności jest progowym prawdopodobieństwem błędu polegającego na odrzuceniu hipotezy zerowej, gdy jest ona prawdziwa, tzw. błąd I rodzaju. To prawdopodobieństwo jest inaczej nazywane wartością p (p-value).

7.1.0.2 Rodzaje błędów

Błąd typu I (wynik fałszywie dodatni) Kiedy odrzucamy hipotezę zerową, gdy hipoteza zerowa jest prawdziwa.

Błąd typu II (wynik fałszywie ujemny) Kiedy nie odrzucamy hipotezy zerowej, gdy hipoteza zerowa jest fałszywa.

Decyzja/Prawdziwość H0 \(H_0\) is true \(H_0\) is false
Odrzucamy \(H_0\) Type I error Correct decision
Nie odrzucamy \(H_0\) Correct decision Type II error

7.1.0.3 P-wartość (p-value)

W testowaniu istotności dla hipotezy zerowej, wartość p to prawdopodobieństwo uzyskania wyników testu co najmniej tak skrajnych, jak wyniki faktycznie zaobserwowane, przy założeniu, że hipoteza zerowa (zakładająć, że zmienna losowa ma tzw. rozkład zerowy (null distribution)) jest poprawna.

Bardzo mała wartość p oznacza, że tak skrajny obserwowany wynik byłby bardzo mało prawdopodobny zakładając prawdziwość hipotezy zerowej (dowód przez sprowadzenie do sprzeczności).

7.1.0.4 Logika testowania hipotez statystycznych - podsumowanie

Testując hipotezę, używamy metody, w której zbieramy materiał dowodowy na temat hipotezy. Jak zdecydować, czy odrzucić hipotezę zerową?

Jeśli przykładowy materiał dowodowy jest zgodny z hipotezą zerową, to jej nie odrzucamy. Jeśli przykładowe dane są niespójne z hipotezą zerową, odrzucamy hipotezę zerową.