7.2 Przykłady

7.2.1 Przykład.

Czy prawdopodobieństwo wyrzucenia „jednego oczka” na sześciościennej kości jest równe 1/6?.

Wykonujemy 300 rzutów kostką do gry. Jeśli kostka jest symetryczna i rzuty wykonujemy rzetelnie, to zmienna losowa \(X = k_1\) równa liczbie wyrzuconych “jedynek” ma rozkład dwumianowy \(Bin(n = 300, p = 1/6)\).

Przyjmijmy, że mamy pewne wątpliwości, czy kostka, którą rzucamy jest uczciwa i podejrzewamy, że wyrzucenie jednego oczka (\(X = 1\)) ma prawdopodobieństwo mniejsze niż 1/6. Jeśli w wyniku doświadczenia ani ani razu nie otrzymamy jedynki, musimy podejrzewać, że coś jest nie w porządku. A może kostka w ogóle nie ma ściany oznaczonej jedną kropką? Wprawdzie zdarzenie „X = 0” w modelu symetrycznej/uczciwej kostki jest możliwe ale skrajnie mało prawdopodobne, \(P(X = 0) = (5/6)^{300} ≈ 1.76∗10^{−24}\). Nie jesteśmy skłonni wierzyć w tak wyjątkowy traf. Odrzucamy więc hipotezę o zgodności modelu.

Jak postąpić jeśli otrzymamy, np. 33 jedynki, nie jest już tak oczywiste. Czy to wynik zgodny z hipotezą o rzetelności kostki, czy też może być podstawą do odrzucenia tej hipotezy?

Rozważmy problem bardziej systematycznie.

Stawiamy następującą hipotezę:

  • H0: \(X ∼ Bin(300, 1/6)\), i.e. \(P(X = 1) = 1/6\).
  • H1: \(P(X = 1) < 1/6\)
  1. Przyjmijmy zastępującą regułę decyzyjną:
  • jeśli \(X < c\) to odrzucamy H0;
  • jeśli \(X >= c\) to pozostajemy przy H0.

dla pewnej liczby „progowej” C, testu.

Próg C ustalimy w następujący sposób. Wybierzmy poziom istotności, powiedzmy \(\alpha = 0.01\). Uznamy, że zajście zdarzenia o prawdopodobieństwie mniejszym niż \(\alpha\) jest dostatecznym powodem do odrzucenia H0. Powinniśmy więc wybrać C tak, aby \(P(X < C) <= 0.01\). Mamy przy tym na myśli prawdopodobieństwo obliczone przy założeniu, że H0 jest prawdziwa. Można sprawdzić, że dla \(X = 36\), mamy \(P(X < 36) = 0.00995 <= 0.01\), a więc ostatecznie nasz test na poziomie istotności 0.01 jest następujący:

  • Odrzucamy H0 jeśli \(X < 36\).

Obszarem krytycznym naszego testu jest podzbiór \(K = \{0, 1, . . . , 35\}\) zbioru obserwacji na zmiennej losowej \(S_X = \{0, 1, . . . , 300\}\).

Jeżeli wynikiem doświadczenia są 33 jedynki, to opisana powyżej reguła decyzyjna odrzuca H0.

  1. Inna metoda weryfikacji powyższego układu hipotez statystycznych wykorzystuje pojęcie p-wartości (\(p-value\)). Obliczamy prawdopodobieństwo otrzymania wyniku takiego jak \(X = 33\) lub gorszego (za „gorszy” uznajemy zbyt małą liczbę jedynek), przy założeniu H0. Mówimy, że p-wartość (lub poziom krytyczny testu) jest w naszym przypadku równa \(P = P(X <= 33) = 0.00379\). Następnie, porównujemy obliczoną p-wartość z założonym poziomem istotności.
  • Odrzucamy H0 jeśli \(p-wartość < 0.01\) (przyjęty poziom istotności testu).

Obie reguły są równoważne, to znaczy prowadzą do takiej samej decyzji. Niemniej, obliczanie p-wartości stwarza dodatkowo możliwość „pomiaru stopnia przekonania” o nieprawdziwości H0.

Zwróćmy uwagę, że nasz test „reaguje na odstępstwa od prawdopodobieństwa 1/6 tylko w dół”. Mówimy, że jest to test hipotezy zerowej:

  • H0: prawdopodobieństwo jedynki = 1/6 przeciwko hipotezie alternatywnej,
  • H1: prawdopodobieństwo jedynki < 1/6.

7.2.2 Przykład.

Ania rzuciła monetą 15 razy i 13 razy uzyskała reszkę. Ania zauważyła, że wygląda na to, że moneta jest obciążona i “preferuje” reszki. Przetestuj hipotezę, że moneta jest uczciwa, na poziomie istotności 1%.

(…)

7.2.3 Przykład.

Dotychczas obserwowane w badaniach poparcie dla wejścia do strefy EURO w Polsce wynosiło ok. 60%. W najnowszym badaniu na reprezentatywnej próbie n = 300 osób, na pytanie, czy popierasz wejście Polski do strefy EURO, 200 respondentów udzieliło odpowiedzi twierdzącej. Czy ten wynik stanowi dostateczny dowód na to, że nastąpił wzrost poparcia dla przystąpienia do strefy EURO w populacji Polaków?

Rozwiązanie:

Treść zadania sugeruje sposób rozwiązania polegający na weryfikacji następującego układu hipotez statystycznych:

  1. \(H_0: p = 0.6\) (właściwie \(p \leq 0.6\)),
  2. \(H_1: p > 0.6\).

\(H_0\) - jest to tzw. hipoteza zerowa, którą trzeba poddać weryfikacji. \(H_1\) - jest to pomocnicza hipoteza alternatywna, którą formułujemy tak, aby była sprzeczna z hipotezą zerową. Załóżmy, że \(H_0\) jest prawdziwa, wtedy \(X\sim Bin(300, 0.6)\). Ponadto, ponieważ np i \(n(1-p) > 5\), to stwierdzamy, że \(X \sim N(np, \sqrt{np(1-p)})\), oraz \(\frac{X}{n} \sim N( p = 0.6, \sqrt{\frac{p(1-p)}{n}} = 0.0283 )\).

Zatem, przy założeniu prawdziwości hipotezy zerowej (dlatego przyjmujemy, że p = 0.6) i stosując przybliżenie normalne,

\[P(X \geq 200) = P(\frac{X}{n} \geq 0.6667 = \frac{2}{3}) = P(Z \geq \frac{\frac{2}{3} - 0.6}{0.0283}) =\] \[= P(Z \geq 2.3557) = 1 - P(Z \leq 2.36) = 1 - 0.990863 = 0.009137 = 0.9\%\]

Odpowiedź: Otrzymane prawdopodobieństwo jest bardzo małe, otrzymaliśmy wynik z próby, który jest sprzeczny z założeniem hipotezy zerowej, dlatego tę hipotezę odrzucamy (zwykle przyjmuje się, że odrzucamy hipotezę zerową, gdy otrzymane prawdopodobieństwo jest mniejsze od 0.05 = 5%. Tę ostatnią wartość nazywa się poziomem istotności testu statystycznego). Ostatecznie stwierdzamy, że istnieją podstawy do uznania, że poparcie dla przystąpienia do strefy EURO wzrosło w populacji.

7.2.4 Przykład.

Jeden z kandydatów w wyborach do rady miejskiej (kandydat A) prognozuje, że jego poparcie wyborcze w najbliższych wyborach wyniesie co najmniej 65%. Bezpośrednio przed wyborami, jeden z ośrodków badania opinii publicznej przeprowadził sondaż w próbie reprezentatywnej liczącej 100 respondentów, na którego podstawie oszacowano spodziewane poparcie wyborcze kandydata A. Ustalono, że frakcja poparcia wyborczego \(\hat{p} = 0.55 = 55\%\) (55 respondentów na 100 zadeklarowało poparcie polityka (X = 55). Czy w świetle wyników badań na podstawie próby możemy przyjąć, że przypuszczenie kandydata A jest fałszywe na poziomie istotności = 0.05?

Rozwiązanie: Zadanie polega na weryfikacji następującego układu hipotez statystycznych:

  1. \(H_0\): \(p = 0.65\) lub \(p > 0.65\)
  2. \(H_1\): \(p < 0.65\)

Możemy zadanie rozwiązać na dwa sposoby (Na potrzeby kursu ze statystyki i demografii wystarczy zapoznać się z pierwszą metodą.).

Metoda nr 1:

Aby odpowiedzieć na postawione w zadaniu pytanie musimy obliczyć błąd standardowy wykorzystanego estymatora parametru populacji (w tym przypadku błąd standardowy dla frakcji z próby \(\sigma_{\hat{p}}\)). Błąd standardowy to po prostu odchylenie standardowe danego estymatora w przestrzeni prób o zadanym rozmiarze n. Następnie należy skonstruować tzw. przedział ufności i ustalić, czy pokrywa on hipotetyczną wartość parametru populacji (w przykładzie wartość \(p_0\)). Przedziały ufności mogą mieć różną szerokość, ale zwykle stosuje się tzw. \(95\%\) przedział ufności. Ogólnie, przedział ufności jest to taki przedział liczbowy złożony z wartości zmiennej losowej (w przykładzie z wartości zmiennej \(\hat{p}\)), który z ustalonym prawdopodobieństwem (zwykle z prawdopodobieństwem równym \(95\%\)) pokryje (zawiera) nieznaną wartość parametru populacji (np. wartość frakcji, średniej arytmetycznej i innych parametrów opisowych). W celu zweryfikowania prawdziwości hipotezy zerowej podanej w zadaniu należy sprawdzić, czy przedział ufności zbudowany z wykorzystaniem danych z próby pokrywa wartość hipotetyczną p = 0.65.

Jak skonstruować 95% przedział ufności dla frakcji \(\hat{p}\)?

Wpierw ustalamy błąd standardowy estymatora \(\sigma_{\hat{p}} = \sqrt{ \frac{p(1-p)}{n} }\).

Na podstawie Centralnego Twierdzenia Granicznego (CTG) wiemy, że (jeżeli spełniony jest warunek np i \(n(1-p) > 5\))

\[\hat{p} \approx N(\mu_{\hat{p}} = p, \sigma_{\hat{p}} = \sqrt{ \frac{p(1-p)}{n} })\]

Na podstawie CTG wiemy, że dla dowolnego ciągu zmiennych losowych \(X_1, X_2, ..., X_n\), niezależnych i o jednakowym rozkładzie (taki ciąg zmiennych losowych można utożsamić z n - elementową próbą losową), przy czym \(\mu_{X_i} = \mu\), \(\sigma_{X_i} = \sigma\), mamy wtedy

  • wartość przeciętna średniej z próby \(E(\overline{X}) = \mu_{\overline{X}} = \mu\) i

  • odchylenie standardowe średniej z próby \(\sigma_{\overline{X}} = \frac{\sigma}{\sqrt{n}}\).

Frakcja z próby \(\hat{p} = \frac{\Sigma X_i}{n}\) (dla \(\Sigma X_i = X\sim Bin(n, p)\)), oraz \(\mu_{\hat{p}} = p\) i \(\sigma_{\hat{p}} = \frac{\sigma}{\sqrt{n}} = \frac{ \sqrt{np(1-p)} }{ \sqrt{n} } = \sqrt{ \frac{p(1-p)}{n} }\).

Zauważ, że \(\hat{p} = \overline{X}\) - dla zmiennej \(X\) o rozkładzie dwumianowym średnia arytmetyczna jest tożsama z proporcją \(p\).

Jeżeli spełniony jest warunek np i \(n(1-p) > 5\), to we wzorze na błąd standardowy możemy zastąpić p oszacowaniem \(\hat{p}\).

Następnie trzeba ustalić granice przedziału ufności.

\[P(- z_{\alpha/2} < Z < z_{\alpha/2}) = P(- z_{\alpha/2} < \frac{\hat{p} - \mu_{\hat{p}}}{\sigma_{\hat{p}}} = \frac{\hat{p} - p}{\sqrt{ \frac{p(1-p)}{n} }} < z_{\alpha/2}) = 1 - \alpha\]

Po przekształceniach (wyprowadzamy p z nierówności) otrzymamy:

\[P(\hat{p} - z_{\alpha/2} \sqrt{ \frac{p(1-p)}{n} } < p < \hat{p} + z_{\alpha/2} \sqrt{ \frac{p(1-p)}{n} } ) = 1 - \alpha\]

Dla 95% przedziału ufności współczynnik \(\alpha\) - tzw. poziom istotności - jest równy 0.05, a \(z_{\alpha/2} = 1.96\)

Korzystając z wprowadzonych wzorów wyznaczamy przedział ufności dla proporcji:

\[P( 0.55 - 1.96\sqrt{\frac{0.55(1-0.55)}{100}} < p < 0.55 + 1.96\sqrt{\frac{0.55(1-0.55)}{100}} ) = 0.95\] \[P( 0.55 - 0.0975 < p < 0.55 + 0.0975 ) = 0.95\]

Ostatecznie, przedział ufności dla frakcji p z zadania to \(0.4525, 0.6475\). Ponieważ, ustalony przedział ufności nie pokrywa wartości hipotetycznej 0.65, to odrzucamy hipotezę zerową. Interpretując 95% przedział ufności powiemy, że w 95 przypadkach na 100 pokrywa on nieznaną wartość parametru populacji p.

Metoda nr 2:

W testowaniu hipotez statystycznych wykorzystuje się logikę dowodu przez sprowadzenie do sprzeczności. Tzn. zakładamy prawdziwość pewnej hipotezy zerowej i następnie wykonując odpowiednie badania empiryczne testujemy, czy wyniki są w sprzeczności z przyjętą hipotezą zerową. Jeżeli otrzymany wynik jest wyraźnie sprzeczny z hipotezą zerową, to wówczas mówimy, że odrzucamy hipotezę zerową (w tym przykładzie \(p \geq 0.65\)). Jeżeli sprzeczności nie dostrzeżemy, to mówimy, że nie ma podstaw do odrzucenia hipotezy zerowej.

W zadaniach dotyczących testowania hipotez statystycznych jest istotne ustalenie pewnego kryterium, którym kierować się będziemy podejmując decyzję, czy dany wynik jest, czy nie jest wyraźnie w sprzeczności z testowaną hipotezą. Tym kryterium jest tzw. poziom istotności testu \(\alpha\). Zwykle przyjmujemy, że \(\alpha = 0.05 = 5\%\)

Po sformułowaniu układu hipotez i rozpoznaniu, że zmienna losowa \(\hat{p}\approx N( p, \sqrt{ \frac{p(1-p)}{n} } )\), obliczamy parametry rozkładu (w rzeczywistości nie znamy wartości p, ale ponieważ przyjęliśmy logikę dowodu przez sprowadzenie do sprzeczności, to przyjmujemy p = granicznej wartość przedziału wyznaczonego przez hipotezę zerową, czyli \(p = 0.65\) - założyliśmy, że kandydat ma rację. Otrzymujemy ostatecznie \(N(0.65, 0.0497)\). Znając parametry rozkładu normalnego przy założeniu prawdziwości hipotezy zerowej możemy teraz sprawdzić jak bardzo różni się wartość z próby od wartości 0.65 (Należy pamiętać, że frakcja p jest to jednocześnie wartość przeciętna \((\mu = p)\) w rozkładzie normalnym, a więc znajduje się dokładnie w środku i jest to wartość, dla której gęstość prawdopodobieństwa jest największa). W procedurze testowania hipotez statystycznych przyjmuje się, że sprzeczność między założeniem a wynikiem badania empirycznego jest wystarczająca do odrzucenia hipotezy zerowej wtedy, gdy:

  • \(P(Z \leq z = \frac{\hat{p} - p}{\sqrt{\frac{p(1-p)}{n}}}) < \alpha\)

    • w przypadku testów lewostronnych (\(p < p_0\))
  • \(P(Z \geq z = \frac{\hat{p} - p}{\sqrt{\frac{p(1-p)}{n}}}) < \alpha\)

    • w przypadku testów prawostronnych (\(p > p_0\))
  • \(P(Z \geq z = \frac{\hat{p} - p}{\sqrt{\frac{p(1-p)}{n}}}) + P(Z \leq z = \frac{\hat{p} - p}{\sqrt{\frac{p(1-p)}{n}}}) < \alpha\)

    • w przypadku testów obustronnych (\(p \neq p_0\))

gdzie Z jest zmienną losową standaryzowaną \(\sim N(0, 1)\). W przykładzie po standaryzacji wartości 0.55 otrzymujemy liczbę -2.01.

Sformułowana hipoteza alternatywna wskazuje na test lewostronny i ponieważ \(P(Z < -2.01) = 0.022 < 0.05\), to podejmujemy decyzję o odrzuceniu hipotezy zerowej, a więc stwierdzamy, że wynik badania z próby przeczy (na poziomie istotności 0.05) twierdzeniu kandydata, że jego poparcie wynosi co najmniej 0.65.