2.3 Podstawowe pojęcia

  1. Dane odnoszą się do zbioru wartości, które są zwykle uporządkowane według zmiennych i jednostek obserwowanych (członków próby/populacji). Przykładem danych jest macierz danych w programie do obsługi arkuszy kalkulacyjnych, takim jak Arkusze Google. Zbiór obserwacji co najmniej jednej zmiennej.
  2. Zmienna: cecha, której wartość może zmieniać się w zależności od obserwacji.
  3. Kiedy chcemy mówić o wpływie czynnika na cechę będącą przedmiotem zainteresowania, identyfikujemy ten czynnik (zmienną) jako zmienną niezależną (często nazywaną predyktorem lub zmienną objaśniającą), a zmienną zależną (często nazywana zmienną odpowiedź).
  4. Populacja: Cały zbiór osób lub obiektów, o których potrzebne są informacje, nazywany jest populacją będącą przedmiotem zainteresowania.
  5. Próbka: Próba to podzbiór populacji wybrany do badania.
  6. Parametr to wartość, zwykle wartość liczbowa, opisująca populację. Parametr jest zwykle wyprowadzany z pomiarów osobników w populacji.
  7. Statystyka to wartość, zwykle wartość liczbowa, opisująca próbkę. Statystyka jest zwykle wyprowadzana z pomiarów osobników w próbce.

Większość badań statystycznych prowadzi się na wybranych z populacji próbach. Nie wolno utożsamiać wielkości np. średniego dochodu netto per capita, która policzona została na podstawie próby, z jej prawdziwą, ale nieznaną, wartością w populacji. Wartość z próby jest jedynie oszacowaniem, estymacją, prawdziwej wielkości dochodu przeciętnego. Mierniki stosowane do oszacowania np. wartości średniej zmiennej \(x\) i obliczane na podstawie danych z próby nazywamy estymatorami nieznanych wartości parametrów populacji.