3.25 Miary pozycyjne - kwartyle, mediana oraz rozstęp międzykwartylowy

Średnia arytmetyczna jest tzw. klasyczną miarą tendencji centralnej. Stosowana jest ona często, ale dla niektórych zmiennych nie można jej wyznaczyć (zmienne mierzone na skalach jakościowych - nominalnej lub porządkowej), a ponadto, czasami jej wartości mogą być mylące (np. gdy liczymy średni dochód mieszkańców danego państwa). W niektórych przypadkach, lepszymi miarami tendencji centralnej są miary pozycyjne takie jak mediana.

Mediana to wartość cechy w szeregu uporządkowanym, powyżej i poniżej której znajduje się jednakowa liczba obserwacji. Mediana jest kwantylem rzędu 1/2, czyli drugim kwartylem. Jeżeli mamy wyznaczyć medianę jakiegoś zbioru liczb, to musimy najpierw wypisać te liczby w kolejności niemalejącej, a następnie wybrać liczbę środkową (w przypadku gdy mamy nieparzystą liczbę liczb w zbiorze). Jeżeli mamy parzystą liczbę elementów w zbiorze, to mediana jest równa średniej arytmetycznej dwóch środkowych liczb. Np., dla ciągu \(1, 2, 4, 6, 8, 9\), mediana wynosi: \(\frac{4+6}{2} = 5\)

Mediana to tzw. drugi kwartyl (\(Q_2\)). Kwartyle dzielą zbiór danych na 4, równe, części w następujący sposób:

Dla ciągu \((3, \textbf{4}, 4, \textbf{5}, 6, \textbf{8}, 8)\), liczba 5 to mediana, pierwsza 4 to pierwszy kwartyl \(Q_1\), a pierwsza 8 to trzeci kwartyl \(Q_3\).

3.25.1 Kwartyle

Wyznaczając kwartyle (\(Q\)), należy obserwacje uporządkować niemalejąco/nierosnąco.

A = {2, 4, 4, 5, 6, 7, 8}

  • \(Q_1 = 4\)
  • \(Q_2 (mediana) = 5\)
  • \(Q_3 = 7\)

A = {1, 3, 3, 4, 5 | 6, 6, 7, 8, 8}

  • \(Q_1 = 3\)
  • \(Q_2 (mediana) = (5+6)/2 = 5.5\)
  • \(Q_3 = 7\)