3.27 Miary pozycji względnej

3.27.1 Percentyl i pozycja/ranga percentylowa (centylowa)

System percentyli jest szeroko stosowany do pokazania, jak dana osoba radziła sobie w stosunku do grupy odniesienia. Opiera się na skumulowanym rozkładzie procentowym. Percentyl to punkt na skali pomiaru, poniżej którego znajduje się określony procent obserwacji w rozkładzie. Powszechnie nazywany jest percentylem. Jeśli na przykład 50% studentów na kierunku historia ma wyniki niższe niż 81, 50. percentyl to 81. Ranga percentylowa to odsetek przypadków, które wypadają poniżej danego punktu na skali pomiaru. W naszym przykładzie ranga percentylowa wyniku 81 wynosi 50.

Nie myl centyli z rangami centylowymi: rangi percentylowe mogą przyjmować wartości tylko z zakresu od 0 do 100, podczas gdy percentyl (punkt) może mieć dowolną wartość, jaką mogą mieć wyniki. Na przykład możliwe jest, że wartość percentyla wynosi 143. Załóżmy, że Maria uzyskała wynik 143 na teście wstępnym do college’u, a 75% kandydatów uzyskało wynik niższy. 75. percentyl to 143; Ranga percentylowa Mary wynosi 75. Standaryzowane testy, takie jak SAT (Scholastic Aptitude Test) i GRE (Graduate Record Exam), publikują swoje wyniki w postaci percentyli lub rang percentylowych.

3.27.2 Wynik standardowy (z-score, standaryzacja zmiennych)

W statystyce wynik standardowy to liczba odchyleń standardowych, o które zaobserwowany punkt danych różni się od średniej wartości tego, co jest obserwowane lub mierzone. Surowe wyniki powyżej średniej mają pozytywne wyniki standardowe, podczas gdy te poniżej średniej mają ujemne wyniki standardowe.

Oblicza się ją, odejmując średnią populacji od indywidualnego surowego wyniku, a następnie dzieląc różnicę przez odchylenie standardowe populacji. Ten proces zamiany wyniku surowego na wynik standardowy nazywa się standaryzacją lub normalizacją. Jednak „normalizowanie" może odnosić się do wielu typów przekształceń; na przykład unitaryzacja służy do sprowadzenia wszystkich wartości do zakresu [0,1]. Można to uogólnić, aby ograniczyć zakres wartości w zbiorze danych między dowolnymi punktami a i b.

3.27.2.1 Z-score jako miara względnej pozycji

Z-score dla obserwacji to liczba odchyleń standardowych, o jaką różni się ona od średniej. Dodatni wynik z wskazuje, że obserwacja jest powyżej średniej. Ujemny wynik z wskazuje, że obserwacja jest poniżej średniej. Z-score jest obliczany jako:

\[\text{z-score}_X = \frac{x_i - \mu_X}{\sigma_X} = \frac{\text{value} - \text{mean}}{\text{standard deviation}}\]

Reguła empiryczna mówi nam, że dla rozkładu w kształcie dzwonu niezwykłe jest, aby obserwacja różniła się o więcej niż 3 odchylenia standardowe od średniej. Obserwacja w rozkładzie dzwonowym jest uważana za potencjalną wartość odstającą (wartość nietypową), jeśli spada o więcej niż 3 odchylenia standardowe od średniej.

Z-score pozwala nam szybko powiedzieć, jak zaskakująca lub ekstremalna jest obserwacja. Z-score konwertuje obserwację (niezależnie od jednostki miary obserwacji) na wspólną skalę pomiaru, która umożliwia porównania (jednostką tej nowej skali staje się odchylenie standardowe).

Ponadto, z-score może być wykorzystany do konstrukcji testów statystycznych (testowanie hipotez).

Standaryzacja zmiennej. Źródło:…