4 Typy Danych w Naukach Społecznych
W badaniach z obszaru nauk społecznych zrozumienie natury danych jest kluczowe dla wyboru odpowiednich metod analizy i wyciągania prawidłowych wniosków.
4.1 Podstawy Zbiorów Liczbowych
Zrozumienie właściwości zbiorów liczbowych jest kluczowe dla uchwycenia natury różnych typów danych w naukach społecznych.
Podstawowe Zbiory Liczbowe
- Liczby Naturalne (ℕ): Liczby używane do liczenia obiektów {0, 1, 2, 3, …}
- Liczby Całkowite (ℤ): Obejmują liczby naturalne, ich przeciwności i zero {…, -2, -1, 0, 1, 2, …}
- Liczby Wymierne (ℚ): Liczby, które można wyrazić jako ułamek dwóch liczb całkowitych
- Liczby Rzeczywiste (ℝ): Wszystkie liczby na osi liczbowej, w tym wymierne i niewymierne
Właściwości Zbiorów
Zbiory Przeliczalne: Zbiory, których elementy można ustawić w relacji jeden do jednego z liczbami naturalnymi. Na przykład, zbiór liczb całkowitych jest przeliczalny.
Zbiory Nieprzeliczalne: Zbiory, które nie są przeliczalne. Zbiór liczb rzeczywistych jest nieprzeliczalny.
Zbiory Dyskretne: Zbiory, w których każdy element jest oddzielony od innych elementów skończoną przerwą. Liczby całkowite tworzą zbiór dyskretny.
Zbiory Gęste: Zbiory, w których między dowolnymi dwoma elementami zawsze znajduje się inny element zbioru. Liczby wymierne i rzeczywiste są zbiorami gęstymi.
4.2 Dane Dyskretne vs. Ciągłe
W nauce o danych i statystyce często kategoryzujemy zmienne jako dyskretne lub ciągłe. Jednak rozróżnienie to nie zawsze jest jednoznaczne, a niektóre zmienne wykazują cechy obu typów. Ta sekcja bada koncepcje danych dyskretnych i ciągłych, ich różnice oraz interesujące przypadki zmiennych, które można traktować jako oba typy lub które kwestionują nasze intuicyjne rozumienie.
Dane Dyskretne
Dane dyskretne mogą przyjmować tylko określone, przeliczalne wartości. Te wartości często (ale nie zawsze) są liczbami całkowitymi.
Cechy Danych Dyskretnych:
- Przeliczalne
- Często reprezentowane przez liczby całkowite
- Mogą być skończone lub nieskończone
- Brak wartości między dwoma sąsiednimi punktami danych
Przykłady:
- Liczba studentów w klasie
- Liczba samochodów sprzedanych przez dealera
- Rozmiary butów
Dane Ciągłe
Dane ciągłe mogą przyjmować dowolną wartość w danym zakresie, w tym wartości ułamkowe i dziesiętne. Ważne jest, aby zauważyć, że ciągłość nie jest określona wyłącznie przez nieprzeliczalność, ale również przez gęstość.
Cechy Danych Ciągłych:
- Mogą być nieprzeliczalne (jak liczby rzeczywiste) lub gęste (jak liczby wymierne)
- Mogą być mierzone z dowolną precyzją (teoretycznie)
- Reprezentowane przez liczby rzeczywiste lub gęste podzbiory liczb rzeczywistych
- Zawsze istnieją wartości między dowolnymi dwoma punktami danych
Przykłady:
- Wzrost
- Waga
- Temperatura
- Procenty (wyjaśnione dalej poniżej)
Spektrum Dyskretno-Ciągłe
W praktyce niektóre zmienne, które matematycznie są dyskretne, często są traktowane tak, jakby były ciągłe. Ta dwoista natura zapewnia elastyczność w analizie i interpretacji tych zmiennych.
Powody Traktowania Danych Dyskretnych jako Ciągłych:
- Gęsta Granularność
- Gdy zmienna dyskretna ma dużą liczbę możliwych wartości w danym zakresie, może przybliżać ciągłość.
- Przykład: Dochód mierzony w pojedynczych groszach. Choć technicznie dyskretny, duża liczba możliwych wartości sprawia, że zachowuje się podobnie do zmiennej ciągłej.
- Wygoda Analityczna
- Metody ciągłe często dają rozsądne i użyteczne wyniki nawet dla gęstych zmiennych dyskretnych.
- Często łatwiej jest używać istniejących narzędzi statystycznych, jeśli założymy ciągłość, ponieważ pozwala to na stosowanie metod opartych na rachunku różniczkowym.
- Przybliżenie Zjawisk Bazowych
- W niektórych przypadkach dyskretny pomiar może być przybliżeniem bazowego procesu ciągłego.
- Przykład: Chociaż mierzymy czas w dyskretnych jednostkach (sekundy, minuty, godziny), sam czas jest ciągły.
Przykłady Zmiennych o Dwoistej Naturze Dyskretno-Ciągłej:
- Wiek
- Dyskretny: Typowo mierzony w pełnych latach
- Ciągły: Może być uznany za zmienną ciągłą w wielu analizach, szczególnie przy dużych populacjach
- Cena i Dochód
- Dyskretne: Ceny i dochody są w rzeczywistości mierzone w dyskretnych jednostkach (np. grosze lub najmniejsza jednostka waluty)
- Ciągłe: W modelach ekonomicznych i wielu analizach ceny i dochody są traktowane jako zmienne ciągłe ze względu na ich gęstą naturę i wygodę analityczną
- Wyniki Testów
- Dyskretne: Często podawane jako liczby całkowite
- Ciągłe: W analizach statystycznych wyniki testów mogą być traktowane jako ciągłe, szczególnie gdy zakres możliwych wyników jest duży
Przypadek Szczególny: Procenty i Liczby Wymierne
Procenty przedstawiają interesujący przypadek w spektrum dyskretno-ciągłym:
- Natura Wymierna: Procenty są zasadniczo ułamkami (m/100), co czyni je liczbami wymiernymi.
- Gęste, ale Przeliczalne: Zbiór liczb wymiernych jest gęsty (między dowolnymi dwoma wymiernymi jest inny wymierny), ale także przeliczalny.
- Praktyczna Ciągłość: W większości praktycznych zastosowań procenty są traktowane jako ciągłe ze względu na ich gęstą naturę.
- Skończona Precyzja: W rzeczywistości procenty są często podawane z ograniczoną liczbą miejsc po przecinku, tworząc skończony zbiór możliwych wartości.
Zmienne mierzone w procentach, takie jak stopy bezrobocia czy frekwencja wyborcza, kwestionują nasze intuicyjne rozumienie dyskretności i ciągłości:
- Są liczbami wymiernymi (ułamki z mianownikiem 100), które technicznie są przeliczalne.
- Tworzą zbiór gęsty w swoim zakresie (od 0% do 100%), pozwalając na wartości między dowolnymi dwoma procentami.
- W praktyce są często traktowane jako zmienne ciągłe ze względu na ich gęstą naturę i wygodę analityczną.
- Precyzja pomiaru (np. podawanie do jednego lub dwóch miejsc po przecinku) może narzucić dyskretną strukturę na to, co koncepcyjnie jest zbiorem gęstym.
Ta dwoistość pozwala na elastyczne podejścia analityczne, w zależności od konkretnego kontekstu badawczego i wymaganej precyzji.
Implikacje dla Analizy Danych
Zrozumienie zniuansowanej natury zmiennych jako dyskretnych, ciągłych lub gdzieś pomiędzy ma ważne implikacje dla analizy danych:
- Elastyczność w Modelowaniu: Pozwala na wykorzystanie szerszego zakresu technik statystycznych.
- Uproszczone Obliczenia: Traktowanie gęstych danych dyskretnych jako ciągłych może uprościć obliczenia i uczynić niektóre analizy bardziej wykonalnymi.
- Lepsza Interpretowalność: W niektórych przypadkach traktowanie danych dyskretnych jako ciągłych może prowadzić do bardziej intuicyjnych lub użytecznych interpretacji wyników.
- Potencjał Błędu: Ważne jest, aby być świadomym, kiedy przybliżenia są odpowiednie, a kiedy mogą prowadzić do mylących wyników.
- Rozważania Teoretyczne vs. Praktyczne: Choć matematyczna natura danych jest ważna, praktyczne względy w pomiarze i analizie często kierują tym, jak traktujemy zmienne.
Wnioski
Rozróżnienie między danymi dyskretnymi a ciągłymi nie zawsze jest sztywne w naukach społecznych. Wiele zmiennych, w tym te dotyczące pieniędzy, procentów czy gęstych pomiarów, można oglądać przez pryzmat zarówno dyskretny, jak i ciągły. Wybór sposobu traktowania powinien być kierowany naturą danych, celami analizy i potencjalnymi implikacjami tego wyboru. Ta elastyczność, gdy jest używana rozważnie, zapewnia potężne narzędzia dla badaczy nauk społecznych do uzyskiwania wglądu w ich dane.
Kluczowe Rozróżnienie Językowe
W języku polskim mamy precyzyjne rozróżnienie:
- “Liczba” → używamy dla rzeczy policzalnych
- “Ilość” → używamy dla rzeczy niepoliczalnych
To rozróżnienie doskonale odzwierciedla dwa podstawowe typy danych liczbowych:
Dane Dyskretne = “Liczba czegoś”
Używamy słowa “liczba” (tak jak mówimy “liczba studentów”)
Wartości są rozdzielone jak pojedyncze elementy
Przykłady:
- Liczba książek: 0, 1, 2, 3…
- Liczba punktów w teście: 0, 1, 2…
- Liczba mieszkańców: 100, 101, 102…
🤔 Czy poprawne jest powiedzenie “ilość studentów” czy “liczba studentów”? (Poprawna forma pomoże Ci rozpoznać typ danych)
Dane Ciągłe = “Ilość czegoś”
Używamy słowa “ilość” (tak jak mówimy “ilość wody”)
Wartości płynnie przechodzą jedna w drugą
Przykłady:
- Ilość cieczy: 1,5231… litra
- Ilość czasu: 2,3891… godziny
- Ilość energii: 5,7123… kWh
🤔 Czy mówimy “ilość wody” czy “liczba wody”? (Poprawna forma wskazuje na typ danych)
Sposób Rozpoznawania
- Czy użyłbyś słowa “liczba”? → Dane dyskretne
- Czy użyłbyś słowa “ilość”? → Dane ciągłe
✍️ Ćwiczenie: Uzupełnij poprawnym słowem i określ typ danych
- _____ uczniów w klasie (liczba/ilość): typ _____
- _____ deszczu (liczba/ilość): typ _____
- _____ piosenek (liczba/ilość): typ _____
- _____ temperatury (liczba/ilość): typ _____
4.3 Wprowadzenie do Typologii Danych Stevensa
Stanley S. Stevens, amerykański psycholog, wprowadził system klasyfikacji skal pomiarowych w swoim artykule z 1946 roku “On the Theory of Scales of Measurement”. Ten system, znany jako typologia danych Stevensa lub poziomy pomiaru, stał się fundamentalny dla zrozumienia, jak różne typy danych powinny być analizowane i interpretowane.
Stevens zaproponował cztery poziomy pomiaru:
- Nominalny
- Porządkowy
- Interwałowy
- Ilorazowy
Każdy poziom ma specyficzne właściwości i pozwala na różne rodzaje operacji statystycznych i analiz.
Skala Nominalna
Definicja
Skala nominalna jest najbardziej podstawowym poziomem pomiaru. Używa etykiet lub kategorii do klasyfikacji danych bez żadnej wartości ilościowej ani porządku.
Właściwości
- Kategorie są wzajemnie wykluczające się
- Brak inherentnego porządku między kategoriami
- Nie można wykonywać znaczących operacji arytmetycznych
Przykłady
- Narodowość (Polak, Niemiec, …)
- Grupy krwi (A, B, AB, O)
- Kolor oczu (Niebieskie, Brązowe, Zielone, Piwne)
- Zmienne binarne (“Sukces” versus “Niepowodzenie”)
Skala Porządkowa
Definicja
Skala porządkowa kategoryzuje dane w uporządkowane kategorie, ale odstępy między kategoriami niekoniecznie są równe lub znaczące.
Właściwości
- Kategorie mają zdefiniowany porządek
- Różnice między kategoriami nie są kwantyfikowalne
- Operacje arytmetyczne na liczbach nie są znaczące
Przykłady
- Poziomy wykształcenia (Szkoła Średnia, Licencjat, Magister, Doktorat)
- Skale Likerta (Zdecydowanie się nie zgadzam, Nie zgadzam się, Neutralnie, Zgadzam się, Zdecydowanie się zgadzam)
- Status społeczno-ekonomiczny (Niski, Średni, Wysoki)
Skala Interwałowa
Definicja
Skala interwałowa ma uporządkowane kategorie z równymi odstępami między sąsiednimi kategoriami. Jednak brakuje jej prawdziwego punktu zerowego.
Właściwości
- Równe odstępy między sąsiednimi kategoriami
- Brak prawdziwego punktu zerowego (zero jest umowne)
- Stosunki między wartościami nie są znaczące
Przykłady
- Temperatura w stopniach Celsjusza lub Fahrenheita
- Lata kalendarzowe
- Skala pH
- Wysokość nad poziomem morza
Skala Ilorazowa
Definicja
Skala ilorazowa jest najwyższym poziomem pomiaru. Ma wszystkie właściwości skali interwałowej plus prawdziwy punkt zerowy, co sprawia, że stosunki między wartościami są znaczące.
Właściwości
- Wszystkie właściwości skal interwałowych
- Prawdziwy punkt zerowy
- Stosunki między wartościami są znaczące
Przykłady
- Wzrost
- Waga
- Wiek
- Dochód
Znaczenie w Badaniach i Analizie
Zrozumienie typologii danych Stevensa jest kluczowe z kilku powodów:
Wybór odpowiednich testów statystycznych: Poziom pomiaru determinuje, które analizy statystyczne są odpowiednie dla danego zbioru danych.
Interpretacja wyników: Znaczenie wyników statystycznych zależy od poziomu pomiaru zaangażowanych zmiennych.
Projektowanie narzędzi pomiarowych: Przy tworzeniu ankiet lub innych narzędzi pomiarowych badacze muszą wziąć pod uwagę poziom pomiaru, który chcą osiągnąć.
Transformacja danych: Czasami dane mogą być przekształcane z jednego poziomu na drugi, ale musi to być robione ostrożnie, aby uniknąć błędnej interpretacji.
Kontrowersje i Ograniczenia
Chociaż typologia Stevensa jest szeroko stosowana, spotkała się z pewnymi krytykami:
Sztywność: Niektórzy twierdzą, że typologia jest zbyt sztywna i że wiele rzeczywistych pomiarów mieści się pomiędzy tymi kategoriami.
Traktowanie danych porządkowych: Trwa debata na temat tego, kiedy właściwe jest traktowanie danych porządkowych jako interwałowych dla pewnych analiz.
Skalowanie psychologiczne: Niektóre konstrukty psychologiczne (jak inteligencja) są trudne do jednoznacznego skategoryzowania w ramach tego systemu.
Podsumowanie
Typologia danych Stevensa dostarcza fundamentalnych ram dla zrozumienia różnych rodzajów danych i ich właściwości. Rozpoznając poziom pomiaru swoich zmiennych, badacze mogą podejmować świadome decyzje dotyczące gromadzenia danych, analizy i interpretacji. Jednak ważne jest, aby pamiętać, że chociaż ta typologia jest użytecznym przewodnikiem, rzeczywiste dane często wymagają niuansowego podejścia i nie zawsze pasują idealnie do tych kategorii.
pH is considered an interval scale because:
It has ordered categories: Lower pH values indicate higher acidity, while higher values indicate higher alkalinity.
The intervals between adjacent pH values are equal in terms of hydrogen ion concentration:
- Each whole number change in pH represents a tenfold change in hydrogen ion concentration.
- For example, the difference in acidity between pH 4 and pH 5 is the same as the difference between pH 7 and pH 8.
It lacks a true zero point:
- pH 0 does not represent a complete absence of hydrogen ions.
- Negative pH values and values above 14 are possible in extreme conditions.
Ratios are not meaningful:
- A pH of 4 is not “twice as acidic” as a pH of 2.
- The ratio of hydrogen ion concentrations, not pH values, indicates relative acidity.
These characteristics align with the definition of an interval scale, where the differences between values are meaningful and consistent, but ratios are not interpretable.
4.4 Popularne Skale Porządkowe w Badaniach Behawioralnych
Skale Likerta
Skale Likerta są szeroko stosowane w psychologii i naukach społecznych do pomiaru postaw, opinii i percepcji. Nazwane na cześć psychologa Rensisa Likerta, skale te zazwyczaj składają się z serii stwierdzeń lub pytań, które respondenci oceniają na skali, często od “Zdecydowanie się nie zgadzam” do “Zdecydowanie się zgadzam”.
Dlaczego Skale Likerta są Zmiennymi Porządkowymi
Skale Likerta są uważane za zmienne porządkowe z kilku powodów:
Porządek bez równych odstępów: Chociaż odpowiedzi mają wyraźną kolejność (np. “Zdecydowanie się nie zgadzam” < “Nie zgadzam się” < “Neutralnie” < “Zgadzam się” < “Zdecydowanie się zgadzam”), odstępy między tymi kategoriami niekoniecznie są równe.
Subiektywna interpretacja: Różnica między “Zdecydowanie się nie zgadzam” a “Nie zgadzam się” może nie być taka sama jak różnica między “Zgadzam się” a “Zdecydowanie się zgadzam” dla wszystkich respondentów.
Brak prawdziwego punktu zerowego: Skale Likerta zazwyczaj nie mają prawdziwego punktu zerowego, co jest cechą charakterystyczną skal interwałowych lub ilorazowych.
Czym są zmienne ilościowe (numeryczne)?
W typologii Stevensa wyróżniamy cztery skale pomiarowe. Zmienne ilościowe to te, które mierzone są na skalach interwałowych lub ilorazowych:
- Skala interwałowa: Posiada równe odstępy między jednostkami, ale brak naturalnego punktu zerowego
- Skala ilorazowa: Posiada równe odstępy między jednostkami oraz naturalny punkt zerowy
Zmienne ilościowe charakteryzują się następującymi właściwościami:
- Równe interwały: Różnica między 5 a 6 reprezentuje taką samą wielkość jak różnica między 95 a 96
- Spójne jednostki: Każdy przyrost reprezentuje taką samą ilość mierzonej cechy
- Obiektywny pomiar: Mierzą rzeczywiste ilości, a nie tylko względne pozycje
- Dopuszczalne operacje matematyczne: Można wykonywać operacje arytmetyczne
Przykłady zmiennych mierzonych na skali ilorazowej:
- Wzrost: 170 cm jest dokładnie o 10 cm wyższe niż 160 cm, a 170 cm jest dokładnie dwa razy wyższe niż 85 cm
- Waga: Różnica między 50 kg a 60 kg to taka sama ilość wagi jak między 80 kg a 90 kg
- Czas: 4 godziny to dwa razy dłużej niż 2 godziny, a różnica między 3 a 4 godzinami jest taka sama jak między 9 a 10 godzinami
- Temperatura w Kelwinach: 200K jest dwa razy cieplejsza niż 100K (ponieważ 0K to zero absolutne)
Przykład skali interwałowej:
- Temperatura w stopniach Celsjusza: Różnica między 20°C a 30°C jest taka sama jak między 70°C a 80°C, ale 40°C nie jest “dwa razy cieplejsze” niż 20°C (brak naturalnego zera)
- Rok kalendarzowy: Różnica między 2020 a 2021 jest taka sama jak między 1950 a 1951, ale rok 2000 nie jest “dwa razy starszy” niż rok 1000
Dlaczego wyniki IQ są zmienną porządkową, a nie ilościową
Mimo liczbowego zapisu, wyniki IQ są w istocie zmienną porządkową (w typologii Stevensa), a nie zmienną interwałową, ponieważ:
- Brak jednolitej jednostki miary: Nie istnieje naturalna jednostka mierząca “inteligencję”
- Konstrukcja oparta na rangach: Skala powstaje przez uszeregowanie ludzi względem siebie, a następnie przekształcenie tych rang w wyniki liczbowe
- Nierówne interwały: Różnica między IQ 100 a 110 niekoniecznie reprezentuje taką samą różnicę poznawczą jak między 130 a 140
- Brak absolutnego zera: Nie istnieje znaczące pojęcie “zerowej inteligencji”
- Zależność od testu: Różne testy IQ mogą dać różne wyniki dla tej samej osoby
Przykład: Rozważmy trzy osoby z wynikami IQ 85, 100 i 115. Choć moglibyśmy chcieć powiedzieć, że różnica między pierwszą a drugą osobą równa się różnicy między drugą a trzecią, nie jest to faktycznie znaczące—zdolności poznawcze reprezentowane przez te wyniki nie wzrastają w równych krokach, mimo że cyfry sugerują równe odstępy. Wyniki te informują nas głównie o pozycji osoby względem innych, co jest cechą skali porządkowej.
Inny przykład: Osoba z IQ 140 nie jest “dwa razy inteligentniejsza” niż osoba z IQ 70, mimo że stosunek liczb wynosi 2:1. Takie porównanie nie ma sensu na skali porządkowej.
Punkty egzaminacyjne - pomiędzy skalą porządkową a interwałową
Choć traktujemy punkty egzaminacyjne jak zmienne ilościowe (interwałowe), często mają one cechy zmiennych porządkowych:
- Nierówna trudność pytań: Pytanie za 10 punktów z fizyki kwantowej nie mierzy tej samej ilości wiedzy co pytanie za 10 punktów z podstawowej arytmetyki
- Różne rodzaje kompetencji: Różne pytania testują różne umiejętności (zapamiętywanie, rozumienie, zastosowanie, analiza)
- Subiektywne przydzielanie punktów: Punktacja zależy od oceny egzaminatora, a nie obiektywnych jednostek miary
- Brak addytywności: Student zdobywający 90 punktów niekoniecznie jest “dwa razy bardziej wykształcony” niż student zdobywający 45 punktów
Przykład: Wyobraźmy sobie dwóch studentów:
- Student A: Odpowiada prawidłowo na wszystkie łatwe i średnie pytania (zdobywa 75 punktów)
- Student B: Odpowiada prawidłowo na wszystkie trudne pytania, ale żadne łatwe (zdobywa 75 punktów)
Mimo równej punktacji, ich wiedza jest jakościowo różna. Punkty sugerują równość, ale w rzeczywistości są to różne profile kompetencji — typowy problem ze zmiennymi, które nie są w pełni ilościowe.
Traktowanie zmiennych porządkowych jako ilościowych w praktyce
Ze względów praktycznych często traktujemy zmienne porządkowe jak zmienne ilościowe, ponieważ:
- Umożliwia to stosowanie znanych operacji matematycznych (średnie, odchylenia)
- Upraszcza komunikację i interpretację wyników (“średni wynik 78%”)
- Pozwala na stosowanie bardziej zaawansowanych metod statystycznych
Przykład: Średnia ocen
- Obliczamy średnią, przypisując wartości liczbowe ocenom (5, 4, 3, 2, 1)
- Traktujemy te wartości jak zmienne ilościowe, obliczając np. średnią 4,5
- Ale czy różnica między oceną 5 a 4 (5-4=1) reprezentuje taką samą różnicę wiedzy jak między oceną 2 a 1 (2-1=1)?
- I czy średnia 5.0 jest naprawdę “dwa razy lepsza” niż średnia 2.5?
Inny przykład: Skale Likerta
- W ankietach często stosujemy skale typu: 1 = “zdecydowanie nie zgadzam się”, 5 = “zdecydowanie zgadzam się”
- Obliczamy średnie odpowiedzi, zakładając równe odstępy między kategoriami
- Ale czy odległość między “zdecydowanie nie zgadzam się” a “raczej nie zgadzam się” jest naprawdę taka sama jak między “raczej zgadzam się” a “zdecydowanie zgadzam się”?
Znaczenie rozróżnienia skal pomiarowych
Rozumienie typologii skal pomiarowych Stevensa ma istotne konsekwencje praktyczne:
- Zmienne jakościowe porządkowe: Pozwalają na stwierdzenie, że coś jest “większe/lepsze” lub “mniejsze/gorsze”, ale nie określają “o ile” (dopuszczalne porównania typu >, <, =)
- Zmienne ilościowe: Pozwalają na określenie dokładnych różnic i proporcji (dopuszczalne operacje +, -, ×, ÷)
Świadomość ograniczeń skali pomiarowej pomaga w poprawnej interpretacji danych i doborze odpowiednich metod analizy.
Przykład: Jeśli Anna uzyskała 75 punktów na teście z historii i 85 punktów na teście z matematyki, nie możemy jednoznacznie stwierdzić, że jest “lepsza z matematyki o 10 jednostek umiejętności”. Punkty z różnych testów nie są bezpośrednio porównywalne, a interwały mogą nie być równoważne.
Poprawniejsze podejście: Lepiej porównać jej wyniki z rozkładem wyników innych uczniów. Jeśli w historii 75 punktów plasuje ją w 50. percentylu, a 85 punktów z matematyki w 90. percentylu, to możemy powiedzieć, że względnie rzecz biorąc, radzi sobie lepiej z matematyką niż historią - co jest wnioskiem opartym na skali porządkowej.
Podsumowanie
Chociaż skale Likerta i wiele miar psychologicznych jest często traktowanych jako dane interwałowe ze względów praktycznych, ważne jest, aby pamiętać o ich porządkowym charakterze.
Skala interwałowa to taka, w której odległości między wartościami są znaczące, ale punkt zerowy jest umowny. W przypadku skal interwałowych (np. temperatury):
- Dozwolone jest dodawanie/odejmowanie wartości oraz mnożenie/dzielenie przez stałe.
- Niedozwolone jest mnożenie/dzielenie wartości ze skali przez siebie, ponieważ prowadzi to do wyników bez interpretacji fizycznej.
Własności Skali Interwałowej
- Równe interwały reprezentują takie same różnice:
- Różnica między 20°C a 25°C (5°C) reprezentuje taką samą zmianę jak między 30°C a 35°C.
- Proporcje różnic są zachowane: 10°C to dwa razy większa zmiana niż 5°C.
- Punkt zero jest umowny:
- 0°C to punkt zamarzania wody, a nie brak temperatury.
- Ten sam stan fizyczny ma różne wartości w różnych skalach: 0°C = 32°F.
- Transformacja liniowa:
- Wzór ogólny: y = ax + b, gdzie a \neq 0.
- Dla temperatury: F = C \times \frac{9}{5} + 32.
Dlaczego Średnia Arytmetyczna Działa
Średnia arytmetyczna działa, ponieważ opiera się na dodawaniu i dzieleniu przez stałą, które są dozwolone w skali interwałowej. Przykład:
Dane: 20°C i 30°C
Metoda 1: Średnia w Celsjuszach, potem konwersja1. Średnia: (20°C + 30°C) ÷ 2 = 25°C
2. Konwersja: 25°C × (9/5) + 32 = 77°F
Metoda 2: Konwersja na °F, potem średnia1. Konwersja: 20°C → 68°F, 30°C → 86°F
2. Średnia: (68°F + 86°F) ÷ 2 = 77°F
Obie metody dają ten sam wynik! ✓
Matematyczny dowód poprawności: \begin{align} \bar{F} &= \frac{F_1 + F_2}{2} \\ &= \frac{(C_1 \times \frac{9}{5} + 32) + (C_2 \times \frac{9}{5} + 32)}{2} \\ &= \frac{(C_1 + C_2) \times \frac{9}{5} + 64}{2} \\ &= \left(\frac{C_1 + C_2}{2}\right) \times \frac{9}{5} + 32 \\ &= \bar{C} \times \frac{9}{5} + 32 \end{align}
Dlaczego Wariancja Jest Problematyczna
Wariancja jest problematyczna, ponieważ opiera się na kwadratach różnic, co prowadzi do jednostek kwadratowych (np. °C²) bez jasnej interpretacji fizycznej. Przykład:
Te same temperatury: 20°C i 30°C
Metoda 1: Wariancja w Celsjuszach1. Średnia: 25°C
2. Odchylenia: (20 - 25)°C = -5°C, (30 - 25)°C = 5°C
3. Kwadraty odchyleń: (-5°C)² = 25(°C)², (5°C)² = 25(°C)²
4. Średnia: (25 + 25)(°C)² ÷ 2 = 25(°C)²
Metoda 2: Wariancja w Fahrenheitach1. Konwersja: 20°C → 68°F, 30°C → 86°F
2. Średnia: 77°F
3. Odchylenia: (68 - 77)°F = -9°F, (86 - 77)°F = 9°F
4. Kwadraty odchyleń: (-9°F)² = 81(°F)², (9°F)² = 81(°F)²
5. Średnia: (81 + 81)(°F)² ÷ 2 = 81(°F)²
Problem: 25(°C)² i 81(°F)² nie są równoważne!
Matematyczna analiza problemu: \begin{align} (F_i - \bar{F})^2 &= [(C_i \times \frac{9}{5} + 32) - (\bar{C} \times \frac{9}{5} + 32)]^2 \\ &= [(C_i - \bar{C}) \times \frac{9}{5}]^2 \\ &= (C_i - \bar{C})^2 \times \left(\frac{9}{5}\right)^2 \end{align}
Wnioski Teoretyczne
- Operacje dozwolone:
- Dodawanie/odejmowanie (zachowuje różnice).
- Mnożenie/dzielenie przez stałe (skalowanie).
- Średnie arytmetyczne.
- Porównywanie różnic temperatur.
- Operacje niedozwolone:
- Mnożenie temperatur przez siebie.
- Dzielenie temperatur przez siebie.
- Średnie geometryczne.
- Współczynnik zmienności.
- Implikacje praktyczne:
- Wariancja i odchylenie standardowe wymagają ostrożnej interpretacji.
- Lepiej używać miar opartych na różnicach (np. MAD - średnie odchylenie bezwzględne).
- Przy porównywaniu zmienności warto standaryzować dane.
Zasada Praktyczna
Jeśli w obliczeniach pojawia się mnożenie wartości ze skali interwałowej przez siebie, należy zachować szczególną ostrożność w interpretacji wyników!
Dwa Rodzaje Proporcji
Proporcje wartości (NIE zachowują się w skali interwałowej):
Weźmy 80°C i 20°C:
W Celsjuszach: 80°C/20°C = 4
W Fahrenheitach: 176°F/68°F ≈ 2.59
W Kelwinach: 353.15K/293.15K ≈ 1.20
Te same temperatury dają różne proporcje! → Proporcje wartości NIE mają sensu na skalach interwałowych; sens mają tylko na skali ilorazowej.
Proporcje różnic (zachowują się w skali interwałowej):
Weźmy dwie pary różnic:
Para 1: 30°C - 20°C = 10°C
Para 2: 80°C - 60°C = 20°C
Proporcja różnic w Celsjuszach:
20°C/10°C = 2
Te same temperatury w Fahrenheitach:
Para 1: 86°F - 68°F = 18°F
Para 2: 176°F - 140°F = 36°F
Proporcja różnic w Fahrenheitach:
36°F/18°F = 2
Proporcja różnic jest taka sama! ✓
Matematyczne Wyjaśnienie
Dla transformacji F = \frac{9}{5}C + 32:
Proporcje wartości NIE zachowują się: [ = ]
Proporcje różnic zachowują się: [ = = ]
Dlaczego To Jest Ważne?
- Dla wartości:
- W skali Celsjusza: 40°C nie jest “dwa razy cieplejsze” niż 20°C.
- W skali Fahrenheita: 100°F nie jest “dwa razy cieplejsze” niż 50°F.
- Tylko w Kelwinach proporcje wartości mają sens fizyczny.
- Dla różnic:
- Wzrost o 20°C jest zawsze dwa razy większy niż wzrost o 10°C.
- Wzrost o 36°F jest zawsze dwa razy większy niż wzrost o 18°F.
- Proporcje różnic są niezależne od skali.
Implikacje dla Statystyk
- Operacje bazujące na różnicach (DZIAŁAJĄ):
- Średnia arytmetyczna.
- Odchylenie bezwzględne.
- Rozstęp.
- Operacje bazujące na proporcjach wartości (NIE DZIAŁAJĄ):
- Średnia geometryczna.
- Współczynnik zmienności.
- Wariancja (bo używa kwadratu wartości).
4.5 Appendix A: Miary Statystyczne dla Różnych Typów Zmiennych
Typ zmiennej | Tendencja centralna | Miary rozproszenia | Wzory | Odpowiednie testy | Wizualizacja |
---|---|---|---|---|---|
Nominalna | Dominanta (moda) | Wskaźnik zróżnicowania | VR = 1 - \frac{f_m}{n} gdzie f_m to częstość modalnej, n to liczba obserwacji | Chi-kwadrat, testy dokładne Fishera | Wykresy słupkowe, kołowe |
Indeks różnorodności (Simpsona) | D = 1 - \sum_{i=1}^{k} p_i^2 gdzie p_i to proporcja i-tej kategorii | Test zgodności, testy niezależności | Mozaikowe wykresy | ||
Entropia Shannona | H = -\sum_{i=1}^{k} p_i \log_2(p_i) gdzie p_i to proporcja i-tej kategorii | Testy oparte na entropii | Wykresy entropii, dendrogram | ||
Porządkowa | Mediana | Rozstęp | R = \max(X) - \min(X) | Mann-Whitney, Kruskal-Wallis | Wykresy skumulowane, wykresy rozbieżne |
Rozstęp międzykwartylowy (IQR) | IQR = Q_3 - Q_1 gdzie Q_1 i Q_3 to pierwszy i trzeci kwartyl | Testy rangowe, testy mediany | Wykresy pudełkowe | ||
Odchylenie ćwiartkowe | Q_D = \frac{Q_3 - Q_1}{2} | Test Jonckheere-Terpstra | Wykresy porządkowe, skumulowane histogramy | ||
Interwałowa/ Ilorazowa | Średnia arytmetyczna | Wariancja | \sigma^2 = \frac{1}{n}\sum_{i=1}^{n}(x_i - \mu)^2 gdzie \mu to średnia | Testy t, ANOVA, regresja | Histogramy, wykresy rozrzutu |
Odchylenie standardowe | \sigma = \sqrt{\sigma^2} | F-test, test Levene’a | Wykresy pudełkowe | ||
Współczynnik zmienności | CV = \frac{\sigma}{\mu} \times 100\% | Testy równości wariancji | Wykresy QQ, wykresy przedziałowe |
Measure (EN) | Miara (PL) | Nominal | Ordinal | Interval | Ratio |
---|---|---|---|---|---|
Central Tendency / Tendencja centralna: | |||||
Mode | Dominanta | ✓ | ✓ | ✓ | ✓ |
Median | Mediana | - | ✓ | ✓ | ✓ |
Arithmetic Mean | Średnia arytmetyczna | - | - | ✓ | ✓ |
Geometric Mean | Średnia geometryczna | - | - | - | ✓ |
Harmonic Mean | Średnia harmoniczna | - | - | - | ✓ |
Dispersion / Rozproszenie: | |||||
Range | Rozstęp | - | ✓ | ✓ | ✓ |
Interquartile Range | Rozstęp międzykwartylowy | - | ✓ | ✓ | ✓ |
Mean Absolute Deviation | Średnie odchylenie bezwzględne | - | - | ✓ | ✓ |
Variance | Wariancja | - | - | ✓* | ✓ |
Standard Deviation | Odchylenie standardowe | - | - | ✓* | ✓ |
Coefficient of Variation | Współczynnik zmienności | - | - | - | ✓ |
Association / Współzależność: | |||||
Chi-square | Chi-kwadrat | ✓ | ✓ | ✓ | ✓ |
Spearman Correlation | Korelacja Spearmana | - | ✓ | ✓ | ✓ |
Kendall’s Tau | Tau Kendalla | - | ✓ | ✓ | ✓ |
Pearson Correlation | Korelacja Pearsona | - | - | ✓* | ✓ |
Covariance | Kowariancja | - | - | ✓* | ✓ |
* Theoretically problematic but commonly used in practice / Teoretycznie problematyczne, ale powszechnie stosowane w praktyce
Notes / Uwagi:
- Measurement Scales / Skale pomiarowe:
- Nominal: Categories without order / Kategorie bez uporządkowania
- Ordinal: Ordered categories / Kategorie uporządkowane
- Interval: Equal intervals, arbitrary zero / Równe interwały, umowne zero
- Ratio: Equal intervals, absolute zero / Równe interwały, absolutne zero
- Practical Considerations / Aspekty praktyczne:
- Some measures marked with ✓* are commonly used for interval data despite theoretical issues / Niektóre miary oznaczone ✓* są powszechnie stosowane dla danych przedziałowych pomimo problemów teoretycznych
- Choice of measure should consider both theoretical appropriateness and practical utility / Wybór miary powinien uwzględniać zarówno poprawność teoretyczną jak i użyteczność praktyczną
- More restrictive scales (ratio) allow all measures from less restrictive scales / Bardziej restrykcyjne skale (ilorazowe) pozwalają na wszystkie miary z mniej restrykcyjnych skal