Test niezależności χ2

Powrót do bazy wiedzy

Test niezależności χ2


Test niezależności χ2 (chi-kwadrat) jest podstawowym testem, pozwalającym na określenie statystycznej istotności zależności pomiędzy dwiema zmiennymi (zazwyczaj nominalnymi).

Pierwszym krokiem w wyliczeniu statystyki służącej za podstawę procedury testowania hipotezy o niezależności zmiennych jest porównanie dwu rodzajów liczebności, znajdujących się w komórkach tabeli krzyżowej zawierającej zmienne uwzględniane w analizie. Są to liczebności obserwowane (rzeczywista, empiryczna liczba obserwacji), oraz oczekiwane (hipotetyczne liczebności, jakich oczekujemy w komórkach tabeli przy założeniu, że zmienne są niezależne) (por. Górniak, Wachnicki 2004: 172, Nawojczyk 2002: 212).

Różnice między liczebnością obserwowaną a oczekiwaną dla poszczególnych komórek nazywamy resztami (Górniak, Wachnicki 2004: 172). Kolejnym krokiem jest obliczenie tzw. reszt standaryzowanych. Procedura standaryzacji reszt polega na podzieleniu reszty przez pierwiastek liczebności oczekiwanej. Suma podniesionych do kwadratu reszt standaryzowanych nosi nazwę statystyki chi kwadrat (ibidem: 172, 176). 

Przy wyliczonej wartości statystyki chi kwadrat otrzymujemy wartość p, określającą prawdopodobieństwo popełnienia błędu I rodzaju, polegającego na odrzuceniu prawdziwej hipotezy zerowej, mówiącej o braku zależności pomiędzy zmiennymi. Jak zaznaczają Górniak i Wachnicki „im mniejsze jest to prawdopodobieństwo, z tym większą ufnością możemy orzec, że zaobserwowana przez nas zależność jest statystycznie istotna, tzn. występuje w zbiorowości generalnej, z której została dobrana próba (przy założeniu, że próba ma charakter reprezentatywny – przyp. RO). Standardowo przyjmuje się, że zależność jest istotna statystycznie gdy wartość tego prawdopodobieństwa jest mniejsza niż 0,05”. (ibidem: 177). 

Mimo iż test chi kwadrat, podobnie jak inne testy nieparametryczne, pozwala na testowanie hipotez statystycznych w sytuacji, kiedy niespełnione są założenia dotyczące poziomu pomiaru zmiennej i jej rozkładu (por. m.in. Gibbons 1993), istnieją określone wymogi, jakie powinny spełnić dane, aby można było z niego skorzystać. W żadnej komórce tabeli krzyżowej liczebność oczekiwana nie powinna być mniejsza niż 1, a nie więcej 20% liczebności oczekiwanych w tabeli może przyjmować wartość mniejszą niż 5 (por. Nawojczyk 2002: 217). 

Wykorzystując test chi kwadrat należy również pamiętać, że nie pozwala on nam na uzyskanie informacji o sile i kierunku zależności pomiędzy zmiennymi, a jedynie umożliwia stwierdzenie (z określonym ryzykiem), czy zależność pomiędzy dwiema zmiennym jest istotna statystycznie. Do określenia siły związku pomiędzy zmiennymi jakościowymi warto wykorzystać miary siły związku oparte o chi kwadrat, np. V Cramera lub Phi Pearsona.  

Wzór cytowania:

Magierowski M. Test niezależności Chi kwadrat. Dostępny: http://www.researchonline.pl/baza?podkategoria=28, data dostępu: .././../2013. 

Bibliografia

Gibbons J. D. 1993. Nonparametric Statistics. An Introduction. London: Sage Publications.
Górniak J., Wachnicki, J. 2004. Pierwsze kroki w analizie danych. Kraków: SPSS Polska.
Nawojczyk M. 2002. Przewodnik po statystyce dla socjologów. Kraków: Wydawnictwo SPSS.


100 000+

Zrealizowanych ankiet. Dołącz do grona naszych klientów!

Szpital Dziecięcy BIS Goldman Recruitment Klon Jawor Iwentarium ISI Edisonda TTPlast Splendour Idea Rozwoju

Newsletter

Promocje, nowości produktowe i żadnego spamu!