Kontingenční tabulky

prev home next

Pracovníci anketní agentury vtrhli do ulic. Vyzpovídali 933 dospělých jedinců a své výsledky shrnuli do tabulky, kterou uveřejnili v denním tisku.

Jak často navštěvujete hypermarkety?
<40 let ≥40 let celkem
muži ženy muži ženy
1 týdně a více 91 162 151 264 668
méně než jednou týdně 91 162 151 264 668
celkem 91 162 151 264 668

Takových podobných tabulek s údaji, které mají popisovat lidské chování, můžete vidět hodně a často včetně hodnocení typu: Bylo zjištěno, že hypermarkety navštěvují především ženy a starší ročníky.

obr 47 Tabulky, kde se uvádějí četnosti dvou znaků (zde četnost návštěvy a věk+pohlaví) se nazývají kontingenční tabulky. Kontingenční tabulka je tedy soubor údajů, četností, empirických hodnot výskytu dvou statistických znaků uspořádaných do dvourozměrné tabulky.

Většinou nás zajímá, jestli uvedené znaky X a Y na sobě nějak závisí nebo ne. Jde-li o kvalitativní znaky (nejdou číselně měřit), používáme pro zjištění, zda závislost existuje či ne, kontingenční tabulky (kontingence=nezávislost) a χ2 test (čti chí-kvadrát) nám to umožňuje. Mluvíme tak často o testu nezávislosti.


Není cílem tohoto textu vykládat teorii kontingenčních tabulek a χ2 testu dobré shody, proto se omezíme na kontingenční tabulky 2 x 2 zvané čtyřpolní.

obr 48 Sledujeme dva znaky, kde rozlišujeme, zda-li respondent tento znak má nebo nemá.
Nulová hypotéza zní: znaky nejsou na sobě závislé.
Zda nulová hypotéza platí či ne rozsoudíme pomocí statistického testu dobré shody pro čtyřpolní tabulky. K tomu je nutné spočítat hodnotu χ2, která má pro čtyřpolní tabulku pravděpodobnostní rozdělení (viz obr) s kritickými hodnotami:

obr 49
na hladině významnosti   α = 5 %     χ2(0,05) = 3,84
na hladině významnosti   α = 1 %      χ2(0,01) = 6,63
Vzorec pro výpočet χ2

chi2

Poznámka: Ze shromážděných dat zapsaných ve formě seznamů je možné vytvářet kontingenční tabulky relativně snadno pomocí Excelu či jiného tabulkového procesoru; včetně testování.


Příkladem kontingenční tabulky typu 2×2 může být následující smyšlený průzkum zastoupení leváků a praváků mezi ženami a muži.

tab0

Protože χ2 = 1,806 < χ2(0,05) = 3,84 potvrzujeme nulovou hypotézu, tj. leváctví na pohlaví nezávisí.


Pozor: χ2-test nelze použít, jestliže
     a)   více než 20% všech očekávaných četností je menší než 5
     b)   v jednom políčku kontingenční tabulky je očekávaná četnost menší než 1.



top