Kontingenční tabulky |
prev | home | next |
Pracovníci anketní agentury vtrhli do ulic. Vyzpovídali 933 dospělých jedinců a své výsledky shrnuli do tabulky, kterou uveřejnili v denním tisku.
| <40 let | ≥40 let | celkem | |||
| muži | ženy | muži | ženy | ||
| 1 týdně a více | 91 | 162 | 151 | 264 | 668 |
| méně než jednou týdně | 91 | 162 | 151 | 264 | 668 |
| celkem | 91 | 162 | 151 | 264 | 668 |
Takových podobných tabulek s údaji, které mají popisovat lidské chování, můžete vidět hodně a často včetně hodnocení typu: Bylo zjištěno, že hypermarkety navštěvují především ženy a starší ročníky.
Tabulky, kde se uvádějí četnosti dvou znaků (zde četnost návštěvy a věk+pohlaví) se nazývají kontingenční tabulky. Kontingenční tabulka je tedy soubor údajů, četností, empirických hodnot výskytu dvou statistických znaků uspořádaných do dvourozměrné tabulky.
Většinou nás zajímá, jestli uvedené znaky X a Y na sobě nějak závisí nebo ne. Jde-li o kvalitativní znaky (nejdou číselně měřit), používáme pro zjištění, zda závislost existuje či ne, kontingenční tabulky (kontingence=nezávislost) a χ2 test (čti chí-kvadrát) nám to umožňuje. Mluvíme tak často o testu nezávislosti.
Není cílem tohoto textu vykládat teorii kontingenčních tabulek a χ2 testu dobré shody, proto se omezíme na kontingenční tabulky 2 x 2 zvané čtyřpolní.
Sledujeme dva znaky, kde rozlišujeme, zda-li respondent tento znak má nebo nemá.
Nulová hypotéza zní: znaky nejsou na sobě závislé.
Zda nulová hypotéza platí či ne rozsoudíme pomocí statistického testu dobré shody pro čtyřpolní tabulky. K tomu je nutné spočítat hodnotu χ2, která má pro čtyřpolní tabulku pravděpodobnostní rozdělení (viz obr)
s kritickými hodnotami:
na hladině významnosti α = 5 % χ2(0,05) = 3,84
na hladině významnosti α = 1 % χ2(0,01) = 6,63
Vzorec pro výpočet χ2

Poznámka: Ze shromážděných dat zapsaných ve formě seznamů je možné vytvářet kontingenční tabulky relativně snadno pomocí Excelu či jiného tabulkového procesoru; včetně testování.
Příkladem kontingenční tabulky typu 2×2 může být následující smyšlený průzkum zastoupení leváků a praváků mezi ženami a muži.

Protože χ2 = 1,806 < χ2(0,05) = 3,84 potvrzujeme nulovou hypotézu, tj. leváctví na pohlaví nezávisí.
Pozor: χ2-test nelze použít, jestliže
a) více než 20% všech očekávaných četností je menší než 5
b) v jednom políčku kontingenční tabulky je očekávaná četnost menší než 1.