testes em tabelas de contingência

Duas variáveis categóricas podem estar relacionadas. Trivialmente, a ocorrência de sol está associada com o uso de óculos de sol assim como a ocorrência de chuva está associada ao uso de casaco impermeável ou guarda-chuvas. Neste caso, é fácil perceber a existência de relação de causa efeito. Por vezes, ser medida associação estatística não significa causa efeito! Pode existir outro motivo, nomeadamente o aumento da população: quanto mais seres humanos mais vendas de telemóveis e mais alface se come: são variáveis associadas. Porém, comer alface não é causa para que compremos telemóveis.

São abordados os testes seguintes:

  • Teste de independência entre dois fatores.

  • Teste homogeneidade entre dois fatores com foco no teste da comparação entre duas sub populações. O método é semelhante na natureza e procedimentos ao teste de independência.

  • Teste de ajustamento de um fator a uma dada distribuição.

Estes são baseados em tabelas de contingência (ou tabelas de contagens) de valores observados \(O_i\) e usam a seguinte estatística de teste:

\[\sum_i \frac{ (O_i - E_i)^2 }{E_i} \sim_{\text{aprox}} \chi^2_{df}\]

em que i percorre todas as células de uma tabela de contingência, \(E_i\) é o valor esperado sob H0 e df são os graus de liberdade apropriados, quantidades estas que dependem do teste a efetuar.