ex. 6.12 (*)
Recolheram-se 75 pupas de Dixella a partir da vegetação emergente de um charco. As diferentes espécies de Dixella não conseguem distinguir-se no estádio de pupa e portanto os dados recolhidos não estão viciados.
À medida que cada adulto emerge as espécies são identificadas e os resultados obtidos foram:
DAu |
DAe |
DAm |
DAt |
|
\(n_i\) |
24 |
32 |
10 |
9 |
Será que se pode considerar que a distribuição de frequência das quatro espécies é homogénea?
☞ sugestões
Nas calculadoras é usual designar-se por teste «Goodness-of-fit» (Teste chi GOF), ou teste de ajustamento do qui-quadrado.
A expressão «distribuição de frequência é homogénea» indica que as quatro classes de pupas vão ter a mesma probabilidade. A notação \((1/4\;:\;1/4\;:\;1/4\;:\;1/4)\) indica as probabilidades iguais.
O teste a efetuar pretende avaliar se há classes, na população, com probabilidade significativamente diferente.
As hipóteses são
H0: \(p_{DAu} = p_{DAe} = p_{DaAm} = p_{DAt} = 1/4\) (a distribuição é homogénea);
H1: a distribuição não é homogénea.
☞ proposta de resolução
As hipóteses são
H0: \(p_{DAu} = p_{DAe} = p_{DaAm} = p_{DAt} = 1/4\) (a distribuição é homogénea);
H1: a distribuição não é homogénea.
A estatística de teste e a distribuição de amostragem são dadas por:
onde k=4 classes e não existindo parâmetros a estimar (ver parâmetros estimados) então p=0. Assim, a distribuição é caracterizada por d.f. = 3 graus de liberdade.
As probabilidades esperadas das classes são, de acordo com o enunciado,
\((1/4 \;:\; 1/4 \;:\; 1/4 \;:\; 1/4)\)
O total de pupas analisadas na amostra é \(n= 75\) (resultado da soma 24 + 32+ 10+9).
As frequências populacionais, em 75 pupas (caso H0 se verifique) são:
\(e_1=n \times 1/4=18.75\)
\(e_2=n \times 1/4=18.75\)
\(e_3=n \times 1/4=18.75\)
\(e_4=n \times 1/4=18.75\)
A tabela mostra as observações por classe e valores esperados das classes:
DAu |
DAe |
DAm |
DAt |
|
\(n_i\) |
24 |
32 |
10 |
9 |
\(e_i\) |
18.75 |
18.75 |
18.75 |
18.75 |
Os valores esperados \(e_i>5\) verificam o pressuposto para o teste de ajustamento do qui-quadrado.
O valor observado da estatística de teste, sob H0, é
Usando a notação «CDF», tem-se:
valor-p = CDF.chisq( lower=19.9866, upper=+infinito, df=3) = 0.0001708313
Conclusão: Assim, rejeita-se H0, a distribuição de frequência das 4 espécies não é homogénea, existindo pelo menos uma diferença significativa no número esperado de uma das espécies.
Para efetuar o teste com calculadora gráfica consulte teste de ajustamento de Pearson.
Para usar as calculadoras, com o teste Goodness-of-fit (GOF), ou teste de ajustamento, introduz-se uma coluna «Lista1» com os valores observados (1ª linha daquela tabela) e os valores esperados na coluna «Lista2» (que estão na 2ª linha da tabela acima).