ex. 6.12 (*)

Recolheram-se 75 pupas de Dixella a partir da vegetação emergente de um charco. As diferentes espécies de Dixella não conseguem distinguir-se no estádio de pupa e portanto os dados recolhidos não estão viciados.

À medida que cada adulto emerge as espécies são identificadas e os resultados obtidos foram:

DAu

DAe

DAm

DAt

\(n_i\)

24

32

10

9


Será que se pode considerar que a distribuição de frequência das quatro espécies é homogénea?

sugestões

Nas calculadoras é usual designar-se por teste «Goodness-of-fit» (Teste chi GOF), ou teste de ajustamento do qui-quadrado.

A expressão «distribuição de frequência é homogénea» indica que as quatro classes de pupas vão ter a mesma probabilidade. A notação \((1/4\;:\;1/4\;:\;1/4\;:\;1/4)\) indica as probabilidades iguais.

O teste a efetuar pretende avaliar se há classes, na população, com probabilidade significativamente diferente.

As hipóteses são

  • H0: \(p_{DAu} = p_{DAe} = p_{DaAm} = p_{DAt} = 1/4\) (a distribuição é homogénea);

  • H1: a distribuição não é homogénea.

proposta de resolução

As hipóteses são

  • H0: \(p_{DAu} = p_{DAe} = p_{DaAm} = p_{DAt} = 1/4\) (a distribuição é homogénea);

  • H1: a distribuição não é homogénea.

A estatística de teste e a distribuição de amostragem são dadas por:

\[\chi^2 = \sum_{i=1}^k \frac{n_i - n p_i)^2}{n p_i} \sim_{aprox} \chi^2_{k - p- 1}\]

onde k=4 classes e não existindo parâmetros a estimar (ver parâmetros estimados) então p=0. Assim, a distribuição é caracterizada por d.f. = 3 graus de liberdade.

As probabilidades esperadas das classes são, de acordo com o enunciado,

  • \((1/4 \;:\; 1/4 \;:\; 1/4 \;:\; 1/4)\)

O total de pupas analisadas na amostra é \(n= 75\) (resultado da soma 24 + 32+ 10+9).

As frequências populacionais, em 75 pupas (caso H0 se verifique) são:

  • \(e_1=n \times 1/4=18.75\)

  • \(e_2=n \times 1/4=18.75\)

  • \(e_3=n \times 1/4=18.75\)

  • \(e_4=n \times 1/4=18.75\)

A tabela mostra as observações por classe e valores esperados das classes:

DAu

DAe

DAm

DAt

\(n_i\)

24

32

10

9

\(e_i\)

18.75

18.75

18.75

18.75

Os valores esperados \(e_i>5\) verificam o pressuposto para o teste de ajustamento do qui-quadrado.

O valor observado da estatística de teste, sob H0, é

\[\begin{split}\begin{eqnarray*} \chi^2_{obs} & = & (24-18.75)^2/18.75 + (32-18.75)^2/18.75 + \\ & & + (10-18.75)^2/18.75 + (9-18.75)^2/18.75 \\ & = & 19.9866 \end{eqnarray*}\end{split}\]

Usando a notação «CDF», tem-se:

  • valor-p = CDF.chisq( lower=19.9866, upper=+infinito, df=3) = 0.0001708313

Conclusão: Assim, rejeita-se H0, a distribuição de frequência das 4 espécies não é homogénea, existindo pelo menos uma diferença significativa no número esperado de uma das espécies.

Para efetuar o teste com calculadora gráfica consulte teste de ajustamento de Pearson.

Para usar as calculadoras, com o teste Goodness-of-fit (GOF), ou teste de ajustamento, introduz-se uma coluna «Lista1» com os valores observados (1ª linha daquela tabela) e os valores esperados na coluna «Lista2» (que estão na 2ª linha da tabela acima).