ex. 2.31 (*)

Recolheu-se uma amostra aleatória de 60 vacas e, na pança de cada uma, contou-se o número de diferentes micro-organismos.

Calcule a probabilidade (aproximada) da média do número de micro-organismos (distintos) ser superior a 40, assumindo que o número esperado para o número de micro-organismos (distintos), por cada pança, é de 35 com desvio padrão de 10.

Siga as várias etapas.

(a) Perante o enunciado, defina uma v.a. X apropriada. Qual a distribuição de X?

sugestões

Estes parâmetros caracterizam a população, isto é, um modelo matemático, não sendo por isso a média e o desvio padrão de uma amostra.

proposta de resolução

  • X = «número de diferentes micro-organismos na pança de uma vaca»

  • \(X \sim \text{generica}\) com média populacional \(\mu=35\) e \(\sigma=10\).

Nota: X é do tipo «número de ocorrências por unidade de tempo» e a distribuição sugerida poderia ser Poisson. Porém, o enunciado é omisso; não indica qual a distribuição e assim considera-se genérica.


(b) Especifique a expressão para a \(\bar X\) neste caso concreto. Quantas v.a. estão a ser somadas? Qual a dimensão da amostra?

sugestões

proposta de resolução

  • a dimensão da amostra é o número de elementos desta que são as 60 panças (ainda aleatórias) em análise.

  • \(\bar X = \frac{1}{60}(X_1 + X_2 + \cdots + X_{60})\)

  • Assumimos que as v.a. são independentes e identicamente distribuídas.


(c) Qual a distribuição, aproximada, de \(\bar X\)? Justifique.

sugestões

  • Uma vez perante uma distribuição genérica, aplicamos o teorema do limite central para o caso da média.

  • Qual a dimensão da amostra e qual a relação com o TLC ?

proposta de resolução

Uma vez que a amostra aleatória tem n=60 elementos então podemos usar o TLC garantindo que a aproximação será razoável (para situações usuais).

Assim:

\[\bar X \sim_{aprox} N\left( \mu_{\bar X} = 35,\; \sigma^2_{\bar X} = \frac{\sigma^2_X}{n} = \frac{10^2}{60} \right)\]

Notas:

  1. \(\sigma^2_{\bar X}\) é a variância da v.a. que é a média amostral aleatória.

  2. \(\mu_{\bar X}\) é a média de \(\bar X\).


(d) Use notação matemática para escrever «probabilidade da média do número de micro-organismos (distintos) ser superior a 40».

proposta de resolução

Sendo uma contagem usa-se rigorosamente \(>\):

\[P( \bar X > 40)\]

Nota: não podemos calcular o valor exato por não conhecermos a distribuição de X e, por conseguinte, a distribuição exata para \(\bar X\).

A próxima alínea introduz o importante teorema do limite central que oferece uma solução aproximada.


(e) Calcule a probabilidade pedida recorrendo à correção à continuidade.

sugestões

Apesar da distribuição ter sido obtida na alínea (c), deve agora passar-se à distribuição da soma por ser mais fácil ajustar a correção à continuidade.

Consulte os documentos:

Se não recorda o básico comece aqui: teorema do limite central.

proposta de resolução

Em geral, devemos usar a aproximação à correção à continuidade da média

\[P( \bar X > 40 ) \approx P( \bar X \ge 40 + \frac{0.5}{60} ) \approx \text{normalcdf}\left(40 + \frac{0.5}{60},\; +\infty,\; 35,\; \sqrt{ \frac{10^2}{60} } \right) \approx 5.234897e-05 \approx 0.0\]

Arredondar a 0.0 é válido em problemas comuns.

alternativa

Se for mais intuitovo, sugere-se passar da média \(\bar X\) à soma Y assim:

\[P( \bar X > 40 ) = P( Y > 40 \times 60 )\]

sendo Y a soma das 60 v.a. (\(Y=X_1 + X_2 + \cdots + X_{60}\))

Usando a versão «soma» do TLC, a aproximação à continuidade fica

\[P( \bar X > 40 ) = P( Y > 40 \times 60 ) \approx \text{cdfnormal}(2400.5,\; +\infty,\; \mu_Y=60\times 35,\; \sigma_Y=\sqrt{60 \times 10^2})\]

Assim,

\[P( Y > 200) \approx 5.234897e-05 \approx 0.0\]

Arredondar a 0.0 é válido em problemas comuns.