ex. 2.31 (*)
Recolheu-se uma amostra aleatória de 60 vacas e, na pança de cada uma, contou-se o número de diferentes micro-organismos.
Calcule a probabilidade (aproximada) da média do número de micro-organismos (distintos) ser superior a
40, assumindo que o número esperado para o número de micro-organismos (distintos), por cada pança, é de 35 com desvio padrão de 10.
Siga as várias etapas.
(a) Perante o enunciado, defina uma v.a. X apropriada. Qual a distribuição de X?
Estes parâmetros caracterizam a população, isto é, um modelo matemático, não sendo por isso a média e o desvio padrão de uma amostra.
Nota: X é do tipo «número de ocorrências por unidade de tempo» e a distribuição sugerida poderia ser Poisson.
Porém, o enunciado é omisso; não indica qual a distribuição e assim considera-se genérica.
(b) Especifique a expressão para a \bar X neste caso concreto. Quantas v.a. estão a ser somadas? Qual a dimensão da amostra?
a dimensão da amostra é o número de elementos desta que são as 60 panças (ainda aleatórias) em análise.
\bar X = \frac{1}{60}(X_1 + X_2 + \cdots + X_{60})
Assumimos que as v.a. são independentes e identicamente distribuídas.
(c) Qual a distribuição, aproximada, de \bar X? Justifique.
Uma vez perante uma distribuição genérica, aplicamos o teorema do limite central para o caso da média.
Qual a dimensão da amostra e qual a relação com o TLC ?
Uma vez que a amostra aleatória tem n=60 elementos então podemos usar o TLC garantindo que a aproximação será razoável (para situações usuais).
Assim:
\bar X \sim_{aprox} N\left( \mu_{\bar X} = 35,\; \sigma^2_{\bar X} = \frac{\sigma^2_X}{n} = \frac{10^2}{60} \right)
Notas:
\sigma^2_{\bar X} é a variância da v.a. que é a média amostral aleatória.
\mu_{\bar X} é a média de \bar X.
(d) Use notação matemática para escrever «probabilidade da média do número de micro-organismos (distintos) ser superior a 40».
Sendo uma contagem usa-se rigorosamente >:
Nota: não podemos calcular o valor exato por não conhecermos a distribuição de X e, por conseguinte, a
distribuição exata para \bar X.
A próxima alínea introduz o importante teorema do limite central que oferece
uma solução aproximada.
(e) Calcule a probabilidade pedida recorrendo à correção à continuidade.
Apesar da distribuição ter sido obtida na alínea (c), deve agora passar-se à distribuição da soma por ser mais fácil ajustar a correção à continuidade.
Consulte os documentos:
Se não recorda o básico comece aqui: teorema do limite central.
Em geral, devemos usar a aproximação à correção à continuidade da média
P( \bar X > 40 ) \approx P( \bar X \ge 40 + \frac{0.5}{60} ) \approx \text{normalcdf}\left(40 + \frac{0.5}{60},\; +\infty,\; 35,\; \sqrt{ \frac{10^2}{60} } \right) \approx 5.234897e-05 \approx 0.0
Arredondar a 0.0 é válido em problemas comuns.
alternativa
Se for mais intuitovo, sugere-se passar da média \bar X à soma Y assim:
P( \bar X > 40 ) = P( Y > 40 \times 60 )
sendo Y a soma das 60 v.a. (Y=X_1 + X_2 + \cdots + X_{60})
Usando a versão «soma» do TLC, a aproximação à continuidade fica
P( \bar X > 40 ) = P( Y > 40 \times 60 ) \approx \text{cdfnormal}(2400.5,\; +\infty,\; \mu_Y=60\times 35,\; \sigma_Y=\sqrt{60 \times 10^2})
Assim,
P( Y > 200) \approx 5.234897e-05 \approx 0.0
Arredondar a 0.0 é válido em problemas comuns.