ex. 2.13
Num estudo ecológico realizado durante uma década mediu-se diariamente a concentração de estrôncio (mg/ml) numa dada localização do rio Tejo. Considere a variável Y que representa a concentração anual de estrôncio no rio Tejo e admita que Y segue uma lei normal de média 40 \(mg/ml\) e variância 11 \((mg/ml)^2\).
(a) Encontre o terceiro quartil associado à v.a. Y e interprete-o no contexto do problema.
☞ sugestões
Qual a descrição da v.a.? \(Y = .....\)
Qual a distribuição da v.a.? \(Y \sim ...\)
Qual é o símbolo usado para 40 \(mg/ml\)?
Qual é o símbolo usado para 11 \((mg/ml)^2\)? O que representam estas quantidades?
Consulte quantil da normal.
☞ solução
Y = concentração anual de estrôncio.
\(Y \sim N(\mu=40,\; \sigma^2=11)\)
40 indica a localização central e 11 indica uma medida de dispersão através da variância.
inv.normal(0.75, 40, sqrt(11))
Resposta: 42.2 \(mg/ml\)
Interpretação: 75% da população, de acordo com este modelo matemático, tem uma concentração de estrôncio igual ou inferior a 42.2 \(mg/ml\) (igualmente, pode-se também afirmar que 25% da população tem uma concentração de estrôncio igual ou superior a 42.2 \(mg/ml\).
(b) Calcule \(P(Y>40|Y>37)\) e interprete esta probabilidade no contexto do problema.
☞ sugestões
Aplique \(P(A|B) = \frac{P(A \cap B)}{P(B)}\) ao caso com \(A=Y>40`e :math:`B=Y>37\).
Qual é a intersecção de \(Y>40 \cap Y>37\)?
Use a sua calculadora gráfica ou consulta da tabela da normal
☞ solução
\(Y>40 \cap Y>37 = Y>40\), pois intersecção quer dizer «elementos em comum».
\(P(Y>40|Y>37) = P(A|B) = \frac{P(Y>40)}{P(Y>37)}\)
P(Y>40) = 0.5 (a Normal é simétrica na média)
P(Y>37) = 0.8171439
Resposta: 0.61
Interpretação: se alguém nos disser que a concentração é superior a 37 \(mg/ml\) então a probabilidade desta ser superior a 40 será diferente do que se não soubessemo que Y>37.
A probabilidade é condicionada pelo que se sabe:
sem se saber que \(Y>37\) então \(P(Y>40)=0.5\) (40 é a mediana e média);
sabendo que \(Y>37\), portanto calculando \(P(Y>40|Y>37)\), a probabilidade de Y>40 é 0.61.
Outro exemplo:
Sabendo que estamos no inverno, a probabilidade de chover é elevada: P(chuva|inverno)
Sabendo que estamos no verão, a probabilidade de chover é baixa: P(chuva|verão)
Não sabendo se estamos no verão ou no inverno, a probabilidade de chuva é um valor intermédio entre aqueles dois extremos. Válido para o exemplo tem-se P(chuva|verão) < P(chuva) < P(chuva|inverno).
(c) Considere a v.a.
em que o intervalo de concentrações 37 a 43 representam valores típicos.
Assim,
(i) Identifique, justificando, a distribuição de W.
(ii) Encontre \(E[10-W]\) e interprete o resultado no contexto do problema.
☞ sugestões
Para a questão (i):
O que é contado? Qual o mínimo e o máximo teoricamente possíveis para a v.a. W?
Em cada ano, ocorre «sucesso» ou «falha». O que define o «sucesso» em cada ano?
Quantos anos, considerados experiências independentes, são observados?
Com base nas duas questões anteriores, qual a distribuição sugerida para a v.a. W? distribuição de Poisson ou distribuição binomial?
Para a questão (ii): * Use as propriedades de E[X].
☞ solução
(i) \(W \sim B(10,\;0.6343)\);
(ii) 3.6571; W mede o número de anos típicos em 10; assim, 10-W mede o número de anos com concentração atípica; finalmente, \(E[10-W]\) indica o número médio de anos com concentração atípica.
(d) Até à década de 90, a generalidade das calculadoras não tinha a distribuição binomial implementada e a estratégia era usar o teorema do limite central. Nessas condições, responda à questão
☞ sugestões
Recorda-se que a variável Y representa a concentração anual de estrôncio no rio Tejo e segue uma normal.
Considere a v.a. binomial
em que
sucesso é «concentração de estrôncio entre 37 e 43»
são observados n=100 anos (considerando 100 experiências independentes).
tem distribuiçao aproximadamente normal \(S \sim_{aprox} N(np,np(1-p))\) pois \(n>30\).
☞ proposta de resolução
Recordando, a variável Y representa a concentração anual de estrôncio no rio Tejo e segue uma normal.
A variável S define-se como sendo o nr. de sucessos em 100 «tentativas» (cada ano é uma tentativa), binomial, pois
um século são 100 anos e assim n = 100 «experiências» (de observação do estrôncio em cada ano).
p = P(«sucesso») = P(37 < concentração X < 43) usando cdf.normal.
A maneira exata de calcular P(S>=72) é, usando a notação das calculadoras,
cdf.binomial(lower=72, upper=100, trials=100, p = ver acima)
A outra maneira, como se fazia sem calculadoras, era observar que «número de sucessos» é na realidade somar v.a. cujos valores são 0 ou 1, i.e., 0+1+1+0+1+1+etc = número total de sucessos (veja aqui).
Se S é uma soma de v.a. então pode aplicar-se o TLC:
S segue aproximadamente uma Normal(Média de Y, Variância de Y)
e como a v.a. S é binomial então
E[S] = np
Var[S] = np(1-p).
ou seja \(S \sim \text{Normal}(np,np(1-p))\).
Resposta:
0.04493 (exato pela cdf.binomial)
0.0279 (usando TLC que aproxima a binomial à normal)
Importante: sempre que há uma soma de muitas v.a. pode-se aplicar o TLC que diz que a distribuição será aproximadamente Normal.
FIM