ex. 2.13

Num estudo ecológico realizado durante uma década mediu-se diariamente a concentração de estrôncio (mg/ml) numa dada localização do rio Tejo. Considere a variável Y que representa a concentração anual de estrôncio no rio Tejo e admita que Y segue uma lei normal de média 40 \(mg/ml\) e variância 11 \((mg/ml)^2\).


(a) Encontre o terceiro quartil associado à v.a. Y e interprete-o no contexto do problema.

sugestões

  • Qual a descrição da v.a.? \(Y = .....\)

  • Qual a distribuição da v.a.? \(Y \sim ...\)

  • Qual é o símbolo usado para 40 \(mg/ml\)?

  • Qual é o símbolo usado para 11 \((mg/ml)^2\)? O que representam estas quantidades?

Consulte quantil da normal.

solução

  • Y = concentração anual de estrôncio.

  • \(Y \sim N(\mu=40,\; \sigma^2=11)\)

  • 40 indica a localização central e 11 indica uma medida de dispersão através da variância.

  • inv.normal(0.75, 40, sqrt(11))

Resposta: 42.2 \(mg/ml\)

Interpretação: 75% da população, de acordo com este modelo matemático, tem uma concentração de estrôncio igual ou inferior a 42.2 \(mg/ml\) (igualmente, pode-se também afirmar que 25% da população tem uma concentração de estrôncio igual ou superior a 42.2 \(mg/ml\).


(b) Calcule \(P(Y>40|Y>37)\) e interprete esta probabilidade no contexto do problema.

sugestões

  • Aplique \(P(A|B) = \frac{P(A \cap B)}{P(B)}\) ao caso com \(A=Y>40`e :math:`B=Y>37\).

  • Qual é a intersecção de \(Y>40 \cap Y>37\)?

Use a sua calculadora gráfica ou consulta da tabela da normal

solução

  • \(Y>40 \cap Y>37 = Y>40\), pois intersecção quer dizer «elementos em comum».

  • \(P(Y>40|Y>37) = P(A|B) = \frac{P(Y>40)}{P(Y>37)}\)

  • P(Y>40) = 0.5 (a Normal é simétrica na média)

  • P(Y>37) = 0.8171439

Resposta: 0.61

Interpretação: se alguém nos disser que a concentração é superior a 37 \(mg/ml\) então a probabilidade desta ser superior a 40 será diferente do que se não soubessemo que Y>37.

A probabilidade é condicionada pelo que se sabe:

  • sem se saber que \(Y>37\) então \(P(Y>40)=0.5\) (40 é a mediana e média);

  • sabendo que \(Y>37\), portanto calculando \(P(Y>40|Y>37)\), a probabilidade de Y>40 é 0.61.

Outro exemplo:

  • Sabendo que estamos no inverno, a probabilidade de chover é elevada: P(chuva|inverno)

  • Sabendo que estamos no verão, a probabilidade de chover é baixa: P(chuva|verão)

  • Não sabendo se estamos no verão ou no inverno, a probabilidade de chuva é um valor intermédio entre aqueles dois extremos. Válido para o exemplo tem-se P(chuva|verão) < P(chuva) < P(chuva|inverno).


(c) Considere a v.a.

W = «número de anos, com concentração anual de estrôncio entre 37 e 43 \(mg/ml\) (inclusive), no rio Tejo, no periodo de uma década»

em que o intervalo de concentrações 37 a 43 representam valores típicos.

Assim,

  • (i) Identifique, justificando, a distribuição de W.

  • (ii) Encontre \(E[10-W]\) e interprete o resultado no contexto do problema.

sugestões

Para a questão (i):

  • O que é contado? Qual o mínimo e o máximo teoricamente possíveis para a v.a. W?

  • Em cada ano, ocorre «sucesso» ou «falha». O que define o «sucesso» em cada ano?

  • Quantos anos, considerados experiências independentes, são observados?

  • Com base nas duas questões anteriores, qual a distribuição sugerida para a v.a. W? distribuição de Poisson ou distribuição binomial?

Para a questão (ii): * Use as propriedades de E[X].

solução

  • (i) \(W \sim B(10,\;0.6343)\);

  • (ii) 3.6571; W mede o número de anos típicos em 10; assim, 10-W mede o número de anos com concentração atípica; finalmente, \(E[10-W]\) indica o número médio de anos com concentração atípica.


(d) Até à década de 90, a generalidade das calculadoras não tinha a distribuição binomial implementada e a estratégia era usar o teorema do limite central. Nessas condições, responda à questão

Ao longo de um século, qual a probabilidade de, em pelo menos 72 anos, se registar uma concentração anual de estrôncio entre 37 e 43 \(mg/ml\) no rio Tejo?

sugestões

Recorda-se que a variável Y representa a concentração anual de estrôncio no rio Tejo e segue uma normal.

Considere a v.a. binomial

S = número de anos com concentração de estrôncio entre 37 e 43 no rio Tejo no conjuntos de 100 anos

em que

  • sucesso é «concentração de estrôncio entre 37 e 43»

  • são observados n=100 anos (considerando 100 experiências independentes).

tem distribuiçao aproximadamente normal \(S \sim_{aprox} N(np,np(1-p))\) pois \(n>30\).

proposta de resolução

Recordando, a variável Y representa a concentração anual de estrôncio no rio Tejo e segue uma normal.

A variável S define-se como sendo o nr. de sucessos em 100 «tentativas» (cada ano é uma tentativa), binomial, pois

  • um século são 100 anos e assim n = 100 «experiências» (de observação do estrôncio em cada ano).

  • p = P(«sucesso») = P(37 < concentração X < 43) usando cdf.normal.

A maneira exata de calcular P(S>=72) é, usando a notação das calculadoras,

cdf.binomial(lower=72, upper=100, trials=100, p = ver acima)

A outra maneira, como se fazia sem calculadoras, era observar que «número de sucessos» é na realidade somar v.a. cujos valores são 0 ou 1, i.e., 0+1+1+0+1+1+etc = número total de sucessos (veja aqui).

Se S é uma soma de v.a. então pode aplicar-se o TLC:

  • S segue aproximadamente uma Normal(Média de Y, Variância de Y)

e como a v.a. S é binomial então

  • E[S] = np

  • Var[S] = np(1-p).

ou seja \(S \sim \text{Normal}(np,np(1-p))\).

Resposta:

  • 0.04493 (exato pela cdf.binomial)

  • 0.0279 (usando TLC que aproxima a binomial à normal)

Importante: sempre que há uma soma de muitas v.a. pode-se aplicar o TLC que diz que a distribuição será aproximadamente Normal.


FIM