ex. 3.33 (*)

Numa determinada região foi recolhida uma amostra casual de 300 fetos dos quais 25 estavam infetados com um certo tipo de parasita. Construa um intervalo de confiança a 99% para a proporção de fetos infetados.

(a) Identifique os dados no enunciado.

sugestões

  • A população é composta de quê? O que mede \(X_i\) em cada indivíduo i? \(X_i = .....\) (recorde que \(X_i\) deve resultar num número)

  • O que é o «sucesso» neste contexto?

  • Qual a letra que representa a proporção de sucessos na população?

  • Qua a dimensão da amostra?

  • Indique uma estimativa pontual para a proporção de fetos infetados? Qual o símbolo usado para a estimativa?

proposta de resolução

  • População de fetos; X_i = 1 se o feto está infetado; 0 se o feto não está infetado.

  • «sucesso» = «um feto está infetado»

  • n=300

  • \(X=\sum_{i=1}^n X_i\) = número de sucessos. Por exemplo: x=0+1+1+0+1+1+…+0.

  • \(\hat p = \frac{X}{n} = \frac{\sum_{i=1}^n x_i}{n} = \frac{25\text{ sucessos}}{300} \approx 0.08333\)

  • 8.3% dos fetos, na amostra, estão infetados.


(b) A expressão do IC para proporções é

\[IC_{1 - \alpha}(\mu) \approx \left[ \hat p - z_{1-\alpha/2} \sqrt{\frac{\hat p (1 - \hat p)}{n}}, \hat p + z_{1-\alpha/2} \sqrt{\frac{\hat p (1 - \hat p)}{n}} \right]\]

Identifique as várias componentes desta expressão para o IC.

sugestões

proposta de resolução

  • \(\hat p\) é a proporção estimada com base na amostra;

  • \(z_{1-\alpha/2}\) é um quantil da \(N(0,\; 1)\) obtido com inv.normal nas calculadoras

  • \(\sqrt{\frac{\hat p (1 - \hat p)}{n}}\) é o desvio considerando \(\hat p\) em denominador:

\[\frac{X/n - p}{p(1-p)/n} = \frac{(\sum_{i=1}^n X_i)/n - p}{p(1-p)/n} \sim_{aprox} N( 0,\; 1 )\]

(c) Quando se pode aplicar esta forma aproximada do IC? Os pressupostos estão verificados?

sugestões

proposta de resolução

  • a aproximação é boa quando \(n \ge 30\) (dando sentido à aplicação do TLC);

  • assim, \(n = 300\) garante uma boa aproximação.


(d) Determine o IC para a proporção de fetos infectados considerando um grau de confiança de 99%.

sugestões

Para determinar \(z_{1-\alpha/2}\) consulte quantis usados em inferência e calculadora gráfica.

proposta de resolução

A dimensão da amostra é suficientemente grande então podemos aplicar a aproximação pelo TLC.

  • \(\hat p = \frac{25}{300} \approx 0.0833\)

  • \(z_{1-\alpha/2} = z_{0.995} = inv.normal(0.995,0,1) = 2.5758\) pois \(\alpha = 1\%\).

\[ \begin{align}\begin{aligned}IC_{99\%}(p) \approx \left[\hat p - 2.5758 \sqrt{\frac{\hat p (1 - \hat p)}{300}}, \hat p + 2.5758 \sqrt{\frac{\hat p (1 - \hat p)}{300}} \right]\\IC_{99\%}(p) \approx [0.042,\; 0.124]\end{aligned}\end{align} \]

Ou indicando de outra maneira: \(\hat p = 0.08 \pm 0.04\) com 99% de confiança.


(e) Se a confiança baixar para 90% o que ocorre à amplitude do intervalo?

proposta de resolução

O grau de confiança é sempre colocado no centro da distribuição. Como 90% é menor que 99% então essa região tem um menor tamanho conduzindo a um IC de menor amplitude, e então mais preciso, mas perdendo em confiança.