ex. 3.2 (*)

Mediu-se o comprimento (em mm) da cauda de 25 ratos do campo escolhidos casualmente tendo observado um valor de \(\bar x\) para a média dessa amostra. Admita que o comprimento da cauda de um rato do campo é bem modelada por uma v.a. \(X\) com distribuição normal, variância conhecida e que \([50.1,\; 52.3]\) representa uma estimativa intervalar, a 95% de confiança, para média \(\mu_X\), obtido com base na amostra das 25 observações.

(a) Recorda-se que o símbolo \(\mu_X\) designa um número real que é a média populacional da distribuição da v.a. \(X\). Assim, a seguinte proposição não faz sentido:

\[P(50.1 < \mu_X < 52.3)=0.95\]

Justifique a razão e indique a interpretação correta para o intervalo \([50.1,\; 52.3]\).

sugestões

solução

O enunciado pretende dizer que a afirmação «a média populacional está entre 50.1 e 52.3 com 0.95 de probabilidade»! Apesar de soar bem no ouvido, é uma afirmação falsa!

O conceito e a afirmação correta é: «95% das amostras recolhidas permitem o cálculo de um intervalo de confiança que contém a média populacional correta».

Daqui pode deduzir-se que quando um investigador determina um intervalo, como [50.1, 52.3], ele não tem maneira de saber se este intervalo está nos 95% de intervalos que contêm à média populacional correta. Pode sempre dar-se o caso de ser um dos 5% de intervalos de confiança que não contêm a média populacional correta. Tal indeterminação deriva da natureza aleatória que a Estatística enfrenta: há sempre a possibilidade de uma conclusão errada, esperando-se que esta seja pouco provável!

De um ponto de vista mais matemático:

O modelo matemático sob o qual foi construído o IC, indica que 95% das amostras, de tamanho \(n=25\), vão conter o valor correto de \(\mu_X\) que modela a média populacional, havendo assim margem para que haja amostras que gerem intervalos que não contenham o correto valor do parâmetro \(\mu_X\). Não se pode dizer que há 0.95 de probabilidade de \(\mu_X\) estar nesse intervalo. Apenas se pode afirmar que 95% das amostras vão produzir um intervalo contendo \(\mu_X\), e não sabemos se \([50.1,\; 52.3]\) contém ou não \(\mu_X\).


(b) Se em vez de 95% fosse tomado um grau de confiança igual a 98%, obter-se-ia um novo intervalo de confiança para a média, de maior ou menor amplitude? Justifique.

sugestões

solução

No caso do «Z Interval», a amplitude é dada por

\[2 \times z_{1-\alpha/2} \times \frac{\sigma}{\sqrt{n}}\]

em que \(z_{1-\alpha/2}\) aumenta com o aumento de \(1 - \alpha\).

Resposta: maior amplitude pois esta depende diretamente do grau de confiança.


(c) Sob que condições o intervalo \([50.1,\; 52.3]\) representa o intervalo com menor amplitude possível, com grau de confiança a 95%, para a média da v.a. \(X\)?

sugestões

Há dois tipos de intervalos: Z interval e T interval.

Qual destas duas formas produz um intervalo de confiança de maior amplitude? Porquê?

Consulte

solução

Os intervalos com base na distribuição \(Z\sim N(0,1)\) são sempre menores que os intervalos obtidos com base na distribuição \(t_{n-1}\). Consulte a imagem em distribuição t de Student.

Assim, a fórmula usada para o IC para \(\mu\) deve ser a que usa distribuição \(Z\sim N(0,1)\) e tal só é possível com variância conhecida \(\sigma^2\) e os dados sejam bem modelados por populações normais.


(d) Nas condições da alínea anterior, encontre o valor observado \(\bar x\).

sugestões

Observe a expressão do IC em intervalo de confiança. Qual o ponto médio (ou ponto do meio) do intervalo?

Para calcular o ponto médio de um intervalo [A,B] basta Calcular a média aritmética de A e B: (A+B)/2.

solução

  • (50.1 + 52.3)/2 = 51.2

Resposta: \(\bar x=51.2\)