intervalo de confiança

Intervalo de Confiança (IC) para a média populacional com estes pressupostos:

Nessas condições, o IC para a média populacional é dado por:

IC_{1-\alpha}(\mu) = \left] \bar x - z_{1-\alpha/2} \frac{\sigma}{\sqrt{n}},\; \bar x + z_{1-\alpha/2} \frac{\sigma}{\sqrt{n}} \right[

sendo z_{1-\alpha/2} um quantil da distribuição normal padrão.

procedimento

O procedimento, tendo em conta os pressupostos

  • X \sim N(\mu,\; \sigma^2): os dados são bem modelados por uma distribuição normal;

  • \sigma^2 é conhecida: a variância populacional é fornecida no enunciado.

e conhecidas as medidas amostrais, é dado por

IC_{1-\alpha}(\mu) = \left[ \bar x - z_{1-\alpha/2} \frac{\sigma}{\sqrt{n}},\; \bar x + z_{1-\alpha/2} \frac{\sigma}{\sqrt{n}} \right]

em que, com base na distribuição normal padrão Z,

z_{1-\alpha/2} = \text{INV.Normal}(1-\alpha/2,\; 0,\; 1)
_images/ei-icp-normalpadrao.png _images/ei-ic-normalpadrao-centro.png

É mostrado, na 2ª figura, que o grau de confiança, 1 - \alpha, é colocado no centro de N(0,1).

exemplo

Com base no enunciado, o IC com grau de confiança a 95% é dado por:

\begin{split}\begin{eqnarray*} IC_{95\%}(\mu) & = & \left] \bar x - z_{1-\alpha/2} \frac{\sigma}{\sqrt{n}},\; \bar x + z_{1-\alpha/2} \frac{\sigma}{\sqrt{n}} \right[ \\ & = & \left] 25.585 - z_{1-\alpha/2} \frac{4.0}{\sqrt{20}},\; 25.585 + z_{1-\alpha/2} \frac{4.0}{\sqrt{20}} \right[ \\ \end{eqnarray*}\end{split}

Com 1-\alpha=0.95 então 1-\alpha/2=0.975. Temos, com base na distribuição normal padrão Z,

z_{0.975} = \text{INV.Normal}(0.975,\; 0,\; 1) = 1.96

Por fim,

\begin{split}\begin{eqnarray*} IC_{95\%}(\mu) & = & \left] 25.585 - z_{1-\alpha/2} \frac{4.0}{\sqrt{20}},\; 25.585 + z_{1-\alpha/2} \frac{4.0}{\sqrt{20}} \right[ \\ & = & \left] 25.585 - 1.96 \times \frac{4.0}{\sqrt{20}},\; 25.585 + 1.96 \times \frac{4.0}{\sqrt{20}} \right[ \\ & = & ]23.8319;27.3381[ \end{eqnarray*}\end{split}

propriedades

  • o ponto central do IC é \bar x, que é a estimação pontual;

  • o intervalo pode ser aberto ou fechado e o seus limites não devem ser vistos de forma categórica (i.e., determinística).

  • a amplitude do IC é dada por 2 \times z_{1-\alpha/2} \times \frac{\sigma}{\sqrt{n}}. Porquê?

No exemplo,

  • a estimativa \mu=\bar x = 25.585 é o centro do intervalo;

  • a amplitude do IC é 2 \times 1.96 \times (4.0)/(\sqrt(20)) = 3.5062.

amplitude do intervalo

  • A amplitude do IC é dada por

2 \times z_{1-\alpha/2} \times \frac{\sigma}{\sqrt{n}}`
  • Quanto maior o grau de confiança maior a largura do intervalo. Porquê?

_images/ei-icp-normalpadrao.png
  • Quanto maior a amostra, menor a largura do intervalo.

_images/ei-icp-amplitude.png

interpretação do intervalo

Um IC para a média populacional pode ser visto como:

  • fornecendo a precisão da estimação pontual para \mu [ver 1.]

    • no exemplo dado, \hat\mu\pm\epsilon = 25.585\pm1.7531, ou seja, com estimativa \hat\mu=\bar x = 25.585 com precisão 1.7531 (a que correponde a amplitude do IC de 3.5062),

ou ainda como,

interpretação da confiança

Tomando como exemplo um grau de confiança é 95% então:

  • 95% das amostras conduzem a ICs que vão conter o parâmetro \mu correto que modela a população de onde as amostras são recolhidas.

Dito de maneira probabilística,

_images/ei-icp-interpretacao.png

Não se pode interpretar, no entanto, que \mu \in ]23.8319;27.3381[ com 95% de probabilidade, pois

  • \mu é um número real, e não uma v.a.; assim, não faz sentido calcular uma probabilidade. Seria como calcular «Prob(5 estar em [1; 10])», i.e., ou está ou não está.

construção

Esta secção explica como obter o IC para uma v.a. normal com variância populacional, \sigma^2, conhecida (fornecida num enunciado).

Uma população é bem modelada por X \sim N(\mu,\; \sigma^2) e, por distribuição normal (amostragem), então \bar X \sim N(\mu,\; \frac{\sigma^2}{n}) ou ainda

\frac{\bar X - \mu}{\sigma/\sqrt{n}} \sim N(0,\;1)

que diz que o afastamento da média amostral, \bar X, à média populacional, \mu, é modelado por uma distribuição normal (face às condições dadas). Então, indicamos que esse afastamento não deve ultrapassar certos limites:

P( -z \le \frac{\bar X - \mu}{\sigma/\sqrt{n}} \le z ) = 1 - \alpha

Transformando a expressão acima,

P( \bar X - z \frac{\sigma}{n} \le \mu \le \bar X + z \frac{\sigma}{n} ) = 1 - \alpha

Nesta expressão:

  • \mu é um número real!

  • \bar X é uma média amostral aleatória (logo é uma v.a.)

  • os limites, esquerdo e direito, dependem de uma amostra.

A mesma expressão pode-se reescrever assim,

P( \text{amostra aleatória gerar um intervalo contendo } \mu ) = 1 - \alpha

R Project

Neste capítulo aborda-se apenas o «Z Interval» pois a população é normal com variância conhecida. No R, este intervalo não existe de origem e então é necessário instalar uma biblioteca.

instalação

Deve executar-se a seguinte instrução apenas uma vez:

install.packages("BSDA")

comandos

Com base no enunciado, o IC com grau de confiança a 95% é dado por

library(BSDA)
dados = c(31.2, 22.5, 26.4, 24.2, 26.0, 24.2, 26.5,
          27.8, 26.4, 24.2, 21.6, 28.8, 23.9, 29.8,
          25.0, 25.4, 24.0, 28.7, 21.9, 23.2)
z.test(dados, sigma.x=4.0, conf.level = 0.95)

sendo o resultado:

One-sample z-Test

data: dados
z = 28.605, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
23.83195 27.33805
sample estimates:
mean of x
25.585

calculadora gráfica

  • Os menus das calculadoras para determinar IC costumam estar no menu «estatística».

  • Em geral, deve procurar-se por «Z Interval» ou «Intervalo Z».

  • Existe o modo «dados»: devem ser introduzidos como em dados não agrupados ou dados agrupados.

  • Existe o modo «stats» (ou ainda modo «variable»).

Exemplo:

  • texas TI Nspire CX: MENU Estatística (6) => Intervalo de Confiança (6) => Intervalo Z (1)