inferência em população genérica
Testes e intervalo de confiança para a média (\(\mu\)) de uma população genérica com recurso ao teorema do limite central:
\(X \; \sim\) distribuição genérica
\(n \ge 30\) (ver dimensão da amostra)
São consideradas duas possibilidades:
variância populacional conhecida (\(\sigma^2\) é conhecida do problema em investigação)
variância populacional estimada pela variância amostral corrigida (\(\hat \sigma^2 = s_c^2\)).
Nestas condições, a variável fulcral segue, aproximadamente, a distribuição normal padrão Z:
Assim, considerando que se tratam de aproximações, a inferência segue os mesmos moldes da inferência em população normal quando a variância populacional é conhecida.
procedimento para obter o IC
Conhecida a média amostral (ver medidas amostrais), fixado o grau de confiança \(1-\alpha\), tendo como pressupondo \(n \ge 30\), uma aproximação do o IC é dada por
em que, com base na distribuição normal padrão Z,
É mostrado, na figura, que o grau de confiança, \(1 - \alpha\), é colocado no centro da distribuição N(0, 1):
TH com base no p-value
Antes de avançar é necessária a verificação dos pressupostos:
\(X \sim \text{generica}\) (X segue uma distribuição genérica)
\(\mu\) conhecido (a média populacional é conhecida)
\(\sigma^2\) conhecido (a variância populacional é conhecida)
\(n \ge 30\) (a amostra é suficientemente grande para se usar a aproximação pelo TLC)
- 1. Especificar a hipóteses H0 e H1
\(\mu_0\) é um valor real obtido no problema em investigação
teste bilateral:
\(H_0:\, \mu = \mu_0 \quad vs \quad H_1:\, \mu \neq \mu_0\)
teste unilateral à direita:
\(H_0:\, \mu = \mu_0 \quad vs \quad H_1:\, \mu > \mu_0\)
teste unilateral à esquerda:
\(H_0:\, \mu = \mu_0 \quad vs \quad H_1:\, \mu < \mu_0\)
- 2. Identificar a estatística de teste
Pressupõe-se \(n \ge 30\).
A notação «\(| \; H_0\)» designa «sob H0», ou seja, sendo H0 verdade então o valor do parâmetro \(\mu\) é o valor real \(\mu_0\) indicado no problema em investigação.
- 3. Obter o valor da estatística de teste
Com base na média amostral e valor \(\mu_0\):
- 4. Calcular o p-value
Consideram-se os três casos.
No que se segue, \(\Phi(z) = \text{CDF.Normal}(z,\; 0,\; 1)\).
4a. Calcular o p-value de um teste bilateral
se \(z_{obs}\) é negativo então
tabelas: \(\text{p-value} = 2 \times \Phi(z_{obs})\)
calculadoras: \(\text{p-value} = 2 \times \text{CDF.Normal}(lower=-\infty,\;upper=z_{obs},\;\mu=0,\;\sigma=1)\)
se \(z_{obs}\) é positivo então
tabelas: \(\text{p-value} = 2 \times (1 - \Phi(z_{obs}))\)
calculadoras: \(\text{p-value} = 2 \times \text{CDF.Normal}(z_{obs},\;+\infty,\;0,\;1)\)
4b. Calcular o p-value de um teste unilateral à direita
Independentemente de \(z_{obs}\) ser positivo ou negativo:
tabelas: \(\text{p-value} = 1 - \Phi(z_{obs})\)
calculadoras: \(\text{p-value} = \text{CDF.Normal}(z_{obs},\;+\infty,\;0,\;1)\)
4c. Calcular o p-value de um teste unilateral à esquerda
Independentemente de \(z_{obs}\) ser positivo ou negativo:
tabelas: \(\text{p-value} = \Phi(z_{obs})\)
calculadoras: \(\text{p-value} = \text{CDF.Normal}(-\infty,\;z_{obs},\;\;0,\;1)\)
- 5. Concluir
se \(\text{p-value} \le \alpha\) então rejeita-se H0 em favor de H1
se \(\text{p-value} > \alpha\) então não se rejeita H0
- 4. Interpretar no contexto do problema em investigação.
Sugestão de interpretação (para o caso em que X é um peso):
«o peso médio (é / não é) significativamente diferente de \(\mu_0\) considerando o nível de significância \(\alpha=5\%\) e com base na amostra considerada.»
«o peso médio (é / não é) significativamente maior que \(\mu_0\) considerando o nível de significância \(\alpha=5\%\) e com base na amostra considerada.»
«o peso médio (é / não é) significativamente menor que \(\mu_0\) considerando o nível de significância \(\alpha=5\%\) e com base na amostra considerada.»
TH com base na região crítica
Antes de avançar é necessária a verificação dos pressupostos:
\(X \sim \text{generica}\) (X segue uma distribuição genérica)
\(\mu\) conhecido (a média populacional é conhecida)
\(\sigma^2\) conhecido (a variância populacional é conhecida)
\(n \ge 30\) (a amostra é suficientemente grande para se usar a aproximação pelo TLC)
- 1. Especificar a hipóteses H0 e H1
\(\mu_0\) é um valor real obtido no problema em investigação.
teste bilateral:
\(H_0:\, \mu = \mu_0 \quad vs \quad H_1:\, \mu \neq \mu_0\)
teste unilateral à direita:
\(H_0:\, \mu = \mu_0 \quad vs \quad H_1:\, \mu > \mu_0\)
teste unilateral à esquerda:
\(H_0:\, \mu = \mu_0 \quad vs \quad H_1:\, \mu < \mu_0\)
- 2. Identificar a estatística de teste
Pressupõe-se \(n \ge 30\).
A notação «\(| \; H_0\)» designa «sob H0», ou seja, sendo H0 verdade então o valor do parâmetro \(\mu\) é o valor real \(\mu_0\) indicado no problema em investigação.
- 3. Obter o valor da estatística de teste
Com base na média amostral e valor \(\mu_0\):
No que se segue, \(\Phi(z) = \text{CDF.Normal}(z,\; 0,\; 1)\).
- 4. Obter a região crítica.
A região crítica é um intervalo onde se rejeita H0 caso este contenha \(z_{obs}\).
4a. região crítica bilateral
tabelas: \(z_{critico} = \Phi^{-1}(1-\alpha/2)\)
calculadoras: \(z_{critico} = \text{INV.Normal}(1-\alpha/2,\;0,\; 1)\) (o resultado é positivo)
\(RC = ]-\infty,\; z_{critico}[ \;\cup\; ]z_{critico},\; +\infty[\).
4b. região crítica unilateral à direita
tabelas: \(z_{critico} = \Phi^{-1}(1-\alpha)\)
calculadoras: \(z_{critico} =\text{INV.Normal}(1-\alpha,\;0,\; 1)\) (o resultado é positivo)
\(RC = ]z_{critico},\; +\infty[\)
4c. região crítica unilateral à esquerda
tabelas: \(z_{critico} = \Phi^{-1}(\alpha)\)
calculadoras: \(z_{critico} = \text{INV.Normal}(\alpha,\;0,\; 1)\) (o resultado é negativo)
\(RC = ]-\infty,\; z_{critico}[\)
- 5. Concluir.
se \(z_{obs}\) pertence à região crítica então rejeita-se H0 em favor de H1,
se \(z_{obs}\) não pertence à região crítica então não se rejeita H0.
- 4. Interpretar no contexto do problema em investigação.
Sugestão de interpretação (para o caso em que X é um peso):
«o peso médio (é / não é) significativamente diferente de \(\mu_0\) considerando o nível de significância \(\alpha=5\%\) e com base na amostra considerada.»
«o peso médio (é / não é) significativamente maior que \(\mu_0\) considerando o nível de significância \(\alpha=5\%\) e com base na amostra considerada.»
«o peso médio (é / não é) significativamente menor que \(\mu_0\) considerando o nível de significância \(\alpha=5\%\) e com base na amostra considerada.»
TH com base no método do IC
Antes de avançar é necessária a verificação dos pressupostos:
\(X \sim \text{generica}\) (X segue uma distribuição genérica)
\(\mu\) conhecido (a média populacional é conhecida)
\(\sigma^2\) conhecido (a variância populacional é conhecida)
\(n \ge 30\) (a amostra é suficientemente grande para se usar a aproximação pelo TLC)
o TH a efetuar é do tipo bilateral (\(H_1:\; \mu \neq \mu_0\))
- 1. Especificar a hipóteses H0 e H1
\(\mu_0\) é um valor real obtido no problema em investigação.
O método do IC apenas se aplica ao teste bilateral:
\(H_0:\, \mu = \mu_0 \quad vs \quad H_1:\, \mu \neq \mu_0\)
- 2. Usar ou determinar o IC
(ver também procedimento para obter o IC)
Se o problema em investigação já dispõe de um IC passa-se para a etapa seguinte.
Pressuposto: \(n \ge 30\)
O IC é obtido com grau de confiança \(1 - \alpha\)
O IC, aproximado, é dado por:
- 3. Concluir
se \(\mu_0\) não pertence ao IC então rejeita-se H0 em favor de H1,
se \(\mu_0\) pertence ao IC então não se rejeita H0.
- 4. Interpretar no contexto do problema em investigação.
Sugestão de interpretação (para o caso em que X é um peso):
«o peso médio (é / não é) significativamente diferente de \(\mu_0\) considerando o nível de significância \(\alpha=5\%\) e com base na amostra considerada.»
calculadora gráfica
Consulte as funções da calculadora gráfica para o teste Z e IC Z.