inferência da regressão

No modelo de regressão linear simples paramétrica são usados três coeficientes populacionais:

  • \(\beta_0\): ordenada na origem (coeficiente populacional)

  • \(\beta_1\): declive (coeficiente populacional)

  • \(\sigma\): desvio padrão da v.a. de erros, \(\epsilon \sim N(0,\; \sigma^2)\)

São apresentadas relações que permitem efetuar testes de hipóteses e intervalos de confiança para estes parâmetros populacionais com base na amostra disponível.

(ver slides 31 a 35 – Capítulo 5)

inferência sobre a ordenada na origem

A inferência (testes de hipóteses e intervalos de confiança) para a ordenada na origem \(\beta_0\) faz-se com a estatística seguinte

\[T = \frac{ \hat{\beta}_0 - \beta_0}{\hat{\sigma}_{\beta_0}} \sim t_{n-2}\]

em que \(\hat{\sigma}_{\beta_0}\) é apresentado abaixo (mas raramente determinado «à mão»).

Um intervalo de confiança para a ordenada na origem é dado por:

\[IC_{1 - \alpha}(\beta_0) = \left[ \hat{\beta}_0 - t_{1-\alpha/2;n-2}\ \hat{\sigma}_{\beta_0} \ ,\ \hat{\beta}_0 + t_{1-\alpha/2;n-2}\ \hat{\sigma}_{\beta_0} \right]\]

Calculam-se os valores-p (unilaterais ou bilateral) com base no valor da estatística de teste, sob H0,

\[t_{obs}|H0 = \frac{ \hat{\beta}_0 - \beta_0}{\hat{\sigma}_{\beta_0}} \sim t_{n-2}\]

Os valores da estimativa, \(\hat{\beta}_0\), e respectivo desvio padrão, \(\hat{\sigma}_{\beta_0}\), são usualmente fornecidos pelo software devido à complexidade do seu cálculo:

\[\begin{split}\begin{eqnarray*} \hat{\beta}_0 & = & \bar Y - \hat{\beta}_1 \, x \\ \hat{\beta}_1 & = & \displaystyle \frac{S_{xY}}{S_{xx}} \end{eqnarray*}\end{split}\]
\[\hat \sigma_{\beta_0} = \sqrt{ \displaystyle \frac{SS_E }{(n-2)} \left(\frac{1}{n} + \frac{\bar x^2}{S_{xx}} \right) }\]

Calculadoras: não apresentam valor-p para a ordenada na origem. No entanto, o valor-p pode ser calculado com base na distribuição t de Student, e quando o valor de \(\hat{\sigma}_{\beta_0}\) é fornecido num enunciado. O IC também pode ser determinado com a expressão acima.

inferência sobre o declive

A inferência (testes de hipóteses e intervalos de confiança) para o declive \(\beta_1\) faz-se com a estatística seguinte

\[T = \frac{ \hat{\beta}_1 - \beta_1}{\hat{\sigma}_{\beta_1}} \sim t_{n-2}\]

em que \(\hat{\sigma}_{\beta_1}\) é apresentado abaixo (mas raramente determinado «à mão»).

Um intervalo de confiança para a ordenada na origem é dado por:

\[IC_{1 - \alpha}(\beta_1) = \left[ \hat{\beta}_1 - t_{1-\alpha/2;n-2}\ \hat{\sigma}_{\beta_1} \ ,\ \hat{\beta}_1 + t_{1-\alpha/2;n-2}\ \hat{\sigma}_{\beta_1} \right]\]

Calculam-se os valores-p (unilaterais ou bilateral) com base no valor da estatística de teste, sob H0,

\[t_{obs}|H0 = \frac{ \hat{\beta}_1 - \beta_1}{\hat{\sigma}_{\beta_1}} \sim t_{n-2}\]

Os valores da estimativa, \(\hat{\beta}_1\) (ver acima), e respectivo desvio padrão, \(\hat{\sigma}_{\beta_1}\), são usualmente fornecidos pelo software devido à complexidade do seu cálculo:

\[\hat \sigma_{\beta_1} = \sqrt{ \displaystyle \frac{SS_E }{(n-2) S_{xx}} }\]

Calculadoras: apresentam valor-p para o declive (testes unilaterais e bilateral). No entanto, o valor-p pode ser calculado com base na distribuição t de Student, e quando o valor de \(\hat{\sigma}_{\beta_1}\) é fornecido num enunciado. O IC também pode ser determinado com a expressão acima.

inferência sobre o desvio padrão dos erros

O desvio padrão dos erros é o parâmetro \(\sigma\)

(por fazer)

inferência sobre a normalidade

Veja ajustamento à normal. As etapas são:

  • QQplot sobre os resíduos;

  • Shapiro-Wilk sobre os resíduos;

  • Lilliefors sobre os resíduos.