inferência da regressão

No modelo de regressão linear simples paramétrica são usados três coeficientes populacionais:

  • \beta_0: ordenada na origem (coeficiente populacional)

  • \beta_1: declive (coeficiente populacional)

  • \sigma: desvio padrão da v.a. de erros, \epsilon \sim N(0,\; \sigma^2)

São apresentadas relações que permitem efetuar testes de hipóteses e intervalos de confiança para estes parâmetros populacionais com base na amostra disponível.

(ver slides 31 a 35 – Capítulo 5)

inferência sobre a ordenada na origem

A inferência (testes de hipóteses e intervalos de confiança) para a ordenada na origem \beta_0 faz-se com a estatística seguinte

T = \frac{ \hat{\beta}_0 - \beta_0}{\hat{\sigma}_{\beta_0}} \sim t_{n-2}

em que \hat{\sigma}_{\beta_0} é apresentado abaixo (mas raramente determinado «à mão»).

Um intervalo de confiança para a ordenada na origem é dado por:

IC_{1 - \alpha}(\beta_0) = \left[ \hat{\beta}_0 - t_{1-\alpha/2;n-2}\ \hat{\sigma}_{\beta_0} \ ,\ \hat{\beta}_0 + t_{1-\alpha/2;n-2}\ \hat{\sigma}_{\beta_0} \right]

Calculam-se os valores-p (unilaterais ou bilateral) com base no valor da estatística de teste, sob H0,

t_{obs}|H0 = \frac{ \hat{\beta}_0 - \beta_0}{\hat{\sigma}_{\beta_0}} \sim t_{n-2}

Os valores da estimativa, \hat{\beta}_0, e respectivo desvio padrão, \hat{\sigma}_{\beta_0}, são usualmente fornecidos pelo software devido à complexidade do seu cálculo:

\begin{split}\begin{eqnarray*} \hat{\beta}_0 & = & \bar Y - \hat{\beta}_1 \, x \\ \hat{\beta}_1 & = & \displaystyle \frac{S_{xY}}{S_{xx}} \end{eqnarray*}\end{split}
\hat \sigma_{\beta_0} = \sqrt{ \displaystyle \frac{SS_E }{(n-2)} \left(\frac{1}{n} + \frac{\bar x^2}{S_{xx}} \right) }

Calculadoras: não apresentam valor-p para a ordenada na origem. No entanto, o valor-p pode ser calculado com base na distribuição t de Student, e quando o valor de \hat{\sigma}_{\beta_0} é fornecido num enunciado. O IC também pode ser determinado com a expressão acima.

inferência sobre o declive

A inferência (testes de hipóteses e intervalos de confiança) para o declive \beta_1 faz-se com a estatística seguinte

T = \frac{ \hat{\beta}_1 - \beta_1}{\hat{\sigma}_{\beta_1}} \sim t_{n-2}

em que \hat{\sigma}_{\beta_1} é apresentado abaixo (mas raramente determinado «à mão»).

Um intervalo de confiança para a ordenada na origem é dado por:

IC_{1 - \alpha}(\beta_1) = \left[ \hat{\beta}_1 - t_{1-\alpha/2;n-2}\ \hat{\sigma}_{\beta_1} \ ,\ \hat{\beta}_1 + t_{1-\alpha/2;n-2}\ \hat{\sigma}_{\beta_1} \right]

Calculam-se os valores-p (unilaterais ou bilateral) com base no valor da estatística de teste, sob H0,

t_{obs}|H0 = \frac{ \hat{\beta}_1 - \beta_1}{\hat{\sigma}_{\beta_1}} \sim t_{n-2}

Os valores da estimativa, \hat{\beta}_1 (ver acima), e respectivo desvio padrão, \hat{\sigma}_{\beta_1}, são usualmente fornecidos pelo software devido à complexidade do seu cálculo:

\hat \sigma_{\beta_1} = \sqrt{ \displaystyle \frac{SS_E }{(n-2) S_{xx}} }

Calculadoras: apresentam valor-p para o declive (testes unilaterais e bilateral). No entanto, o valor-p pode ser calculado com base na distribuição t de Student, e quando o valor de \hat{\sigma}_{\beta_1} é fornecido num enunciado. O IC também pode ser determinado com a expressão acima.

inferência sobre o desvio padrão dos erros

O desvio padrão dos erros é o parâmetro \sigma

(por fazer)

inferência sobre a normalidade

Veja ajustamento à normal. As etapas são:

  • QQplot sobre os resíduos;

  • Shapiro-Wilk sobre os resíduos;

  • Lilliefors sobre os resíduos.