ex. 5.14

Numa análise de regressão foi efetuada a seguinte análise dos resíduos (\(e_i = y_i - \hat y_i\), i=1,…,36).

Com base nos testes de ajustamento à normalidade responda às questões seguintes.

_images/ex5_13_residuos.png

(a) Indique o que significa \(y_i\), \(\hat y_i\) e \(e_i\)?

solução

  • \(y_i\) é o valor de resposta observado para um dado \(x_i\) em que a medida observada \(y_i\) contém um erro (na regressão são registados pares \((x_i,y_i)\);

  • \(\hat y_i=\) é um valor que pertence à reta de regressão para um dado \(x_i\) resultante da equação \(\hat y_i = \beta_0 + \beta_1 x_i\) (portanto, sem o erro);

  • \(e_i\) é o resíduo (uma concretização da v.a. do erro \(\epsilon\)), isto é, a diferença entre o valor observado na amostra \(y_i\) e o valor predito na reta de regressão \(\hat y_i = \beta_0 + \beta_1 x_i\).


(b) Que conclusão tira da análise de resíduos?

solução

Ambos rejeitam a normalidade dos erros, isto é, perante as hipóteses:

\[H_0:\, \epsilon \sim \text{Normal} \text{ vs } H_1:\, \epsilon \not \sim \text{Normal}\]

rejeita-se $H_0$. Assim, o pressuposto de regressão linear paramétrica é rejeitado; não faz sentido aplicar regressão linear com este preciso modelo:

\[Y = \beta_0 + \beta_1 x + \epsilon, \quad \epsilon \sim N(0,\sigma^2)\]