significado da regressão

Será que Y depende de x?

diagrama de dispersão

O diagrama de dispersão deve mostrar evidência da dependência, em média, de y face a x:

_images/rl-significado-dispersao.png

teste de hipóteses sobre o parâmetro do declive

Além da informação visual deve ser realizado um teste de hipóteses ao declive \(\beta_1\):

\[H_0:~\beta_1=0~~vs~~H_1:~\beta_1\neq 0\]

Este teste de hipóteses efetua-se com base na distribuição t de Student, com n-2 graus de liberdade, como pode ser lido na secção inferência da regressão.

Com base no R ou calculadoras é obtido o p-value ao coeficiente de regressão \(\beta_1\) (declive). Um exemplo encontra-se na imagem, em que o p-value se encontra na caixa vermelha:

_images/rl-significado-th-r-pvalue.png

A regra é a usual:

  • se o p-value do teste ao declive \(\beta_1\) for inferior ao níveis usuais de significância então rejeita-se H0. A interpretação é que o declive é significativamente difernete de zero ou seja a regressão faz sentido: os valores y médios dependem significativamente de x.

  • caso contrário, p-value superior aos níveis usuais de significância, a regressão não faz sentido e os valores y médios não dependem significativamente de x.

As calculadoras gráficas e o software estatístico realizam os cálculos com base na amostra fornecida por forma à obtenção do p-value para o teste mencionado:

tabela de output do R

A imagem contém um exemplo de tabela de output do software R para a regressão linear simples:

_images/rl-significado-th-r.png

Os campos da tabela «Coefficients» são:

Estimate

Std. Error

t value

p-values

(Intercept)

\(\hat \beta_0\)

\(\hat \sigma_0\)

\(t_{obs,0}\)

p-value de \(\beta_0\)

variável x

\(\hat \beta_1\)

\(\hat \sigma_1\)

\(t_{obs,1}\)

p-value de \(\beta_1\)

Mais informação em inferência da regressão.