ex. 5.11

Recolheu-se informação relativa ao número de fogos florestais e área ardida (em hectares) em Portugal, desde 1943 até 1978 fogos.csv.

Pretende-se relacionar a área total ardida com o número de fogos.


(a) Construiu-se um diagrama de dispersão das duas variáveis

_images/ex5_11.png

(a-i) Acha que se pode observar uma relação linear subjacente aos dados?

sugestões

a refletir

solução

A observação do gráfico não sugere adequação de um modelo linear.


(a-ii) O que pode dizer sobre a variabilidade dos dados?

sugestões

a refletir

solução

À medida que os valores de \(x\) aumenta, aumenta a dispersão dos valores de \(y\); O gráfico sugere efetuar uma transformação da variável \(y\) (nomeadamente, de tipo logarítmica).


(b) Qual o valor do coeficiente de determinação?

_images/ex5_11a.png

sugestões

A reflectir.

solução

\(R^2 = 0.809\), menor que 0.9, o que sugere que a relação

entre math:y e math:x pode não ser bem modelada por uma regressão linear simples.


(c) Com base na tabela de regressão indique a equação da reta de regressão.

_images/ex5_11b.png

sugestões

A reflectir.

solução

\(y=-910.247 + 33.499x\)


(d) Por cada incêndio adicional que se observe, qual é a área média que se espera que arda?

sugestões

A reflectir.

solução

\(\hat{\beta}_1 = 33.499\)


(e) Teste se a ordenada na origem é significativamente diferente de 0, ao nível de signific^{a}ncia \(1\%\).

(e-i) Escreva as hipóteses em causa.

sugestões

A reflectir.

solução

\(H_0: \beta_0 = 0\) vs \(H_1: \beta_0 \neq 0\)


(e-ii) Registe o valor-p do teste.

sugestões

A reflectir.


solução

valor-p = 0.041


(e-iii) Conclua.

sugestões

A reflectir.

solução

valor-p superior a \(\alpha = 0.01\). Assim, não se rejeita \(H_0\); Logo, sob a validade do modelo de regressão linear, é esperada que a área ardida seja (significativamente) nula quando não se observam incêndios!


(f) Teste se o declive é significativamente diferente de 0, ao nível de signific^{a}ncia $1%$.

(f-i) Escreva as hipóteses em causa.

sugestões

A reflectir.

solução

\(H_0: \beta_1 = 0\) vs \(H_1: \beta_1 \neq 0\)


(f-ii) Registe o valor-p do teste.

sugestões

A reflectir.

solução

valor-p = 0.0


(f-iii) Conclua.

sugestões

A reflectir.


solução

valor-p inferior a \(\alpha = 0.01\). Assim, rejeita-se \(H_0\). Logo, sob a validade do modelo de regressão linear, é esperada que a área ardida seja (significativamente) afectada pelo número de incêndios!


(g) Com base nos seguintes gráficos efetue uma análise de resíduos para averiguar se pode considerar válidos os pressupostos da análise de regressão linear.

_images/ex5_11c.png _images/ex5_11d.png

sugestões

A reflectir.

solução

Gráfico 1: os pontos não apresentam uma distribuição

aleatória em torno da reta \(y=x\)

Gráfico 2: os pontos não apresentam o mesmo tipo de dispersão em torno do eixo do \(xx\) (reta horizontal passando pelo ordenada nula).

Estes dois gráficos colocam em causa a validade dos pressupostos de regressão. Portanto, todas as conclusão obtidas sob a validade do modelo de regressão podem não estar corretas.