ex. 5.5

Um biólogo marinho está a estudar uma espécie de pinguins e está interessado no tamanho das aves que acasalam. A variável utilizada para o efeito é o comprimento de um osso da perna que, a partir de estudos anteriores, é tida como um bom indicador da variável em causa. As medidas estão em mm e arredondadas à décima. Os dados encontram-se no ficheiro pinguins.csv.

X

17.1

18.5

19.7

16.2

21.3

19.6

Y

16.5

17.4

17.3

16.8

19.5

18.3

Pretende-se saber se o comprimento dos ossos das fêmeas (X) está correlacionado com o comprimento dos ossos dos machos (Y), nos casais desta espécie de pinguins.


(a) Efetue um gráfico de dispersão e comente.

sugestões

A reflectir.

solução

O gráfico de dispersão apresenta correlação positiva.

_images/ex5_05_dispersao.png

(b) As amostras possuem apenas 6 observações. Através dos pressupostos de aplicação dos coeficientes de Pearson e de Spearman justifique a escolha pela utilização do coeficiente de correlação de Spearman para responder à questão.

sugestões

A reflectir.

solução

Sugere-se a utilização do coeficiente de Spearman porque não há justificação da normalidade dos dados.


(c) A seguinte tabela foi produzida Os resultados obtidos foram os seguintes

Spearman's rank correlation rho
data:  dados$femea and dados$macho
S = 8, p-value = 0.05139
alternative hypothesis: true rho is greater than 0
sample estimates:
rho
0.7714286

Qual o valor do coeficiente de correlação de Spearman? O que pode concluir?

sugestões

No contexto do «output» do R, o termo rho é «coeficiente amostral de Spearman» (diz sample estimates). (Assim, este valor em «rho» é o que se representa por \(r_s\) na literatura.)

solução

O coeficiente de correlação de Spearman, amostral, \(r_s=0.771\) que indica um grau moderado de correlação monótona crescente (este coeficiente não indica se a correlação é linear).


(d) Realize o teste de hipóteses ao coeficiente de Spearman conforme indicado na tabela do R.

sugestões

A reflectir.

solução

O coeficiente de Spearman populacional \(\rho_s\) deve ser testado (o «output» do R usa «rho» que deve ser visto como \(r_s\), i.e., coef. amostral de Spearman).

A caixa indica que o teste é «true rho is grater than zero». Então o teste de hipóteses é:

\[H_0 : \rho_s =0 \quad vs \quad H_1 : \rho_s > 0\]

Sendo o valor-p (unilateral à direita) igual a 0.05139 rejeita-se H0, por exemplo, ao nível de significância de 10%. Assume-se que a correlação é significativa e crescente.