ex. 1.5
Considere o seguinte conjunto de dados de índices de massa corporal canino (IMCC), Kg/m, recolhidos a partir de uma amostra casual de 10 cães:
IMCC |
20 |
23 |
50 |
32 |
34 |
23 |
26 |
27 |
25 |
32 |
(a) Relativamente à caixa de bigodes associada a este conjunto de dados qual das seguintes afirmaçõe sé correta (resolva sem os quartis da calculadora):
Existe uma observação atípica e o bigode que se observa do lado direito tem comprimento igual a 2.
Existe uma observação atípica e o bigode que se observa do lado direito tem comprimento igual a 13.5.
Não existe uma observação atípica e o bigode que se observa do lado direito vai até ao valor 50.
Não existe uma observação atípica e o comprimento da caixa (sem os ditos bigodes é igual a 9.
☞ solução
A afirmação (1) é a correta pois \(34-Q_3=2\) e existe uma única observação atípica (valor 50).
Segue-se a justificação completa. A amostra ordenada é:
Q1: n=10, p=0.25, np=2.5 não é inteiro, \(x_{(floor(2.5+1))}=x_{(3)}=23\)
Q2: n=10, p=0.50, np=5 é inteiro, \((x_{(5)}+x_{(6)})/2=(26+27)/2=26.5\)
Q3: n=10, p=0.75, np=7.5 não é inteiro, \(x_{(floor(7.5+1))}=x_{(8)}=32\).
(Nota: no caso do algorimos só para a mediana, como n=10 é par então faz-se média com os valores nas posições 5 e 6 como acima.)
Assim, min=20, \(Q_1=23\), \(m_e=26.5\), \(Q_3=32\) e máx=50.
As barreiras são: -4, 9.5, 45.5, e 59 e destas só se marca a barreira 45.4.
Assim, a afirmação (1) é a correta pois \(34-Q_3=2\) e existe uma única observação atípica (valor 50).
(b) Indique o valor à direita do qual se encontram apenas 25% dos valores observados.
☞ solução
À direita de 32 ocorrem 25% das observações sendo necessário considerar a amostra ordenada:
(c) Complete a frase:
☞ solução
A amostra ordenada é:
e assim, a resposta é 23 pois n=10, p=0.2, np=2, logo \(P_{20}=(x_{(2)} + x_{(3)})/2=(23+23)/2=23\).
☞ mostrar código R
x = c(20, 23, 23, 25, 26, 26, 27, 32, 32, 34, 50)
q = quantile(x, prob=c(0.25,0.5,0.75) )
q1 = q[["25%"]] #ou: q1 = as.numeric( quantile(x,0.25) )
med= q[["50%"]] #ou: med = as.numeric( quantile(x,0.50) )
q3 = q[["75%"]] #ou: q3 = as.numeric( quantile(x,0.75) )
h = q3 - q1 #distância interquartil
barreiras = c(q1 - 3*h, q1 - 1.5*h, q3 + 1.5*h, q3 + 3*h)
barreiras #para mostrar
boxplot(x,horizontal=TRUE)