ex. 1.5

Considere o seguinte conjunto de dados de índices de massa corporal canino (IMCC), Kg/m, recolhidos a partir de uma amostra casual de 10 cães:

IMCC

20

23

50

32

34

23

26

27

25

32

(a) Relativamente à caixa de bigodes associada a este conjunto de dados qual das seguintes afirmaçõe sé correta (resolva sem os quartis da calculadora):

  1. Existe uma observação atípica e o bigode que se observa do lado direito tem comprimento igual a 2.

  2. Existe uma observação atípica e o bigode que se observa do lado direito tem comprimento igual a 13.5.

  3. Não existe uma observação atípica e o bigode que se observa do lado direito vai até ao valor 50.

  4. Não existe uma observação atípica e o comprimento da caixa (sem os ditos bigodes é igual a 9.

solução

A afirmação (1) é a correta pois \(34-Q_3=2\) e existe uma única observação atípica (valor 50).

Segue-se a justificação completa. A amostra ordenada é:

20, 23, 23, 25, 26, 27, 32, 32, 34, 50
  • Q1: n=10, p=0.25, np=2.5 não é inteiro, \(x_{(floor(2.5+1))}=x_{(3)}=23\)

  • Q2: n=10, p=0.50, np=5 é inteiro, \((x_{(5)}+x_{(6)})/2=(26+27)/2=26.5\)

  • Q3: n=10, p=0.75, np=7.5 não é inteiro, \(x_{(floor(7.5+1))}=x_{(8)}=32\).

(Nota: no caso do algorimos só para a mediana, como n=10 é par então faz-se média com os valores nas posições 5 e 6 como acima.)

Assim, min=20, \(Q_1=23\), \(m_e=26.5\), \(Q_3=32\) e máx=50.

As barreiras são: -4, 9.5, 45.5, e 59 e destas só se marca a barreira 45.4.

Assim, a afirmação (1) é a correta pois \(34-Q_3=2\) e existe uma única observação atípica (valor 50).


(b) Indique o valor à direita do qual se encontram apenas 25% dos valores observados.

solução

À direita de 32 ocorrem 25% das observações sendo necessário considerar a amostra ordenada:

20, 23, 23, 25, 26, 27, 32, 32, 34, 50

(c) Complete a frase:

Pelo menos 20% dos cães têm IMCC inferior (ou igual) a _________.

solução

A amostra ordenada é:

20, 23, 23, 25, 26, 27, 32, 32, 34, 50

e assim, a resposta é 23 pois n=10, p=0.2, np=2, logo \(P_{20}=(x_{(2)} + x_{(3)})/2=(23+23)/2=23\).


mostrar código R

x = c(20, 23, 23, 25, 26, 26, 27, 32, 32, 34, 50)
q = quantile(x, prob=c(0.25,0.5,0.75) )
q1 = q[["25%"]] #ou: q1  = as.numeric( quantile(x,0.25) )
med= q[["50%"]] #ou: med = as.numeric( quantile(x,0.50) )
q3 = q[["75%"]] #ou: q3  = as.numeric( quantile(x,0.75) )
h = q3 - q1 #distância interquartil
barreiras = c(q1 - 3*h, q1 - 1.5*h, q3 + 1.5*h, q3 + 3*h)
barreiras  #para mostrar
boxplot(x,horizontal=TRUE)