quantil amostral
O quantil amostral x de ordem p, que se designa por x_{p}, descreve-se, em linguagem corrente não rigorosa, por:
valor x até ao qual se observam pelo menos p \times 100\% observações da amostra ordenada
sendo p \in [0;1].
Por exemplo, x_{0.30} = 25 indica que: «pelo menos 30% das observações são iguais ou inferiores ao valor 25». (A percentagem 30% é para trás do valor do quantil.)
Mas uma definição mais precisa é necessária. É a conjugação obrigatória de duas partes:
à esquerda de x_p está uma proporção não inferior a p dos valores mais reduzidos da amostra ordenada;
à direita de x_p está uma proporção não inferior a (1-p) dos valores mais elevados da amostra ordenada.
Veja o exempo no quartil amostral que explica a necessidade destas duas partes.
descrição
Começando com um exemplo: considere a seguinte amostra ordenada de n=10 elementos:
(10, 20, 20, 25, 40, 40, 40, 50, 60, 90)
Nesta amostra, diz-se que um quantil de ordem 0.30 é, por exemplo, x_{0.30} = 25 verificando que
pelo menos 30% das observações são iguais ou inferiores ao valor 25 (à esquerda de 25, contando com o valor 25, ocorrem mais de 30% de observações)
mas também deve ser verificado que
pelo menos 70% das observações são iguais ou superiores ao valor 25 (à direita de 25, contando com o valor 25, ocorrem 70% das observações).
Há mais que um quantil de ordem p=0.3:
o valor 20.2 também é um quantil de ordem p=0.30 pois 30% das observações são iguais ou inferiores a 20.2 e 70% das observações são iguais ou superiores a 20.2.
valores alternativos de quantis ocorrem num intervalo entre duas observações distintas (ou infinito no caso dos extremos).
definição e notação
Um quantil de ordem p (com 0 \le p \le 1) é um valor, x_p, que divide a amostra ordenada em duas partes, tal que
à esquerda de x_p está uma proporção não inferior a p dos valores mais reduzidos da amostra
e, também deve ser verificado,
à direita uma proporção não inferior a (1-p) dos valores mais elevados da amostra.
Dizer que x_p é um quantil de ordem p significa que:
pelo menos p \times100\% das observações da amostra são menores ou iguais a x_p e
pelo menos (1-p)\times 100\% das observações são maiores ou iguais a x_p.
Propriedade: há mais que um quantil de ordem p. Os softwares, calculadoras ou expressões em formulários podem determinar valores diferentes para um quantil, todos eles corretos, e dentro de um intervalo possível. Uns serão mais à esquerda, outros mais ao centro e outros mais à direita. Depende da maneira como se interpreta.
cálculo de quantis
A seguinte expressão permite calcular um quantil de ordem p
Se np não é inteiro, escolhe-se o inteiro seguinte para posição na amostra ordenada;
Se np é inteiro, faz-se média entre os dois valores consecutivos na amostra ordenada, a começar em np
exemplo 1
O valor do quantil de ordem 1/4, i.e. x_{1/4}, na seguinte amostra ordenada
calcula-se np=10 \times 0.25=2.5 com n=10 e p=1/4, e não sendo inteiro,
De facto, existem:
30% de observações iguais ou inferiores a 1 e
90% de observações iguais ou superiores a 1.
verificando a definição:
pelo menos 25\% das observações da amostra são menores ou iguais a 1 e
pelo menos 75\% das observações são maiores ou iguais a 1.
Note-se que o valor 1.5 também é um quantil de ordem 1/4 pois verifica a definição.
exemplo 2
O valor do quantil de ordem 1/4, i.e. x_{1/4}, na seguinte amostra ordenada
calcula-se np=10 \times 0.25=2.5 com n=10 e p=1/4, e não sendo inteiro,
De facto, existem:
90% de observações iguais ou inferiores a 1 e
90% de observações iguais ou superiores a 1.
que verifica a definição. A percentagem 90% surge porque há muita repetição de 1s na amostra.
quantis mais frequentes
Consoante o valor de p alguns quantis recebem designações próprias.
Quartil amostral (ver +)
Quando p \in \{1/4, 2/4, 3/4\} usa-se a notação Q_1 (1º quartil), Q_2 (2º quartil) e Q_3 (3º quartil).
O quartil Q_2 também se designa por mediana amostral.
Decis
Quando p \in \{1/10, 2/10, \cdots, 9/10\} usa-se a notação D_1 (1º decil) até ao D_9 (9º decil).
Percentis
Quando p \in \{1/100, 2/100, \cdots, 99/100\} com notação P_1 (1º percentil) até ao P_{99} (99º percentil).
R Project
A função quantile() calcula um qualquer quantil:
dados = c(0, 1, 1, 1, 1, 1, 1, 1, 1, 2)
quantile(dados, 0.25)
que resulta em
25%
1
O método de cálculo da função quantile() é diferente do algoritmo explicitado acima.
Ver também: quartis em R.