quantil amostral

O quantil amostral x de ordem p, que se designa por x_{p}, descreve-se, em linguagem corrente não rigorosa, por:

  • valor x até ao qual se observam pelo menos p \times 100\% observações da amostra ordenada

  • sendo p \in [0;1].

Por exemplo, x_{0.30} = 25 indica que: «pelo menos 30% das observações são iguais ou inferiores ao valor 25». (A percentagem 30% é para trás do valor do quantil.)

Mas uma definição mais precisa é necessária. É a conjugação obrigatória de duas partes:

  • à esquerda de x_p está uma proporção não inferior a p dos valores mais reduzidos da amostra ordenada;

  • à direita de x_p está uma proporção não inferior a (1-p) dos valores mais elevados da amostra ordenada.

Veja o exempo no quartil amostral que explica a necessidade destas duas partes.

descrição

Começando com um exemplo: considere a seguinte amostra ordenada de n=10 elementos:

(10, 20, 20, 25, 40, 40, 40, 50, 60, 90)

Nesta amostra, diz-se que um quantil de ordem 0.30 é, por exemplo, x_{0.30} = 25 verificando que

  • pelo menos 30% das observações são iguais ou inferiores ao valor 25 (à esquerda de 25, contando com o valor 25, ocorrem mais de 30% de observações)

  • mas também deve ser verificado que

  • pelo menos 70% das observações são iguais ou superiores ao valor 25 (à direita de 25, contando com o valor 25, ocorrem 70% das observações).

Há mais que um quantil de ordem p=0.3:

  • o valor 20.2 também é um quantil de ordem p=0.30 pois 30% das observações são iguais ou inferiores a 20.2 e 70% das observações são iguais ou superiores a 20.2.

  • valores alternativos de quantis ocorrem num intervalo entre duas observações distintas (ou infinito no caso dos extremos).

definição e notação

  • Um quantil de ordem p (com 0 \le p \le 1) é um valor, x_p, que divide a amostra ordenada em duas partes, tal que

    • à esquerda de x_p está uma proporção não inferior a p dos valores mais reduzidos da amostra

    • e, também deve ser verificado,

    • à direita uma proporção não inferior a (1-p) dos valores mais elevados da amostra.

  • Dizer que x_p é um quantil de ordem p significa que:

    • pelo menos p \times100\% das observações da amostra são menores ou iguais a x_p e

    • pelo menos (1-p)\times 100\% das observações são maiores ou iguais a x_p.

Propriedade: há mais que um quantil de ordem p. Os softwares, calculadoras ou expressões em formulários podem determinar valores diferentes para um quantil, todos eles corretos, e dentro de um intervalo possível. Uns serão mais à esquerda, outros mais ao centro e outros mais à direita. Depende da maneira como se interpreta.

cálculo de quantis

A seguinte expressão permite calcular um quantil de ordem p

\begin{split}x_p = \left\{ \begin{array}{l} x_{\left( \lfloor np+1 \rfloor \right)} \text{ se np não inteiro}\\ \displaystyle \frac{x_{(np)} + x_{(np+1)}}{2} \text{ se np inteiro} \end{array} \right.\end{split}
  • Se np não é inteiro, escolhe-se o inteiro seguinte para posição na amostra ordenada;

  • Se np é inteiro, faz-se média entre os dois valores consecutivos na amostra ordenada, a começar em np

exemplo 1

O valor do quantil de ordem 1/4, i.e. x_{1/4}, na seguinte amostra ordenada

\begin{split}\begin{array}{cccccccccc} x_{(1)} & x_{(2)} & x_{(3)} & x_{(4)} & x_{(5)} & x_{(6)} & x_{(7)} & x_{(8)} & x_{(9)} & x_{(10)}\\ \hline 0 & 1 & 1 & 2 & 2 & 3 & 4 & 4 & 5 & 6 \\ \end{array}\end{split}

calcula-se np=10 \times 0.25=2.5 com n=10 e p=1/4, e não sendo inteiro,

x_{1/4} = x_{(\lfloor 2.5+1 \rfloor)} = x_{(3)} = 1

De facto, existem:

  • 30% de observações iguais ou inferiores a 1 e

  • 90% de observações iguais ou superiores a 1.

verificando a definição:

  • pelo menos 25\% das observações da amostra são menores ou iguais a 1 e

  • pelo menos 75\% das observações são maiores ou iguais a 1.

Note-se que o valor 1.5 também é um quantil de ordem 1/4 pois verifica a definição.

exemplo 2

O valor do quantil de ordem 1/4, i.e. x_{1/4}, na seguinte amostra ordenada

\begin{split}\begin{array}{cccccccccc} x_{(1)} & x_{(2)} & x_{(3)} & x_{(4)} & x_{(5)} & x_{(6)} & x_{(7)} & x_{(8)} & x_{(9)} & x_{(10)}\\ \hline 0 & 1 & 1 & 1 & 1 & 1 & 1 & 1 & 1 & 2 \\ \end{array}\end{split}

calcula-se np=10 \times 0.25=2.5 com n=10 e p=1/4, e não sendo inteiro,

x_{1/4} = x_{(\lfloor 2.5+1 \rfloor)} = x_{(3)} = 1

De facto, existem:

  • 90% de observações iguais ou inferiores a 1 e

  • 90% de observações iguais ou superiores a 1.

que verifica a definição. A percentagem 90% surge porque há muita repetição de 1s na amostra.

quantis mais frequentes

Consoante o valor de p alguns quantis recebem designações próprias.

Quartil amostral (ver +)

Quando p \in \{1/4, 2/4, 3/4\} usa-se a notação Q_1 (1º quartil), Q_2 (2º quartil) e Q_3 (3º quartil).

O quartil Q_2 também se designa por mediana amostral.

Decis

Quando p \in \{1/10, 2/10, \cdots, 9/10\} usa-se a notação D_1 (1º decil) até ao D_9 (9º decil).

Percentis

Quando p \in \{1/100, 2/100, \cdots, 99/100\} com notação P_1 (1º percentil) até ao P_{99} (99º percentil).

R Project

A função quantile() calcula um qualquer quantil:

dados = c(0, 1, 1, 1, 1, 1, 1, 1, 1, 2)
quantile(dados, 0.25)

que resulta em

25%
  1

O método de cálculo da função quantile() é diferente do algoritmo explicitado acima.

Ver também: quartis em R.