quantil amostral

O quantil amostral \(x\) de ordem p, que se designa por \(x_{p}\), descreve-se, em linguagem corrente não rigorosa, por:

  • valor \(x\) até ao qual se observam pelo menos \(p \times 100\%\) observações da amostra ordenada

  • sendo \(p \in [0;1]\).

Por exemplo, \(x_{0.30} = 25\) indica que: «pelo menos 30% das observações são iguais ou inferiores ao valor 25». (A percentagem 30% é para trás do valor do quantil.)

Mas uma definição mais precisa é necessária. É a conjugação obrigatória de duas partes:

  • à esquerda de \(x_p\) está uma proporção não inferior a \(p\) dos valores mais reduzidos da amostra ordenada;

  • à direita de \(x_p\) está uma proporção não inferior a \((1-p)\) dos valores mais elevados da amostra ordenada.

Veja o exempo no quartil amostral que explica a necessidade destas duas partes.

descrição

Começando com um exemplo: considere a seguinte amostra ordenada de \(n=10\) elementos:

\((10, 20, 20, 25, 40, 40, 40, 50, 60, 90)\)

Nesta amostra, diz-se que um quantil de ordem 0.30 é, por exemplo, \(x_{0.30} = 25\) verificando que

  • pelo menos 30% das observações são iguais ou inferiores ao valor 25 (à esquerda de 25, contando com o valor 25, ocorrem mais de 30% de observações)

  • mas também deve ser verificado que

  • pelo menos 70% das observações são iguais ou superiores ao valor 25 (à direita de 25, contando com o valor 25, ocorrem 70% das observações).

Há mais que um quantil de ordem \(p=0.3\):

  • o valor 20.2 também é um quantil de ordem \(p=0.30\) pois 30% das observações são iguais ou inferiores a 20.2 e 70% das observações são iguais ou superiores a 20.2.

  • valores alternativos de quantis ocorrem num intervalo entre duas observações distintas (ou infinito no caso dos extremos).

definição e notação

  • Um quantil de ordem \(p\) (com \(0 \le p \le 1\)) é um valor, \(x_p\), que divide a amostra ordenada em duas partes, tal que

    • à esquerda de \(x_p\) está uma proporção não inferior a \(p\) dos valores mais reduzidos da amostra

    • e, também deve ser verificado,

    • à direita uma proporção não inferior a \((1-p)\) dos valores mais elevados da amostra.

  • Dizer que \(x_p\) é um quantil de ordem \(p\) significa que:

    • pelo menos \(p \times100\%\) das observações da amostra são menores ou iguais a \(x_p\) e

    • pelo menos \((1-p)\times 100\%\) das observações são maiores ou iguais a \(x_p\).

Propriedade: há mais que um quantil de ordem p. Os softwares, calculadoras ou expressões em formulários podem determinar valores diferentes para um quantil, todos eles corretos, e dentro de um intervalo possível. Uns serão mais à esquerda, outros mais ao centro e outros mais à direita. Depende da maneira como se interpreta.

cálculo de quantis

A seguinte expressão permite calcular um quantil de ordem \(p\)

\[\begin{split}x_p = \left\{ \begin{array}{l} x_{\left( \lfloor np+1 \rfloor \right)} \text{ se np não inteiro}\\ \displaystyle \frac{x_{(np)} + x_{(np+1)}}{2} \text{ se np inteiro} \end{array} \right.\end{split}\]
  • Se \(np\) não é inteiro, escolhe-se o inteiro seguinte para posição na amostra ordenada;

  • Se \(np\) é inteiro, faz-se média entre os dois valores consecutivos na amostra ordenada, a começar em \(np\)

exemplo 1

O valor do quantil de ordem \(1/4\), i.e. \(x_{1/4}\), na seguinte amostra ordenada

\[\begin{split}\begin{array}{cccccccccc} x_{(1)} & x_{(2)} & x_{(3)} & x_{(4)} & x_{(5)} & x_{(6)} & x_{(7)} & x_{(8)} & x_{(9)} & x_{(10)}\\ \hline 0 & 1 & 1 & 2 & 2 & 3 & 4 & 4 & 5 & 6 \\ \end{array}\end{split}\]

calcula-se \(np=10 \times 0.25=2.5\) com \(n=10\) e \(p=1/4\), e não sendo inteiro,

\[x_{1/4} = x_{(\lfloor 2.5+1 \rfloor)} = x_{(3)} = 1\]

De facto, existem:

  • 30% de observações iguais ou inferiores a 1 e

  • 90% de observações iguais ou superiores a 1.

verificando a definição:

  • pelo menos \(25\%\) das observações da amostra são menores ou iguais a \(1\) e

  • pelo menos \(75\%\) das observações são maiores ou iguais a \(1\).

Note-se que o valor 1.5 também é um quantil de ordem 1/4 pois verifica a definição.

exemplo 2

O valor do quantil de ordem \(1/4\), i.e. \(x_{1/4}\), na seguinte amostra ordenada

\[\begin{split}\begin{array}{cccccccccc} x_{(1)} & x_{(2)} & x_{(3)} & x_{(4)} & x_{(5)} & x_{(6)} & x_{(7)} & x_{(8)} & x_{(9)} & x_{(10)}\\ \hline 0 & 1 & 1 & 1 & 1 & 1 & 1 & 1 & 1 & 2 \\ \end{array}\end{split}\]

calcula-se \(np=10 \times 0.25=2.5\) com \(n=10\) e \(p=1/4\), e não sendo inteiro,

\[x_{1/4} = x_{(\lfloor 2.5+1 \rfloor)} = x_{(3)} = 1\]

De facto, existem:

  • 90% de observações iguais ou inferiores a 1 e

  • 90% de observações iguais ou superiores a 1.

que verifica a definição. A percentagem 90% surge porque há muita repetição de 1s na amostra.

quantis mais frequentes

Consoante o valor de \(p\) alguns quantis recebem designações próprias.

Quartil amostral (ver +)

Quando \(p \in \{1/4, 2/4, 3/4\}\) usa-se a notação \(Q_1\) (1º quartil), \(Q_2\) (2º quartil) e \(Q_3\) (3º quartil).

O quartil \(Q_2\) também se designa por mediana amostral.

Decis

Quando \(p \in \{1/10, 2/10, \cdots, 9/10\}\) usa-se a notação \(D_1\) (1º decil) até ao \(D_9\) (9º decil).

Percentis

Quando \(p \in \{1/100, 2/100, \cdots, 99/100\}\) com notação \(P_1\) (1º percentil) até ao \(P_{99}\) (99º percentil).

R Project

A função quantile() calcula um qualquer quantil:

dados = c(0, 1, 1, 1, 1, 1, 1, 1, 1, 2)
quantile(dados, 0.25)

que resulta em

25%
  1

O método de cálculo da função quantile() é diferente do algoritmo explicitado acima.

Ver também: quartis em R.