quantil amostral
O quantil amostral \(x\) de ordem p, que se designa por \(x_{p}\), descreve-se, em linguagem corrente não rigorosa, por:
valor \(x\) até ao qual se observam pelo menos \(p \times 100\%\) observações da amostra ordenada
sendo \(p \in [0;1]\).
Por exemplo, \(x_{0.30} = 25\) indica que: «pelo menos 30% das observações são iguais ou inferiores ao valor 25». (A percentagem 30% é para trás do valor do quantil.)
Mas uma definição mais precisa é necessária. É a conjugação obrigatória de duas partes:
à esquerda de \(x_p\) está uma proporção não inferior a \(p\) dos valores mais reduzidos da amostra ordenada;
à direita de \(x_p\) está uma proporção não inferior a \((1-p)\) dos valores mais elevados da amostra ordenada.
Veja o exempo no quartil amostral que explica a necessidade destas duas partes.
descrição
Começando com um exemplo: considere a seguinte amostra ordenada de \(n=10\) elementos:
\((10, 20, 20, 25, 40, 40, 40, 50, 60, 90)\)
Nesta amostra, diz-se que um quantil de ordem 0.30 é, por exemplo, \(x_{0.30} = 25\) verificando que
pelo menos 30% das observações são iguais ou inferiores ao valor 25 (à esquerda de 25, contando com o valor 25, ocorrem mais de 30% de observações)
mas também deve ser verificado que
pelo menos 70% das observações são iguais ou superiores ao valor 25 (à direita de 25, contando com o valor 25, ocorrem 70% das observações).
Há mais que um quantil de ordem \(p=0.3\):
o valor 20.2 também é um quantil de ordem \(p=0.30\) pois 30% das observações são iguais ou inferiores a 20.2 e 70% das observações são iguais ou superiores a 20.2.
valores alternativos de quantis ocorrem num intervalo entre duas observações distintas (ou infinito no caso dos extremos).
definição e notação
Um quantil de ordem \(p\) (com \(0 \le p \le 1\)) é um valor, \(x_p\), que divide a amostra ordenada em duas partes, tal que
à esquerda de \(x_p\) está uma proporção não inferior a \(p\) dos valores mais reduzidos da amostra
e, também deve ser verificado,
à direita uma proporção não inferior a \((1-p)\) dos valores mais elevados da amostra.
Dizer que \(x_p\) é um quantil de ordem \(p\) significa que:
pelo menos \(p \times100\%\) das observações da amostra são menores ou iguais a \(x_p\) e
pelo menos \((1-p)\times 100\%\) das observações são maiores ou iguais a \(x_p\).
Propriedade: há mais que um quantil de ordem p. Os softwares, calculadoras ou expressões em formulários podem determinar valores diferentes para um quantil, todos eles corretos, e dentro de um intervalo possível. Uns serão mais à esquerda, outros mais ao centro e outros mais à direita. Depende da maneira como se interpreta.
cálculo de quantis
A seguinte expressão permite calcular um quantil de ordem \(p\)
Se \(np\) não é inteiro, escolhe-se o inteiro seguinte para posição na amostra ordenada;
Se \(np\) é inteiro, faz-se média entre os dois valores consecutivos na amostra ordenada, a começar em \(np\)
exemplo 1
O valor do quantil de ordem \(1/4\), i.e. \(x_{1/4}\), na seguinte amostra ordenada
calcula-se \(np=10 \times 0.25=2.5\) com \(n=10\) e \(p=1/4\), e não sendo inteiro,
De facto, existem:
30% de observações iguais ou inferiores a 1 e
90% de observações iguais ou superiores a 1.
verificando a definição:
pelo menos \(25\%\) das observações da amostra são menores ou iguais a \(1\) e
pelo menos \(75\%\) das observações são maiores ou iguais a \(1\).
Note-se que o valor 1.5 também é um quantil de ordem 1/4 pois verifica a definição.
exemplo 2
O valor do quantil de ordem \(1/4\), i.e. \(x_{1/4}\), na seguinte amostra ordenada
calcula-se \(np=10 \times 0.25=2.5\) com \(n=10\) e \(p=1/4\), e não sendo inteiro,
De facto, existem:
90% de observações iguais ou inferiores a 1 e
90% de observações iguais ou superiores a 1.
que verifica a definição. A percentagem 90% surge porque há muita repetição de 1s na amostra.
quantis mais frequentes
Consoante o valor de \(p\) alguns quantis recebem designações próprias.
Quartil amostral (ver +)
Quando \(p \in \{1/4, 2/4, 3/4\}\) usa-se a notação \(Q_1\) (1º quartil), \(Q_2\) (2º quartil) e \(Q_3\) (3º quartil).
O quartil \(Q_2\) também se designa por mediana amostral.
Decis
Quando \(p \in \{1/10, 2/10, \cdots, 9/10\}\) usa-se a notação \(D_1\) (1º decil) até ao \(D_9\) (9º decil).
Percentis
Quando \(p \in \{1/100, 2/100, \cdots, 99/100\}\) com notação \(P_1\) (1º percentil) até ao \(P_{99}\) (99º percentil).
R Project
A função quantile() calcula um qualquer quantil:
dados = c(0, 1, 1, 1, 1, 1, 1, 1, 1, 2)
quantile(dados, 0.25)
que resulta em
25%
1
O método de cálculo da função quantile() é diferente do algoritmo explicitado acima.
Ver também: quartis em R.