Considere a amostra: 1.0, 1.0, 2.1, 4.1, 5.0, 6.0.
A amostra tem dimensão 6. De modo sumariado, a função de distribuição empírica
pode ter este aspeto:
para x = 1.0 então F_6(1.0)=2/6 \approx 0.33 (33% das observações da amostra são iguais ou menores que 1)
para x = 2.1 então F_6(2.1)=3/6 = 0.5 (50% das observações da amostra são iguais ou menores que 2.1)
para x = 4.1 então F_6(4.1)=4/6 \approx 0.66 (66% das observações da amostra são iguais ou menores que 4.1)
para x = 5.0 então F_6(5.0)=5/6 \approx 0.83 (83% das observações da amostra são iguais ou menores que 5)
para x = 6.0 então F_6(6.0)=1 (100% das observações são iguais ou inferiores a 6)
A amostra tem dimensão 6.
F_6(0)=0 pois 0 valores na amostra são iguais ou inferiores a 0.
F_6(2.5)=3/6=0.5 pois 3 valores na amostra são iguais ou inferiores a 2.5.
F_6(7) pois todos os valores na amostra são iguais ou inferiores a 7.
A próxima alínea generaliza esta noção.
A função deve ser definida para qualquer valor no eixo xx: \mathbb{R}.
Começa-se por definir os intervalos, em geral abertos à direita [a,b[:
x < 1 - de -\infty até antes do primeiro valor observado;
1 \le x < 2.1 - do 1º valor observado e ao 2º valor observado (aberto);
2.1 \le x < 4.1 - do 2º valor observado e ao 3º valor observado (aberto);
4.1 \le x < 5 - etc
5 \le x \le 6 - etc
x \ge 6 - do último valor observado até +\infty
Com rigor matemático, esta função escreve-se assim:
\begin{split}F(x) = \left\{
\begin{array}{ll}
0 & \text{ se } x < 1 \\
0.33 & \text{ se } 1 \le x < 2.1\\
0.5 & \text{ se } 2.1 \le x < 4.1\\
0.66 & \text{ se } 4.1 \le x < 5\\
0.83 & \text{ se } 5 \le x 6\\
1 & \text{ se } x \ge 6
\end{array}
\right.\end{split}