histograma

O histograma é um gráfico de rectângulos justapostos que reflecte a forma da distribuição de frequências da amostra. São particularmente úteis para amostras de variáveis contínuas ou amostras com poucas observações repetidas.

Cada rectângulo tem por base um intervalo de valores contínuos, no eixo x, que se designa por classe.

Os histogramas podem ter classes de igual amplitude (o caso mais usual) mas podem ser construídos com classes de diferentes amplitudes mas, nesse caso, algum cuidado é preciso ter pois:

  • é a área que indica a maior ou menor densidade de observações e não apenas a altura; caso as classes sejam iguais, o problema não se coloca; caso as classes tenham diferentes amplitudes, então a altura do rectângulo deve ser ajustada por forma a que a área coincida com a frequência de observações na classe indicada.

construção

Para construir um histograma é necessário:

  1. Dividir o eixo em classes abrangendo todos os valores da amostra; por convenção consideran-se classes com a forma \(]a,b]\), isto é, as observações iguais a a não entram nesta classe.

  2. Contar quantos elementos da amostra estão em cada classe; ou, usando a desigmação mais apropriada, determinar a «frequência absoluta da classe».

  3. Se as classes são da mesma amplitude, a altura do rectângulo é a frequência absoluta da classe; se as classes têm diferentes amplitudes então a altura é a frequência absoluta da classe a dividir pela amplitude da classe; recorda-se: são as áreas que indicam a frequência da classe.

☞ exercício 1

Realize o exercício.

número de classes

Os histogramas dependem do número de classes considerado. Muitas classes pode produzir um histograma com demasiada irregularidade, enquantoque um histograma com poucas classes pode ocultar a forma da distribuição (e perder-se informação).

_images/aed-pdf-126.png

classes com diferentes amplitudes?

Quando as classes têm diferentes amplitudes, observa-se que alguns softwares disponíveis não produzem histogramas correctos. Por exemplo, o seguinte conjunto de dados relativos ao peso de 414 mulheres com 8 meses de gestão no Excel produziu o seguinte errado «histograma»!

_images/aed-pdf-125.png