natureza e escalas

Uma variável descritiva que caracteriza um elemento de uma população pode ser de diferentes naturezas e escalas.

O seguinte quadro resume a natureza e respectivas escalas de uma variável descritiva:

A natureza também ocorre como «tipo» de uma variável.

A secção «fronteira pouco clara: natureza discreta ou contínua?» descreve situações híbridas.

quantitativa (ou numérica)

É uma variável cujo domínio são os números reais (eventualmente, apenas os inteiros).

discreta – variável quantitativa discreta

Este tipo de natureza de variável é associado principalmente a contagens (mas não só). São exemplos:

  • número de pessoas dentro de uma loja entre as 9h e as 10h: os valores podem ser 0, 1, 2, etc

  • número de dias de sol em um ano: os valores podem ser 0, 1, 2, etc

  • número de batérias por caixa de petri:

  • número de aves num dado bando em uma hora do dia e numa dada zona

  • número de janelas numa parede

  • número de peças defeituosas por lote (assume valores de contagem)

Para todas elas os valores podem ser 0, 1, 2, etc. Na prática haverá um limite na contagem. O modelo matemático suporta qualquer valor de qualquer magnitude mesmo que tal possa ter uma probabilidade residual de ocorrer.

A palavra discreta tem dois significados que, em inglês, correspondem a duas palavras diferentes: dicrete e discreet <https://www.merriam-webster.com/dictionary/discreet>. Veja outros exemplos na área entitulada «matemática discreta».

contínua – variável quantitativa contínua

Este tipo de natureza de variável é associado principalmente a medidas que possam, pelo menos em teoria, ser tão precisas quanto a capacidade de medida de um dispositivo.

São exemplos:

  • peso (Kg) de um ser humano numa dada região

  • tempo de vida de um dado ser

  • comprimento de um robalo pescado em 1995 em águas territoriais portuguesas

propriedades das variáveis quantitivas

Uma diferença crucial entre variáveis quantitativas discretas e contínuas descreve-se com dois exemplos:

  • numa discreta não há ocorrências entre os valores 1 e 2; por exemplo, não faz sentido dizer 2,5 crias por ninhada;

  • numa contínua há uma infinidade de valores entre 1 e 2; faz sentido dizer que o peso é 1,1Kg ou 1,123Kg com tantas casas decimais quantas a máquina de pesagem consiga ou seja de interesse ao estudo.

Entre qualquer par de observações de uma variável contínua exite uma infinidade de observações possíveis.

  • Altura de um edifício – por exemplo entre 20 e 21 metros existe uma infinidade de alturas possíveis de edifícios.

Entre cada par contíguo de observações de uma variável discreta não existe qualquer valor observável.

  • Número de celulas – por exemplo, entre 3 e 4 células não existe observação possível.

escalas de uma variável quantitativa

escala de razões

  1. o valor 0 indica ausência de atributo;

  2. múltiplos fazem sentido;

  3. as diferenças fazem sentido.

escala de intervalos

  1. o valor 0 não indica a ausência de atributo (é o caso da temperatura em graus Celsius);

  2. apenas as diferenças fazem sentido.

  • As variáveis quantitativas também se designam por variáveis numéricas.

qualitativa (ou categórica)

As variáveis qualitativas, que também se designam por variáveis categóricas, referem-se a nomes, designações.

São exemplos

  • Região de Proveniência (pois assume valores intrinsecamente não-numéricos)

  • Designação da peça de fruta num cesto em uma casa portuguesa

  • Qualidade de um serviço (mau, médio, bom)

Eventualmente, pode existir codificações, por exemplo o género de uma pessoa pode aparecer como «1» e «0» num base de dados:

  • 1 - género feminimo

  • 0 - género masculino

mas a natureza e a escala da variável permanecem inalteradas: Note-se que a codificação é um mero mecaniso de redção de espaço numa base de dados.

escalas de uma variável qualitativa

escala de ordinal

  • existe uma ordem intrínseca; por exemplo, a «Qualidade de um serviço» tem intrisecamente uma ordem: mau, médio, bom.

escala de nominal

  • apenas nomes (ou designações), sem qualquer ordem; por eemplo, a designação da peça de fruta num cesto não obedece a uma ordem, ou a variável raça de cães também não.

fronteira pouco clara: natureza discreta ou contínua?

No caso das variáveis quantitativas a fronteira pode ser pouco clara.

Por vezes, os dados de uma variável contínua são registados com precisão finita sendo, na prática, tomados como de natureza discreta:
  • exemplo 1: a idade de uma pessoa, em anos.

  • exemplo 2: a idade de uma pessoa, por categorias ordenadas (novo, velho).

Os valores possíveis que uma variável discreta pode assumir representam uma gama de valores tão dispersos que, na prática, os dados observados para a variável são tratados como se fosse de natureza contínua agrupando os valores em intervalos (classes):
  • exemplo: número de habitações familiares por freguesia (há valores muito diversos neste tipo de variável).

A imagem mostra dois eixos de variáveis discretas. Porém, é visível, no segundo gráfico, que entre 0 e 1 não há observações. Já no primeiro gráfico, fica difícil indicar um intervalo onde não ocorram observações devido à elevada densidade. Neste último caso, podemos «aproximar» a variável discreta a uma contínua.

_images/ed-natureza-discreta-continua.png