função massa de probabilidade

A função massa de probabilidade, \(f(x)\), permite atribuir uma probabilidade a cada distinto valor x de uma v.a. discreta.

Exemplo simplista de um mundo não real: se X=0 se «menino» e X=1 se «menina» então \(f(0)=0.5\) e \(f(1)=0.5\).

função \(f(x)\)

A função massa de probabilidade (f.m.p.) designa-se por \(f(x)\) e define-se por:

\[f(x) = P(X=x)\]

para qualquer valor x resultante de uma v.a. \(X\) que tome valores num conjunto discreto, possivelmente infinito.

Axiomas:

  • a soma de \(f(x)\) para todos os distintos x tem que ser 1;

  • \(0 \le f(x) \le 1\) para qualquer valor x;

  • \(f(x)=0\) sempre que x não seja um resultado observável da v.a. X.

uma distribuição genérica

Considere o seguinte exemplo em que

  • X = «número de crias de um animal adulto em três anos»

sendo a distribuição discreta determinada pela tabela (ou função):

x

0

1

2

3

4

P(X=x)

0.03

0.19

0.44

0.30

0.04

Sempre que uma distribuição não tem nome dizemos que é genérica.

Verificação dos axiomas:

  • \(0.03 + 0.19 + 0.44 + 0.30 + 0.04 = 1\)

  • \(0 \le f(x) \le 1\) para qualquer valor x, ou seja, uma probabilidade não pode ser negativa e uma probabilidade não pode ser superior a 1;

  • considera-se que \(f(x)=0\) para qualquer valor fora do conjunto \(\{0,1,2,3,4\}\).

média populacional, \(E(X)\)

No caso discreto, a medida de localização central designada por média populacional obtém-se assim:

\[\mu = E[X] = \sum_{i} x_i f(x_i)\]

isto é, uma soma pesada em que cada distinto elemento \(x_i\) tem um peso correspondente \(f(x_i)=P(X=x_i)\).

No exemplo apresentado:

\[\mu = E[X] = 0 \times 0.03 + 1 \times 0.19 + 2 \times 0.44 + 3 \times 0.30 + 4 \times 0.04 = 2.13\]

Interpretação: em média um adulto gera 2.13 crias; claro que não se pode gerar «0.13 crias» mas esta medida, a média, é um conceito abstrato que serve para estudar uma tendência. Por exemplo, o número médio de filhos por casal humano tem vindo a descer na europa.

variância populacional, \(Var(X)\)

A variância populacional é uma medida de dispersão em torno da média populacional. A variância é também uma média mas dos afastamentos de \(\mu\) ao quadrado por forma a remover o sinal -/+.

No caso discreto, a variância populacional obtém-se assim:

\[\sigma^2 = Var[X] = \sum_{i} (x_i - \mu)^2 f(x_i)\]

isto é, uma soma pesada em que cada distinto elemento \((x_i - \mu)^2\) tem um peso correspondente \(f(x_i)=P(X=x_i)\).

O desvio padrão populacional é \(\sigma = \sqrt{Var[X]}\).

No exemplo apresentado:

\[\begin{split}\begin{array}{rl} \sigma^2 = Var[X] = & (0-2.13)^2 \times 0.03 + \\ & (1-2.13)^2 \times 0.19 + (2-2.13)^2 \times 0.44 + \\ & (3-2.13)^2 \times 0.30 + (4-2.13)^2 \times 0.04 \\ & \approx 0.76 \end{array}\end{split}\]

O desvio padrão é \(\sigma\approx0.87\).

Interpretação: a baixa medida de dispersão \(\sigma=0.87\) revela que o número de crias não se afasta muito da média 2.13, no caso desta população genérica.