função massa de probabilidade

A função massa de probabilidade, f(x), permite atribuir uma probabilidade a cada distinto valor x de uma v.a. discreta.

Exemplo simplista de um mundo não real: se X=0 se «menino» e X=1 se «menina» então f(0)=0.5 e f(1)=0.5.

função f(x)

A função massa de probabilidade (f.m.p.) designa-se por f(x) e define-se por:

f(x) = P(X=x)

para qualquer valor x resultante de uma v.a. X que tome valores num conjunto discreto, possivelmente infinito.

Axiomas:

  • a soma de f(x) para todos os distintos x tem que ser 1;

  • 0 \le f(x) \le 1 para qualquer valor x;

  • f(x)=0 sempre que x não seja um resultado observável da v.a. X.

uma distribuição genérica

Considere o seguinte exemplo em que

  • X = «número de crias de um animal adulto em três anos»

sendo a distribuição discreta determinada pela tabela (ou função):

x

0

1

2

3

4

P(X=x)

0.03

0.19

0.44

0.30

0.04

Sempre que uma distribuição não tem nome dizemos que é genérica.

Verificação dos axiomas:

  • 0.03 + 0.19 + 0.44 + 0.30 + 0.04 = 1

  • 0 \le f(x) \le 1 para qualquer valor x, ou seja, uma probabilidade não pode ser negativa e uma probabilidade não pode ser superior a 1;

  • considera-se que f(x)=0 para qualquer valor fora do conjunto \{0,1,2,3,4\}.

média populacional, E(X)

No caso discreto, a medida de localização central designada por média populacional obtém-se assim:

\mu = E[X] = \sum_{i} x_i f(x_i)

isto é, uma soma pesada em que cada distinto elemento x_i tem um peso correspondente f(x_i)=P(X=x_i).

No exemplo apresentado:

\mu = E[X] = 0 \times 0.03 + 1 \times 0.19 + 2 \times 0.44 + 3 \times 0.30 + 4 \times 0.04 = 2.13

Interpretação: em média um adulto gera 2.13 crias; claro que não se pode gerar «0.13 crias» mas esta medida, a média, é um conceito abstrato que serve para estudar uma tendência. Por exemplo, o número médio de filhos por casal humano tem vindo a descer na europa.

variância populacional, Var(X)

A variância populacional é uma medida de dispersão em torno da média populacional. A variância é também uma média mas dos afastamentos de \mu ao quadrado por forma a remover o sinal -/+.

No caso discreto, a variância populacional obtém-se assim:

\sigma^2 = Var[X] = \sum_{i} (x_i - \mu)^2 f(x_i)

isto é, uma soma pesada em que cada distinto elemento (x_i - \mu)^2 tem um peso correspondente f(x_i)=P(X=x_i).

O desvio padrão populacional é \sigma = \sqrt{Var[X]}.

No exemplo apresentado:

\begin{split}\begin{array}{rl} \sigma^2 = Var[X] = & (0-2.13)^2 \times 0.03 + \\ & (1-2.13)^2 \times 0.19 + (2-2.13)^2 \times 0.44 + \\ & (3-2.13)^2 \times 0.30 + (4-2.13)^2 \times 0.04 \\ & \approx 0.76 \end{array}\end{split}

O desvio padrão é \sigma\approx0.87.

Interpretação: a baixa medida de dispersão \sigma=0.87 revela que o número de crias não se afasta muito da média 2.13, no caso desta população genérica.