teorema do limite central

  • TLC = Teorema do Limite Central

O TLC tem interesse prático especial porque se aplica a uma população caracterizada por uma v.a. com distribuição genérica, ou outra desde que não seja a distribuição normal.

Se X é uma v.a. com média populacional (\mu) e variância populacional (\sigma^2) finitas, então

X_1 + \cdots + X_n \sim_{aprox} N(n\mu,\; n\sigma^2)

A média de variáveis aleatórias iid tem um resultado equivalente:

\bar X \sim_{aprox} N\left( \mu,\; \frac{\sigma^2}{n} \right),

isto é, a média amostral aleatória é caracterizada, de forma aproximada, por uma distribuição normal mesmo que as v.a. X_i não o sejam.

A ter em conta:

aplicar o TLC

A expressão «aplicar o TLC» que dizer podemos usar uma distribuição normal para calcular probabilidades e quantis, de forma aproximada, para uma soma de v.a. ou uma média de v.a. se o número n é elevado. Aplicar o TLC resume-se a

  • caracterizar uma população por uma v.a. X modelada por uma distribuição que não seja a normal;

  • conhecer a média, \mu, da v.a. X;

  • conhecer a variância, \sigma^2, da v.a. X;

  • garantir uma boa aproximação com n \ge 30 (sendo este valor apenas uma referência não obrigatória pois depende da aplicação concreta do TLC);

  • calcular probabilidades ou quantis usando um dos casos:

X_1 + \cdots + X_n \sim_{aprox} N(n\mu,\; n\sigma^2)
\bar X \sim_{aprox} N\left( \mu,\; \frac{\sigma^2}{n} \right),

Os resultados de probabilidade ou quantis são aproximados e, por isso, também deve ser consultada a próxima secção no caso da v.a. ser discreta.

quando realizar correção à continuidade

O TLC aplica-se a v.a. contínua e, também, a v.a. discreta.

No modelo contínuo, P(X=a)=0, isto é, não há área por baixo do ponto e assim acontece na distribuição normal. Veja a razão aqui.

Porém, no modelo discreto P(X=a)\neq a para valores inteiros a de interesse. Uma soma de v.a. discretas, X_i,

Y = X_1 + \cdots + X_n

é, ainda, uma v.a. discreta, Y. Aplicando o TLC:

Y \sim_{aprox} Normal(n\,\mu_X, n\,\sigma^2_X)\,.

O problema surge porque:

  • P(Y=a) \neq 0 para a um inteiro de interesse mas

  • P(Y=a) = 0 se usarmos que Y \sim_{aprox} normal

e a solução é fazer a «correção à continuidade»:

  • P(Y=a) \approx P(a-0.5 \le Y \le a+0.5) sempre que se passa a usar a distribuição normal

sendo um exemplo

  • P(Y=10) \approx P(9.5 \le Y \le 10.5), ao usar a distribuição normal

Só deve ser feita correção à continuidade quando a v.a. é discreta.

São apresentados dois casos: correção à continuidade da soma ou correção à continuidade da média

correção à continuidade da soma

Se a v.a. é discreta, e apenas nessa condição, pode ser útil fazer a «correção à continuidade da soma» pois

Y = X_1 + \cdots + X_n

e, pelo TLC, Y \sim_{aprox} Normal(n\,\mu_X, n\,\sigma^2_X) sendo esta aproximação com melhor qualidade se n\ge 30.

O TLC proporciona um valor de probabilidade aproximado. Porém, quando se trata de uma v.a. discreta então ainda se sugere fazer uma segunda correção designada por correção à continuidade que se passa a apresentar. Usando uma expressão, não rigorosa mas intuitiva, em que a é um número inteiro,

P(Y=a) \approx P(a-0.5 \le Y \le a+0.5)

em que:

  • P(Y=a) é a probabilidade caso se conheça a distribuição discreta exata de Y;

  • P(a-0.5 \le Y \le a+0.5) é a probabilidade obtida como se Y fosse uma v.a. contínua com Y \sim_{aprox} N(n\mu,\; n\sigma^2).

Em resumo:

  • se queremos Y=a devemos considerar o intervalo a-0.5 \le Y \le a+0.5 (a usar em expressões como Y\le a ou Y\ge a;

  • se não queremos Y=a, isto é, Y<a ou Y>a, então devemos excluir o intervalo [a-0.5,a+0.5].

_images/tlc-correcao-01.png _images/tlc-correcao-02.png

correção à continuidade da média

Se a v.a. é discreta, e apenas nessa condição, pode ser útil fazer a «correção à continuidade da média» pois uma média baseia-se numa soma. Veja a secção anterior.

As expressões para a média, \bar X, são:

P(\bar X > a) \approx P( \bar X \ge a + \frac{0.5}{n})
P(\bar X < a) \approx P( \bar X \le a - \frac{0.5}{n})
P(a < \bar X < b) \approx P( a + \frac{0.5}{n} < \bar X < b - \frac{0.5}{n})
P(a < \bar X \le b) \approx P( a + \frac{0.5}{n} < \bar X < b + \frac{0.5}{n})

alternativa

Pode ser mais intuitivo passar à soma:

P(\bar X = a) = P( Y = a \times n) \approx P(a \times n - 0.5 \le Y \le a \times n + 0.5)

mas, neste caso, tem que se usar Y \sim_{aprox} N(n\mu,\; n\sigma^2).

TLC e a distribuição de Poisson

Resumo: se X \sim Poisson(\lambda_X), e \lambda_X \ge 5, então X \sim_{aprox} Normal(\lambda_X, \lambda_X).


Um caso particular do TLC aplica-se à distribuição de Poisson. Uma das propriedades da Poisson é que a soma de v.a. de Poisson é ainda modelada por uma Poisson. Se

Y = X_1 + \cdots + X_n

e cada X_i segue uma Poisson, X_i \sim Poisson(\lambda_X), então Y também segue uma Poisson:

Y \sim Poisson(n \, \lambda_X)

Por outro lado, como a soma de v.a. tem distribuição aproximada a uma distribuição normal:

Y \sim_{aprox} Normal(n \, \lambda_X, n \, \lambda_X)

sendo este resultado uma boa aproximação se n\,\lambda_X \ge 5.

Um resultado apenas para uma v.a. também é válido se

X \sim Poisson(\lambda_X)

e \lambda_X \ge 5 então

X \sim_{aprox} Normal(\lambda_X, \lambda_X)

pois podemos ver X como sendo uma soma de n v.a. com média \frac{1}{n} \lambda_X.

TLC e a distribuição binomial

Resumo do conceito: se X \sim binomial(n,\;p), n \ge 30, então X \sim_{aprox} Normal(np,\; np(1-p)).

ou, como se fazia antigamente, «número de sucessos» é na realidade somar v.a. cujos valores são 0 e 1, i.e., 0+1+1+0+1+1 etc = nr de sucessos.

Importante: sempre que há uma soma de muitas v.a. pode-se aplicar o TLC que diz que a distribuição será aproximadamente Normal.

Uma distribuição binomial, por definição, caracteriza uma soma de v.a. Y=X1+…+Xn do seguinte modo: cada Xi pode tomar o valor 1 (no caso de «sucesso») ou tomar o valor 0 (no caso de «insucesso»). Assim, Y é uma soma de v.a. e, sendo uma soma, a sua distribuição aproxima-se à de uma Normal, que é o resultado dado pelo TLC para a soma de v.a..

Em detalhe, como a v.a. Y é binomial então

  • E[Y] = np

  • Var[Y] = np(1-p)

e assim, Y \sim_\text{aprox} Normal( np, np(1-p) ).

No caso da binomial, a aproximação tem pouco erro quando np \ge 5 e np(1-p) \ge 5. Sendo Y uma v.a. discreta, pode-se realizar correção à continuidade.

porque é importante

Na investigação de um processo recorrendo a estatística é frequente caracterizar uma população, enquanto modelo matemático, pela sua média populacional (\mu).

Três pontos de vista, cada vez mais gerais:

  1. O TLC estabelece uma relação entre a «média de uma amostra» e a «média populacional» que é um parâmetro de um modelo matemático.

  2. O TLC estabelece uma relação entre amostra e população.

  3. O TLC estabelece uma relação entre a realidade e um modelo matemático.

O modo com é feito está expresso nas expressões acima, no texto.

conceitos e ideia

Conceitos de estatística descritiva envolvidos no TLC:

  1. amostra: colecionam-se várias amostras de dimensão n;

  2. média amostral: calcula-se a média \bar x para cada amostra (teremos várias médias);

  3. histograma: faz-se um histograma com as várias médias «\bar x».

O que se obtém, se usarmos muitas amostras, é um histograma de médias, \bar x, que se aproxima a uma distribuição normal:

\bar X \sim_{aprox} N\left( \mu,\; \frac{\sigma^2}{n} \right)

Uma imagem mil palavras

_images/TLC-wikipedia640pts.png

Adaptado de imagem na wikipedia. Mathieu ROUAUD - Own work, CC BY-SA 4.0

exemplo das pintas de um dado de seis faces

Este exemplo é fácil reproduzir em casa.

_images/tlc-exemplo-do-dado.png

Lançamento de um dado:

  1. o dado é lançado 100 vezes e registados os números obtidos;

  2. obtém-se uma distribuição quase uniforme (probabilidades quase idênticas para os valores 1 a 6);

  3. os resultados de 1, 2, …, 6 são (quase) equiprováveis.

Lançamento de dois dados:

  1. os dois dados são lançados 100 vezes e é registada a soma dos números obtidos;

  2. obtém-se uma distribuição em forma de telhado.

  3. os resultados de 2 (=1+1) e 12 (=6+6) são menos provaveis enquanto que o valor 7 pode ser obtido de seis maneiras (1+6,2+5,3+4,4+3,5+2,6+1) tornando o 7 muito frequente.

Lançamento de três dados:

  1. os três dados são lançados 100 vezes e é registada a soma dos números obtidos;

  2. obtém-se uma distribuição em forma de telhado, já arredondado.

  3. os resultados de 3 (=1+1+1) e 18 (=6+6+6) são menos provaveis enquanto que os valores 10 ou 11 podem ser obtido de muitas maneiras e por isso muito mais prováveis.

etc

Lançamento de seis dados:

  1. os seis dados são lançados 100 vezes e é registada a soma dos números obtidos;

  2. obtém-se uma distribuição já em forma de gaussiana.

  3. o mesmo argumento das situações anteriores sendo que o resultado 6 (=1+1+1+1+1+1) e o resultado 36 (=6+6+6+6+6+6) são pouco prováveis pois só podem ser obtidos desta maneira.