teorema do limite central
TLC = Teorema do Limite Central
O TLC tem interesse prático especial porque se aplica a uma população caracterizada por uma v.a. com distribuição genérica, ou outra desde que não seja a distribuição normal.
Se X é uma v.a. com média populacional (\(\mu\)) e variância populacional (\(\sigma^2\)) finitas, então
A média de variáveis aleatórias iid tem um resultado equivalente:
isto é, a média amostral aleatória é caracterizada, de forma aproximada, por uma distribuição normal mesmo que as v.a. \(X_i\) não o sejam.
A ter em conta:
se a v.a. é discreta, e apenas nessa condição, pode ser útil fazer a «correção à continuidade»: quando realizar correção à continuidade;
há dois casos particulares de aplicação: TLC e a distribuição de Poisson e TLC e a distribuição binomial.
aplicar o TLC
A expressão «aplicar o TLC» que dizer podemos usar uma distribuição normal para calcular probabilidades e quantis, de forma aproximada, para uma soma de v.a. ou uma média de v.a. se o número n é elevado. Aplicar o TLC resume-se a
caracterizar uma população por uma v.a. X modelada por uma distribuição que não seja a normal;
conhecer a média, \(\mu\), da v.a. X;
conhecer a variância, \(\sigma^2\), da v.a. X;
garantir uma boa aproximação com \(n \ge 30\) (sendo este valor apenas uma referência não obrigatória pois depende da aplicação concreta do TLC);
calcular probabilidades ou quantis usando um dos casos:
Os resultados de probabilidade ou quantis são aproximados e, por isso, também deve ser consultada a próxima secção no caso da v.a. ser discreta.
quando realizar correção à continuidade
O TLC aplica-se a v.a. contínua e, também, a v.a. discreta.
No modelo contínuo, \(P(X=a)=0\), isto é, não há área por baixo do ponto e assim acontece na distribuição normal. Veja a razão aqui.
Porém, no modelo discreto \(P(X=a)\neq a\) para valores inteiros a de interesse. Uma soma de v.a. discretas, \(X_i\),
é, ainda, uma v.a. discreta, \(Y\). Aplicando o TLC:
O problema surge porque:
\(P(Y=a) \neq 0\) para a um inteiro de interesse mas
\(P(Y=a) = 0\) se usarmos que \(Y \sim_{aprox} normal\)
e a solução é fazer a «correção à continuidade»:
\(P(Y=a) \approx P(a-0.5 \le Y \le a+0.5)\) sempre que se passa a usar a distribuição normal
sendo um exemplo
\(P(Y=10) \approx P(9.5 \le Y \le 10.5)\), ao usar a distribuição normal
Só deve ser feita correção à continuidade quando a v.a. é discreta.
São apresentados dois casos: correção à continuidade da soma ou correção à continuidade da média
correção à continuidade da soma
Se a v.a. é discreta, e apenas nessa condição, pode ser útil fazer a «correção à continuidade da soma» pois
e, pelo TLC, \(Y \sim_{aprox} Normal(n\,\mu_X, n\,\sigma^2_X)\) sendo esta aproximação com melhor qualidade se \(n\ge 30\).
O TLC proporciona um valor de probabilidade aproximado. Porém, quando se trata de uma v.a. discreta então ainda se sugere fazer uma segunda correção designada por correção à continuidade que se passa a apresentar. Usando uma expressão, não rigorosa mas intuitiva, em que a é um número inteiro,
em que:
\(P(Y=a)\) é a probabilidade caso se conheça a distribuição discreta exata de Y;
\(P(a-0.5 \le Y \le a+0.5)\) é a probabilidade obtida como se Y fosse uma v.a. contínua com \(Y \sim_{aprox} N(n\mu,\; n\sigma^2)\).
Em resumo:
se queremos \(Y=a\) devemos considerar o intervalo \(a-0.5 \le Y \le a+0.5\) (a usar em expressões como \(Y\le a\) ou \(Y\ge a\);
se não queremos \(Y=a\), isto é, \(Y<a\) ou \(Y>a\), então devemos excluir o intervalo \([a-0.5,a+0.5]\).
correção à continuidade da média
Se a v.a. é discreta, e apenas nessa condição, pode ser útil fazer a «correção à continuidade da média» pois uma média baseia-se numa soma. Veja a secção anterior.
As expressões para a média, \(\bar X\), são:
alternativa
Pode ser mais intuitivo passar à soma:
mas, neste caso, tem que se usar \(Y \sim_{aprox} N(n\mu,\; n\sigma^2)\).
TLC e a distribuição de Poisson
Resumo: se \(X \sim Poisson(\lambda_X)\), e \(\lambda_X \ge 5\), então \(X \sim_{aprox} Normal(\lambda_X, \lambda_X)\).
Um caso particular do TLC aplica-se à distribuição de Poisson. Uma das propriedades da Poisson é que a soma de v.a. de Poisson é ainda modelada por uma Poisson. Se
e cada \(X_i\) segue uma Poisson, \(X_i \sim Poisson(\lambda_X)\), então \(Y\) também segue uma Poisson:
Por outro lado, como a soma de v.a. tem distribuição aproximada a uma distribuição normal:
sendo este resultado uma boa aproximação se \(n\,\lambda_X \ge 5\).
Um resultado apenas para uma v.a. também é válido se
e \(\lambda_X \ge 5\) então
pois podemos ver X como sendo uma soma de n v.a. com média \(\frac{1}{n} \lambda_X\).
TLC e a distribuição binomial
Resumo do conceito: se \(X \sim binomial(n,\;p)\), \(n \ge 30\), então \(X \sim_{aprox} Normal(np,\; np(1-p))\).
ou, como se fazia antigamente, «número de sucessos» é na realidade somar v.a. cujos valores são 0 e 1, i.e., 0+1+1+0+1+1 etc = nr de sucessos.
Importante: sempre que há uma soma de muitas v.a. pode-se aplicar o TLC que diz que a distribuição será aproximadamente Normal.
Uma distribuição binomial, por definição, caracteriza uma soma de v.a. Y=X1+…+Xn do seguinte modo: cada Xi pode tomar o valor 1 (no caso de «sucesso») ou tomar o valor 0 (no caso de «insucesso»). Assim, Y é uma soma de v.a. e, sendo uma soma, a sua distribuição aproxima-se à de uma Normal, que é o resultado dado pelo TLC para a soma de v.a..
Em detalhe, como a v.a. Y é binomial então
E[Y] = np
Var[Y] = np(1-p)
e assim, \(Y \sim_\text{aprox} Normal( np, np(1-p) )\).
No caso da binomial, a aproximação tem pouco erro quando \(np \ge 5\) e \(np(1-p) \ge 5\). Sendo Y uma v.a. discreta, pode-se realizar correção à continuidade.
porque é importante
Na investigação de um processo recorrendo a estatística é frequente caracterizar uma população, enquanto modelo matemático, pela sua média populacional (\(\mu\)).
Três pontos de vista, cada vez mais gerais:
O TLC estabelece uma relação entre a «média de uma amostra» e a «média populacional» que é um parâmetro de um modelo matemático.
O TLC estabelece uma relação entre amostra e população.
O TLC estabelece uma relação entre a realidade e um modelo matemático.
O modo com é feito está expresso nas expressões acima, no texto.
conceitos e ideia
Conceitos de estatística descritiva envolvidos no TLC:
amostra: colecionam-se várias amostras de dimensão n;
média amostral: calcula-se a média \(\bar x\) para cada amostra (teremos várias médias);
histograma: faz-se um histograma com as várias médias «\(\bar x\)».
O que se obtém, se usarmos muitas amostras, é um histograma de médias, \(\bar x\), que se aproxima a uma distribuição normal:
Uma imagem mil palavras
Adaptado de imagem na wikipedia. Mathieu ROUAUD - Own work, CC BY-SA 4.0
exemplo das pintas de um dado de seis faces
Este exemplo é fácil reproduzir em casa.
Lançamento de um dado:
o dado é lançado 100 vezes e registados os números obtidos;
obtém-se uma distribuição quase uniforme (probabilidades quase idênticas para os valores 1 a 6);
os resultados de 1, 2, …, 6 são (quase) equiprováveis.
Lançamento de dois dados:
os dois dados são lançados 100 vezes e é registada a soma dos números obtidos;
obtém-se uma distribuição em forma de telhado.
os resultados de 2 (=1+1) e 12 (=6+6) são menos provaveis enquanto que o valor 7 pode ser obtido de seis maneiras (1+6,2+5,3+4,4+3,5+2,6+1) tornando o 7 muito frequente.
Lançamento de três dados:
os três dados são lançados 100 vezes e é registada a soma dos números obtidos;
obtém-se uma distribuição em forma de telhado, já arredondado.
os resultados de 3 (=1+1+1) e 18 (=6+6+6) são menos provaveis enquanto que os valores 10 ou 11 podem ser obtido de muitas maneiras e por isso muito mais prováveis.
etc
Lançamento de seis dados:
os seis dados são lançados 100 vezes e é registada a soma dos números obtidos;
obtém-se uma distribuição já em forma de gaussiana.
o mesmo argumento das situações anteriores sendo que o resultado 6 (=1+1+1+1+1+1) e o resultado 36 (=6+6+6+6+6+6) são pouco prováveis pois só podem ser obtidos desta maneira.