medidas amostrais
Uma medida amostral é uma medida numérica que descreve uma característica de uma amostra. É habitualmente representada por letras latinas como x, m, s, n, e outras. São exemplos a média amostral, designada pelo símbolo \(\bar x\), o desvio padrão corrigido e a variância, \(s_c\) e \(s_c^2\), respetivamente.
A maioria das medidas que vamos considerar podem ser obtidas usando a máquina de calcular.
introdução
As medidas consideradas neste wiki são:
- medidas de localização central:
média amostral \(\bar x\)
mediana amostral \(m_e\)
moda amostral \(m_o\)
- medidas de localização relativa:
quantil amostral \(x_p\) cujos casos particulares são o quartil \(Q_i\), decil \(D_i\), percentil \(P_i\)
- medidas de dispersão:
amplitude ou distância interquartil amostral (:math:`H)
desvio padrão amostral \(s_c\) e variância corrigida amostral \(s_c^2\)
- medida de forma:
coeficiente de assimetria amostral (skewness).
dados não agrupados
Trata-se da amostra, em bruto, tal como é obtida por um investigador. Algumas medidas amostrais calculadas por fórmula requerem que a amostra esteja ordenada.
Exemplo:
Amostra em bruto e com poucas ou nenhumas repetições de valores: o número de diferentes espécies de um dado inseto por zona: 10, 21, 32, 5, 6, 9.
A mesma amostra, em bruto, mas ordenada: 5, 6, 9, 10, 21, 32.
notação
elemento de uma amostra: \(x_1=10\), \(x_2=21\), \(x_3=32\), \(x_4=5\), \(x_5=6\), \(x_6=9\),
elemento de uma amostra ordenada: \(x_{(1)}=5\), \(x_{(2)}=6\), \(x_{(3)}=9\), \(x_{(4)}=10\), \(x_{(5)}=21\), \(x_{(6)}=32\),
dados agrupados
Quando há repetição de observações pode ser construída uma tabela de frequências ou, dito de outra maneira, agrupando os dados.
Exemplo de amostra em que ocorrem muitos elementos repetidos:
o número de novos casos de uma doença num dia com os seguintes registos: 0, 1, 1, 2, 0, 0, 1, 1, 0, 2, 3. Neste caso há repetição de obsevações.
Quando há repetições de elementos temos o seguinte algoritmo:
ordenar os elementos distintos (designados por \(x_i^*\)), \(i=1,\ldots,k\) (k é o número de elementos distintos)
contar cada elemento observado na amostra (designado de frequência absoluta \(n_i\))
No exemplo acima, \(k=4\) (elementos distintos 0, 1, 2, 3):
observação |
frequência |
---|---|
0 |
4 |
1 |
4 |
2 |
2 |
3 |
1 |
notação
elementos distintos: \(x_1^*=0\), \(x_2^*=1\), \(x_3^*=2\) e \(x_4^*=3\).
frequência absoluta de cada elemento distinto: \(n_1=4\), \(n_2=4\), \(n_2=2\) e \(n_4=1\).
calculadoras gráficas
texas TI Nspire CX
Abrir folha de cálculo e
colocar a amostra na coluna a[] e depois, sem sair da folha de cálculo,
MENU 4: Estatistica => 1: Cálculos estatísticos => 1: Estatísticas de uma variável => Número de listas = 1;
Preencher:
Lista X1: a[]
Lista de Frequências: 1
Resultados: c[]
A primeira coluna deve ter as observações e a segunda deve ter as frequências absolutas de cada observação. (Note que apesar de existirem duas colunas de valores, só há 1 variável estatística em análise.)
Abrir folha de cálculo e
na coluna A[] colocar as observações
na coluna B[] colocar as frequencias
sem sair da folha de cálculo
MENU 4: Estatistica => 1: Cálculos estatísticos => 1: Estatísticas de uma variável => Número de listas = 1;
Preencher com:
Lista X1: a[]
Lista de Frequências: b[]
Resultados: c[]
note que:
na calculadora, \(s\) designa o desvio padrão amostral corrigido;
na calculadora, \(\sigma\) designa o desvio padrão amostral (não corrigido);
o maior destes dois valores é sempre o corrigido. Veja porquê.
texas TI 84
Apenas uma coluna de valores:
Tecla STAT => Edit => Preencher L1 (\(x_i^*\))
Tecla STAT => CALC => 1-var Stats, inserir L1
Com menus: confirmar se L1 está colocado em «List» e «Freq.List» está vazia.
A primeira coluna deve ter as observações e a segunda deve ter as frequências absolutas de cada observação. (Note que apesar de existirem duas colunas de valores, só há 1 variável estatística em análise.)
Tecla STAT => Edit => Preencher L1 (\(x_i^*\)) e L2 (\(n_i\))
Tecla STAT => CALC => 1-var Stats, inserir L1, depois «,» e depois L2
Com menus: confirmar se «List» = L1 e se «Freq.List» = L2.
note que:
na calculadora, \(s\) designa o desvio padrão amostral corrigido;
na calculadora, \(\sigma\) designa o desvio padrão amostral (não corrigido);
o maior destes dois valores é sempre o corrigido. Veja porquê.
casio FX 9860gii
MENU Edit e introduzir a amostra na «List1», por exemplo.
MENU => Stat => Calc
Botão SET e escolher para X a «List1» e para a Frequência o valor «1» (botão abaixo).
Botão: 1-var
A primeira coluna deve ter as observações e a segunda deve ter as frequências absolutas de cada observação. (Note que apesar de existirem duas colunas de valores, só há 1 variável estatística em análise.)
MENU Edit e introduzir a amostra na «List1», por exemplo.
Introduzir as frequências absolutas na «List2».
MENU => Stat => Calc
Botão SET e escolher para X a «List1» e para a Frequência a «List2».
Botão: 1-var
note que:
na calculadora, \(s\) designa o desvio padrão amostral corrigido;
na calculadora, \(\sigma\) designa o desvio padrão amostral (não corrigido);
o maior destes dois valores é sempre o corrigido. Veja porquê.
casio FX CG 20
MENU Edit e introduzir a amostra na «List1», por exemplo.
MENU => Stat => Calc => 1 variável
Botão SET e escolher para X a «List1» e para a Frequência o valor «1» (botão abaixo).
Botão: 1-var
A primeira coluna deve ter as observações e a segunda deve ter as frequências absolutas de cada observação. (Note que apesar de existirem duas colunas de valores, só há 1 variável estatística em análise.)
MENU Edit e introduzir a amostra na «List1», por exemplo.
Introduzir as frequências absolutas na «List2».
MENU => Stat => Calc
Botão SET e escolher para X a «List1» e para a Frequência a «List2».
Botão: 1-var
note que:
na calculadora, \(s\) designa o desvio padrão amostral corrigido;
na calculadora, \(\sigma\) designa o desvio padrão amostral (não corrigido);
o maior destes dois valores é sempre o corrigido. Veja porquê.
Excel sobre medidas amostrais
Ficheiro Excel para cálculo de medidas amostrais: LINK
(em desenvolvimento)