amostra aleatória

Uma amostra aleatória é uma coleção de variáveis aleatórias, todas com a mesma distribuições frequentes e sendo independentes umas das outras (diz-se que as v.a. são i.i.d.). Essa coleção é expressa por letras maiúsculas indexadas \(X_i\):

\[X_1,\, X_2,\, \ldots,\, X_n\]

em que cada símbolo \(X_i\) identifica uma variável aleatória.

Na estatística descritiva, foi usada a notação com x, minúsculo, para designar uma amostra concreta: \(x_1,\, x_2,\, \ldots,\, x_n\). Cada símbolo \(x_i\) designa um valor real.

exemplo

Seja \(X\;=\;\)»o número de infeções com e. coli por hopital numa dada região». Então,

  • \(X_1,\, X_2,\, X_3,\, X_4\) denota uma amostra aleatória de dimensão 4, isto é, o número de infeções em 4 hipotéticos hospitais, independentes uns dos outros, e que sigam a mesma distribuições frequentes de infeções por e. coli.

Uma concretização de uma amostra aleatória é uma coleção de números reais (possívelmente inteiros). No seguimento,

  • \(x_1=20,\; x_2=33,\; x_3=21,\; x_4=56\) denota uma amostra concreta de dimensão \(n=4\) de número de infeções em 4 hospitais concretos.

independentes e identicamente distribuídas

Esta é uma expressão comum na literatura e quer dizer o seguinte:

  • «independentes»: tal como os sucessivos lançamentos de um dado facetado de 1 a 6, uma sequência de v.a. numa amostra aleatória, são independentes entre si;

  • «identicamente distribuídas»: cada v.a. \(X_i\), que compõe a amostra aleatória, segue uma mesma distribuição que um dado contexto deve identificar.

A sigla para esta junção de características é «iid» (ou «i.i.d.»).

notação

  • «dimensão da amostra»: o número de elementos de uma amostra (ou em linguagem coloquial, «o número de amostras»);

  • «\(X_i\)»: uma v.a. de uma amostra aleatória;

  • «\(x_i\)»: um elemento de amostra (concreta); um número real, possivelmente um inteiro nulo ou positivo.