duas amostras emparelhadas (t test)

Pretende-se comparar as duas médias de duas amostras emparelhada, partindo do pressuposto da normalidade das populações. Devido ao emparelhamento, o procedimento passa por subtrair os pares de observações. Trata-se esta situação como se trata uma única população.

descrição

  • Temos duas amostras emparelhadas, de dimensão \(n\), sendo \(X_1,\ldots,X_n\) e \(Y_1,\ldots,Y_n\). Estas formam pares \((X_i,Y_i)\) dos quais se forma uma única amostra de diferenças:

\[\begin{split}\begin{array}{c|ccc} X & x_1 & x_2 & \cdots & x_n \\ Y & y_1 & y_2 & \cdots & y_n \\ \hline D & d_1 = x_1 - y_1 & d_2=x_2 - y_2 & \cdots & d_n = x_n - y_n \\ \end{array}\end{split}\]

hipóteses a testar

O teste bilateral é:

\[H_0: \underbrace{\mu_X - \mu_Y}_{\mu_D} = 0 \quad vs \quad H_1: \underbrace{\mu_X - \mu_Y}_{\mu_D} \neq 0\]

e, de forma semelhante, para os casos unilaterais \(>\) ou \(<\) em \(H_1\).

Considerando que se reduzem as duas amostras a uma só então escreve-se o teste com base na v.a. D:

\[\mu_D = \mu_X - \mu_Y\]

ou seja, pode realizar-se o teste bilateralou os testes unilaterais:

\[ \begin{align}\begin{aligned}H_0\,:\, \mu_D = 0 \quad vs \quad H_1\,:\, \mu_D \neq 0\\H_0\,:\, \mu_D = 0 \quad vs \quad H_1\,:\, \mu_D > 0\\H_0\,:\, \mu_D = 0 \quad vs \quad H_1\,:\, \mu_D < 0\end{aligned}\end{align} \]

estatística de teste

\[T=\frac{\bar D - \mu_D}{S_{D}/\sqrt n} \underset{sob~H_0}{\sim} t_{n-1},\]

onde \(D_i=X_i-Y_i\).

R project

#ficheiro com duas colunas diferentes: "CHUVA" e "SECA"
dados = read.csv("linces.csv")
head(dados)
#data.frame só com as colunas  c("CHUVA","SECA")
pesos = dados[, c("CHUVA","SECA")]
head(pesos)
#criar novo data.frame pesos com colunas "peso" e "epoca"
pesos = stack(pesos)
names(pesos) <- c("peso","epoca")
head(pesos)
# fazer o teste t para amostras emparelhadas
t.test(peso~epoca,data=pesos, paired=TRUE)

texas TI 84

Partindo da amostra das diferenças \(d_i = x_i - y_i\) realiza-se o teste t (só para uma amostra):

  • 1 Samp T test