anova a 1 fator

A ANOVA é uma técnica baseada em análise de variância usada para comparar médias de várias populações independentes. Cada população é definida por um fator (uma v.a. indepedente) cujos valores definem «grupos», por exemplo, se a «região do país» é o fator, então norte, centro e sul são os grupos fixos (pré-determinados) antes da experiência. Se o fator é uma temperaturapode existir lugar a sorteamento gerando valores de um domínio. Neste caso chama-se de anova de efeitos aleatórios.

exemplos

Quandos os valores da v.a. X são pre-determinada antes da experiência diz-se que é uma anova de efeitos fixos (i.e., grupos fixos).

Assim, fatores fixos, ou efeitos fixos, é quando os tratamentos/grupos/níveis são pré-determinados à partida temos uma experiência com efeitos fixos.

exemplo 1: ANOVA 1 fator - efeitos fixos

Como o objetivo de estudar o efeito do tipo de dieta (X1, variá- vel independente, categorizada) no peso corporal (Y, variável dependente, numérica) de animais de uma determinada espé- cie, foram estudados cinquenta animais distribuídos ao acaso por 5 grupos (5 níveis) onde cada grupo ficou sujeito a um tipo de dieta alimentar.

Assume-se: Peso corporal = função (tipo de dieta)

Conjetura a testar: O peso médio corporal é diferente nos 5 grupos de animais sujeitos às 5 dietas distintas.

_images/anova-exemplo1.png

exemplo 2: ANOVA 1 fator - efeitos fixos

Quinze amostras de uma espécie de planta foram distribuídas ao acaso por 3 locais distintos (X, variável independente, nominal) e, para cada amostra, foi analisado o conteúdo de fósforo (Y, variável dependente, contínua).

Assume-se Conteúdo de fósforo=função (local)

Objetivo: Avaliar o efeito do local na quantidade média de fósforo na planta.

_images/anova-exemplo2.png

estatística descritiva na ANOVA

  • Caixa-de-bigodes comparativas

  • Diagrama de médias e erros

pressupostos (conceitos)

Uma ANOVA a 1 fator realiza-se quando se têm k grupos de observações independentes (k amostras) sendo as amostras, de cada grupo, independentes entre si.

Para que esse teste seja paramétrico (o melhor mais potente é com a ANOVA paramétrica) então:

  1. O planeamento deve ser equilibrado, isto é, os grupos devem ter a mesma dimensão n.

    • o número total de observações é \(N=k \times n\)

  2. Cada grupo de observações deve ser bem modelado por uma distribuição normal (há auotes com consideram que a amostra no seu todo deve ser bem modelada por uma distribuição normal).

  3. A variância das k subpopulações não deve diferir significativamente, isto é, deve existir homogeneidade de variâncias entre grupos.

análise de variância (anova)

  • \(MS_G\) é proporcional à variabilidade da média das observações \(Y_{i\cdot}\) em cada grupo. O fator é o principal responsável por esta variabilidade.

  • \(MS_E\) é a possivelmente pequena variabilidade usual dos «erros» num modelo devida natureza dos fenómenos (tudo é processo logo não há duas entidades iguais).

procedimento

ANOVA paramétrica a 1 fator:

1. Identificar as populações e hipóteses

A população é vista como k subpopulações.

  • identificar o fator (X) que divide a população em k subpopulações (k grupos/níveis/tratamentos)

  • a variável de resposta (Y)

  • indicar se são efeitos fixos ou aleatórios

  • escrever as hipóteses

2. Estatística descritiva e validação de pressupostos

Útil para se ficar com uma ideia gráfica de qual hipótese será escolhida.

  • estatística descritiva

    • boxplot

    • gráfico de médias e erros

    • gráficos de IC

  • validação dos pressupostos

    • mesma dimensão (planeamento equilibrado)

    • qqplot normal

    • Bartlett test (apenas se dados normais)

3. Metódo de teste

Não é fácil realizar o teste «à mão» devido aos elevado número de somas e quadrados.

Exemplo de tabela:

Sum of Squares

df

Mean Square

\(F_{obs}\)

valor-p

Between Groups

\(SS_G=100.667\)

\(g-1=2\)

\(MS_G=50.333\)

\(26.647\)

\(0.0\)

Within Groups

\(SS_E=17.0\)

\(g(n-1)=9\)

\(MS_E=1.889\)

Total

\(SS_T=117.667\)

\(ng-1=11\)

Alguns aspetos são apresentados:

  • Estatística de teste

    • F para comparação de duas variâncias

  • Valor observado

    • aquela big tabela

  • p-value

    • p = P(F>fobs)

4. Conclusão e Interpretação

Usa-se o método do p-value.

  • rejeitando H0: existe pelo menos uma média significativamente diferente das outras

  • não rejeitando H0: as médias não são significativamente diferentes

5. Comparação de pares

Apenas para «efeitos fixos».

  • método de Bonferroni

  • método de Tukey

Nota: não se aplica a efeitos aleatórios.

R Project

ANOVA paramétrica a 1 fator em R (online):

São 3 grupos (A,B,C) e n=5 observações por grupo fixo:


Verificação dos pressupostos da ANOVA paramétrica a 1 fator:

Caixas de bigodes comparativas


Ajustamento à Normal


Homogeneidade de variâncias


Comparações múltiplas com Método de Tukey (que pares podem ser significativamente diferentes):

Comparações múltiplas com Bonferroni (que pares podem ser significativamente diferentes):

Outro exemplo:

  • Começa-se por introduzir os dados num data.frame.

  • A função rep(a,n) que repete «a» por n vezes auxilia na introdução dos tipos de habitat de cada porco ibérico observado.

dados = data.frame(
        habitat=c( rep(1,5),rep(2,5),rep(3,5) ),
        peso=c( 45, 53, 57, 48, 60, 72, 75, 85,
                81, 74, 65, 61, 51, 55, 63)  )
dados

Com o data.frame, invoca-se a função aov para efetuar uma ANOVA, em que o peso é função do habitat peso ~ habitat:

resultado = aov(peso ~ habitat,data=dados)
summary(resultado)