Ejemplo de un cálculo ANOVA

Un análisis factorial de la varianza, también conocido como ANOVA, nos brinda una forma de hacer comparaciones múltiples de varias medias poblacionales. En lugar de hacer esto de manera pareada, podemos observar simultáneamente todos los medios bajo consideración. Para realizar una prueba ANOVA, necesitamos comparar dos tipos de variación, la variación entre las medias de la muestra, así como la variación dentro de cada una de nuestras muestras..

Combinamos toda esta variación en una sola estadística, llamada F estadística porque usa la distribución F. Hacemos esto dividiendo la variación entre muestras por la variación dentro de cada muestra. La forma de hacer esto normalmente es manejada por el software, sin embargo, hay algún valor en ver que uno de esos cálculos funcione.

Será fácil perderse en lo que sigue. Aquí está la lista de pasos que seguiremos en el siguiente ejemplo:

  1. Calcule las medias muestrales para cada una de nuestras muestras, así como la media para todos los datos muestrales.
  2. Calcule la suma de los cuadrados de error. Aquí dentro de cada muestra, cuadramos la desviación de cada valor de datos de la media muestral. La suma de todas las desviaciones al cuadrado es la suma de los cuadrados de error, SSE abreviado.
  3. Calcular la suma de cuadrados de tratamiento. Al cuadrado la desviación de cada media muestral de la media general. La suma de todas estas desviaciones al cuadrado se multiplica por una menos que el número de muestras que tenemos. Este número es la suma de los cuadrados de tratamiento, abreviado SST.
  4. Calcule los grados de libertad. El número total de grados de libertad es uno menos que el número total de puntos de datos en nuestra muestra, o norte - 1. El número de grados de libertad de tratamiento es uno menos que el número de muestras utilizadas, o metro - 1. El número de grados de libertad de error es el número total de puntos de datos, menos el número de muestras, o norte - metro.
  5. Calcule el cuadrado medio de error. Esto se denota MSE = SSE / (norte - metro).
  6. Calcule el cuadrado medio de tratamiento. Esto se denota MST = SST /metro - '1.
  7. Calcula el F estadística. Esta es la razón de los dos cuadrados medios que calculamos. Entonces F = MST / MSE.

El software hace todo esto con bastante facilidad, pero es bueno saber qué está sucediendo detrás de escena. En lo que sigue, elaboramos un ejemplo de ANOVA siguiendo los pasos enumerados anteriormente.

Datos y medias de muestra

Supongamos que tenemos cuatro poblaciones independientes que satisfacen las condiciones para ANOVA de factor único. Deseamos probar la hipótesis nula H0 0: μ1 = μ2 = μ3 = μ4 4. Para los propósitos de este ejemplo, utilizaremos una muestra de tamaño tres de cada una de las poblaciones estudiadas. Los datos de nuestras muestras son:

  • Muestra de la población # 1: 12, 9, 12. Esto tiene una media muestral de 11.
  • Muestra de la población # 2: 7, 10, 13. Esto tiene una media muestral de 10.
  • Muestra de la población # 3: 5, 8, 11. Esto tiene una media muestral de 8.
  • Muestra de la población # 4: 5, 8, 8. Esto tiene una media muestral de 7.

La media de todos los datos es 9.

Suma de cuadrados de error

Ahora calculamos la suma de las desviaciones al cuadrado de cada media muestral. Esto se llama la suma de los cuadrados de error..

  • Para la muestra de la población n. ° 1: (12-11)2 + (9-11)2 +(12-11)2 = 6
  • Para la muestra de la población # 2: (7 - 10)2 + (10-10)2 +(13-10)2 = 18
  • Para la muestra de la población # 3: (5 - 8)2 + (8 - 8)2 +(11 - 8)2 = 18
  • Para la muestra de la población # 4: (5 - 7)2 + (8 - 7)2 +(8 - 7)2 = 6.

Luego sumamos todas estas sumas de desviaciones al cuadrado y obtenemos 6 + 18 + 18 + 6 = 48.

Suma de cuadrados de tratamiento

Ahora calculamos la suma de los cuadrados de tratamiento. Aquí observamos las desviaciones al cuadrado de cada media muestral de la media general, y multiplicamos este número por uno menos que el número de poblaciones:

3 [(11 - 9)2 + (10 - 9)2 +(8 - 9)2 + (7 - 9)2] = 3 [4 + 1 + 1 + 4] = 30.

Grados de libertad

Antes de continuar con el siguiente paso, necesitamos los grados de libertad. Hay 12 valores de datos y cuatro muestras. Por lo tanto, el número de grados de libertad de tratamiento es 4 - 1 = 3. El número de grados de libertad de error es 12 - 4 = 8.

Cuadrados medios

Ahora dividimos nuestra suma de cuadrados por el número apropiado de grados de libertad para obtener los cuadrados medios.

  • El cuadrado medio para el tratamiento es 30/3 = 10.
  • El cuadrado medio para el error es 48/8 = 6.

La estadística F

El paso final de esto es dividir el cuadrado medio para el tratamiento por el cuadrado medio para el error. Esta es la estadística F de los datos. Así, para nuestro ejemplo F = 10/6 = 5/3 = 1.667.

Se pueden usar tablas de valores o software para determinar la probabilidad de obtener un valor del estadístico F tan extremo como este valor solo por casualidad.