Un análisis factorial de la varianza, también conocido como ANOVA, nos brinda una forma de hacer comparaciones múltiples de varias medias poblacionales. En lugar de hacer esto de manera pareada, podemos observar simultáneamente todos los medios bajo consideración. Para realizar una prueba ANOVA, necesitamos comparar dos tipos de variación, la variación entre las medias de la muestra, así como la variación dentro de cada una de nuestras muestras..
Combinamos toda esta variación en una sola estadística, llamada F estadística porque usa la distribución F. Hacemos esto dividiendo la variación entre muestras por la variación dentro de cada muestra. La forma de hacer esto normalmente es manejada por el software, sin embargo, hay algún valor en ver que uno de esos cálculos funcione.
Será fácil perderse en lo que sigue. Aquí está la lista de pasos que seguiremos en el siguiente ejemplo:
El software hace todo esto con bastante facilidad, pero es bueno saber qué está sucediendo detrás de escena. En lo que sigue, elaboramos un ejemplo de ANOVA siguiendo los pasos enumerados anteriormente.
Supongamos que tenemos cuatro poblaciones independientes que satisfacen las condiciones para ANOVA de factor único. Deseamos probar la hipótesis nula H0 0: μ1 = μ2 = μ3 = μ4 4. Para los propósitos de este ejemplo, utilizaremos una muestra de tamaño tres de cada una de las poblaciones estudiadas. Los datos de nuestras muestras son:
La media de todos los datos es 9.
Ahora calculamos la suma de las desviaciones al cuadrado de cada media muestral. Esto se llama la suma de los cuadrados de error..
Luego sumamos todas estas sumas de desviaciones al cuadrado y obtenemos 6 + 18 + 18 + 6 = 48.
Ahora calculamos la suma de los cuadrados de tratamiento. Aquí observamos las desviaciones al cuadrado de cada media muestral de la media general, y multiplicamos este número por uno menos que el número de poblaciones:
3 [(11 - 9)2 + (10 - 9)2 +(8 - 9)2 + (7 - 9)2] = 3 [4 + 1 + 1 + 4] = 30.
Antes de continuar con el siguiente paso, necesitamos los grados de libertad. Hay 12 valores de datos y cuatro muestras. Por lo tanto, el número de grados de libertad de tratamiento es 4 - 1 = 3. El número de grados de libertad de error es 12 - 4 = 8.
Ahora dividimos nuestra suma de cuadrados por el número apropiado de grados de libertad para obtener los cuadrados medios.
El paso final de esto es dividir el cuadrado medio para el tratamiento por el cuadrado medio para el error. Esta es la estadística F de los datos. Así, para nuestro ejemplo F = 10/6 = 5/3 = 1.667.
Se pueden usar tablas de valores o software para determinar la probabilidad de obtener un valor del estadístico F tan extremo como este valor solo por casualidad.