La varianza y la desviación estándar son dos medidas de variación estrechamente relacionadas de las que escuchará mucho en estudios, revistas o clases de estadísticas. Son dos conceptos básicos y fundamentales en estadística que deben entenderse para comprender la mayoría de los demás conceptos o procedimientos estadísticos. A continuación, revisaremos qué son y cómo encontrar la varianza y la desviación estándar.
Por definición, la varianza y la desviación estándar son medidas de variación para las variables de relación de intervalo. Describen cuánta variación o diversidad hay en una distribución. Tanto la varianza como la desviación estándar aumentan o disminuyen en función de qué tan cerca se agrupan los puntajes alrededor de la media.
La varianza se define como el promedio de las desviaciones al cuadrado de la media. Para calcular la varianza, primero resta la media de cada número y luego eleva al cuadrado los resultados para encontrar las diferencias al cuadrado. Luego encuentras el promedio de esas diferencias al cuadrado. El resultado es la varianza..
La desviación estándar es una medida de la distribución de los números en una distribución. Indica cuánto, en promedio, cada uno de los valores en la distribución se desvía de la media o centro de la distribución. Se calcula tomando la raíz cuadrada de la varianza.
La varianza y la desviación estándar son importantes porque nos dicen cosas sobre el conjunto de datos que no podemos aprender simplemente mirando la media o el promedio. Como ejemplo, imagine que tiene tres hermanos menores: un hermano que tiene 13 años y gemelos que tienen 10. En este caso, la edad promedio de sus hermanos sería 11. Ahora imagine que tiene tres hermanos, de 17 a 12 años. , y 4. En este caso, la edad promedio de sus hermanos seguiría siendo 11, pero la varianza y la desviación estándar serían mayores..
Digamos que queremos encontrar la varianza y la desviación estándar de la edad entre su grupo de 5 amigos cercanos. Las edades de usted y sus amigos son 25, 26, 27, 30 y 32.
Primero, debemos encontrar la edad media: (25 + 26 + 27 + 30 + 32) / 5 = 28.
Luego, necesitamos calcular las diferencias de la media para cada uno de los 5 amigos.
25-28 = -3
26-28 = -2
27-28 = -1
30-28 = 2
32 - 28 = 4
Luego, para calcular la varianza, tomamos cada diferencia de la media, la elevamos al cuadrado y luego promediamos el resultado.
Varianza = ((-3)2 + (-2)2 + (-1)2 + 22 + 4 42) / 5
= (9 + 4 + 1 + 4 + 16) / 5 = 6.8
Entonces, la varianza es 6.8. Y la desviación estándar es la raíz cuadrada de la varianza, que es 2.61. Lo que esto significa es que, en promedio, usted y sus amigos tienen una edad de 2.61 años.
Aunque es posible calcular la varianza a mano para conjuntos de datos más pequeños como este, los programas de software estadístico también se pueden usar para calcular la varianza y la desviación estándar.
Al realizar pruebas estadísticas, es importante tener en cuenta la diferencia entre un población y un muestra. Para calcular la desviación estándar (o varianza) de una población, necesitaría recolectar mediciones para todos los miembros del grupo que está estudiando; para una muestra, solo recolectaría mediciones de un subconjunto de la población.
En el ejemplo anterior, asumimos que el grupo de cinco amigos era una población; si lo hubiéramos tratado como una muestra, calcular la desviación estándar de la muestra y la varianza de la muestra sería ligeramente diferente (en lugar de dividir por el tamaño de la muestra para encontrar la varianza, primero habríamos restado uno del tamaño de la muestra y luego dividido por este menor número).
La varianza y la desviación estándar son importantes en las estadísticas, ya que sirven como base para otros tipos de cálculos estadísticos. Por ejemplo, la desviación estándar es necesaria para convertir los puntajes de las pruebas en puntajes Z. La varianza y la desviación estándar también juegan un papel importante cuando se realizan pruebas estadísticas como las pruebas t.
Frankfort-Nachmias, C. y Leon-Guerrero, A. (2006). Estadísticas sociales para una sociedad diversa. Thousand Oaks, CA: Pine Forge Press.