Una distribución normal de datos es aquella en la que la mayoría de los puntos de datos son relativamente similares, lo que significa que ocurren dentro de un pequeño rango de valores con menos valores atípicos en los extremos alto y bajo del rango de datos.
Cuando los datos se distribuyen normalmente, trazarlos en un gráfico da como resultado una imagen simétrica y en forma de campana, a menudo llamada curva de campana. En dicha distribución de datos, la media, la mediana y la moda tienen el mismo valor y coinciden con el pico de la curva..
Sin embargo, en ciencias sociales, una distribución normal es más un ideal teórico que una realidad común. El concepto y la aplicación de la misma como una lente a través de la cual examinar los datos es a través de una herramienta útil para identificar y visualizar normas y tendencias dentro de un conjunto de datos..
Una de las características más notables de una distribución normal es su forma y simetría perfecta. Si dobla una imagen de una distribución normal exactamente en el medio, obtendrá dos mitades iguales, cada una una imagen especular de la otra. Esto también significa que la mitad de las observaciones en los datos se ubican a ambos lados del centro de la distribución..
El punto medio de una distribución normal es el punto que tiene la frecuencia máxima, es decir, el número o la categoría de respuesta con más observaciones para esa variable. El punto medio de la distribución normal es también el punto en el que caen tres medidas: la media, la mediana y la moda. En una distribución perfectamente normal, estas tres medidas son todas iguales.
En todas las distribuciones normales o casi normales, existe una proporción constante del área bajo la curva que se encuentra entre la media y cualquier distancia dada de la media cuando se mide en unidades de desviación estándar. Por ejemplo, en todas las curvas normales, el 99.73 por ciento de todos los casos caen dentro de tres desviaciones estándar de la media, el 95.45 por ciento de todos los casos caen dentro de dos desviaciones estándar de la media, y el 68.27 por ciento de los casos caen dentro de una desviación estándar de la media.
Las distribuciones normales a menudo se representan en puntajes estándar o puntajes Z, que son números que nos indican la distancia entre un puntaje real y la media en términos de desviaciones estándar. La distribución normal estándar tiene una media de 0.0 y una desviación estándar de 1.0.
Aunque una distribución normal es teórica, hay varias variables que los investigadores estudian y que se parecen mucho a una curva normal. Por ejemplo, los puntajes de los exámenes estandarizados, como SAT, ACT y GRE, generalmente se parecen a una distribución normal. La altura, la capacidad atlética y las numerosas actitudes sociales y políticas de una población determinada también suelen parecerse a una curva de campana.
El ideal de una distribución normal también es útil como punto de comparación cuando los datos no se distribuyen normalmente. Por ejemplo, la mayoría de las personas supone que la distribución del ingreso familiar en los EE. UU. Sería una distribución normal y se parecería a la curva de campana cuando se traza en un gráfico. Esto significaría que la mayoría de los ciudadanos estadounidenses ganan en el rango medio de ingresos, o en otras palabras, que hay una clase media saludable. Mientras tanto, los números de aquellos en las clases económicas más bajas serían pequeños, al igual que los números en las clases altas. Sin embargo, la distribución real del ingreso familiar en los Estados Unidos no se parece en absoluto a una curva de campana. La mayoría de los hogares se ubican en el rango bajo a medio-bajo, lo que significa que hay más personas pobres que luchan por sobrevivir que personas que viven vidas cómodas de clase media. En este caso, el ideal de una distribución normal es útil para ilustrar la desigualdad de ingresos..