Un histograma es un tipo de gráfico que tiene amplias aplicaciones en estadística. Los histogramas proporcionan una interpretación visual de los datos numéricos al indicar el número de puntos de datos que se encuentran dentro de un rango de valores. Estos rangos de valores se denominan clases o bins. La frecuencia de los datos que cae en cada clase se representa mediante el uso de una barra. Cuanto más alta sea la barra, mayor será la frecuencia de los valores de datos en ese bin.
A primera vista, los histogramas se parecen mucho a los gráficos de barras. Ambas gráficas emplean barras verticales para representar datos. La altura de una barra corresponde a la frecuencia relativa de la cantidad de datos en la clase. Cuanto mayor sea la barra, mayor será la frecuencia de los datos. Cuanto más baja es la barra, más baja es la frecuencia de los datos. Pero las apariencias pueden ser engañosas. Es aquí donde las similitudes terminan entre los dos tipos de gráficos..
La razón por la que estos tipos de gráficos son diferentes tiene que ver con el nivel de medición de los datos. Por un lado, los gráficos de barras se utilizan para datos en el nivel nominal de medición. Los gráficos de barras miden la frecuencia de los datos categóricos, y las clases para un gráfico de barras son estas categorías. Por otro lado, los histogramas se usan para datos que están al menos en el nivel ordinal de medición. Las clases para un histograma son rangos de valores..
Otra diferencia clave entre los gráficos de barras y los histogramas tiene que ver con el orden de las barras. En un gráfico de barras, es una práctica común reorganizar las barras en orden de altura decreciente. Sin embargo, las barras en un histograma no se pueden reorganizar. Deben mostrarse en el orden en que ocurren las clases.
El diagrama de arriba nos muestra un histograma. Supongamos que se lanzan cuatro monedas y se registran los resultados. El uso de la tabla de distribución binomial apropiada o los cálculos directos con la fórmula binomial muestran que la probabilidad de que no se muestren cabezas es 1/16, la probabilidad de que una cabeza se muestre es 4/16. La probabilidad de dos cabezas es 6/16. La probabilidad de tres cabezas es 4/16. La probabilidad de cuatro cabezas es 1/16.
Construimos un total de cinco clases, cada una de ancho uno. Estas clases corresponden al número de cabezas posibles: cero, uno, dos, tres o cuatro. Sobre cada clase, dibujamos una barra vertical o un rectángulo. Las alturas de estas barras corresponden a las probabilidades mencionadas para nuestro experimento de probabilidad de lanzar cuatro monedas y contar las caras..
El ejemplo anterior no solo demuestra la construcción de un histograma, sino que también muestra que las distribuciones de probabilidad discretas se pueden representar con un histograma. De hecho, y la distribución de probabilidad discreta puede ser representada por un histograma.
Para construir un histograma que represente una distribución de probabilidad, comenzamos seleccionando las clases. Estos deberían ser los resultados de un experimento de probabilidad. El ancho de cada una de estas clases debe ser una unidad. Las alturas de las barras del histograma son las probabilidades para cada uno de los resultados. Con un histograma construido de tal manera, las áreas de las barras también son probabilidades.
Dado que este tipo de histograma nos da probabilidades, está sujeto a un par de condiciones. Una estipulación es que solo se pueden usar números no negativos para la escala que nos da la altura de una barra dada del histograma. Una segunda condición es que, dado que la probabilidad es igual al área, todas las áreas de las barras deben sumar un total de una, equivalente al 100%.
Las barras en un histograma no necesitan ser probabilidades. Los histogramas son útiles en otras áreas además de la probabilidad. Cada vez que deseamos comparar la frecuencia de ocurrencia de datos cuantitativos, se puede usar un histograma para representar nuestro conjunto de datos.