Hay una variedad de estadísticas descriptivas. Números como la media, la mediana, la moda, la asimetría, la curtosis, la desviación estándar, el primer cuartil y el tercer cuartil, por nombrar algunos, cada uno nos dice algo sobre nuestros datos. En lugar de mirar estas estadísticas descriptivas individualmente, a veces combinarlas ayuda a darnos una imagen completa. Con este fin en mente, el resumen de cinco números es una forma conveniente de combinar cinco estadísticas descriptivas.
Está claro que debe haber cinco números en nuestro resumen, pero ¿cuáles cinco? Los números elegidos son para ayudarnos a conocer el centro de nuestros datos, así como la distribución de los puntos de datos. Con esto en mente, el resumen de cinco números consiste en lo siguiente:
La media y la desviación estándar también se pueden usar juntas para transmitir el centro y la difusión de un conjunto de datos. Sin embargo, ambas estadísticas son susceptibles de valores atípicos. La mediana, el primer cuartil y el tercer cuartil no están tan influenciados por los valores atípicos..
Dado el siguiente conjunto de datos, informaremos el resumen de cinco números:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7, 8, 11, 12, 15, 15, 15, 17, 17, 18, 20
Hay un total de veinte puntos en el conjunto de datos. La mediana es, por lo tanto, el promedio de los valores de datos décimo y undécimo o:
(7 + 8) / 2 = 7.5.
La mediana de la mitad inferior de los datos es el primer cuartil. La mitad inferior es:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7
Así calculamosQ1= (4 + 6) / 2 = 5.
La mediana de la mitad superior del conjunto de datos original es el tercer cuartil. Necesitamos encontrar la mediana de:
8, 11, 12, 15, 15, 15, 17, 17, 18, 20
Así calculamosQ3= (15 + 15) / 2 = 15.
Reunimos todos los resultados anteriores e informamos que el resumen de cinco números para el conjunto de datos anterior es 1, 5, 7.5, 12, 20.
Se pueden comparar cinco resúmenes de números entre sí. Encontraremos que dos conjuntos con medias similares y desviaciones estándar pueden tener resúmenes de cinco números muy diferentes. Para comparar fácilmente dos resúmenes de cinco números de un vistazo, podemos usar una gráfica de caja o un gráfico de caja y bigotes.