¿Cuál es el resumen de 5 números?

Hay una variedad de estadísticas descriptivas. Números como la media, la mediana, la moda, la asimetría, la curtosis, la desviación estándar, el primer cuartil y el tercer cuartil, por nombrar algunos, cada uno nos dice algo sobre nuestros datos. En lugar de mirar estas estadísticas descriptivas individualmente, a veces combinarlas ayuda a darnos una imagen completa. Con este fin en mente, el resumen de cinco números es una forma conveniente de combinar cinco estadísticas descriptivas.

¿Qué cinco números??

Está claro que debe haber cinco números en nuestro resumen, pero ¿cuáles cinco? Los números elegidos son para ayudarnos a conocer el centro de nuestros datos, así como la distribución de los puntos de datos. Con esto en mente, el resumen de cinco números consiste en lo siguiente:

  • El mínimo: este es el valor más pequeño en nuestro conjunto de datos.
  • El primer cuartil: este número se denota Q1 y el 25% de nuestros datos cae por debajo del primer cuartil.
  • La mediana: este es el punto medio de los datos. 50% de todos los datos caen por debajo de la mediana.
  • El tercer cuartil: este número se denota Q3 y el 75% de nuestros datos cae por debajo del tercer cuartil.
  • El máximo: este es el valor más grande en nuestro conjunto de datos.

La media y la desviación estándar también se pueden usar juntas para transmitir el centro y la difusión de un conjunto de datos. Sin embargo, ambas estadísticas son susceptibles de valores atípicos. La mediana, el primer cuartil y el tercer cuartil no están tan influenciados por los valores atípicos..

Un ejemplo

Dado el siguiente conjunto de datos, informaremos el resumen de cinco números:

1, 2, 2, 3, 4, 6, 6, 7, 7, 7, 8, 11, 12, 15, 15, 15, 17, 17, 18, 20

Hay un total de veinte puntos en el conjunto de datos. La mediana es, por lo tanto, el promedio de los valores de datos décimo y undécimo o:

(7 + 8) / 2 = 7.5.

La mediana de la mitad inferior de los datos es el primer cuartil. La mitad inferior es:

1, 2, 2, 3, 4, 6, 6, 7, 7, 7

Así calculamosQ1= (4 + 6) / 2 = 5.

La mediana de la mitad superior del conjunto de datos original es el tercer cuartil. Necesitamos encontrar la mediana de:

8, 11, 12, 15, 15, 15, 17, 17, 18, 20

Así calculamosQ3= (15 + 15) / 2 = 15.

Reunimos todos los resultados anteriores e informamos que el resumen de cinco números para el conjunto de datos anterior es 1, 5, 7.5, 12, 20.

Representación grafica

Se pueden comparar cinco resúmenes de números entre sí. Encontraremos que dos conjuntos con medias similares y desviaciones estándar pueden tener resúmenes de cinco números muy diferentes. Para comparar fácilmente dos resúmenes de cinco números de un vistazo, podemos usar una gráfica de caja o un gráfico de caja y bigotes.