Comprensión del rango intercuartil en estadística

El rango intercuartil (IQR) es la diferencia entre el primer cuartil y el tercer cuartil. La fórmula para esto es:

IQR = Q3 - Q1

Hay muchas mediciones de la variabilidad de un conjunto de datos. Tanto el rango como la desviación estándar nos dicen qué tan dispersos son nuestros datos. El problema con estas estadísticas descriptivas es que son bastante sensibles a los valores atípicos. Una medida de la extensión de un conjunto de datos que es más resistente a la presencia de valores atípicos es el rango intercuartil.

Definición de rango intercuartil

Como se vio anteriormente, el rango intercuartil se basa en el cálculo de otras estadísticas. Antes de determinar el rango intercuartil, primero necesitamos conocer los valores del primer cuartil y el tercer cuartil. (Por supuesto, el primer y tercer cuartiles dependen del valor de la mediana).

Una vez que hemos determinado los valores del primer y tercer cuartiles, el rango intercuartil es muy fácil de calcular. Todo lo que tenemos que hacer es restar el primer cuartil del tercer cuartil. Esto explica el uso del término rango intercuartil para esta estadística.

Ejemplo

Para ver un ejemplo del cálculo de un rango intercuartil, consideraremos el conjunto de datos: 2, 3, 3, 4, 5, 6, 6, 7, 8, 8, 8, 9. El resumen de cinco números para esto conjunto de datos es:

  • Mínimo de 2
  • Primer cuartil de 3.5
  • Mediana de 6
  • Tercer cuartil de 8
  • Máximo de 9

Así vemos que el rango intercuartil es 8 - 3.5 = 4.5.

El significado del rango intercuartil

El rango nos da una medida de cuán extendido es la totalidad de nuestro conjunto de datos. El rango intercuartil, que nos dice qué tan separados están el primer y el tercer cuartil, indica qué tan extendido está el 50% medio de nuestro conjunto de datos..

Resistencia a los valores atípicos

La principal ventaja de utilizar el rango intercuartil en lugar del rango para la medición de la dispersión de un conjunto de datos es que el rango intercuartil no es sensible a los valores atípicos. Para ver esto, veremos un ejemplo.

Del conjunto de datos anterior tenemos un rango intercuartil de 3.5, un rango de 9 - 2 = 7 y una desviación estándar de 2.34. Si reemplazamos el valor más alto de 9 con un valor extremo atípico de 100, la desviación estándar se convierte en 27.37 y el rango es 98. Aunque tenemos cambios bastante drásticos de estos valores, el primer y tercer cuartiles no se ven afectados y, por lo tanto, el rango intercuartil no cambia.

Uso del rango intercuartil

Además de ser una medida menos sensible de la propagación de un conjunto de datos, el rango intercuartil tiene otro uso importante. Debido a su resistencia a los valores atípicos, el rango intercuartil es útil para identificar cuándo un valor es un valor atípico.

La regla del rango intercuartil es lo que nos informa si tenemos un valor atípico leve o fuerte. Para buscar un valor atípico, debemos mirar por debajo del primer cuartil o por encima del tercer cuartil. Hasta dónde debemos llegar depende del valor del rango intercuartil.