¿Qué es la regla del rango intercuartil?

La regla del rango intercuartil es útil para detectar la presencia de valores atípicos. Los valores atípicos son valores individuales que quedan fuera del patrón general del resto de los datos. Esta definición es algo vaga y subjetiva, por lo que es útil tener una regla para ayudar a considerar si un punto de datos es realmente un valor atípico.

El rango intercuartil

Cualquier conjunto de datos puede describirse por su resumen de cinco números. Estos cinco números, en orden ascendente, consisten en:

  • El valor mínimo o más bajo del conjunto de datos.
  • El primer cuartil Q1 - esto representa un cuarto del camino a través de la lista de todos los datos
  • La mediana del conjunto de datos: representa el punto medio de la lista de todos los datos.
  • El tercer cuartil Q3 - esto representa tres cuartos del camino a través de la lista de todos los datos
  • El valor máximo o más alto del conjunto de datos..

Estos cinco números se pueden usar para contarnos un poco sobre nuestros datos. Por ejemplo, el rango, que es solo el mínimo restado del máximo, es un indicador de cómo extender el conjunto de datos..

Similar al rango, pero menos sensible a los valores atípicos, es el rango intercuartil. El rango intercuartil se calcula de la misma manera que el rango. Todo lo que hacemos es restar el primer cuartil del tercer cuartil:

IQR = Q3 - Q1.

El rango intercuartil muestra cómo se distribuyen los datos sobre la mediana. Es menos susceptible que el rango a los valores atípicos.

Regla intercuartil para valores atípicos

El rango intercuartil se puede usar para ayudar a detectar valores atípicos. Todo lo que necesitamos hacer es lo siguiente:

  1. Calcular el rango intercuartil para nuestros datos
  2. Multiplique el rango intercuartil (IQR) por el número 1.5
  3. Agregue 1.5 x (IQR) al tercer cuartil. Cualquier número mayor que este es un presunto atípico.
  4. Restar 1.5 x (IQR) del primer cuartil. Cualquier número menor que este es un presunto atípico.

Es importante recordar que esta es una regla general y generalmente se cumple. En general, debemos hacer un seguimiento en nuestro análisis. Cualquier posible valor atípico obtenido por este método debe examinarse en el contexto de todo el conjunto de datos..

Ejemplo

Veremos esta regla de rango intercuartil en funcionamiento con un ejemplo numérico. Supongamos que tenemos el siguiente conjunto de datos: 1, 3, 4, 6, 7, 7, 8, 8, 10, 12, 17. El resumen de cinco números para este conjunto de datos es mínimo = 1, primer cuartil = 4, mediana = 7, tercer cuartil = 10 y máximo = 17. Podemos mirar los datos y decir que 17 es un valor atípico. Pero, ¿qué dice nuestra regla de rango intercuartil??

Calculamos el rango intercuartil para ser

Q3 - Q1 = 10 - 4 = 6

Ahora multiplicamos por 1.5 y tenemos 1.5 x 6 = 9. Nueve menos que el primer cuartil es 4 - 9 = -5. Ningún dato es menor que esto. Nueve más que el tercer cuartil es 10 + 9 = 19. Ningún dato es mayor que esto. A pesar de que el valor máximo es cinco más que el punto de datos más cercano, la regla del rango intercuartil muestra que probablemente no debería considerarse un valor atípico para este conjunto de datos.