La regla del rango intercuartil es útil para detectar la presencia de valores atípicos. Los valores atípicos son valores individuales que quedan fuera del patrón general del resto de los datos. Esta definición es algo vaga y subjetiva, por lo que es útil tener una regla para ayudar a considerar si un punto de datos es realmente un valor atípico.
Cualquier conjunto de datos puede describirse por su resumen de cinco números. Estos cinco números, en orden ascendente, consisten en:
Estos cinco números se pueden usar para contarnos un poco sobre nuestros datos. Por ejemplo, el rango, que es solo el mínimo restado del máximo, es un indicador de cómo extender el conjunto de datos..
Similar al rango, pero menos sensible a los valores atípicos, es el rango intercuartil. El rango intercuartil se calcula de la misma manera que el rango. Todo lo que hacemos es restar el primer cuartil del tercer cuartil:
IQR = Q3 - Q1.
El rango intercuartil muestra cómo se distribuyen los datos sobre la mediana. Es menos susceptible que el rango a los valores atípicos.
El rango intercuartil se puede usar para ayudar a detectar valores atípicos. Todo lo que necesitamos hacer es lo siguiente:
Es importante recordar que esta es una regla general y generalmente se cumple. En general, debemos hacer un seguimiento en nuestro análisis. Cualquier posible valor atípico obtenido por este método debe examinarse en el contexto de todo el conjunto de datos..
Veremos esta regla de rango intercuartil en funcionamiento con un ejemplo numérico. Supongamos que tenemos el siguiente conjunto de datos: 1, 3, 4, 6, 7, 7, 8, 8, 10, 12, 17. El resumen de cinco números para este conjunto de datos es mínimo = 1, primer cuartil = 4, mediana = 7, tercer cuartil = 10 y máximo = 17. Podemos mirar los datos y decir que 17 es un valor atípico. Pero, ¿qué dice nuestra regla de rango intercuartil??
Calculamos el rango intercuartil para ser
Q3 - Q1 = 10 - 4 = 6
Ahora multiplicamos por 1.5 y tenemos 1.5 x 6 = 9. Nueve menos que el primer cuartil es 4 - 9 = -5. Ningún dato es menor que esto. Nueve más que el tercer cuartil es 10 + 9 = 19. Ningún dato es mayor que esto. A pesar de que el valor máximo es cinco más que el punto de datos más cercano, la regla del rango intercuartil muestra que probablemente no debería considerarse un valor atípico para este conjunto de datos.