El primer y tercer cuartiles son estadísticas descriptivas que son medidas de posición en un conjunto de datos. Similar a cómo la mediana denota el punto medio de un conjunto de datos, el primer cuartil marca el cuarto o punto del 25%. Aproximadamente el 25% de los valores de los datos son menores o iguales que el primer cuartil. El tercer cuartil es similar, pero para el 25% superior de los valores de datos. Analizaremos estas ideas con más detalle a continuación..
Hay varias formas de medir el centro de un conjunto de datos. La media, la mediana, la moda y el rango medio tienen sus ventajas y limitaciones para expresar la mitad de los datos. De todas estas formas de encontrar el promedio, la mediana es la más resistente a los valores atípicos. Marca el centro de los datos en el sentido de que la mitad de los datos es menor que la mediana.
No hay razón para detenernos en encontrar solo el medio. ¿Qué pasa si decidimos continuar este proceso? Podríamos calcular la mediana de la mitad inferior de nuestros datos. La mitad del 50% es 25%. Por lo tanto, la mitad de la mitad, o un cuarto, de los datos estaría por debajo de esto. Como estamos tratando con una cuarta parte del conjunto original, esta mediana de la mitad inferior de los datos se llama primer cuartil y se denota por Q1.
No hay ninguna razón por la que miramos la mitad inferior de los datos. En cambio, podríamos haber mirado la mitad superior y haber realizado los mismos pasos que arriba. La mediana de esta mitad, que denotaremos por Q3 también divide el conjunto de datos en cuartos. Sin embargo, este número denota la cuarta parte superior de los datos. Por lo tanto, tres cuartos de los datos están por debajo de nuestro número Q3. Por eso llamamos Q3 el tercer cuartil.
Para aclarar todo esto, veamos un ejemplo. Puede ser útil revisar primero cómo calcular la mediana de algunos datos. Comience con el siguiente conjunto de datos:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7, 8, 11, 12, 15, 15, 15, 17, 17, 18, 20
Hay un total de veinte puntos de datos en el conjunto. Comenzamos por encontrar la mediana. Como hay un número par de valores de datos, la mediana es la media de los valores décimo y undécimo. En otras palabras, la mediana es:
(7 + 8) / 2 = 7.5.
Ahora mire la mitad inferior de los datos. La mediana de esta mitad se encuentra entre los valores quinto y sexto de:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7
Por lo tanto, se encuentra que el primer cuartil es igual Q1 = (4 + 6) / 2 = 5
Para encontrar el tercer cuartil, mire la mitad superior del conjunto de datos original. Necesitamos encontrar la mediana de:
8, 11, 12, 15, 15, 15, 17, 17, 18, 20
Aquí la mediana es (15 + 15) / 2 = 15. Así, el tercer cuartil Q3 = 15.
Los cuartiles ayudan a darnos una imagen más completa de nuestro conjunto de datos en su conjunto. El primer y tercer cuartiles nos brindan información sobre la estructura interna de nuestros datos. La mitad central de los datos se encuentra entre el primer y el tercer cuartil, y se centra en la mediana. La diferencia entre el primer y el tercer cuartil, llamado rango intercuartil, muestra cómo se organizan los datos sobre la mediana. Un pequeño rango intercuartil indica datos agrupados sobre la mediana. Un rango intercuartil mayor muestra que los datos están más dispersos.
Se puede obtener una imagen más detallada de los datos conociendo el valor más alto, llamado valor máximo, y el valor más bajo, llamado valor mínimo. El mínimo, primer cuartil, mediana, tercer cuartil y máximo son un conjunto de cinco valores llamados resumen de cinco números. Una forma efectiva de mostrar estos cinco números se llama diagrama de caja o gráfico de caja y bigote.