Es la proyección de medianoche de la nueva película de éxito. Las personas están en fila afuera del teatro esperando para entrar. Supongamos que le piden que encuentre el centro de la línea. Cómo harías esto?
Hay un par de formas diferentes de resolver este problema. Al final, tendría que averiguar cuántas personas había en la fila y luego tomar la mitad de ese número. Si el número total es par, entonces el centro de la línea estaría entre dos personas. Si el número total es impar, entonces el centro sería una sola persona.
Puede preguntar: "¿Qué tiene que ver encontrar el centro de una línea con las estadísticas?" Esta idea de encontrar el centro es exactamente lo que se usa al calcular la mediana de un conjunto de datos.
La mediana es una de las tres formas principales de encontrar el promedio de datos estadísticos. Es más difícil de calcular que el modo, pero no tan laborioso como calcular la media. Es el centro de la misma manera que encontrar el centro de una línea de personas. Después de enumerar los valores de datos en orden ascendente, la mediana es el valor de datos con el mismo número de valores de datos encima y debajo de él.
Se prueban once baterías para ver cuánto duran. Sus vidas, en horas, están dadas por 10, 99, 100, 103, 103, 105, 110, 111, 115, 130, 131. ¿Cuál es la vida media? Como hay un número impar de valores de datos, esto corresponde a una línea con un número impar de personas. El centro será el valor medio..
Hay once valores de datos, por lo que el sexto está en el centro. Por lo tanto, la duración media de la batería es el sexto valor en esta lista, o 105 horas. Tenga en cuenta que la mediana es uno de los valores de datos.
Se pesan veinte gatos. Sus pesos, en libras, están dados por 4, 5, 5, 5, 6, 6, 6, 7, 7, 7, 8, 8, 9, 10, 10, 10, 11, 12, 12, 13. Qué Cuál es la mediana del peso felino? Como hay un número par de valores de datos, esto corresponde a la línea con un número par de personas. El centro está entre los dos valores medios..
En este caso, el centro se encuentra entre los valores de datos décimo y undécimo. Para encontrar la mediana calculamos la media de estos dos valores y obtenemos (7 + 8) / 2 = 7.5. Aquí la mediana no es uno de los valores de datos.
Las únicas dos posibilidades son tener un número par o impar de valores de datos. Entonces, los dos ejemplos anteriores son las únicas formas posibles de calcular la mediana. O la mediana será el valor medio, o la mediana será la media de los dos valores medios. Por lo general, los conjuntos de datos son mucho más grandes que los que vimos anteriormente, pero el proceso de encontrar la mediana es el mismo que estos dos ejemplos.
La media y el modo son muy sensibles a los valores atípicos. Lo que esto significa es que la presencia de un valor atípico afectará dramáticamente ambas medidas del centro. Una ventaja de la mediana es que no está influenciada tanto por un valor atípico..
Para ver esto, considere el conjunto de datos 3, 4, 5, 5, 6. La media es (3 + 4 + 5 + 5 + 6) / 5 = 4.6, y la mediana es 5. Ahora mantenga el mismo conjunto de datos, pero agregue el valor 100: 3, 4, 5, 5, 6, 100. Claramente, 100 es un valor atípico, ya que es mucho mayor que todos los demás valores. La media del nuevo conjunto es ahora (3 + 4 + 5 + 5 + 6 + 100) / 6 = 20.5. Sin embargo, la mediana del nuevo conjunto es 5. Aunque el
Debido a lo que hemos visto anteriormente, la mediana es la medida preferida del promedio cuando los datos contienen valores atípicos. Cuando se informan los ingresos, un enfoque típico es informar el ingreso medio. Esto se hace porque el ingreso medio está sesgado por un pequeño número de personas con ingresos muy altos (piense en Bill Gates y Oprah).