¿Cuál es la desigualdad de Chebyshev?

La desigualdad de Chebyshev dice que al menos 1-1 /K2 de datos de una muestra debe estar dentro de K desviaciones estándar de la media (aquí K es cualquier número real positivo mayor que uno).

Cualquier conjunto de datos que normalmente se distribuye, o en forma de curva de campana, tiene varias características. Uno de ellos se ocupa de la difusión de los datos en relación con el número de desviaciones estándar de la media. En una distribución normal, sabemos que el 68% de los datos es una desviación estándar de la media, el 95% son dos desviaciones estándar de la media y aproximadamente el 99% se encuentra dentro de tres desviaciones estándar de la media.

Pero si el conjunto de datos no se distribuye en forma de curva de campana, entonces una cantidad diferente podría estar dentro de una desviación estándar. La desigualdad de Chebyshev proporciona una manera de saber en qué fracción de los datos cae K desviaciones estándar de la media para ninguna conjunto de datos.

Hechos sobre la desigualdad

También podemos establecer la desigualdad anterior reemplazando la frase "datos de una muestra" con distribución de probabilidad. Esto se debe a que la desigualdad de Chebyshev es el resultado de la probabilidad, que luego puede aplicarse a las estadísticas.

Es importante tener en cuenta que esta desigualdad es un resultado que se ha demostrado matemáticamente. No es como la relación empírica entre la media y el modo, o la regla general que conecta el rango y la desviación estándar.

Ilustración de la desigualdad

Para ilustrar la desigualdad, veremos algunos valores de K:

  • por K = 2 tenemos 1 - 1 /K2 = 1 - 1/4 = 3/4 = 75%. Entonces, la desigualdad de Chebyshev dice que al menos el 75% de los valores de datos de cualquier distribución deben estar dentro de dos desviaciones estándar de la media.
  • por K = 3 tenemos 1 - 1 /K2 = 1 - 1/9 = 8/9 = 89%. Entonces, la desigualdad de Chebyshev dice que al menos el 89% de los valores de datos de cualquier distribución deben estar dentro de tres desviaciones estándar de la media.
  • por K = 4 tenemos 1 - 1 /K2 = 1 - 1/16 = 15/16 = 93.75%. Entonces, la desigualdad de Chebyshev dice que al menos el 93.75% de los valores de datos de cualquier distribución deben estar dentro de dos desviaciones estándar de la media.

Ejemplo

Supongamos que hemos muestreado los pesos de los perros en el refugio de animales local y descubrimos que nuestra muestra tiene una media de 20 libras con una desviación estándar de 3 libras. Con el uso de la desigualdad de Chebyshev, sabemos que al menos el 75% de los perros que muestreamos tienen pesos que son dos desviaciones estándar de la media. Dos veces la desviación estándar nos da 2 x 3 = 6. Resta y suma esto de la media de 20. Esto nos dice que el 75% de los perros tienen un peso de 14 libras a 26 libras.

Uso de la desigualdad

Si sabemos más acerca de la distribución con la que estamos trabajando, entonces generalmente podemos garantizar que más datos están a un cierto número de desviaciones estándar de la media. Por ejemplo, si sabemos que tenemos una distribución normal, entonces el 95% de los datos son dos desviaciones estándar de la media. La desigualdad de Chebyshev dice que en esta situación sabemos que al menos El 75% de los datos son dos desviaciones estándar de la media. Como podemos ver en este caso, podría ser mucho más que este 75%.

El valor de la desigualdad es que nos da un escenario de "peor caso" en el que lo único que sabemos sobre nuestros datos de muestra (o distribución de probabilidad) es la media y la desviación estándar. Cuando no sabemos nada más sobre nuestros datos, la desigualdad de Chebyshev proporciona una idea adicional de cuán extendido es el conjunto de datos.

Historia de la desigualdad

La desigualdad lleva el nombre del matemático ruso Pafnuty Chebyshev, quien declaró la desigualdad por primera vez sin pruebas en 1874. Diez años más tarde, Markov demostró la desigualdad en su Ph.D. disertación. Debido a las variaciones en cómo representar el alfabeto ruso en inglés, Chebyshev también se escribe como Tchebysheff.