El teorema del límite central es el resultado de la teoría de probabilidad. Este teorema aparece en varios lugares en el campo de la estadística. Aunque el teorema del límite central puede parecer abstracto y carente de aplicación, este teorema es bastante importante para la práctica de la estadística..
Entonces, ¿cuál es exactamente la importancia del teorema del límite central? Todo tiene que ver con la distribución de nuestra población. Este teorema le permite simplificar problemas en estadísticas al permitirle trabajar con una distribución que es aproximadamente normal.
La declaración del teorema del límite central puede parecer bastante técnica, pero se puede entender si pensamos en los siguientes pasos. Comenzamos con una muestra aleatoria simple con norte individuos de una población de interés. A partir de esta muestra, podemos formar fácilmente una media muestral que corresponde a la media de qué medida tenemos curiosidad en nuestra población.
Se produce una distribución de muestreo para la media muestral seleccionando repetidamente muestras aleatorias simples de la misma población y del mismo tamaño, y luego calculando la media muestral para cada una de estas muestras. Estas muestras deben considerarse independientes entre sí..
El teorema del límite central se refiere a la distribución muestral de las medias muestrales. Podemos preguntar sobre la forma general de la distribución de muestreo. El teorema del límite central dice que esta distribución de muestreo es aproximadamente normal, comúnmente conocida como curva de campana. Esta aproximación mejora a medida que aumentamos el tamaño de las muestras aleatorias simples que se utilizan para producir la distribución de muestreo..
Hay una característica muy sorprendente con respecto al teorema del límite central. El hecho sorprendente es que este teorema dice que una distribución normal surge independientemente de la distribución inicial. Incluso si nuestra población tiene una distribución sesgada, que ocurre cuando examinamos cosas como los ingresos o el peso de las personas, una distribución muestral para una muestra con un tamaño de muestra suficientemente grande será normal.
La aparición inesperada de una distribución normal de una distribución de población sesgada (incluso bastante sesgada) tiene algunas aplicaciones muy importantes en la práctica estadística. Muchas prácticas en estadística, como las que implican pruebas de hipótesis o intervalos de confianza, hacen algunas suposiciones sobre la población de la que se obtuvieron los datos. Una suposición que se hace inicialmente en un curso de estadística es que las poblaciones con las que trabajamos están normalmente distribuidas.
La suposición de que los datos provienen de una distribución normal simplifica las cosas, pero parece un poco poco realista. Solo un poco de trabajo con algunos datos del mundo real muestra que los valores atípicos, la asimetría, los picos múltiples y la asimetría se muestran de manera bastante rutinaria. Podemos evitar el problema de los datos de una población que no es normal. El uso de un tamaño de muestra apropiado y el teorema del límite central nos ayudan a sortear el problema de los datos de poblaciones que no son normales..
Por lo tanto, aunque no conozcamos la forma de la distribución de donde provienen nuestros datos, el teorema del límite central dice que podemos tratar la distribución de muestreo como si fuera normal. Por supuesto, para que las conclusiones del teorema se mantengan, necesitamos un tamaño de muestra que sea lo suficientemente grande. El análisis exploratorio de datos puede ayudarnos a determinar qué tamaño de muestra es necesario para una situación dada.