Intervalos de confianza 4 errores comunes

Los intervalos de confianza son una parte clave de las estadísticas inferenciales. Podemos usar cierta probabilidad e información de una distribución de probabilidad para estimar un parámetro de población con el uso de una muestra. La declaración de un intervalo de confianza se realiza de tal manera que se malinterpreta fácilmente. Analizaremos la interpretación correcta de los intervalos de confianza e investigaremos cuatro errores que se cometen con respecto a esta área de estadísticas..

¿Qué es un intervalo de confianza??

Un intervalo de confianza se puede expresar como un rango de valores o en la siguiente forma:

Estimación ± Margen de error

Un intervalo de confianza generalmente se establece con un nivel de confianza. Los niveles de confianza comunes son 90%, 95% y 99%.

Veremos un ejemplo en el que queremos usar una media muestral para inferir la media de una población. Supongamos que esto da como resultado un intervalo de confianza de 25 a 30. Si decimos que tenemos una confianza del 95% de que la media de población desconocida está contenida en este intervalo, entonces realmente estamos diciendo que encontramos el intervalo utilizando un método que es exitoso en dando resultados correctos el 95% del tiempo. A la larga, nuestro método no tendrá éxito el 5% del tiempo. En otras palabras, no lograremos capturar la verdadera población, lo que significa que solo una de cada 20 veces.

Error # 1

Ahora veremos una serie de errores diferentes que se pueden cometer cuando se trata de intervalos de confianza. Una afirmación incorrecta que a menudo se hace sobre un intervalo de confianza con un nivel de confianza del 95% es que existe una probabilidad del 95% de que el intervalo de confianza contenga la media real de la población.

La razón de que esto sea un error es realmente bastante sutil. La idea clave relacionada con un intervalo de confianza es que la probabilidad utilizada ingresa a la imagen con el método que se utiliza, al determinar el intervalo de confianza es que se refiere al método que se utiliza.

Error # 2

Un segundo error es interpretar que un intervalo de confianza del 95% dice que el 95% de todos los valores de datos en la población se encuentran dentro del intervalo. Nuevamente, el 95% habla sobre el método de la prueba..

Para ver por qué la afirmación anterior es incorrecta, podríamos considerar una población normal con una desviación estándar de 1 y una media de 5. Una muestra que tenía dos puntos de datos, cada uno con valores de 6 tiene una media muestral de 6. Un 95% El intervalo de confianza para la media de la población sería de 4.6 a 7.4. Esto claramente no se superpone con el 95% de la distribución normal, por lo que no contendrá el 95% de la población.

Error # 3

Un tercer error es decir que un intervalo de confianza del 95% implica que el 95% de todos los medios de muestra posibles se encuentran dentro del rango del intervalo. Reconsidere el ejemplo de la última sección. Cualquier muestra de tamaño dos que estuviera compuesta solo por valores menores a 4.6 tendría una media menor a 4.6. Por lo tanto, estas medias muestrales quedarían fuera de este intervalo de confianza particular. Las muestras que coinciden con esta descripción representan más del 5% del monto total. Por lo tanto, es un error decir que este intervalo de confianza captura el 95% de todas las medias muestrales.

Error # 4

Un cuarto error al tratar con los intervalos de confianza es pensar que son la única fuente de error. Si bien hay un margen de error asociado con un intervalo de confianza, hay otros lugares donde los errores pueden arrastrarse en un análisis estadístico. Un par de ejemplos de este tipo de errores podrían ser el diseño incorrecto del experimento, el sesgo en el muestreo o la imposibilidad de obtener datos de un determinado subconjunto de la población..