A veces, en las estadísticas, es útil ver ejemplos resueltos de problemas. Estos ejemplos pueden ayudarnos a resolver problemas similares. En este artículo, analizaremos el proceso de llevar a cabo estadísticas inferenciales para obtener un resultado relativo a dos medios de población. No solo veremos cómo realizar una prueba de hipótesis sobre la diferencia de dos medias de población, sino que también construiremos un intervalo de confianza para esta diferencia. Los métodos que utilizamos a veces se denominan prueba t de dos muestras y un intervalo de confianza t de dos muestras.
Supongamos que deseamos evaluar la aptitud matemática de los niños de primaria. Una pregunta que podemos tener es si los niveles de grado más altos tienen puntajes de prueba promedio más altos.
Una muestra aleatoria simple de 27 estudiantes de tercer grado recibe una prueba de matemáticas, se califican sus respuestas y se encuentra que los resultados tienen una puntuación media de 75 puntos con una desviación estándar de la muestra de 3 puntos.
Una muestra aleatoria simple de 20 estudiantes de quinto grado recibe el mismo examen de matemáticas y sus respuestas se califican. El puntaje promedio para los estudiantes de quinto grado es 84 puntos con una desviación estándar de muestra de 5 puntos.
Ante este escenario hacemos las siguientes preguntas:
Debemos seleccionar qué procedimiento usar. Al hacer esto, debemos asegurarnos y verificar que se hayan cumplido las condiciones para este procedimiento. Se nos pide que comparemos dos medias poblacionales. Una colección de métodos que se pueden usar para hacer esto son aquellos para procedimientos t de dos muestras.
Para utilizar estos procedimientos t para dos muestras, debemos asegurarnos de que se cumplan las siguientes condiciones:
Vemos que la mayoría de estas condiciones se cumplen. Nos dijeron que tenemos muestras aleatorias simples. Las poblaciones que estamos estudiando son grandes ya que hay millones de estudiantes en estos niveles de grado..
La condición que no podemos asumir automáticamente es si los puntajes de las pruebas se distribuyen normalmente. Como tenemos un tamaño de muestra lo suficientemente grande, por la solidez de nuestros procedimientos t, no necesariamente necesitamos que la variable esté distribuida normalmente.
Como se cumplen las condiciones, realizamos un par de cálculos preliminares..
El error estándar es una estimación de una desviación estándar. Para esta estadística, agregamos la varianza muestral de las muestras y luego tomamos la raíz cuadrada. Esto da la fórmula:
(s1 2 / / norte1 + s22 / / norte2)1/2
Al usar los valores anteriores, vemos que el valor del error estándar es