Ejemplo de dos muestras de prueba T e intervalo de confianza

A veces, en las estadísticas, es útil ver ejemplos resueltos de problemas. Estos ejemplos pueden ayudarnos a resolver problemas similares. En este artículo, analizaremos el proceso de llevar a cabo estadísticas inferenciales para obtener un resultado relativo a dos medios de población. No solo veremos cómo realizar una prueba de hipótesis sobre la diferencia de dos medias de población, sino que también construiremos un intervalo de confianza para esta diferencia. Los métodos que utilizamos a veces se denominan prueba t de dos muestras y un intervalo de confianza t de dos muestras.

La declaración del problema

Supongamos que deseamos evaluar la aptitud matemática de los niños de primaria. Una pregunta que podemos tener es si los niveles de grado más altos tienen puntajes de prueba promedio más altos.

Una muestra aleatoria simple de 27 estudiantes de tercer grado recibe una prueba de matemáticas, se califican sus respuestas y se encuentra que los resultados tienen una puntuación media de 75 puntos con una desviación estándar de la muestra de 3 puntos.

Una muestra aleatoria simple de 20 estudiantes de quinto grado recibe el mismo examen de matemáticas y sus respuestas se califican. El puntaje promedio para los estudiantes de quinto grado es 84 puntos con una desviación estándar de muestra de 5 puntos.

Ante este escenario hacemos las siguientes preguntas:

¿Los datos de la muestra nos proporcionan evidencia de que el puntaje promedio de la prueba de la población de todos los estudiantes de quinto grado excede el puntaje promedio de la prueba de la población de todos los estudiantes de tercer grado??
¿Qué es un intervalo de confianza del 95% para la diferencia en las puntuaciones medias de las pruebas entre las poblaciones de alumnos de tercer y quinto grado?

Condiciones y procedimiento

Debemos seleccionar qué procedimiento usar. Al hacer esto, debemos asegurarnos y verificar que se hayan cumplido las condiciones para este procedimiento. Se nos pide que comparemos dos medias poblacionales. Una colección de métodos que se pueden usar para hacer esto son aquellos para procedimientos t de dos muestras.

Para utilizar estos procedimientos t para dos muestras, debemos asegurarnos de que se cumplan las siguientes condiciones:

Tenemos dos muestras aleatorias simples de las dos poblaciones de interés..
Nuestras muestras aleatorias simples no constituyen más del 5% de la población..
Las dos muestras son independientes entre sí, y no hay coincidencia entre los sujetos..
La variable se distribuye normalmente.
Tanto la media de la población como la desviación estándar son desconocidas para ambas poblaciones.

Vemos que la mayoría de estas condiciones se cumplen. Nos dijeron que tenemos muestras aleatorias simples. Las poblaciones que estamos estudiando son grandes ya que hay millones de estudiantes en estos niveles de grado..

La condición que no podemos asumir automáticamente es si los puntajes de las pruebas se distribuyen normalmente. Como tenemos un tamaño de muestra lo suficientemente grande, por la solidez de nuestros procedimientos t, no necesariamente necesitamos que la variable esté distribuida normalmente.

Como se cumplen las condiciones, realizamos un par de cálculos preliminares..

Error estándar

El error estándar es una estimación de una desviación estándar. Para esta estadística, agregamos la varianza muestral de las muestras y luego tomamos la raíz cuadrada. Esto da la fórmula:

(s₁² / / norte₁ + s₂² / / norte₂)^1/2

Al usar los valores anteriores, vemos que el valor del error estándar es

Ciencias