Prueba de bondad de ajuste de chi-cuadrado

La prueba de bondad de ajuste de chi-cuadrado es una variación de la prueba de chi-cuadrado más general. La configuración para esta prueba es una variable categórica única que puede tener muchos niveles. A menudo, en esta situación, tendremos en mente un modelo teórico para una variable categórica. A través de este modelo, esperamos que ciertas proporciones de la población caigan en cada uno de estos niveles. Una prueba de bondad de ajuste determina qué tan bien las proporciones esperadas en nuestro modelo teórico coinciden con la realidad.

Hipótesis nulas y alternativas

Las hipótesis nulas y alternativas para una prueba de bondad de ajuste se ven diferentes a algunas de nuestras otras pruebas de hipótesis. Una razón para esto es que una prueba de bondad de ajuste de chi-cuadrado es un método no paramétrico. Esto significa que nuestra prueba no se refiere a un solo parámetro de población. Por lo tanto, la hipótesis nula no establece que un solo parámetro adquiere un cierto valor.

Comenzamos con una variable categórica con norte niveles y dejar pagyo ser la proporción de la población a nivel yo. Nuestro modelo teórico tiene valores de qyo para cada una de las proporciones. La declaración de las hipótesis nula y alternativa son las siguientes:

  • H0 0: pag1 = q1, pag2 = q2,… pagnorte = qnorte
  • Hun: Para al menos uno yo, pagyo no es igual a qyo.

Recuentos reales y esperados

El cálculo de una estadística de chi-cuadrado implica una comparación entre los recuentos reales de variables de los datos en nuestra muestra aleatoria simple y los recuentos esperados de estas variables. Los recuentos reales provienen directamente de nuestra muestra. La forma en que se calculan los recuentos esperados depende de la prueba de chi-cuadrado particular que estamos usando.

Para una prueba de bondad de ajuste, tenemos un modelo teórico de cómo se deben proporcionar nuestros datos. Simplemente multiplicamos estas proporciones por el tamaño de la muestra norte para obtener nuestros recuentos esperados.

Estadística de prueba de computación

La estadística de chi-cuadrado para la prueba de bondad de ajuste se determina comparando los recuentos reales y esperados para cada nivel de nuestra variable categórica. Los pasos para calcular la estadística de chi-cuadrado para una prueba de bondad de ajuste son los siguientes:

  1. Para cada nivel, reste el recuento observado del recuento esperado.
  2. Cuadra cada una de estas diferencias.
  3. Divida cada una de estas diferencias al cuadrado por el valor esperado correspondiente.
  4. Sume todos los números del paso anterior juntos. Esta es nuestra estadística de chi-cuadrado.

Si nuestro modelo teórico coincide perfectamente con los datos observados, los recuentos esperados no mostrarán ninguna desviación de los recuentos observados de nuestra variable. Esto significará que tendremos una estadística de chi-cuadrado de cero. En cualquier otra situación, la estadística de chi-cuadrado será un número positivo.

Grados de libertad

El número de grados de libertad no requiere cálculos difíciles. Todo lo que tenemos que hacer es restar uno del número de niveles de nuestra variable categórica. Este número nos informará sobre cuál de las distribuciones infinitas de chi-cuadrado debemos usar.

Tabla de Chi-cuadrado y valor P

La estadística de chi-cuadrado que calculamos corresponde a una ubicación particular en una distribución de chi-cuadrado con el número apropiado de grados de libertad. El valor p determina la probabilidad de obtener un estadístico de prueba de este extremo, suponiendo que la hipótesis nula es verdadera. Podemos usar una tabla de valores para una distribución de chi-cuadrado para determinar el valor p de nuestra prueba de hipótesis. Si tenemos un software estadístico disponible, esto puede usarse para obtener una mejor estimación del valor p.

Regla de decisión

Tomamos nuestra decisión sobre si rechazar la hipótesis nula basada en un nivel predeterminado de significancia. Si nuestro valor p es menor o igual a este nivel de significancia, entonces rechazamos la hipótesis nula. De lo contrario, no podemos rechazar la hipótesis nula.