Las estadísticas inferenciales obtienen su nombre de lo que sucede en esta rama de las estadísticas. En lugar de simplemente describir un conjunto de datos, la estadística inferencial busca inferir algo sobre una población sobre la base de una muestra estadística. Un objetivo específico en la estadística inferencial implica la determinación del valor de un parámetro de población desconocido. El rango de valores que usamos para estimar este parámetro se llama intervalo de confianza.
Un intervalo de confianza consta de dos partes. La primera parte es la estimación del parámetro de población. Obtenemos esta estimación utilizando una muestra aleatoria simple. A partir de esta muestra, calculamos la estadística que corresponde al parámetro que deseamos estimar. Por ejemplo, si estuviéramos interesados en la altura media de todos los estudiantes de primer grado en los Estados Unidos, usaríamos una muestra aleatoria simple de estudiantes de primer grado de EE. UU., Los mediríamos a todos y luego calcularíamos la altura media de nuestra muestra.
La segunda parte de un intervalo de confianza es el margen de error. Esto es necesario porque nuestra estimación sola puede ser diferente del verdadero valor del parámetro de población. Para permitir otros valores potenciales del parámetro, necesitamos producir un rango de números. El margen de error hace esto, y cada intervalo de confianza tiene la siguiente forma:
Estimación ± Margen de error
La estimación está en el centro del intervalo, y luego restamos y sumamos el margen de error de esta estimación para obtener un rango de valores para el parámetro.
Adjunto a cada intervalo de confianza hay un nivel de confianza. Esta es una probabilidad o porcentaje que indica cuánta certeza debemos atribuir a nuestro intervalo de confianza. Si todos los demás aspectos de una situación son idénticos, cuanto mayor sea el nivel de confianza, mayor será el intervalo de confianza.
Este nivel de confianza puede generar cierta confusión. No es una declaración sobre el procedimiento de muestreo o la población. En cambio, está dando una indicación del éxito del proceso de construcción de un intervalo de confianza. Por ejemplo, los intervalos de confianza con una confianza del 80 por ciento, a la larga, perderán el verdadero parámetro de población una de cada cinco veces.
Cualquier número de cero a uno podría, en teoría, ser usado para un nivel de confianza. En la práctica, 90 por ciento, 95 por ciento y 99 por ciento son niveles de confianza comunes.
El margen de error de un nivel de confianza está determinado por un par de factores. Podemos ver esto examinando la fórmula del margen de error. Un margen de error es de la forma:
Margen de error = (Estadística para el nivel de confianza) * (Desviación estándar / Error)
La estadística para el nivel de confianza depende de qué distribución de probabilidad se está utilizando y qué nivel de confianza hemos elegido. Por ejemplo, si Ces nuestro nivel de confianza y estamos trabajando con una distribución normal, entonces C es el área debajo de la curva entre -z* * a z* *. Este número z* * es el número en nuestra fórmula de margen de error.
El otro término necesario en nuestro margen de error es la desviación estándar o error estándar. Aquí se prefiere la desviación estándar de la distribución con la que estamos trabajando. Sin embargo, típicamente los parámetros de la población son desconocidos. Este número no suele estar disponible cuando se forman intervalos de confianza en la práctica.
Para lidiar con esta incertidumbre al conocer la desviación estándar, en su lugar utilizamos el error estándar. El error estándar que corresponde a una desviación estándar es una estimación de esta desviación estándar. Lo que hace que el error estándar sea tan poderoso es que se calcula a partir de la muestra aleatoria simple que se usa para calcular nuestra estimación. No se necesita información adicional ya que la muestra realiza toda la estimación por nosotros..
Hay una variedad de situaciones diferentes que requieren intervalos de confianza. Estos intervalos de confianza se utilizan para estimar varios parámetros diferentes. Aunque estos aspectos son diferentes, todos estos intervalos de confianza están unidos por el mismo formato general. Algunos intervalos de confianza comunes son aquellos para una media poblacional, varianza poblacional, proporción poblacional, la diferencia de dos medias poblacionales y la diferencia de dos proporciones poblacionales.