En estadística, el término robusto o robustez se refiere a la solidez de un modelo estadístico, pruebas y procedimientos de acuerdo con las condiciones específicas del análisis estadístico que un estudio espera lograr. Dado que se cumplen estas condiciones de estudio, se puede verificar que los modelos son verdaderos mediante el uso de pruebas matemáticas.
Muchos modelos se basan en situaciones ideales que no existen cuando se trabaja con datos del mundo real y, como resultado, el modelo puede proporcionar resultados correctos incluso si las condiciones no se cumplen exactamente.
Las estadísticas sólidas, por lo tanto, son estadísticas que producen un buen rendimiento cuando los datos se obtienen de una amplia gama de distribuciones de probabilidad que no se ven afectadas en gran medida por valores atípicos o pequeñas desviaciones de los supuestos del modelo en un conjunto de datos dado. En otras palabras, una estadística robusta es resistente a errores en los resultados..
Una forma de observar un procedimiento estadístico robusto comúnmente sostenido, uno no necesita buscar más allá de los procedimientos t, que utilizan pruebas de hipótesis para determinar las predicciones estadísticas más precisas.
Para un ejemplo de robustez, consideraremos t-procedimientos, que incluyen el intervalo de confianza para una media poblacional con desviación estándar poblacional desconocida, así como pruebas de hipótesis sobre la media poblacional.
El uso de t-Los procedimientos asumen lo siguiente:
En la práctica, con ejemplos de la vida real, los estadísticos rara vez tienen una población que se distribuye normalmente, por lo que la pregunta es: "¿Cuán robustos son nuestros t-procedimientos?
En general, la condición de que tengamos una muestra aleatoria simple es más importante que la condición que hemos muestreado de una población normalmente distribuida; La razón de esto es que el teorema del límite central asegura una distribución de muestreo que es aproximadamente normal: cuanto mayor es el tamaño de nuestra muestra, más cerca está la distribución de muestreo de la media de la muestra a ser normal.
Tan robustez para t-Los procedimientos dependen del tamaño de la muestra y la distribución de nuestra muestra. Las consideraciones para esto incluyen:
En la mayoría de los casos, la solidez se ha establecido a través del trabajo técnico en estadística matemática y, afortunadamente, no necesariamente necesitamos hacer estos cálculos matemáticos avanzados para utilizarlos adecuadamente; solo necesitamos entender cuáles son las pautas generales para la solidez de nuestro método estadístico específico.
Los procedimientos en T funcionan como estadísticas robustas, ya que generalmente producen un buen rendimiento según estos modelos al tener en cuenta el tamaño de la muestra en la base para aplicar el procedimiento.