¿Qué es una distribución de muestreo?

El muestreo estadístico se usa con bastante frecuencia en estadística. En este proceso, nuestro objetivo es determinar algo sobre una población. Como las poblaciones son típicamente de gran tamaño, formamos una muestra estadística seleccionando un subconjunto de la población que tiene un tamaño predeterminado. Al estudiar la muestra podemos usar estadísticas inferenciales para determinar algo sobre la población.

Una muestra estadística de tamaño. norte implica un solo grupo de norte individuos o sujetos que han sido elegidos al azar de la población. Estrechamente relacionado con el concepto de una muestra estadística es una distribución de muestreo.

Origen de las distribuciones de muestreo

Una distribución de muestreo ocurre cuando formamos más de una muestra aleatoria simple del mismo tamaño de una población dada. Estas muestras se consideran independientes entre sí. Entonces, si un individuo está en una muestra, entonces tiene la misma probabilidad de estar en la siguiente muestra que se toma.

Calculamos una estadística particular para cada muestra. Esto podría ser una media muestral, una varianza muestral o una proporción muestral. Dado que una estadística depende de la muestra que tenemos, cada muestra típicamente producirá un valor diferente para la estadística de interés. El rango de los valores que se han producido es lo que nos da nuestra distribución de muestreo..

Distribución de muestreo para medias

Por ejemplo, consideraremos la distribución muestral para la media. La media de una población es un parámetro que generalmente se desconoce. Si seleccionamos una muestra de tamaño 100, entonces la media de esta muestra se calcula fácilmente sumando todos los valores y luego dividiéndolos por el número total de puntos de datos, en este caso, 100. Una muestra de tamaño 100 puede darnos una media de 50. Otra muestra de este tipo puede tener una media de 49. Otra de 51 y otra muestra podría tener una media de 50.5.

La distribución de estas medias muestrales nos da una distribución muestral. Nos gustaría considerar más que solo cuatro medias de muestra como lo hemos hecho anteriormente. Con varios medios de muestra más, tendríamos una buena idea de la forma de la distribución de muestreo.

¿Por qué nos importa?

Las distribuciones de muestreo pueden parecer bastante abstractas y teóricas. Sin embargo, hay algunas consecuencias muy importantes al usarlas. Una de las principales ventajas es que eliminamos la variabilidad presente en las estadísticas..

Por ejemplo, supongamos que comenzamos con una población con una media de μ y una desviación estándar de σ. La desviación estándar nos da una medida de cuán extendida es la distribución. Compararemos esto con una distribución de muestreo obtenida formando muestras aleatorias simples de tamaño norte. La distribución muestral de la media seguirá teniendo una media de μ, pero la desviación estándar es diferente. La desviación estándar para una distribución de muestreo se convierte en σ / √ norte.

Así tenemos el siguiente

  • Un tamaño de muestra de 4 nos permite tener una distribución de muestreo con una desviación estándar de σ / 2.
  • Un tamaño de muestra de 9 nos permite tener una distribución de muestreo con una desviación estándar de σ / 3.
  • Un tamaño de muestra de 25 nos permite tener una distribución de muestreo con una desviación estándar de σ / 5.
  • Un tamaño de muestra de 100 nos permite tener una distribución de muestreo con una desviación estándar de σ / 10.

En la práctica

En la práctica de las estadísticas, rara vez formamos distribuciones de muestreo. En cambio, tratamos las estadísticas derivadas de una muestra aleatoria simple de tamaño norte como si fueran un punto a lo largo de una distribución de muestreo correspondiente. Esto enfatiza nuevamente por qué deseamos tener tamaños de muestra relativamente grandes. Cuanto mayor sea el tamaño de la muestra, menor será la variación que obtendremos en nuestra estadística.

Tenga en cuenta que, aparte del centro y la dispersión, no podemos decir nada sobre la forma de nuestra distribución de muestreo. Resulta que bajo algunas condiciones bastante amplias, el Teorema del límite central puede aplicarse para decirnos algo bastante sorprendente sobre la forma de una distribución de muestreo.