Distribución de probabilidad en estadística

Si dedica mucho tiempo a las estadísticas, muy pronto se encontrará con la frase "distribución de probabilidad". Aquí es donde realmente podemos ver cuánto se superponen las áreas de probabilidad y estadística. Aunque esto puede parecer algo técnico, la frase distribución de probabilidad es realmente solo una forma de hablar sobre la organización de una lista de probabilidades. Una distribución de probabilidad es una función o regla que asigna probabilidades a cada valor de una variable aleatoria. La distribución puede en algunos casos estar listada. En otros casos, se presenta como un gráfico..

Ejemplo

Supongamos que tiramos dos dados y luego registramos la suma de los dados. Sumas en cualquier lugar de dos a 12 son posibles. Cada suma tiene una probabilidad particular de ocurrir. Simplemente podemos enumerar estos de la siguiente manera:

  • La suma de 2 tiene una probabilidad de 1/36
  • La suma de 3 tiene una probabilidad de 2/36
  • La suma de 4 tiene una probabilidad de 3/36
  • La suma de 5 tiene una probabilidad de 4/36
  • La suma de 6 tiene una probabilidad de 5/36
  • La suma de 7 tiene una probabilidad de 6/36
  • La suma de 8 tiene una probabilidad de 5/36
  • La suma de 9 tiene una probabilidad de 4/36
  • La suma de 10 tiene una probabilidad de 3/36
  • La suma de 11 tiene una probabilidad de 2/36
  • La suma de 12 tiene una probabilidad de 1/36

Esta lista es una distribución de probabilidad para el experimento de probabilidad de lanzar dos dados. También podemos considerar lo anterior como una distribución de probabilidad de la variable aleatoria definida al observar la suma de los dos dados.

Grafico

Se puede graficar una distribución de probabilidad y, a veces, esto nos ayuda a mostrar características de la distribución que no eran aparentes con solo leer la lista de probabilidades. La variable aleatoria se traza a lo largo de X-eje, y la probabilidad correspondiente se representa a lo largo del y-eje. Para una variable aleatoria discreta, tendremos un histograma. Para una variable aleatoria continua, tendremos el interior de una curva suave.

Las reglas de probabilidad todavía están vigentes y se manifiestan de varias maneras. Como las probabilidades son mayores o iguales que cero, la gráfica de una distribución de probabilidad debe tener y-coordenadas que no son negativas. Otra característica de las probabilidades, a saber, que es la máxima que puede ser la probabilidad de un evento, aparece de otra manera.

Área = probabilidad

El gráfico de una distribución de probabilidad se construye de tal manera que las áreas representan probabilidades. Para una distribución de probabilidad discreta, en realidad solo estamos calculando las áreas de los rectángulos. En el gráfico anterior, las áreas de las tres barras correspondientes a cuatro, cinco y seis corresponden a la probabilidad de que la suma de nuestros dados sea cuatro, cinco o seis. Las áreas de todas las barras suman un total de uno.

En la distribución normal estándar o curva de campana, tenemos una situación similar. El área debajo de la curva entre dos z Los valores corresponden a la probabilidad de que nuestra variable se encuentre entre esos dos valores. Por ejemplo, el área bajo la curva de campana para -1 z.

Distribuciones importantes

Hay literalmente infinitas distribuciones de probabilidad. A continuación se incluye una lista de algunas de las distribuciones más importantes:

  • Distribución binomial - Da el número de éxitos para una serie de experimentos independientes con dos resultados.
  • Distribución de chi-cuadrado - Para determinar qué tan cerca se ajustan las cantidades observadas a un modelo propuesto
  • Distribución F - Utilizado en el análisis de varianza (ANOVA)
  • Distribución normal - Se llama curva de campana y se encuentra en todas las estadísticas..
  • Distribución t de Student - Para usar con muestras pequeñas de una distribución normal