¿Qué es un diagrama de dispersión?

Uno de los objetivos de las estadísticas es la organización y visualización de datos. Muchas veces, una forma de hacerlo es usar un gráfico, tabla o tabla. Cuando se trabaja con datos emparejados, un tipo de gráfico útil es un diagrama de dispersión. Este tipo de gráfico nos permite explorar de manera fácil y efectiva nuestros datos al examinar una dispersión de puntos en el plano.

Datos emparejados

Vale la pena resaltar que un diagrama de dispersión es un tipo de gráfico que se utiliza para datos emparejados. Este es un tipo de conjunto de datos en el que cada uno de nuestros puntos de datos tiene dos números asociados. Los ejemplos comunes de tales emparejamientos incluyen:

  • Una medida antes y después de un tratamiento. Esto podría tomar la forma del desempeño de un estudiante en una prueba previa y luego una prueba posterior.
  • Un diseño experimental de pares emparejados. Aquí un individuo está en el grupo de control y otro individuo similar está en el grupo de tratamiento.
  • Dos medidas del mismo individuo. Por ejemplo, podemos registrar el peso y la altura de 100 personas..

Gráficos 2D

El lienzo en blanco con el que comenzaremos para nuestro diagrama de dispersión es el sistema de coordenadas cartesianas. Esto también se llama el sistema de coordenadas rectangulares debido al hecho de que cada punto puede ubicarse dibujando un rectángulo particular. Un sistema de coordenadas rectangular se puede configurar de la siguiente manera:

  1. Comenzando con una recta numérica horizontal. Esto se llama el X-eje.
  2. Agrega una recta numérica vertical. Intersecar el X-eje de tal manera que el punto cero de ambas líneas se cruza. Esta segunda recta numérica se llama y-eje.
  3. El punto donde se cruzan los ceros de nuestra recta numérica se llama origen.

Ahora podemos trazar nuestros puntos de datos. El primer número en nuestro par es el X-coordinar. Es la distancia horizontal lejos del eje y, y por lo tanto también el origen. Nos movemos hacia la derecha para obtener valores positivos de X ya la izquierda del origen para valores negativos de X.

El segundo número en nuestro par es el y-coordinar. Es la distancia vertical lejos del eje x. Comenzando en el punto original en el X-eje, subir para valores positivos de y y abajo para valores negativos de y.

La ubicación en nuestro gráfico se marca con un punto. Repetimos este proceso una y otra vez para cada punto de nuestro conjunto de datos. El resultado es una dispersión de puntos, lo que le da al diagrama de dispersión su nombre..

Explicativo y respuesta

Una instrucción importante que queda es tener cuidado de qué variable está en qué eje. Si nuestros datos emparejados consisten en un emparejamiento explicativo y de respuesta, entonces la variable explicativa se indica en el eje x. Si se considera que ambas variables son explicativas, entonces podemos elegir cuál se trazará en el eje xy cuál en el y-eje.

Características de un diagrama de dispersión

Hay varias características importantes de un diagrama de dispersión. Al identificar estos rasgos podemos descubrir más información sobre nuestro conjunto de datos. Estas características incluyen:

  • La tendencia general entre nuestras variables. Mientras leemos de izquierda a derecha, ¿cuál es el panorama general? Un patrón ascendente, descendente o cíclico.?
  • Cualquier valor atípico de la tendencia general. ¿Son estos valores atípicos del resto de nuestros datos, o son puntos influyentes??
  • La forma de cualquier tendencia. ¿Es esto lineal, exponencial, logarítmico o algo más??
  • La fuerza de cualquier tendencia. ¿Qué tan cerca se ajustan los datos al patrón general que identificamos??

Temas relacionados

Los diagramas de dispersión que exhiben una tendencia lineal pueden analizarse con las técnicas estadísticas de regresión lineal y correlación. La regresión se puede realizar para otros tipos de tendencias que no son lineales..