Uno de los objetivos de las estadísticas es organizar los datos de manera significativa. Las tablas bidireccionales son una forma importante de organizar un tipo particular de datos emparejados. Al igual que con la construcción de cualquier gráfico o tabla en estadísticas, es muy importante conocer los tipos de variables con las que estamos trabajando. Si tenemos datos cuantitativos, entonces se debe usar un gráfico como un histograma o un diagrama de tallo y hoja. Si tenemos datos categóricos, entonces es apropiado un gráfico de barras o gráfico circular.
Al trabajar con datos emparejados debemos tener cuidado. Existe un diagrama de dispersión para los datos cuantitativos emparejados, pero ¿qué tipo de gráfico hay para los datos categóricos emparejados? Siempre que tengamos dos variables categóricas, debemos usar una tabla de dos vías..
Primero, recordamos que los datos categóricos se relacionan con rasgos o categorías. No es cuantitativo y no tiene valores numéricos..
Una tabla de dos vías implica una lista de todos los valores o niveles para dos variables categóricas. Todos los valores para una de las variables se enumeran en una columna vertical. Los valores para la otra variable se enumeran a lo largo de una fila horizontal. Si la primera variable tiene metro valores y la segunda variable tiene norte valores, entonces habrá un total de Minnesota entradas en la tabla. Cada una de estas entradas corresponde a un valor particular para cada una de las dos variables..
A lo largo de cada fila y a lo largo de cada columna, las entradas se suman. Estos totales son importantes al determinar distribuciones marginales y condicionales. Estos totales también son importantes cuando realizamos una prueba de chi-cuadrado para la independencia.
Por ejemplo, consideraremos una situación en la que examinaremos varias secciones de un curso de estadística en una universidad. Queremos construir una tabla de dos vías para determinar qué diferencias, si las hay, existen entre hombres y mujeres en el curso. Para lograr esto, contamos el número de cada calificación de letra que obtuvieron los miembros de cada género.
Notamos que la primera variable categórica es la de género, y hay dos valores posibles en el estudio de hombres y mujeres. La segunda variable categórica es la de calificación de letras, y hay cinco valores dados por A, B, C, D y F. Esto significa que tendremos una tabla de dos vías con 2 x 5 = 10 entradas, más un fila adicional y una columna adicional que serán necesarias para tabular los totales de fila y columna.
Nuestra investigación muestra que:
Esta información se ingresa en la tabla de dos vías a continuación. El total de cada fila nos dice cuántos de cada tipo de calificación se obtuvo. Los totales de la columna nos indican la cantidad de hombres y la cantidad de mujeres..
Las tablas de dos vías ayudan a organizar nuestros datos cuando tenemos dos variables categóricas. Esta tabla se puede usar para ayudarnos a comparar entre dos grupos diferentes en nuestros datos. Por ejemplo, podríamos considerar el rendimiento relativo de los hombres en el curso de estadística frente al rendimiento de las mujeres en el curso..
Después de formar una tabla de dos vías, el siguiente paso puede ser analizar los datos estadísticamente. Podemos preguntarnos si las variables que están en el estudio son independientes entre sí o no. Para responder a esta pregunta, podemos usar una prueba de chi-cuadrado en la tabla de dos vías.
Masculino | Hembra | Total | |
UN | 50 | 60 60 | 110 |
si | 60 60 | 80 | 140 |
C | 100 | 50 | 150 |
re | 40 | 50 | 90 |
F | 30 | 20 | 50 |
Total | 280 | 260 | 540 |