Cuentas y recuentos en estadística

En estadística, las palabras "contar" y "contar" son sutilmente diferentes entre sí, aunque ambas implican dividir datos estadísticos en categorías, clases o contenedores. Aunque las palabras se usan indistintamente, los recuentos se basan en organizar los datos en estas clases, mientras que los recuentos se basan en enumerar realmente la cantidad en cada clase.

Particularmente cuando se construye un histograma o un gráfico de barras, hay momentos en los que distinguimos entre un conteo y un conteo, por lo que es importante entender lo que cada uno de estos significa cuando se usa en estadística, aunque también es importante tener en cuenta que existen algunas desventajas para utilizando cualquiera de estas herramientas organizativas.

Tanto los sistemas de conteo como de conteo resultan en una pérdida de información. Cuando vemos que hay tres valores de datos en una clase dada sin los datos de origen, es imposible saber cuáles eran esos tres valores de datos, en lugar de que caigan en algún lugar en un rango estadístico dictado por el nombre de la clase. Como resultado, un estadístico que quiera retener información sobre los valores de datos individuales en un gráfico necesitaría usar un diagrama de tallo y hoja.

Cómo usar efectivamente los sistemas de conteo

Para realizar un recuento con un conjunto de datos se requiere uno para ordenar los datos. Por lo general, los estadísticos se enfrentan a un conjunto de datos que no está en ningún tipo de orden, por lo que el objetivo es clasificar estos datos en diferentes categorías, clases o contenedores..

Un sistema de conteo es una forma conveniente y eficiente de clasificar datos en estas clases. A diferencia de otros métodos en los que los estadísticos pueden cometer errores antes de contar cuántos puntos de datos caen en cada clase, el sistema de conteo lee los datos tal como están enumerados y hace una marca de conteo "|" en la clase correspondiente.

Es común agrupar las marcas de conteo en cinco para que sea más fácil contar estas marcas más adelante. Esto a veces se hace haciendo la quinta marca de conteo como una barra diagonal en los primeros cuatro. Por ejemplo, suponga que está tratando de dividir el siguiente conjunto de datos en las clases 1-2, 3-4, 5-6, 7-8 y 9,10: 

  • 1, 8, 1, 9, 3, 2, 4, 3, 4, 5, 7, 1, 8, 2, 4, 1, 9, 3, 5, 2, 4, 3, 4, 5, 7, 10

Para contar correctamente estas cifras, primero deberíamos anotar las clases y luego colocar las marcas de conteo a la derecha de los dos puntos cada vez que un número en el conjunto de datos corresponde a una de las clases, como se ilustra a continuación:

  • 1-2: | El | El | El | El | El | El |
  • 3-4: | El | El | El | El | El | El | El |
  • 5-6: | El | El |
  • 7-8: | El | El | El |
  • 9-10: | El | El |

A partir de este recuento, se pueden ver los comienzos de un histograma, que luego se puede utilizar para ilustrar y comparar las tendencias de cada clase que aparece en el conjunto de datos. Para hacer esto con mayor precisión, uno debe referirse a un conteo para enumerar cuántas marcas de conteo existen en cada clase.

Cómo usar efectivamente los sistemas de conteo

Un recuento es diferente de un recuento en que los sistemas de recuento ya no están reorganizando u organizando datos, sino que literalmente cuentan el número de ocurrencias de valores que pertenecen a cada clase en el conjunto de datos. La forma más fácil de hacer esto, y de hecho por qué los estadísticos los usan, es contando el número de recuentos en los sistemas de conteo.

El conteo es más difícil de hacer con datos sin procesar como los que se encuentran en el conjunto anterior porque uno debe realizar un seguimiento individual de múltiples clases sin el uso de marcas de conteo; es por eso que el conteo suele ser el último paso en el análisis de datos antes de agregar estos valores a los histogramas o la barra gráficos.

El recuento realizado anteriormente tiene los siguientes recuentos. Para cada línea, todo lo que tenemos que hacer ahora es indicar cuántas marcas de conteo caen en cada clase. Cada una de las siguientes filas de datos está organizada Clase: Tally: Count: 

  • 1-2: | El | El | El | El | El | El | : 7
  • 3-4: | El | El | El | El | El | El | El | : 8
  • 5-6: | El | El | : 3
  • 7-8: | El | El | El | : 4
  • 9-10: | El | El | : 3

Con este sistema de mediciones todo organizado de manera conjunta, los estadísticos pueden observar el conjunto de datos desde un punto de vista más lógico y comenzar a hacer suposiciones basadas en las relaciones entre cada clase de datos..