Muchas veces los investigadores quieren saber las respuestas a las preguntas de gran alcance. Por ejemplo:
Este tipo de preguntas son enormes en el sentido de que requieren que hagamos un seguimiento de millones de personas.
La estadística simplifica estos problemas mediante el uso de una técnica llamada muestreo. Al realizar una muestra estadística, nuestra carga de trabajo puede reducirse enormemente. En lugar de rastrear los comportamientos de miles de millones o millones, solo necesitamos examinar los de miles o cientos. Como veremos, esta simplificación tiene un precio.
La población de un estudio estadístico es de lo que estamos tratando de descubrir algo. Se compone de todas las personas que están siendo examinadas. Una población realmente puede ser cualquier cosa. Californianos, caribus, computadoras, automóviles o condados podrían considerarse poblaciones, dependiendo de la pregunta estadística. Aunque la mayoría de las poblaciones investigadas son grandes, no necesariamente tienen que ser.
Una estrategia para investigar a la población es realizar un censo. En un censo, examinamos a todos y cada uno de los miembros de la población en nuestro estudio. Un buen ejemplo de esto es el censo de EE. UU. Cada diez años, la Oficina del Censo envía un cuestionario a todos en el país. Los que no devuelven el formulario son visitados por los trabajadores del censo
Los censos están cargados de dificultades. Por lo general, son caros en términos de tiempo y recursos. Además de esto, es difícil garantizar que todos en la población hayan sido contactados. Otras poblaciones son aún más difíciles de realizar un censo. Si quisiéramos estudiar los hábitos de los perros callejeros en el estado de Nueva York, buena suerte redondeando todos de esos caninos transitorios.
Dado que normalmente es imposible o poco práctico rastrear a cada miembro de una población, la siguiente opción disponible es muestrear la población. Una muestra es cualquier subconjunto de una población, por lo que su tamaño puede ser pequeño o grande. Queremos una muestra lo suficientemente pequeña como para ser manejable por nuestra potencia informática, pero lo suficientemente grande como para darnos resultados estadísticamente significativos..
Si una empresa encuestadora está tratando de determinar la satisfacción de los votantes con el Congreso, y su tamaño de muestra es uno, entonces los resultados no tendrán sentido (pero serán fáciles de obtener). Por otro lado, pedirle a millones de personas va a consumir demasiados recursos. Para lograr un equilibrio, las encuestas de este tipo generalmente tienen tamaños de muestra de alrededor de 1000.
Pero tener el tamaño de muestra correcto no es suficiente para garantizar buenos resultados. Queremos una muestra que sea representativa de la población. Supongamos que queremos saber cuántos libros lee el estadounidense promedio anualmente. Les pedimos a 2000 estudiantes universitarios que hagan un seguimiento de lo que leen durante el año, y luego volvemos a consultar con ellos después de que haya pasado un año. Encontramos que el número promedio de libros leídos es 12, y luego concluimos que el estadounidense promedio lee 12 libros al año.
El problema con este escenario es con la muestra. La mayoría de los estudiantes universitarios tienen entre 18 y 25 años y sus instructores les exigen que lean libros de texto y novelas. Esta es una representación pobre del estadounidense promedio. Una buena muestra contendría personas de diferentes edades, de todos los ámbitos de la vida y de diferentes regiones del país. Para adquirir dicha muestra, tendríamos que componerla al azar para que todos los estadounidenses tengan la misma probabilidad de estar en la muestra..
El estándar de oro de los experimentos estadísticos es la muestra aleatoria simple. En tal muestra de tamaño norte individuos, cada miembro de la población tiene la misma probabilidad de ser seleccionado para la muestra, y cada grupo de norte los individuos tienen la misma probabilidad de ser seleccionados. Hay una variedad de formas de muestrear una población. Algunos de los más comunes son:
Como dice el dicho: "Bien comenzado está a medio hacer". Para asegurarnos de que nuestros estudios y experimentos estadísticos tengan buenos resultados, necesitamos planificarlos y comenzarlos con cuidado. Es fácil llegar a malas muestras estadísticas. Las buenas muestras aleatorias simples requieren un poco de trabajo para obtener. Si nuestros datos se obtuvieron al azar y de manera arrogante, no importa cuán sofisticado sea nuestro análisis, las técnicas estadísticas no nos darán ninguna conclusión que valga la pena..