¿Qué nivel de alfa determina la importancia estadística?

No todos los resultados de las pruebas de hipótesis son iguales. Una prueba de hipótesis o prueba de significación estadística generalmente tiene un nivel de significación asociado. Este nivel de significación es un número que normalmente se denota con la letra griega alfa. Una pregunta que surge en una clase de estadística es: "¿Qué valor de alfa debería usarse para nuestras pruebas de hipótesis?"

La respuesta a esta pregunta, como con muchas otras preguntas en estadística, es: "Depende de la situación". Exploraremos lo que queremos decir con esto. Muchas revistas de diferentes disciplinas definen que los resultados estadísticamente significativos son aquellos para los cuales alfa es igual a 0.05 o 5%. Pero el punto principal a tener en cuenta es que no hay un valor universal de alfa que deba usarse para todas las pruebas estadísticas.

Valores de uso común Niveles de significación

El número representado por alfa es una probabilidad, por lo que puede tomar un valor de cualquier número real no negativo menor que uno. Aunque en teoría cualquier número entre 0 y 1 puede usarse para alfa, cuando se trata de práctica estadística, este no es el caso. De todos los niveles de significación, los valores de 0,10, 0,05 y 0,01 son los más utilizados para alfa. Como veremos, podría haber razones para usar valores alfa además de los números más comúnmente utilizados..

Nivel de significancia y errores tipo I

Una consideración contra un valor de "talla única" para alfa tiene que ver con cuál es la probabilidad de este número. El nivel de significancia de una prueba de hipótesis es exactamente igual a la probabilidad de un error de Tipo I. Un error de Tipo I consiste en rechazar incorrectamente la hipótesis nula cuando la hipótesis nula es realmente verdadera. Cuanto menor es el valor de alfa, menos probable es que rechacemos una hipótesis nula verdadera.

Hay diferentes instancias donde es más aceptable tener un error de Tipo I. Un valor mayor de alfa, incluso uno mayor de 0,10 puede ser apropiado cuando un valor menor de alfa da como resultado un resultado menos deseable.

En la evaluación médica de una enfermedad, considere las posibilidades de una prueba que arroje resultados falsos positivos para una enfermedad con una prueba que resulte falsamente negativa para una enfermedad. Un falso positivo dará como resultado ansiedad para nuestro paciente, pero conducirá a otras pruebas que determinarán que el veredicto de nuestra prueba fue realmente incorrecto. Un falso negativo le dará a nuestro paciente la suposición incorrecta de que no tiene una enfermedad cuando en realidad sí la tiene. El resultado es que la enfermedad no será tratada. Dada la opción, preferiríamos tener condiciones que den como resultado un falso positivo que un falso negativo.

En esta situación, con mucho gusto aceptaríamos un valor mayor para alfa si resultara en una compensación de una menor probabilidad de un falso negativo.

Nivel de significancia y valores P

Un nivel de significación es un valor que establecemos para determinar la significación estadística. Esto termina siendo el estándar por el cual medimos el valor p calculado de nuestra estadística de prueba. Decir que un resultado es estadísticamente significativo en el nivel alfa solo significa que el valor p es menor que alfa. Por ejemplo, para un valor de alfa = 0.05, si el valor p es mayor que 0.05, no podemos rechazar la hipótesis nula.

Hay algunos casos en los que necesitaríamos un valor p muy pequeño para rechazar una hipótesis nula. Si nuestra hipótesis nula se refiere a algo que es ampliamente aceptado como verdadero, entonces debe haber un alto grado de evidencia a favor de rechazar la hipótesis nula. Esto es proporcionado por un valor p que es mucho más pequeño que los valores comúnmente utilizados para alfa.

Conclusión

No hay un valor de alfa que determine la significación estadística. Aunque los números como 0.10, 0.05 y 0.01 son valores comúnmente usados ​​para alfa, no existe un teorema matemático predominante que diga que estos son los únicos niveles de significancia que podemos usar. Al igual que con muchas cosas en las estadísticas, debemos pensar antes de calcular y, sobre todo, usar el sentido común.