Pruebas de bondad de ajuste
Esta es una prueba que determina si una muestra pudo haberse obtenido de una distribución poblacional hipotética. Se analizan las frecuencias (o proporciones) de una variable categórica.
Ejemplo: En la última encuesta para determinar la intención de voto, se seleccionó una muestra de 678 hombres y 522 mujeres [1]. Si la proporción de la población de hombres y mujeres es de 53.87 % y 46.13% [2] respectivamente, podemos preguntarnos si las proporciones de hombres y mujeres en la muestra corresponden a las de la población. Es decir, la hipótesis nula sería
H0: La muestra proviene de la población especificada
H1: La muestra no proviene de la población especificada
En la muestra de 1200 personas, tendríamos dos frecuencias, la observada y la esperada.
el cual procede de una distribución chi-cuadrado de grados de libertad gl dados por
gl = k - c - 1
donde k es el número de categorías y c es el número de parámetros poblacionales desconocidos estimados por estadísticos muestrales.
Este estadístico puede ser comparado con un valor crítico
para un nivel de significancia dado alfa, o bien se calcula el valor p para determinar si se rechaza o no la hipótesis nula. El criterio es si
entonces la hipótesis nula se rechaza. El valor p correspondiente es la probabilidad de que si se toma otra muestra de 1200 personas, el valor de c² exceda el valor dado para esta muestra en particular.
En este ejemplo, para una significancia del 5%
por lo que no se rechaza la hipótesis nula con una significancia del 5%. El valor p indica que se puede rechazar la hipótesis nula con una significancia del 6.76%. Este valor p también se puede calcular en Excel, utilizando el comando CHITEST (Excel 2000, versión en inglés), teniendo como entradas las frecuencias observadas y las esperadas (sin los totales).