Esta prueba es alternativa al test de ANOVA para ver si existen diferencias entre las medias cuando los datos no se ajustan a una distribución normal. Pero como corresponde a un método no paramétrico, lo que se comparan son las medianas.
Contraste de Hipótesis:
H0: las k muestras provienen de la misma población
H1: Al menos una muestra proviene de una población con una mediana diferente a las demás
Estadístico de prueba:
donde:
n: es el tamaño de la muestra
R: es el orden asignado (ranking según KW)
Criterio de rechazo:
Si p-valor < α, entonces se rechaza la hipótesis nula.
Requisitos para la prueba:
- La muestra debe ser aleatoria simple
- Los datos deben tener un factor categórico
- La respuesta debe ser continua
- Los datos de todos los grupos deben tener distribuciones con una forma similar
El siguiente ejemplo ilustra como puede construirse un estadístico de Kruskal-Wallis en Excel.
Los siguientes datos corresponden a una ronda intralaboratorio, donde 6 analistas ensayan en forma independiente un material de referencia en sextuplicado. Determinar si las medianas de los analistas son iguales o si al menos una de ellas difiere, con un nivel de confianza del 95%.
Este estadístico, lo que hace es asignar un número de orden a cada valor, ya sea en forma descendente o ascendente. Si dos o más de los valores son iguales, se dice que se registra "un empate". En este caso, se asigna a esos valores repetidos el promedio resultante.
En Excel, para realizar esa operación existe una función que se denomina jerarquia.media.
=JERARQUIA.MEDIA(número;referencia;[orden]).
Número: es el valor al que hay que asignarle un orden
referencia: es el intervalo de valores (todos)
[orden]: 0 significa descendente y 1 ascendente.
Finalmente, para obtener H, el estadístico de Kruskal-Wallis y el p-valor, se procede de acuerdo con la siguiente figura.
Conclusión.
Como el nivel de confianza es del 95%, alfa = 0,05.
Por lo tanto, como p-valor < 0,05, se rechaza la hipótesis nula. Es decir, al menos una de las medianas difiere.
Referencia:
[1] E.L. Lehmann (1975). Nonparametrics: Statistical Methods Based on Ranks, Holden-Day.
[2] M. Hollander and D.A. Wolfe (1973). Nonparametric Statistical Methods, John Wiley & Sons, Inc.