Mostrando entradas con la etiqueta Kruskal Wallis. Mostrar todas las entradas
Mostrando entradas con la etiqueta Kruskal Wallis. Mostrar todas las entradas

viernes, 9 de septiembre de 2022

PRUEBA DE KRUSKAL-WALLIS CON EXCEL

Esta prueba es alternativa al test de ANOVA para ver si existen diferencias entre las medias cuando los datos no se ajustan a una distribución normal. Pero como corresponde a un método no paramétrico, lo que se comparan son las medianas.

Contraste de Hipótesis:
H0: las k muestras provienen de la misma población
H1: Al menos una muestra proviene de una población con una mediana diferente a las demás


Estadístico de prueba:

donde:
n: es el tamaño de la muestra
R: es el orden asignado (ranking según KW)

Criterio de rechazo:
Si p-valor < α, entonces se rechaza la hipótesis nula.


Requisitos para la prueba:
  1. La muestra debe ser aleatoria simple
  2. Los datos deben tener un factor categórico
  3. La respuesta debe ser continua
  4. Los datos de todos los grupos deben tener distribuciones con una forma similar
El siguiente ejemplo ilustra como puede construirse un estadístico de Kruskal-Wallis en Excel.
Los siguientes datos corresponden a una ronda intralaboratorio, donde 6 analistas ensayan en forma independiente un material de referencia en sextuplicado. Determinar si las medianas de los analistas son iguales o si al menos una de ellas difiere, con un nivel de confianza del 95%.



Este estadístico, lo que hace es asignar un número de orden a cada valor, ya sea en forma descendente o ascendente. Si dos o más de los valores son iguales, se dice que se registra "un empate". En este caso, se asigna a esos valores repetidos el promedio resultante.
En Excel, para realizar esa operación existe una función que se denomina jerarquia.media.
=JERARQUIA.MEDIA(número;referencia;[orden]).
Número: es el valor al que hay que asignarle un orden
referencia: es el intervalo de valores (todos)
[orden]: 0 significa descendente y 1 ascendente.


Finalmente, para obtener H, el estadístico de Kruskal-Wallis y el p-valor, se procede de acuerdo con la siguiente figura.


Conclusión.
Como el nivel de confianza es del 95%, alfa = 0,05.
Por lo tanto, como p-valor < 0,05, se rechaza la hipótesis nula. Es decir, al menos una de las medianas difiere.

Referencia: 
[1] E.L. Lehmann (1975). Nonparametrics: Statistical Methods Based on Ranks, Holden-Day.
[2] M. Hollander and D.A. Wolfe (1973). Nonparametric Statistical Methods, John Wiley & Sons, Inc.

Pincha aquí para saber más acerca de los cursos que se ofrecen en 2023: CURSOS ONLINE