El siguiente artículo está basado en el paper de Rawski y colaboradores [1] y tiene por objeto entregar una alternativa para evaluar la linealidad de las curvas de calibración.
Para ello, se propone realizar una completa evaluación estadística que incluya el test de Falta de Ajuste, el test clásico de Fisher-Snedecor, el test de IUPAC y el test de Mandel.
Diseño de las pruebas
Supongamos que se prepararon 11 soluciones de distinta concentración de un elemento y se leyeron por espectrofotometría. Con estos datos se quiere saber si el método lineal o cuadrático es adecuado o no para este rango de concentración.
Test de Falta de ajuste (Lack of Test)
Para realizar este test clásico se necesita un mínimo de repeticiones en triplicado, lo que no se requiere para los test restantes que sólo necesitan usar los promedios como respuesta. Lo que hace esta prueba es detectar si los datos se ajustan bien o débilmente al modelo de regresión adoptado (en nuestro caso lineal). Por lo tanto, el contraste de hipótesis es:
H0: Los datos se ajustan al modelo de regresión adoptado es decir, yij = axi + b
versus
HA: Los datos no se ajustan bien al modelo de regresión adoptado
Para facilitar el desarrollo de este test, sólo se necesita copiar los datos y pegarlos en un software estadístico. En nuestro ejemplo se usó Minitab.
H0: Los datos se ajustan al modelo de regresión adoptado es decir, yij = axi + b
versus
HA: Los datos no se ajustan bien al modelo de regresión adoptado
Para facilitar el desarrollo de este test, sólo se necesita copiar los datos y pegarlos en un software estadístico. En nuestro ejemplo se usó Minitab.
Los resultados se muestran a continuación.
Como se puede apreciar, el valor p de falta de ajuste indica 0,000, esto significa que con un 95% de confianza se rechaza la idea de que los datos se ajusten a un modelo lineal, Veamos el análisis de residuos.
Acá se puede apreciar claramente que la relación entre las variables no se ajustan bien a un modelo de regresión lineal. Por lo tanto, se puede concluir que el modelo lineal no es adecuado.
Test Clásico de Fisher - Snedecor
Este test permite comparar la significancia de los efectos lineal y cuadrático. En el fondo, define la significancia de ambos efectos como una relación de dicho efecto y la varianza residual.
Las siguientes hipótesis están en juego:
Si F lin > F#, lin, y F cuad < F#, cuad, entonces el modelo cuadrático es adecuado.
Si F lin < F#, lin, y F cuad > F#, cuad, entonces el modelo lineal es adecuado.
Las siguientes hipótesis están en juego:
Si F lin > F#, lin, y F cuad < F#, cuad, entonces el modelo cuadrático es adecuado.
Si F lin < F#, lin, y F cuad > F#, cuad, entonces el modelo lineal es adecuado.
Para ello, se necesitan calcular los siguientes términos:
r2 lineal = 0,9668
SC res = 0,2212
n = 11
k = 1 (grado del polinomio lineal)
F lin = 261,7
r2 cuadratico = 0,9984
n = 11
k = 2 (grado del polinomio cuadrático)
F cuad = 154,7
Los valores de F obtenidos se deben comparar con los respectivos valores criticos de F (alfa; 1; n - k - 1) tomados de las tablas de distribución F.
Si la significancia del efecto es menor que el correspondiente valor crítico, entonces el efecto dado debe ser considerado como no significativo, caso contrario el modelo lineal no es apropiado. en nuestro caso, los F críticos son
F# lineal = 5,117 (0,05; 1 ;9)
F# cuad = 5,318 (0,05;1; 8)
En ambos casos, el F del estadístico de prueba es mayor que el F crítico. Por lo tanto ambos modelos son significativos.
Test de IUPAC [1][3]
La Unión Internacional de Química Pura y aplicada, IUPAC, modificó el test de Fisher-Snedecor para mejorar las conclusiones de este test, centrándose sólo en las varianzas residuales de los modelos lineal y cuadrático.
El contraste de hipótesis es:
H0: La varianza explicada por el término adicional no difiere de la varianza residual del modelo. Por lo tanto, el modelo cuadrático no es significativo.
versus
HA: La varianza explicada por el término adicional difiere de la varianza residual del modelo. Por lo tanto, el modelo cuadrático es significativo.
Se necesitan calcular los siguientes términos:
S2 (ŷ lin) = 0,0008173
S2 (ŷ cuad) = 4,54 x 10-5
Finalmente, el estadístico de prueba es:
En ambos casos, el F del estadístico de prueba es mayor que el F crítico. Por lo tanto ambos modelos son significativos.
Test de IUPAC [1][3]
La Unión Internacional de Química Pura y aplicada, IUPAC, modificó el test de Fisher-Snedecor para mejorar las conclusiones de este test, centrándose sólo en las varianzas residuales de los modelos lineal y cuadrático.
El contraste de hipótesis es:
H0: La varianza explicada por el término adicional no difiere de la varianza residual del modelo. Por lo tanto, el modelo cuadrático no es significativo.
versus
HA: La varianza explicada por el término adicional difiere de la varianza residual del modelo. Por lo tanto, el modelo cuadrático es significativo.
Se necesitan calcular los siguientes términos:
S2 (ŷ lin) = 0,0008173
S2 (ŷ cuad) = 4,54 x 10-5
Finalmente, el estadístico de prueba es:
FIUPAC = 17,075
Este valor se compara con el F crítico que es F# = 5,318 (con alfa = 0,05; 1 ; n-3)
Este valor se compara con el F crítico que es F# = 5,318 (con alfa = 0,05; 1 ; n-3)
Como el F de IUPAC es mayor al F # crítico, entonces se puede concluir que el modelo lineal no es el más adecuado. ´Por lo tanto, sí lo es el modelo cuadrático.
Test de Mandel (Test IUPAC modificado)
Este test es una modificación al test de IUPAC. El objetivo consiste en chequear si la varianza explicada por el modelo cuadrático es más grande que la varianza explicada por el modelo lineal, pero considerando la influencia de los grados de libertad.
Para ello, se necesita calcular lo siguiente:
S2 (ŷ lin) = 0,0008173
Para ello, se necesita calcular lo siguiente:
S2 (ŷ lin) = 0,0008173
FM = 154,673
Este valor se compara con el F crítico que es F# = 5,318 (con alfa = 0,05; 1 ; n-3)
Como el F de Mandel es mayor al F # crítico, entonces se puede concluir que el modelo lineal no es el más adecuado. ´Por lo tanto, sí lo es el modelo cuadrático.
Otra forma de contrastar esta hipótesis es convirtiendo el puntaje F experimental en p-valor.
En Excel se coloca;
=distr.F(FM;grados de libertad numerador;grados de libertad denominador)
o en nuestro caso:
=distr.F(154,673;1;8)
El resultado es
p-valor = 1,63E-06
Como p-valor es menor a alfa= 0,05, entonces se rechaza la Hipótesis nula con un 95 % de confianza. Por lo tanto, se puede concluir que el modelo lineal no es adecuado.
Conclusión general
La siguiente tabla muestra el resumen de los resultados:
N°
|
Test
|
Resultados
|
1
|
Falta de ajuste
|
El modelo lineal da un débil ajuste
|
2
|
Fisher-Snedecor
|
El modelo lineal es significativo
El modelo cuadrático es significativo
|
3
|
IUPAC
|
El modelo cuadrático es válido
|
4
|
Mandel
|
El modelo cuadrático es válido
|
Referencias
[1] Rawski, Sanecki, Kijowska, Skital, Saletnik. "Regression Analysis in Analytical Chemistry, Determination and Validation of Linear and Quadratic Regression Dependencies". S. Afr. J. Chem. 2016, 69, 166-173.
[2] Van Loco, "Linearity of calibration curves: use and misuse of the correlation coefficient, Accred Qual Assur (2002) 7:281–285.
[3] IUPAC, Danzer and Currie "Guidelines for Calibration in Analytical Chemistry". Pure &Appl. Chem., Vol. 70, No. 4, pp. 993-1014, 1998.
[4] Curso de validación de metodologías de Mauricio Arancibia G.
Pincha aquí para saber más acerca de los cursos que se ofrecen en 2023: CURSOS ONLINE