El concepto de incertidumbre se asocia a las mediciones. La ciencia que estudia las mediciones se llama metrología. Y actualmente, existen 7 unidades fundamentales que han sido establecidas por el Bureau internacional de pesas y medidas, BIPM, con el fin de que todas las magnitudes a nivel mundial se tracen o se comparen directa o indirectamente con estas unidades. En metrología se parte de la base que todas las magnitudes son parámetros desconocidos porque tienen asociada una incertidumbre. Y es esa Incertidumbre la que se define como duda. Por lo tanto, "la incertidumbre de la medida", corresponde a la duda que tenemos respecto de un resultado de una medición y se relaciona con la dispersión de los valores que podrían razonablemente ser atribuidos a la magnitud que deseamos medir (mensurando).
En la estadística clásica, también conocida como frecuentista, los parámetros de la población también son considerados desconocidos. Para poderlos conocer debemos estimarlos a partir de una muestra, proceso conocido como "inferencia estadística". Sin embargo, para conocer esos parámetros desconocidos debemos tener claro qué es lo que deseamos conocer y es ahí donde radica el problema de la metrología. Más específicamente cuando tratamos con incertidumbres tipo A.
Es ahí precisamente donde se producen las inconsistencias, en la forma cómo se calculan las incertidumbres tipo A, y como Eurachem y Nordtest se refieren a los intervalos de incertidumbre calculados, como intervalos de confianza.
El concepto de intervalo de confianza no tiene sentido aplicarlo en la forma como lo hacen estas publicaciones, debido a que el concepto se refiere a la precisión cómo se estima el parámetro a través de un estadístico. Es decir, existe una estimación puntual cuando obtenemos un sólo valor numérico, pero cuando hacemos repeticiones para tener una mejor estimación de ese parámetro, lo que se hace es una estimación por intervalos de ese parámetro, que también se conoce como estimación por intervalo de confianza, pero esto se puede hacer con diferentes parámetros, tales como la media poblacional, la desviación estándar, una proporción, la pendiente, el coeficiente de correlación, etc. En resumen, esa estimación depende de n, del número de repeticiones.
Pero, ¿realmente el concepto de incertidumbre debe estar centrado principalmente en este tipo de intervalos?. A mi juicio, creo que ahí radica el error, ya que los procesos que necesitamos medir, para la repetibilidad por ejemplo, tienen sus propias dispersiones, y que no dependen del tamaño de muestra, me refiero al sistema de medición; operadores, equipos, método, etc. Para medir sus incertidumbres debemos recurrir a otro tipo de intervalos o más precisamente semi-intervalos, que se asocian a los "intervalos de tolerancia estadístico" y que corresponde a una proporción p de la población. Pero como igual tenemos que usar muestras para estimarlas, esa proporción se debe calcular con un nivel de confianza dado.
Por lo tanto, el intervalo de confianza obtenido debe ser lo más pequeño posible, insignificante respecto del intervalo de tolerancia estadístico. Si ese no es el caso, entonces y sólo entonces, el intervalo de confianza deberá sumarse al intervalo de tolerancia estadístico para obtener el intervalo de cobertura final, y la mitad de ese intervalo corresponderá a la incertidumbre total de la medida.
Y qué ocurre si en vez de valores individuales consideramos réplicas
Bueno, en este caso, ya no hablaríamos de la población de valores individuales, sino de una nueva población, que podríamos denominarle "la población de las medias individuales", con el objeto de que la media aritmética de la nueva población debería sea considerada como un valor individual. De esta forma si tenemos duplicados, el intervalo de tolerancia estadístico correspondería a los nuevos valores individuales (medias). Pero como igual debemos tomar una muestra, la respuesta más precisa obedece al área de las probabilidades. Es decir, igual debemos establecer un nivel de confianza dado para entregar esa proporción de la nueva población de duplicados.
Mi propuesta
Mi propuesta es usar los intervalos o semi-intervalos de tolerancia estadístico con un nivel de confianza dado para la estimación de la repetibilidad. Intervalo asociado a los valores individuales.
Incluso cuando se quiere mejorar la incertidumbre de la medida utilizando réplicas. En este último caso, el intervalo de tolerancia estadístico corresponderá a las medias aritméticas, las cuales deberán ser consideradas como los nuevos valores individuales de la nueva población, pero como esa proporción p de la nueva población de replicados se hace respecto de una muestra, entonces la estimación de p se debería realizar con un nivel de confianza dado.
Referencias:
[1] artículo de mi autoría:
NO CONFUNDAS INTERVALOS DE CONFIANZA CON INTERVALOS DE TOLERANCIA ESTADÍSTICO[2] Meeker, Hans, Escobar - Statistical Intervals_ A Guide for Practitioners and Researchers - Ed. 2017
(2) Montgomery, Runger - Applied Statistics and Probability for Engineers, - 7ª Ed, 2018
(3) Walpole, Myers, Myers, Ye - Probability & Statistics for Engineers & Scientists - Ed. 2016
(4) Norma ISO 16269-6:2014 - Statistical interpretation of data — Part 6: Determination of statistical tolerance intervals - Ed 2014
No hay comentarios:
Publicar un comentario