jueves, 21 de marzo de 2024

ENSAYO SOBRE LOS FUNDAMENTOS DE UN NUEVO MODELO DE QAQC

Ronald Fisher fue quien se dio cuenta que había que diferenciar entre población y muestra. Fue él, precisamente, quien introdujo los términos de parámetros (asociados a la población) y estadísticos (asociados a la muestra). A la vez, también se percató que los parámetros desconocidos, teníamos que "estimarlos" a partir de una muestra, proceso denominado "inferencia estadística".

Hasta aquí, tenemos una población con parámetros desconocidos, donde la estimación de los parámetros se hace a través de una muestra, cuyos términos a evaluar se denominan ahora "estadísticos". Y la inferencia estadística se denomina al proceso mediante el cual se hace afirmaciones válidas acerca de la población o proceso con base en la información contenida en una muestra.

Sin embargo, algo que no nos dicen los libros de estadística clásico o introductorio, la mayoría al menos, es que para poder estimar el valor del parámetro a partir de una muestra, debemos necesariamente realizar "MEDICIONES" sobre esta última. Y la inclusión de este nuevo factor en la estimación del parámetro, lo cambia todo, porque necesariamente se tiene que incorporar nuevas fuentes de ruido que hacen que la estimación se haga menos precisa.

De eso se trata este artículo, de identificar cuáles son esas fuentes de incertidumbres como tratarlas para obtener resultados que sean lo más óptimo posible.


ESTIMACIÓN DE LOS PARÁMETROS DE UNA POBLACIÓN EN AUSENCIA DE SESGO

En este primer apartado, vamos a tratar de la estimación de los parámetros, media y variación natural de la característica de interés, de una población, estática o dinámica (proceso), heterogénea u homogénea, entendiendo que si se trata de este último caso, la variación natural de la población se hace cero. y esta estimación la vamos a realizar en ausencia de sesgo para facilitar nuestro análisis del modelo.

Por lo tanto, la secuencia para realizar una estimación del parámetro en el mundo real es: 

POBLACIÓN - Muestreo - MUESTRA - Medición - RESULTADO

La siguiente figura corresponde a un modelo, todavía en calidad de borrador, que muestra tentativamente los factores involucrados en la estimación de parámetros de una población a través de una muestra. Lo que interesa aquí es estimar tanto la media como la variación de la característica en esa población.

Figura 1 - Estimación de la media de la característica de interés y la variación natural de la característica de interés en la población. La primera fila trata de la estimación de la media de la población, mediante x̄ . La segunda fila trata en cambio de la variación de los valores individuales, X
donde: 
      µ                 : Media de la población
      x̄                 : Media de la muestra
      σNAT (P)     : Variación natural de la población
      SNAT (P)    : Variación natural de la muestra que representa a la de la población
      SNAT (M)   : Variación natural asociada al muestreo
      SNAT (SM) : Variación natural del sistema de medición
      SNAT (T)     : Variación natural total
      S                : Variación debido a la estimación de la media (Error estándar de la media)

En esta figura, se presenta la estimación de la variación natural de la característica de la población considerando todas las etapas hasta obtener un resultado. Como se puede apreciar, en el proceso de muestreo se introduce una variación adicional que corresponde a la variación natural del muestreo. Sin embargo, en el proceso de medición se vuelve a introducir una nueva variación, que corresponde a la variación natural del sistema de medición. 

En todas estas etapas se han introducido variaciones que he denominado "natural" para diferenciarla de un cuarto componente, que no corresponde a la variación natural de las etapas anteriores, que es la que se asocia a la estimación del parámetro, en este caso, de la media poblacional.

Diferenciar entre variación natural y estimación del parámetro es importante por varias razones. 

  1. Las variaciones naturales son constantes a estimar, no dependen del tamaño de muestra. En cambio, la variación debido a la estimación del parámetro depende fuertemente del tamaño de muestra.
  2. La estimación del parámetro a través del estadístico sólo nos dice que tan confiables es el resultado obtenido. En cambio, la variación natural está asociada con la variabilidad de los procesos.
Veamos de qué depende cada variabilidad.

Variación asociada a la estimación de la media depende:
        a) de la variación natural total o de la variación natural de cada proceso, según corresponda
        b) del tamaño de muestra, n
        c) del Nivel de confianza, 1 - α

Variación natural asociada al sistema de medición depende:  
        a) de la variación asociada a equipos
        b) de la variación asociada a operadores
        c) de la variación asociada a método
        d) de la variación asociada a factores ambientales
        e) de otras fuentes

Variación natural asociada al muestreo depende:    
        a) de la variación asociada a las operaciones selectivas
            (debido al error fundamental, de segregación/agrupamiento, de delimitación, de extracción,
            de ponderación, de tendencia y/o cíclico)
        b) de la variación asociada a las operaciones no selectivas 
            (debido al error de preparación)

En resumen, la incertidumbre total, en ausencia de sesgo, asociada a un resultado va a depender de 4 variaciones que se suman.
  1. De la variación natural de la población
  2. De la variación natural del muestreo
  3. De la variación natural del sistema de medición
  4. De la variación asociada a la estimación de la media
Sin embargo, minimizar las diferentes fuentes de incertidumbre va a depender del objetivo que se persiga. A saber:
  1. Si queremos que nuestra estimación de la media y de la variación natural de la característica de interés sea lo más precisa posible, entonces debemos minimizar las variaciones 2, 3 y 4. 
  2. Y cuando nuestro objetivo, o nuestra población sea el sistema de medición, entonces, 1, 2 y 4 deberán ser insignificantes.
  3. Si nuestro objetivo es estimar la media del sistema de medición en un proceso ya definido previamente, entonces deberán sumarse 3 y 4, pero en las condiciones y tamaño de muestra tal cual se usan en ese proceso. Y 1 y 2 deberán ser cero e insignificantes, respectivamente.
  4. En otras ocasiones, se requerirá, la incertidumbre del sistema de medición más el muestreo en las condiciones y tamaño de muestra tal cual se usan en ese proceso. En este caso se deberán sumar 2, 3 y 4. Y 1 deberá ser cero.

Por lo tanto, la incertidumbre total respecto de la media de un resultado, en ausencia de sesgo, va a corresponder al semi-intervalo de tolerancia estadístico, el que deberá sumarse al semi-intervalo de confianza de la media, según corresponda. 


Referencias

  1. Meeker, Hans, Escobar - Statistical Intervals_ A Guide for Practitioners and Researchers - Ed. 2017
  2. Montgomery, Runger - Applied Statistics and Probability for Engineers, - 7ª Ed, 2018
  3. Walpole, Myers, Myers, Ye - Probability & Statistics for Engineers & Scientists - Ed. 2016
  4. Norma ISO 16269-6:2014 - Statistical interpretation of data — Part 6: Determination of statistical tolerance intervals - Ed 2014

No hay comentarios:

Publicar un comentario