martes, 17 de enero de 2023

NO CONFUNDAS INTERVALOS DE CONFIANZA CON INTERVALOS DE TOLERANCIA ESTADÍSTICO

Uno de los grandes errores que se comete en el mundo de la ingeniería y de las ciencias es confundir estos dos tipos de intervalos.

La mayoría de los usuarios de métodos estadísticos están familiarizados con los intervalos de confianza (comunes) para la media de la población y para la desviación estándar de la población, pero a menudo no para los cuantiles de la población o la probabilidad de exceder un valor umbral especificado. A pesar de que algunas personas, especialmente en la industria, también conocen los intervalos de tolerancia, tienden frecuentemente a confundir estos intervalos, calculando un intervalo de confianza para contener la media poblacional cuando el problema requiere un intervalo de tolerancia o un intervalo de predicción.

Este artículo tiene por objeto, mostrar cuáles son esas diferencias y como se aplican en el mundo real.

Pero primero partamos definiendo qué entendemos por intervalo de confianza y qué entendemos por intervalo de tolerancia estadístico.

Un Intervalo de confianza, IC, es un intervalo donde podemos suponer de manera razonable que se encuentra el valor verdadero. Y cuando hablamos de un IC del 95% lo que estamos diciendo es que, si el experimento se repitiera varias veces, existe la probabilidad de que el 95% de esos intervalos pueda contener el valor verdadero.

En palabras simples, la longitud de ese intervalo es una medida de la precisión de la estimación del parámetro a través del estadístico.

En cambio, un intervalo de tolerancia estadístico (o simplemente intervalo de tolerancia para muchos textos), IT, es un intervalo que contiene una proporción específica de una población con un nivel de confianza establecido.

Para entender ambos conceptos, supongamos que tenemos un contenedor que contiene un cierto tipo de mineral, cuya característica de interés se encuentra uniformemente diseminado en el medio y que este lote lo podemos ver como una población probabilística (lotes de 0-D en la teoría de Pierre Gy), y estamos interesados en saber 2 cosas respecto de él:

Pregunta a) Cual es el contenido de arsénico medio en gpt; y

Pregunta b) Cuál es su variabilidad o dispersión en ese contenedor

Supongamos que los datos se pueden ajustar a una distribución aproximadamente normal, por lo tanto, para estimar los respectivos parámetros (valores que son desconocidos para nosotros) en a) podemos usar la media aritmética muestral para estimar la media poblacional μ, y para b) podemos usar la desviación estándar muestral para estimar la desviación estándar poblacional, σ.

Pero, también podemos hacer dos preguntas adicionales acerca de los datos del contenido de arsénico del contenedor:

Pregunta c) Qué tan confiable es el valor medio de arsénico reportado y

Pregunta d) Qué tan confiable es la desviación estándar de arsénico reportada.

Para las preguntas a y b estamos ante la presencia de estimaciones puntuales. Existe una estimación puntual para la media y una estimación puntual para la desviación estándar. Pero como la estimación puntual es un solo número, el hecho de repetir varias veces este experimento, vamos a obtener diferentes estimaciones puntuales y dependiendo del tamaño de muestra elegido esas diferencias podrían ser grandes o pequeñas. Por ello, la respuesta a las preguntas c y d están relacionadas con otro tipo de estimación; la estimación por intervalos (o intervalos de confianza) de la media y la estimación por intervalos (o intervalos de confianza) de la desviación estándar.

Sin embargo, todavía podemos hacer una quinta pregunta diferente a las anteriores:

Pregunta e) Cuáles son los valores extremos de contenido de arsénico que se presentan en el contenedor, que equivale a preguntar en qué intervalo se presenta el contenido de arsénico. Pero también podríamos preguntar por una proporción específica, no necesariamente sus extremos.

Partiendo de la base que se trata de un material heterogéneo, (y que la variabilidad del sistema de medición (conformada por operador, equipos y otros factores) es despreciable. La respuesta a e) corresponde a estimar el intervalo de tolerancia estadístico. Pero como igual debemos tomar una muestra, la respuesta más precisa obedece al área de las probabilidades. Es decir, igual debemos establecer un nivel de confianza dado para entregar esa proporción.

Matemáticamente equivale a estimar en forma simultánea μ y σ, que son desconocidos. Y eso se hace a través del factor k de la siguiente expresión:

donde k es un factor que se puede obtener de tablas estadísticas y depende de alfa y del tamaño de muestra.

 

Demostración de las diferencias entre IC e IT

Para realizar una demostración de las diferencias entre ambos intervalos, vamos a partir del principio que, si el tamaño de muestra tiende a infinito, la estimación de μ con la media muestral y de σ con s coinciden respectivamente.

Matemáticamente, si queremos calcular el intervalo de tolerancia estadístico del 95% para una muestra con media = 100 y desviación estándar = 5 para un número infinito de observaciones, no importa el nivel de confianza. El resultado es:

IT = 100-1,96*5, 100 + 1,96*5 = (90.2, 109.8)

En cambio, para el intervalo de confianza de la media y de la desviación estándar (no importa el nivel de confianza escogido) el resultado es cero.

IC para la media = (100.0, 100.0) que es equivalente a 100 +/- 0

IC de la desv. estándar = (5.0, 5.0)

El siguiente ejercicio se realizó usando el software Minitab. Se tomó una muestra lo suficientemente grande para que estas estimaciones de μ y σ sean lo más confiable posible. Se generaron 10.000.000 de números aleatorios para una distribución normal con media = 100 y desviación estándar = 5.

Con estos datos se realizó una estimación por intervalos con diferentes niveles de confianza; 0,90, 0,95 y 0,99.


Como se puede apreciar con tamaños de muestra muy grandes, los límites de confianza inferior y superior son muy semejantes. Es decir, el intervalo de confianza es demasiado pequeño.

Lo mismo se realizó para la estimación por intervalo de la desviación estándar.


donde se aprecia que los límites de confianza inferior y superior son semejantes, independientes del nivel de confianza,

Ahora bien, al calcular el intervalo de tolerancia estadístico para 10.000.000 de observaciones generadas aleatoriamente con diferentes niveles de confianza encontramos que los valores no dependen del nivel de confianza porque tienden a converger a un valor específico. 


Conclusión, el intervalo de tolerancia estadístico tiende a una proporción constante cuando n tiende a infinito, no importa el nivel de confianza.

En cambio, el intervalo de confianza tiende a ser cero.


Aplicaciones en el mundo real.

El siguiente ejemplo tiene por objetivo a ayudarnos a clarificar estas diferencias.

Tema. - Un material de referencia elaborado en un laboratorio para el elemento hierro.

Descripción. - Un material que es preparado en un laboratorio como material de referencia y que ese mismo material es ensayado diferentes veces por diferentes operadores, en diferentes días para obtener una media (valor asignado al MR) y una desviación estándar para ese laboratorio.

Datos; 


Objetivos:

Pregunta a) Cuál es el contenido medio de hierro en el Material de referencia. Esto equivale a determinar la media aritmética, que corresponde al valor central de los datos.

Respuesta: X barra = 12,51% Fe

Pregunta b) Cuál es su variabilidad o dispersión. Esto equivale a determinar la reproducibilidad media a través de la desviación estándar, que corresponde a la variación debida al sistema de medición, partiendo de la base que la no homogeneidad del MR es despreciable y que toda la variabilidad se deba al sistema de medición (operadores, equipos, método, otros factores).

Respuesta:  s =0,18% Fe

Pregunta c) Qué tan confiable es el valor medio de hierro reportado. Esto equivale a realizar una estimación por intervalos de la media, que es lo mismo que determinar el intervalo de confianza de la media. 

Respuesta: (12,47 a 12,54) % Fe con un 95% de confianza

Eso equivale al semi-intervalo +/- 0,03% Fe

Pregunta d) Qué tan confiable es la desviación estándar de hierro reportado. Esto equivale a realizar una estimación por intervalos de la desviación estándar, que es lo mismo que determinar el intervalo de confianza de la desviación estándar.

Respuesta: (0,16 a 0,21) % Fe con un 95% de confianza

Pregunta e) Cuáles son los valores extremos de contenido de hierro que se obtuvieron en la estandarización (asociado al sistema de medición).  Pero también podríamos preguntarnos por una proporción específica. Esto equivale a preguntar cuál es el intervalo de tolerancia estadístico.

Respuesta: Con un 95 % de confianza (1 - α = 0,95), se puede afirmar que el 95% de los valores (p = 0,95) producto del sistema de medición cubren un intervalo que va desde 12,11 a 12,91 % Fe. 

Con un 95% de confianza, se puede afirmar que el 99% de los valores se encuentran entre 11,98 a 13,04 % Fe.

Referencias

(1) Meeker, Hans, Escobar - Statistical Intervals_ A Guide for Practitioners and Researchers - Ed. 2017

(2) Montgomery, Runger - Applied Statistics and Probability for Engineers, - 7ª Ed, 2018

(3) Walpole, Myers, Myers, Ye - Probability & Statistics for Engineers & Scientists - Ed. 2016

(4) Norma ISO 16269-6:2014 - Statistical interpretation of data — Part 6: Determination of statistical tolerance intervals - Ed 2014

(5) Curso de Estadística con Excel aplicado a procesos mineros de Mauricio Arancibia G.

Pincha aquí para saber más acerca de los cursos que se ofrecen en 2023: CURSOS ONLINE

miércoles, 11 de enero de 2023

POTENCIA Y TAMAÑO DE MUESTRA PARA LA PRUEBA Z DE 1 MUESTRA EN EXCEL

Uno de los grandes problemas que el profesional e investigador enfrenta diariamente al usar pruebas estadísticas es asegurar que su resultados y conclusiones sean confiables. En la estadística frecuentista equivale a validar los supuestos subyacentes y a determinar el tamaño de muestra mínimo para que sus resultados sean válidos (aparte de considerar otros factores).

En la prueba z de 1 muestra, lo que se desea determinar es que tan significativa es la diferencia entre la media de una muestra y un valor de referencia cuando sigma es conocido. 

(Ojo, en estadística el concepto de muestra se refiere a un conjunto de observaciones que lo asociamos a alguna característica de interés para nuestro estudio)

El contraste de hipótesis es:

Prueba bilateral: 

H0 : μ = μ0 vs H1: μ ≠ μ0

Prueba unilateral

H0 : μ ≤ μ0 vs H1: μ > μ0

H0 : μ ≥ μ0 vs H1: μ < μ0

Para el criterio de rechazo se pueden usar cualquiera de los siguientes tres métodos alternativos que son equivalentes; el método del puntaje, el método de la probabilidad o el intervalo de confianza. 

Pero, las conclusiones de esta prueba además van a depender de la interrelación de 5 factores; el tamaño de la muestra, la variabilidad de los datos, la diferencia que se quiere detectar, la potencia de la prueba (asociada al error tipo II) y el error tipo I.

Vamos por parte, que es el error tipo I y el error tipo II.

Cuando repetimos un experimento varias veces, los resultados que obtenemos (los datos), nunca van a ser iguales, estamos en el campo de las probabilidades y aquí podemos cometer dos tipos de errores;

El error tipo I, expresado como probabilidad alfa; es la probabilidad de rechazar la hipótesis nula cuando la hipótesis nula es cierta.

El error tipo II, expresado como probabilidad beta, es la probabilidad de no rechazar la hipótesis nula cuando la hipótesis nula es falsa.

La potencia de la prueba, en cambio, es la probabilidad de rechazar la hipótesis nula cuando la hipótesis nula es falsa. Esto último nos estaría dando un indicador de que tan sensible es una prueba para detectar una diferencia específica. Valores del 80% hacia arriba se considera bueno, sobre el 90% aún mejor.


Determinación de la potencia de la prueba z de 1 muestra en Excel 

En resumen, para determinar la potencia de una prueba tenemos que considerar que ésta depende de los siguientes factores:

1.- El tipo de prueba estadística

2.- Si la prueba es unilateral o bilateral

3.- la probabilidad alfa

4.- El tamaño de la muestra, n

5.- La diferencia que deseamos detectar

6.- la variabilidad de los datos


Por lo tanto, las ecuaciones que determinan la potencia son:

Para una prueba bilateral:  H1: μ ≠ μ0




Para una prueba unilateral:  H1: μ > μ0 




Para una prueba unilateral:  H1: μ < μ0 




A continuación, se presenta como puede determinarse la potencia de la prueba z de 1 muestra en Excel.

Los datos de entrada se escriben en una pestaña en Excel que denominaremos "salida" (Ver figura 2). En la segunda pestaña denominada "calculo" es donde se realizan los cálculos respectivos (Figura 1) 


Figura 1.- Hoja de cálculo para determinar la potencia de la prueb

En la pestaña salida, es donde se anotan los datos y se despliega el resultado. En la siguiente figura se muestra la potencia obtenida para una prueba bilateral



Figura 2.- Hoja donde se escriben los datos de entrada; n, alfa, sigma y diferencia a detectar.

Las hipótesis alternativas que se presentan en el cuadro verde de la Figura 2 se construye a partir de los controles de formularios de Excel, que se ubican en; programador > Insertar > controles de formulario > botón de opción (control de formulario).
Una vez colocado esos botones, con el botón derecho del mouse se debe teclear Formato de control


Figura 3.- Menú para ingresar a Formato de control

Una vez en formato de control, se debe vincular a la celda respectiva de la pestaña calculo, tal como se muestra en Figura 4.


Figura 4.- Cuadro de diálogo del Formato de control

Y con esto deberían aparecer los resultados en la hoja de salida, de la Figura 2.


Determinación del tamaño de muestra para la prueba z de 1 muestra en Excel

Para determinar el tamaño de muestra, tenemos que considerar, que ésta depende de los siguientes factores:

1.- El tipo de prueba estadística

2.- Si la prueba es unilateral o bilateral

3.- la probabilidad alfa

4.- La potencia de la prueba

5.- La diferencia que deseamos detectar

6.- la variabilidad de los datos

Por lo tanto, las ecuaciones que determinan el tamaño de muestra son:

Para las pruebas unilaterales:






donde:





Para la prueba bilateral:

Se debe usar un método iterativo para encontrar n. En Excel se puede recurrir a la función BUSCARV.

A continuación, se presenta como puede determinarse el tamaño de muestra para la prueba z de 1 muestra en Excel.
Los datos de entrada se escriben en la pestaña en Excel que se denomina "salida" (Ver figura 6). En la segunda pestaña denominada "calculo" es donde se realizan los cálculos respectivos (Figura 5)


Figura 5.- Hoja de cálculo para determinar el tamaño de muestra

En la pestaña salida, es donde se anotan los datos y se despliega el resultado. En la siguiente figura se muestra el tamaño de muestra mínimo que se requiere para una prueba bilateral.


Figura 6.- Hoja donde se escriben los datos de entrada; potencia, alfa, sigma y diferencia a detectar.

Las hipótesis alternativas que se presentan en el cuadro verde de la Figura 6 se construye a partir de los controles de formularios de Excel, que se ubican en programador > Insertar > controles de formulario > botón de opción (control de formulario).
Una vez colocado esos botones, con el botón derecho del mouse se teclea Formato de control

Figura 7.- Menú para ingresar a Formato de control

Y se vincula a la celda respectiva de la pestaña calculo, en este caso relacionada con el tamaño de muestra


Figura 8.- Cuadro de diálogo del Formato de control

Por último, en la pestaña iterativo z, se presenta el método iterativo para determinar el tamaño de muestra para una prueba bilateral.


Figura 9.- Hoja de cálculo donde se presenta el método iterativo para obtener el tamaño de muestra para una prueba bilateral


Figura 10.- Hoja de cálculo donde se presenta el método iterativo para obtener el tamaño de muestra para una prueba bilateral

Se debe tener presente, que para el resto de las pruebas como t de 1 muestra, test de 1 varianza, t de 2 muestras independientes, t de muestras pareadas, ANOVA de 1 factor, etc. cada una de ellas tiene su propio cálculo de potencia y tamaño de muestra.

Referencia
(2) Montgomery D., Runger G., “Applied Statistics and Probability for Engineers”, 7° Ed. 2018

Pincha aquí para saber más acerca de los cursos que se ofrecen en 2023: CURSOS ONLINE