lunes, 23 de marzo de 2020

Estimación de la media robusta paso a paso

El siguiente artículo enseña como realizar el cálculo de la media robusta de una serie de datos mediante el método iterativo que se presenta en la norma ISO 5725-5, y que recibe el nombre de "Algoritmo A".


La idea central es usar un método alternativo o complementario al descarte de los datos anómalos de los test de Cochran, Grubbs, h y k de Mandel y otros.

A continuación, se presenta el método propuesto por ISO 5725-5 paso a paso.

Para ello, consideremos 9 datos correspondientes a una serie de un ensayo. Para estimar la media robusta los ordenamos de menor a mayor como sigue:
x1
17,570
x2
19,500
x3
20,100
x4
20,155
x5
20,300
x6
20,705
x7
20,940
x8
21,185
x9
24,140

Primero calculamos la media, la desviación estándar, la mediana (designada como x*) y la desviación estándar basada en la mediana, s*.
x1
17,570
x2
19,500
x3
20,100
x4
20,155
x5
20,300
x6
20,705
x7
20,940
x8
21,185
x9
24,140
Media
20,511
desv est
1,727
x*
20,300
s*
0,949

Para calcular s*, se procede como sigue
|x1 - x*|
2,73
|x2 - x*|
0,8
|x3 - x*|
0,2
|x4 - x*|
0,145
|x5 - x*|
0
|x6 - x*|
0,405
|x7 - x*|
0,64
|x8 - x*|
0,885
|x9 - x*|
3,84

Por lo tanto s* = 1,483*mediana |xi – x*| = 0,949

Para la primera iteración, aparece un nuevo término, que denotaremos j:
j = 1,5 s*. En este caso, j = 1,5*0,949 = 1,424

Iteración
0
1
j

1,424
x* - j

18,876
x* + j

21,724
x1
17,570

x2
19,500

x3
20,100

x4
20,155

x5
20,300

x6
20,705

x7
20,940

x8
21,185

x9
24,140

Media
20,511

desv est
1,727

x*
20,300

s*
0,949


Para calcular los términos x1 a x9 se procede como sigue:
Los valores extremos son x1 y x9.
Para el dato menor x1,
si x1 < (x* - j), entonces colocar (x* - j), de lo contrario repetir el valor x1
Para el dato mayor x9:
si x9 > (x* + j), entonces colocar x9, de lo contrario repetir el valor (x* - j)
El resto de los valores de x2 a x8 se vuelven a repetir en la siguiente columna.

Iteración
0
1
j

1,424
x* - j

18,876
x* + j

21,724
x1
17,570
18,876
x2
19,500
19,500
x3
20,100
20,100
x4
20,155
20,155
x5
20,300
20,300
x6
20,705
20,705
x7
20,940
20,940
x8
21,185
21,185
x9
24,140
21,724
Media
20,511

desv est
1,727

x*
20,300

s*
0,949


Luego, se calcula la media, desviación estándar y los valores de x* y s* para esta primera iteración.
Iteración
0
1
j

1,424
x* - j

18,876
x* + j

21,724
x1
17,570
18,876
x2
19,500
19,500
x3
20,100
20,100
x4
20,155
20,155
x5
20,300
20,300
x6
20,705
20,705
x7
20,940
20,940
x8
21,185
21,185
x9
24,140
21,724
Media
20,511
20,837
desv est
1,727
0,869
x*
20,300
20,387
s*
0,949
0,986

Para s* se procede calculando s* = 1,483*mediana  |xi - x*|

Lo mismo procede para la segunda, tercera, cuarta y quinta iteración.

La siguiente tabla muestra los resultados de 5 iteraciones: 
Iteración
0
1
2
3
4
5
j

1,424
1,478
1,515
1,540
1,558
x* - j

18,876
18,909
18,892
18,871
18,854
x* + j

21,724
21,866
21,921
21,951
21,970
x1
17,570
18,876
18,909
18,892
18,871
18,854
x2
19,500
19,500
19,500
19,500
19,500
19,500
x3
20,100
20,100
20,100
20,100
20,100
20,100
x4
20,155
20,155
20,155
20,155
20,155
20,155
x5
20,300
20,300
20,300
20,300
20,300
20,300
x6
20,705
20,705
20,705
20,705
20,705
20,705
x7
20,940
20,940
20,940
20,940
20,940
20,940
x8
21,185
21,185
21,185
21,185
21,185
21,185
x9
24,140
21,724
21,866
21,921
21,951
21,970
Media
20,511
20,837
20,407
20,411
20,412
20,412
desv est
1,727
0,869
0,890
0,905
0,916
0,924
x*
20,300
20,387
20,407
20,411
20,412
20,412
s*
0,949
0,986
1,010
1,027
1,039
1,047

De la cuarta y quinta iteración los valores de la media y x* no difieren o el cambio de x* y s* desde un cálculo a otro se hace pequeño. Por lo tanto, podemos asumir que la media robusta es 20,412.     

Referencia:
ISO 5725-5:1998 (corr 2005) Accuracy (trueness and precision) of measurement methods and results — Part 5: Alternative methods for the determination of the precision of a standard measurement method.  Pág. 35. 
ANALYST. DECEMBER 1989, VOL. 114 Robust Statistics- How Not to Reject Outliers. Part 1. Basic Concepts, pp 1693 a 1697.
ANALYST. DECEMBER 1989, VOL. 114 Robust Statistics- How Not to Reject Outliers. Part 2. Inter-laboratory Trials, pp 1699 a 1702.

Pincha aquí para saber más acerca de los cursos que se ofrecen en 2023: CURSOS ONLINE

3 comentarios:

  1. Hola Mauricio!! Interesante posteo. Consulta el valor asignado a j=1.5 como lo determinas? O es una convencion? Viene dado por la norma? Que valor de j se utiliza para la segunda, tercera, etc iteraciones?

    Saludos,

    Manuel Escudero

    ResponderEliminar
    Respuestas


    1. El valor j = 1,5 viene dado por la norma . Pero si quieres más detalle, acabo de agregar el artículo donde ISO extrae esa información. Los valores de j para el resto de las iteraciones se calcula con el s* de la iteración anterior. Por ejemplo en la segunda iteración es 1,5*0,986 =1,478, en la tercera iteración es 1,5*1,010 = 1,515, y así sucesivamente. Saludos

      Eliminar
  2. IN. Mauricio podria hacer un post sobre el rango dinamico lineal y cual es la manera correcta de hacer el rango dinamico lineal en el equipo varian 240.
    Saludos cordiales.

    ResponderEliminar