Experiencia del estudio geoestadístico de composición química de ...

More documents

Recommendations

Info

$Curso de LaTeX$

En la mayor parte de los estudios de conjuntos de datos composicionales seríafactible inducir la presencia de componentes con valores nulos simplementeaumentando el número de componentes a considerar en las observaciones. Porejemplo, si en un estudio de la composición de los presupuestos de las familias,subdividimos la componente Vestido y Calzado en las componentes: Camisas,Pantalones, Faldas, Suéteres, Chaquetas, Abrigos, Ropa interior, Botas, Zapatos, yCalzado Deportivo, nos aparecerán componentes con valores nulos. En consecuencia,una primera cuestión que debemos resolver en un estudio de datos con ceros es siestos ceros son o no producto de una subdivisión excesiva de las componentes queestamos observando. En el caso que la respuesta sea afirmativa, es necesario realizaruna amalgama (Aitchison, 1986) de algunas de las componentes de las observaciones.Recordemos que la operación amalgama consiste en aglutinar o sumar partesobteniéndose un conjunto de datos de menor dimensión por lo que refiere al número departes. Observemos que uno de los efectos de la operación amalgama es eliminar lapresencia de valores nulos en las componentes. En consecuencia, la amalgama debeconsiderarse como una fase previa a la aplicación de una técnica multivariante. Estaoperación debe realizarse teniendo siempre muy presente la propia naturaleza de lascomponentes a aglutinar. En general, una vez se ha superado la fase de amalgama delos datos deberá decidirse si se asumen los valores nulos como ceros esenciales ocomo ceros por redondeo.Por lo que se refiere a conjuntos de datos con ceros esenciales, la presencia de uncero esencial en una parte de una observación nos informa que, en relación a otraobservación que en la misma componente contenga un valor no nulo, estas dosobservaciones deben pertenecer a grupos diferentes. Esta idea se conoce como elProblema del Martini Perfecto, del inglés Perfect Martini Problem. Se considera que unMartini es una bebida consistente en una mezcla, en diferentes proporciones, deginebra, de vermut seco, y de vermut dulce. La idea fundamental que aparece en esteejemplo es que una observación –bebida– que contenga un cero esencial en unacomponente –le falta un ingrediente– no es un Martini, sino una bebida diferente. Enconsecuencia, cuando se está interesado en aplicar una técnica estadística a unconjunto de datos con observaciones que contienen ceros esenciales, estos valoresnulos juegan un papel de atributos que separan a las observaciones entre si, según elnúmero y la disposición de sus ceros. De esta manera, dos observaciones inicialmentepertenecen al mismo grupo si son observaciones con ceros comunes, es decir con elmismo número y disposición de los valores nulos. A partir de esta preclasificacióninicial, y dentro de cada grupo, aplicaremos la técnica estadística deseada. En laaplicación de la técnica, dentro de cada grupo, se utilizarán únicamente las partes nonulas. En Martín-Fernández (2001) se propone un algoritmo automático para crear losgrupos de datos en función del número y disposición de los ceros.Si nos centramos en el problema de los ceros por redondeo, recordemos que estamosasumiendo que el valor nulo que aparece en una parte es un dato que se ha traducidopor un cero debido a que corresponde a valores que no han sido registrados odetectados por ser valores extremadamente pequeños. Es decir, en una parte de laobservación aparece un cero que proviene de un dato censurado por tener un valorinferior al umbral de detección de la variable en cuestión. Este umbral de detección sederiva de la precisión con la que se trabaja en el proceso de medida. Está ampliamenteaceptado que la estrategia a seguir se inspira en el reemplazamiento de los ceros porredondeo por una cantidad relativamente pequeña. En Martín-Fernández (2001) y16
Martín-Fernández et al (2003) se exponen en detalle las dificultades que presenta elreemplazamiento propuesto por Aitchison (1986) y el interés por buscar unasubstitución coherente con el carácter composicional de los datos. En aquellos trabajosse propone una nueva aproximación al problema basada en el reemplazamiento de losceros por redondeo mediante una fórmula que tenga buenas propiedades respecto delas operaciones perturbación y formación de subcomposiciones. Consideremos δ k elvalor del reemplazamiento derivado del umbral de detección para la k-ésimacomponente. Sea x una observación que contenga ceros por redondeo. Entonces,construimos la observación r=(r 1 , r 2 ,..., r D ) substituyendo los ceros de x mediante laexpresión siguiente:rk⎧ δksi x⎪= ⎨xk(1− ∑ δl)si x⎪⎩ xl= 0Obsérvese que, con el objetivo de que se siga cumpliendo la restricción de sumaconstante, la modificación de las partes no nulas es una modificación de tipomultiplicativa. De esta manera, en Martín-Fernández (2001) se demuestra que si eneste reemplazamiento se utiliza el verdadero valor perdido entonces, en r se obtiene elverdadero valor de la observación: en el mismo trabajo, el autor demuestra que estereemplazamiento tiene propiedades razonables respecto la operación de formación desubcomposiciones y la operación perturbación.Una vez realizado el reemplazamiento de los ceros por redondeo aplicaremos latransformación deseada, alr, clr o ilr, y podremos aplicar el método estadístico quecreamos conveniente a los datos transformados. Una vez obtenidos los resultados dela técnica estadística surgirá de manera natural la necesidad de realizar un análisis desensibilidad. El problema que se nos plantea en el análisis de sensibilidad de losresultados es estudiar el grado de dependencia de los resultados obtenidos en elanálisis estadístico con respecto de los valores δ k utilizados en el reemplazamiento.Recordemos que los valores δ k se derivan del valor del umbral de detección. Enconsecuencia, una estrategia adecuada para realizar un análisis de sensibilidadconsiste en hacer variar el valor δ k en un rango ligado al umbral de detección o almáximo error de redondeo. En particular, si denominamos δ r al máximo error porredondeo, un rango adecuado (Aitchison, 1986) de variación de los valores δ k consisteenδr≤ δk≤ 25δrkk= 0> 017
Page 3: Report de investigaciónExperiencia
Page 6 and 7: Claro que antes de recoger una mues
Page 8 and 9: Los datos composicionales aparecen
Page 10 and 11: ⎡⎢x ⊕ y = ⎢⎢⎣∑jx1y1x
Page 12 and 13: Aitchison (1997) propuso la media g
Page 14 and 15: Supongamos que la matriz transforma
Page 18 and 19: 3. Descripción estadística de la
Page 20 and 21: A la vista de la naturaleza de los
Page 22 and 23: 0.166) es ligeramente mayor, que la
Page 24 and 25: una parte importante y separada de
Page 26 and 27: clr(Zn)clr(Fe)clr(Pb)clr(Ba)clr(Rb)
Page 28 and 29: En los diagramas ternarios que mues
Page 30 and 31: Tabla 6. Grado de manifestación de
Page 34 and 35: su concentración pasa también al
Page 36 and 37: clr(Zn)clr(Fe)clr(Pb)clr(Rb)clr(Ba)
Page 42 and 43: 4.4. Distribución de las observaci
Page 44 and 45: clr(Zn)clr(Fe)clr(Pb)clr(Ba)clr(Sr)
Page 46 and 47: Zn cRb cBa cFigura 28. Diagrama ter
Page 48 and 49: condiciones de de acidez-alcalinida
Page 50: • Pérelman A.I. Izucháiya geog

Experiencia del estudio geoestadístico de composición química de ...

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?