⎡⎢x ⊕ y = ⎢⎢⎣∑jx1y1x yjj,...,i
vectorial euclidiano con dimensión D-1. En consecuencia, si <strong>de</strong>notamos como e 1,..., e D −1a una base ortonormal <strong><strong>de</strong>l</strong> símplex, toda <strong>composición</strong> x está <strong>de</strong>terminada <strong>de</strong> formaúnica por su vector <strong>de</strong> coor<strong>de</strong>nadasilr( x) = [ < x,e1 >a ,..., < x, e D- 1>a ],Esta transformación permite i<strong>de</strong>ntificar cada elemento <strong><strong>de</strong>l</strong> símplex con su vector <strong>de</strong>coor<strong>de</strong>nadas.La existencia <strong>de</strong> más <strong>de</strong> una transformación nos lleva a la situación <strong>de</strong> <strong>de</strong>ber elegirentre una <strong>de</strong> ellas como paso previo a la aplicación <strong>de</strong> cualquier método estadísticomultivariante. Ciertamente, las tres transformaciones están relacionadas medianteexpresiones matriciales que permiten obtener cada una <strong>de</strong> ellas a partir <strong>de</strong> cualquiera<strong>de</strong> las otras. En este trabajo no se reproducen estas relaciones matriciales por motivos<strong>de</strong> brevedad, para más <strong>de</strong>talles consúltese Aitchison (1986) y Egozcue et al (2003).Naturalmente, será también nuestra misión investigar si los resultados obtenidos <strong>de</strong> laaplicación <strong><strong>de</strong>l</strong> método estadístico multivariante se ven o no afectados por latransformación elegida.Tradicionalmente, en las aplicaciones que exigen simetría en el tratamiento <strong>de</strong> suscomponentes, como por ejemplo una clasificación no paramétrica, se utiliza latrasformación clr. Para la mo<strong><strong>de</strong>l</strong>ización <strong>de</strong> conjuntos <strong>de</strong> datos composicionales condistribuciones multivariantes, se ha venido utilizando mayoritariamente la trasformaciónalr. De esta forma se evita trabajar con distribuciones <strong>de</strong>generadas. Si se <strong>de</strong>sea utilizarla transformación clr en trabajos que incluyan el mo<strong><strong>de</strong>l</strong>o normal, Barceló-Vidal et al.(1999) <strong>de</strong>muestran que para salvar la dificultad <strong>de</strong> matrices <strong>de</strong> covarianzas<strong>de</strong>generadas es suficiente con prescindir <strong>de</strong> una <strong>de</strong> las variables <strong><strong>de</strong>l</strong> conjunto <strong>de</strong> datosclr-transformados. Sin embargo, con cualquiera <strong>de</strong> las dos trasformaciones, se <strong>de</strong>beráanalizar si los resultados <strong><strong>de</strong>l</strong> método aplicado son invariantes por permutaciones <strong>de</strong> lascomponentes. Esta metodología ha permitido ampliar las familias <strong>de</strong> distribucionessobre el símplex. Destacamos el mo<strong><strong>de</strong>l</strong>o normal logístico aditivo (Aitchison, 1986) o elmo<strong><strong>de</strong>l</strong>o normal asimétrico logístico aditivo (Mateu-Figueras et al, 1998). En laactualidad se están <strong>de</strong>sarrollando (Mateu-Figueras and Pawlowsky-Glahn, 2004) la<strong>de</strong>finición <strong>de</strong> mo<strong><strong>de</strong>l</strong>os paramétricos basados en la transformación ilr. Usando estatransformación únicamente queda la dificultad <strong>de</strong> constatar que los resultados no<strong>de</strong>pen<strong>de</strong>n <strong>de</strong> la base ortonormal escogida. Paralelamente se está trabajando enmo<strong><strong>de</strong>l</strong>os <strong>de</strong>finidos sin necesidad <strong>de</strong> recurrir a las transformaciones. En el trabajoMateu-Figueras and Pawlowsky-Glahn (2004) los autores introducen el mo<strong><strong>de</strong>l</strong>o normalen el símplex a partir <strong>de</strong> la función <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> su vector <strong>de</strong> coor<strong>de</strong>nadas.Aitchison (1992) concluye que la naturaleza <strong>de</strong> los datos composicionales imponeque cualquier distancia entre datos composicionales <strong>de</strong> cumplir los siguientesrequisitos: invariante por cambios <strong>de</strong> escala, invariante por perturbaciones, ysubcomposicionalmente dominante. Se pue<strong>de</strong> <strong>de</strong>finir una distancia a<strong>de</strong>cuada mediantela expresión d , y) = d (clr( x),clr(y)),don<strong>de</strong> d eurepresenta la distancia euclidiana.a(x euD{ ∈ S : i 1 N}Si x = [ x ,..., x ]X =1= representa un conjunto <strong>de</strong> datosi i iD,....,composicionales, habitualmente la media aritmética X <strong><strong>de</strong>l</strong> conjunto <strong>de</strong> datos no esrepresentativa <strong><strong>de</strong>l</strong> centro <strong><strong>de</strong>l</strong> conjunto, y a<strong>de</strong>más no es una medida compatible con laoperación perturbación.11