30.07.2015 Views

Actas JP2011 - Universidad de La Laguna

Actas JP2011 - Universidad de La Laguna

Actas JP2011 - Universidad de La Laguna

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>Actas</strong> XXII Jornadas <strong>de</strong> Paralelismo (<strong>JP2011</strong>) , <strong>La</strong> <strong>La</strong>guna, Tenerife, 7-9 septiembre 2011la base <strong>de</strong> conocimiento KB y no <strong>de</strong>l resultado <strong>de</strong>otras pruebas, ni <strong>de</strong>l estado <strong>de</strong>l grafo <strong>de</strong> clasificaciónen cada momento. Este estado <strong>de</strong>l grafo <strong>de</strong>terminaqué tests hay que hacer para clasificar un concepto,cuántos y cuáles son necesarios. Ante esto, algunasposibilida<strong>de</strong>s en paralelo que surgen son:Previamente a la clasificación, calcular en paralelotodas las posibles pruebas <strong>de</strong> inclusión entrecada par <strong>de</strong> conceptos <strong>de</strong> la ontología. Esto implicaque n conceptos necesitarían n ∗ (n − 1)test SUB. Esto supondría realizar muchas operacionesinnecesarias, lo que redundaría en unamejora, si la hubiera, poco significativa.Durante el proceso <strong>de</strong> clasificación, calcular enparalelo todas las posibles pruebas que comomucho habría que hacer para añadir un concepto.Esto supondría una sobrecarga mucho menorque la posibilidad anterior, ya que como muchohabría que hacer tantas pruebas para cada conceptocomo nodos <strong>de</strong>l grafo hubiera clasificadosen cada momento. Aun así, habría que evaluar sieste enfoque podría llegar a mejorar en algún casoa la versión secuencial FaCT++, que está basadaen heurísticas.B. Nivel SAT: paralelismo <strong>de</strong>ntro <strong>de</strong> la creación <strong>de</strong>un mo<strong>de</strong>loUn test SAT se correspon<strong>de</strong> con la aplicación <strong>de</strong>una regla <strong>de</strong> expansión durante el cálculo <strong>de</strong> un mo<strong>de</strong>lonecesario para realizar una prueba <strong>de</strong> inclusión.Por norma general estas reglas son <strong>de</strong>pendientes entresí, excepto las no <strong>de</strong>terministas que producen divergenciasen el mo<strong>de</strong>lo. Por lo tanto cambiar el or<strong>de</strong>nen que se evalúan, o evaluarlas en paralelo suponeun gran riesgo <strong>de</strong> que el resultado <strong>de</strong>l algoritmo nosea correcto o incluso <strong>de</strong> que su tiempo <strong>de</strong> ejecuciónse dispare. Los propios autores <strong>de</strong> FaCT++, advierten<strong>de</strong> que no se <strong>de</strong>be modificar el or<strong>de</strong>n en que sehacen las comprobaciones [6]. Estas limitaciones enel or<strong>de</strong>n se <strong>de</strong>ben, en parte, a intentar minimizar laexpansión <strong>de</strong>l mo<strong>de</strong>lo para garantizar la terminaciónsecuencial <strong>de</strong>l algoritmo. Habría que evaluar si enuna arquitectura paralela con mucha mayor potencia<strong>de</strong> cálculo se podrían relajar estas restricciones,garantizando igualmente la corrección y terminación<strong>de</strong>l algoritmo. Por otro lado, surge otro gran problemacuando se empieza la construcción <strong>de</strong> un mo<strong>de</strong>lo,ya que no se dispone <strong>de</strong> las reglas que hay que aplicar,es <strong>de</strong>cir, qué expansiones hay que hacer, ya quelo único que se tiene al comienzo es una restriccióninicial C ⊆ D y sólo en el momento en que se compruebey se expanda esta restricción se obtendrán lasnuevas restricciones a ser comprobar. Debido a estemotivo, en cada momento tendríamos muy pocas reglasque evaluar en paralelo, ya que se van obteniendoal ir expandiendo el mo<strong>de</strong>lo. Para obtener unaposible mejora, al igual que en el caso <strong>de</strong>l paralelismoa nivel SUB, es necesario disponer <strong>de</strong>l or<strong>de</strong>n <strong>de</strong>varios cientos o miles <strong>de</strong> reglas, lo cual es bastanteimprobable que suceda. A<strong>de</strong>más, las posibles reglasdisponibles en cada momento, difícilmente serían in<strong>de</strong>pendientesy habría que tener consi<strong>de</strong>raciones adicionalesque perjudicarían aún más el rendimiento.Una posible opción sería expandir todas las reglasdisponibles a la vez, o expandirlas según el tipo <strong>de</strong>operador en que se basen.IV. Evaluación <strong>de</strong> FaCT++<strong>La</strong>s ontologías usadas en las pruebas con FaCT++son cuatro: Snomed-CT, Thesaurus, Pombe y Nsennetsu.Snomed-CT [5] es la terminología médica másimportante en la actualidad, ya que constituye la base<strong>de</strong> conocimiento clínico <strong>de</strong> mayor uso en el ámbitosanitario. Muestra <strong>de</strong> su interés es su consi<strong>de</strong>ración<strong>de</strong> terminología oficial en varios países, entre ellosEspaña. Aunque su forma <strong>de</strong> representación nativano es OWL, en este trabajo usamos una conversiónautomática disponible en el Bioportal [7].Thesaurus es la ontología <strong>de</strong>sarrollada por el NCIpara el dominio <strong>de</strong>l cáncer, que también está disponibleen OWL en el Bioportal. Estas dos ontologíasson consi<strong>de</strong>radas referencia en el ámbito biomédicoy no se pue<strong>de</strong>n consi<strong>de</strong>rar semánticamente ricas <strong>de</strong>s<strong>de</strong>la perspectiva <strong>de</strong> los axiomas y operadores lógicosque incluyen. Se basan fundamentalmente en una taxonomía.Por su parte, Pombe y Nsennetsu son dosontologías generadas automáticamente a partir <strong>de</strong> losficheros <strong>de</strong> anotaciones <strong>de</strong> los genomas <strong>de</strong> SchizosaccharomycesPombe y Neorickettsia sennetsu Miyayamarespecto <strong>de</strong> Gene Ontology, usando la versiónenriquecida <strong>de</strong> Gene Ontology <strong>de</strong>scrita en [4]. Estasdos ontologías se pue<strong>de</strong>n consi<strong>de</strong>rar semánticamentericas <strong>de</strong>s<strong>de</strong> la perspectiva <strong>de</strong> los axiomas y operadoreslógicos que incluyen, pues contienen bastantepropieda<strong>de</strong>s semántica que relacionan las clases <strong>de</strong> laontología.A. Descripción <strong>de</strong> entorno <strong>de</strong> simulaciónSe han realizado pruebas con la versión FaCT++secuencial, y con una implementación paralela a nivelSUB en OpenMP. Para las pruebas secuenciales se hausado una máquina con dos procesadores Intel XeonCPU E5620 Quad-Core a 2.40GHz. Por otro lado,para las pruebas <strong>de</strong> la implementación en OpenMPse ha usado un superor<strong>de</strong>nador <strong>de</strong> memoria compartida<strong>de</strong>l Centro <strong>de</strong> Supercomputación <strong>de</strong> la FundaciónParque Científico <strong>de</strong> Murcia, cuyas principalescaracterísticas son las siguientes: HP Integrity SuperdomeSX2000 con 64 procesadores Intel Itanium2Dual-Core Montvale a 1.60Ghz y 1.5 TB <strong>de</strong> memoriacompartida.B. Perfiles <strong>de</strong> ejecuciónComo se ha dicho, FaCT++ divi<strong>de</strong> los conceptosque forman parte <strong>de</strong> cada ontología en tres tipos:CD, noCD y non-primitive. El comportamiento <strong>de</strong>lalgoritmo y el perfil <strong>de</strong> ejecución que se obtiene esdiferente según la composición <strong>de</strong> la ontología. Segúnel porcentaje <strong>de</strong> conceptos que hay <strong>de</strong> cada tipo seobtienen tres perfiles <strong>de</strong> ejecución:Conceptos CD: no requieren proceso <strong>de</strong> clasificación,la posición <strong>de</strong> cada concepto en el grafo<strong>JP2011</strong>-179

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!