30.07.2015 Views

Actas JP2011 - Universidad de La Laguna

Actas JP2011 - Universidad de La Laguna

Actas JP2011 - Universidad de La Laguna

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>Actas</strong> XXII Jornadas <strong>de</strong> Paralelismo (<strong>JP2011</strong>) , <strong>La</strong> <strong>La</strong>guna, Tenerife, 7-9 septiembre 2011y ABox. <strong>La</strong>s TBoxs contienen conceptos que formanparte <strong>de</strong> la ontología, y se usa para crear un mo<strong>de</strong>lo<strong>de</strong> representación <strong>de</strong>l conocimiento a partir <strong>de</strong> ellos.<strong>La</strong> ABox contiene los individuos y las relaciones entreellos, haciendo uso <strong>de</strong> estas para inferir propieda<strong>de</strong>sy comprobar su consistencia con la ontología.FaCT++ tiene como objetivo principal clasificaruna ontología a partir <strong>de</strong> su TBox usando un algoritmoTableaux. Para ello se evalúa su organizaciónjerárquica (taxonomía), que es un grafo jerárquico<strong>de</strong> inclusión en don<strong>de</strong> cada nodo representa un concepto,y un nodo C es hijo <strong>de</strong> otro nodo D si existeentre ellos una relación <strong>de</strong> inclusión C ⊆ D, es <strong>de</strong>cir,C está incluido en D (D es más genérico que C,o C es una especialización <strong>de</strong> D). Como se verá acontinuación, para construir esta clasificación, se vacalculando el or<strong>de</strong>n parcial <strong>de</strong> inclusión entre conceptosmediante pruebas <strong>de</strong> inclusión entre pares <strong>de</strong>estos.El algoritmo Tableaux trabaja a varios niveles <strong>de</strong>abstracción y complejidad. En el nivel <strong>de</strong> abstracciónmás alto FaCT++ trabaja con conceptos. Divi<strong>de</strong> lacolección <strong>de</strong> conceptos en tres grupos según una serie<strong>de</strong> propieda<strong>de</strong>s: completamente <strong>de</strong>finidos (CD),no completamente <strong>de</strong>finidos (noCD) y no-primitivos(non-p). Los conceptos CD y noCD no requieren serprocesados mediante el algoritmo Tableaux completopara ser clasificados, mientras los conceptos non-phan <strong>de</strong> ser procesados por el algoritmo completo, portanto son computacionalmente más costosos <strong>de</strong> clasificar.Los conceptos no se clasifican en el mismoor<strong>de</strong>n en que aparecen, sino siguiendo un or<strong>de</strong>n quebusca minimizar el número <strong>de</strong> pruebas que va a necesitarcada concepto para clasificarse.<strong>La</strong> fase SUB (subsumption) comienza cada vez queun concepto es seleccionado y propuesto para ser clasificado.Consiste en <strong>de</strong>terminar la posición correcta<strong>de</strong>l nuevo concepto <strong>de</strong>ntro <strong>de</strong>l grafo parcial <strong>de</strong> inclusiónque hay construido hasta ese momento. Paraello se van haciendo pruebas <strong>de</strong> inclusión entre pares<strong>de</strong> conceptos, formados por el concepto actual ycada uno <strong>de</strong> los nodos que forman parte <strong>de</strong>l grafo <strong>de</strong>inclusión parcial. Estas pruebas siguen un proceso <strong>de</strong>clasificación en dos partes: TopDown que trata <strong>de</strong> <strong>de</strong>terminarlos padres, y BottomUp que <strong>de</strong>termina loshijos <strong>de</strong>l concepto actual. Sin embargo, el algoritmomás importante a este nivel es la Búsqueda Baa<strong>de</strong>r,que va recorriendo el grafo <strong>de</strong> inclusión actual enun or<strong>de</strong>n concreto, y <strong>de</strong>terminando que pruebas <strong>de</strong>inclusión hay que llevar a cabo. De esta forma <strong>de</strong>terminacuales son realmente necesarias y lo que es másimportante, el or<strong>de</strong>n en que han <strong>de</strong> hacerse.Durante la fase <strong>de</strong> más bajo nivel, fase SAT (satisfiability),cada prueba <strong>de</strong> inclusión C ⊆ D se lleva acabo instanciando a un razonador, y equivale a comprobarsi la supuesta inclusión se satisface <strong>de</strong> acuerdoa la KB, es <strong>de</strong>cir, si la contradice o no. <strong>La</strong> supuestainclusión se satisface si es posible construir un mo<strong>de</strong>lo<strong>de</strong> acuerdo a la KB que cumpla la relación C ⊆ D,o por el contrario es inconsistente si durante la construcción<strong>de</strong> este mo<strong>de</strong>lo se contradicen entre sí variosaxiomas, ya sean los generados o los ya existentes enla KB. <strong>La</strong> construcción <strong>de</strong> este mo<strong>de</strong>lo implica conocery tener en cuenta la lógica <strong>de</strong> <strong>de</strong>scripción enque está basada la ontología, ya que este mo<strong>de</strong>lo seirá construyendo incrementalmente, aplicando reglas<strong>de</strong> expansión basadas en los operadores matemáticosque están incluidos en dicha lógica.Inicialmente se parte <strong>de</strong> la suposición C ⊆ D,a esta premisa se le aplicará la regla <strong>de</strong> expansión<strong>de</strong>l operador ⊆ <strong>de</strong> la lógica subyacente (SHOIN (D)en el caso <strong>de</strong> OWL-DL y FaCT++), quedando queC ⊆ KB D ≡ (C ⊓ ¬D) no es posible en KB. Actoseguido se aplicaría la regla <strong>de</strong> expansión correspondienteal operador ⊓, y así sucesivamente. Si seconsigue expandir todas las reglas y terminar el mo<strong>de</strong>losin producir ninguna incoherencia el test SUB escierto, si por el contrario hay alguna contradicción,la suposición inicial C ⊆ D es falsa.Este proceso <strong>de</strong> creación <strong>de</strong> un mo<strong>de</strong>lo expandiendoreglas es el kernel <strong>de</strong>l razonador FaCT++, y es elproceso más costoso en el que emplea la mayor parte<strong>de</strong> su tiempo <strong>de</strong> procesamiento. El or<strong>de</strong>n en queestas nuevas reglas se comprueban influye <strong>de</strong>cisivamenteen el tiempo <strong>de</strong> procesamiento resultante, yaque el coste <strong>de</strong> aplicar los distintos operadores difiereenormemente entre unos y otros. FaCT++ trata estoestableciendo un or<strong>de</strong>n <strong>de</strong> aplicación <strong>de</strong> la nuevas reglasproducidas, las reglas no se expan<strong>de</strong>n en el or<strong>de</strong>nen que se producen. Para ello se usa una estructurabastante compleja llamada TODO list formada porvarias listas y colas <strong>de</strong> espera, en don<strong>de</strong> las reglas seclasifican según el operador lógico que contienen, yse aplican en un or<strong>de</strong>n modificable pre<strong>de</strong>finido mediantepriorida<strong>de</strong>s. El or<strong>de</strong>n usado por <strong>de</strong>fecto enFaCT++ es <strong>de</strong> menor a mayor coste computacional,priorizando siempre los operadores lógicos queimplican menor coste aunque hayan sido añadidosmás tar<strong>de</strong> que otros <strong>de</strong> mayor coste. Los operadoresque implican diversificar el mo<strong>de</strong>lo, lógicamente, seevalúan los últimos.III. PlanteamientoComo se verá más a<strong>de</strong>lante en el trabajo relacionado,los estudios llevados a cabo sobre opciones <strong>de</strong>paralelización <strong>de</strong> algoritmos Tableaux se encuentranen fases poco avanzadas, y no han mostrado gran<strong>de</strong>sprogresos en los últimos años. A continuación, mostraremosun estudio <strong>de</strong> la posible paralelización <strong>de</strong>algoritmo Tableaux según los dos niveles <strong>de</strong> abstracciónanteriormente comentados.A. Nivel SUB: paralelismo entre pruebas <strong>de</strong> inclusiónDurante el proceso <strong>de</strong> clasificación, cuando se vaa añadir un concepto nuevo al grafo parcial <strong>de</strong> inclusión,se conoce dicho concepto, y todos los nodosque forman dicho grafo. Con lo cual, cuando empiezala clasificación <strong>de</strong> un concepto se sabe a prioriel máximo número <strong>de</strong> pruebas que hay que realizarpara clasificarlo, y estas pruebas son perfectamenteparalelizables, ya que su resultado sólo <strong>de</strong>pen<strong>de</strong> <strong>de</strong><strong>JP2011</strong>-178

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!