11.07.2015 Views

enriquecimiento del conocimiento previo en programación lógica ...

enriquecimiento del conocimiento previo en programación lógica ...

enriquecimiento del conocimiento previo en programación lógica ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

3. Revisión de métodos 8f ′ (t 1 , . . . , t n ) ∈ BestR. Por último para especializar la cláusula G se añade f ′ , <strong>en</strong> lugar de f, al cuerpo deG.TILDE/ICLTop-Down Induction of Logical DEcision Trees o TILDE [3], es un sistema ILP cuyo esquema de apr<strong>en</strong>dizajees el de interpretaciones, y las teorías construidas con árboles de decisión lógicos [4].Los argum<strong>en</strong>tos numéricos que serán discretizados se declaran a priori con el metapredicado to be discretized.Así, to be discretized (atom (A, B, C) , [A, C]) indica que los argum<strong>en</strong>tos A y C deb<strong>en</strong> ser discretizados.La discretizaciòn de cada argum<strong>en</strong>to declarado, se lleva a cabo antes <strong>del</strong> proceso de apr<strong>en</strong>dizaje conel algoritmo MDLP, al cual se le han hecho dos adaptaciones. Primero, <strong>en</strong> lugar <strong>del</strong> número de ejemplospara el cálculo de la ganancia de información, se utiliza una suma de pesos. Esto se debe a que <strong>en</strong> losdatos relacionales un ejemplo puede t<strong>en</strong>er más de un valor por cada argum<strong>en</strong>to. De esta manera un ejemplosin valores ti<strong>en</strong>e un peso igual a 0. Si ti<strong>en</strong>e el máximo de valores posible, <strong>en</strong>tonces ti<strong>en</strong>e un peso igual a1. La segunda adaptación es respecto al criterio de paro, ya que <strong>en</strong> el algoritmo de discretización original,el criterio de paro dep<strong>en</strong>de <strong>del</strong> Mminimum Description L<strong>en</strong>gth Principle. En TILDE el usuario define unnúmero máximo de intervalos M, con lo cual la ejecución <strong>del</strong> algoritmo se deti<strong>en</strong>e cuando el rango numéricose divida <strong>en</strong> M intervalos.Los intervalos creados pued<strong>en</strong> ser usados de las sigui<strong>en</strong>tes formas: usando desigualdades (, ≥)para id<strong>en</strong>tificar si un valor numérico es m<strong>en</strong>or o mayor que algún punto de división; con igualdad (=) paraverificar si algún valor cae d<strong>en</strong>tro de algún intervalo limitado por dos puntos de división consecutivos, p.e.V alor ∈ Intervalo = [d 1 ..d 2 ]; y por último verificando si un valor se <strong>en</strong>cu<strong>en</strong>tra <strong>en</strong> un intervalo creado pordos puntos de división no consecutivos.En [19, 20], los autores adaptan el algoritmo de discretización MDLP exactam<strong>en</strong>te igual que <strong>en</strong> TILDE,pero el esquema de apr<strong>en</strong>dizaje es el de Inductive Constraint Logic - ICL.Ent MDL o ECL-GSDEl sistema Entropy Minimization plus Minimum Description L<strong>en</strong>gth Principle - Ent MDL [9] (llamado ECLwith Global Univariate Supervised Discretization - ECL-GSD <strong>en</strong> [11]), utiliza el algoritmo MDLP paradiscretizar el rango de de cada atributo numérico. Al igual que TILDE e ICL la discretización es a priori,aunque no se m<strong>en</strong>ciona ninguna modificación al algoritmo original. En este caso cada intervalo creado esutilizado como un valor categórico durante el apr<strong>en</strong>dizaje.Apr<strong>en</strong>dizaje Multivalores <strong>en</strong> ILP (AMILP)En nuestro trabajo de maestría llevamos a cabo una discretización global (antes <strong>del</strong> proceso de apr<strong>en</strong>dizaje)de los atributos categóricos y numéricos. Esta discretización es binaria y para cada atributo numérico obt<strong>en</strong>emosun punto de división d, y para cada atributo categórico se obti<strong>en</strong><strong>en</strong> dos subconjuntos de categorías.Esta discretización se lleva a cabo con el algoritmo de división de nodo de dos inductores de árbolesde decisión: QUEST (Quick Unbiased Effici<strong>en</strong>t Statistical Tree) [22] y CRUISE (Classification Rule withUnbiased Interaction Selection and Estimation) [18].Después de discretizar los atributos, se crean nuevas variables (multivalores) que son agregadas al<strong>conocimi<strong>en</strong>to</strong> <strong>previo</strong> <strong>del</strong> conjunto de <strong>en</strong>tr<strong>en</strong>ami<strong>en</strong>to.Por último se ejecuta el proceso de apr<strong>en</strong>dizaje utilizando dos de los sistemas más populares <strong>en</strong> ILP:Aleph [26] y FOIL [25].

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!