enriquecimiento del conocimiento previo en programaciÃ³n lÃ³gica ...

More documents

Recommendations

Info

Capítulo 3Revisión de métodosA continuación presentamos la revisión realizada de métodos ILP que implementan estrategias para elmanejo de atributos numéricos y/o categóricos. Estos los clasificamos en aquellos métodos que utilizanla discretización, la programación lógica de restricciones, los algoritmos genéticos, y la transformación deun problema relacional en otro tipo.3.1 Discretización en ILPPara el manejo de valores numéricos, algunos sistemas ILP discretizan el rango numérico de un atributo A,con el algoritmo Minimum Description Length Principle -MDLP [12]. Este algoritmo ordena de maneraascendente el conjunto numérico S, donde cada s ∈ S tiene asignada una de k clases. Después se crea unconjunto T de puntos provisionales, donde cada T i ∈ T es el punto intermedio entre dos valores consecutivosde S, dividiéndolo en los subconjuntos S 1 y S 2 .Después se calcula la información de entropía de clase para cada E (A, T i ; S) = |S1||S| Ent (S 1)+ |S2||S| Ent (S 2),donde Ent (S i ) = − ∑ kj=1 P (C j, S i ) log 2 (P (C j , S i )), k es el número de clases, P (C j , S i ) es el número deejemplos de S i con clase C j . Se selecciona el intervalo con el valor más pequeño: E (A, T min ; S).Si Gain (A, T min ; S) ≤ log2(N−1)N+ ∆(A,Tmin;S)N, entonces T min divide a S, y el proceso se repite recursivamenteen S 1 y S 2 . En otro caso el proceso se detiene.(Además ∆ (A, T min ; S) = log 2 3 k − 2 ) − [kEnt (S) − k 1 Ent (S 1 ) − k 2 Ent (S 2 )]; N =| S |; Gain (A, T min ; S) =Ent (S) − E (A, T min ; S) es la ganancia de información de T min ; k, k 1 , k 2 son las clases representadas enS, S 1 yS 2 respectivamente.INDUBI/CSLEste sistema utiliza dos tipos de literales: f (t 1 , . . . , t n ) = V y f (t 1 , . . . , t n ) ∈ R, donde f es una funciónde aridad n; t i es una variable o una constante; V es el valor que toma f; R es un conjunto de posiblesvalores que puede tomar f [23].Si una literal numérica f (ya sea V un valor numérico o R un conjunto de valores numéricos) es elegidapara especializar una cláusula G, entonces el sistema INDUBI/CSL define un conjunto de puntos de divisióne intervalos a lo largo del rango numérico de la siguiente manera: un punto de división d define dos intervalosdisjuntos [l 1 , l 2 ],[r 1 , r 2 ], donde l 1 es el valor más pequeño del intervalo izquierdo con clase +, l 2 es el valormás grande tal que l 2 < d, r 1 es el valor más pequeño tal que r 1 > d, r 2 es el valor más grande con clase +.Después se calcula la ganancia de información para cada intervalo (de acuerdo al algoritmo MDLP).El intervalo con mayor ganancia de información, denotado BestR, es usado para crear una nueva literal:7
3. Revisión de métodos 8f ′ (t 1 , . . . , t n ) ∈ BestR. Por último para especializar la cláusula G se añade f ′ , en lugar de f, al cuerpo deG.TILDE/ICLTop-Down Induction of Logical DEcision Trees o TILDE [3], es un sistema ILP cuyo esquema de aprendizajees el de interpretaciones, y las teorías construidas con árboles de decisión lógicos [4].Los argumentos numéricos que serán discretizados se declaran a priori con el metapredicado to be discretized.Así, to be discretized (atom (A, B, C) , [A, C]) indica que los argumentos A y C deben ser discretizados.La discretizaciòn de cada argumento declarado, se lleva a cabo antes del proceso de aprendizaje conel algoritmo MDLP, al cual se le han hecho dos adaptaciones. Primero, en lugar del número de ejemplospara el cálculo de la ganancia de información, se utiliza una suma de pesos. Esto se debe a que en losdatos relacionales un ejemplo puede tener más de un valor por cada argumento. De esta manera un ejemplosin valores tiene un peso igual a 0. Si tiene el máximo de valores posible, entonces tiene un peso igual a1. La segunda adaptación es respecto al criterio de paro, ya que en el algoritmo de discretización original,el criterio de paro depende del Mminimum Description Length Principle. En TILDE el usuario define unnúmero máximo de intervalos M, con lo cual la ejecución del algoritmo se detiene cuando el rango numéricose divida en M intervalos.Los intervalos creados pueden ser usados de las siguientes formas: usando desigualdades (, ≥)para identificar si un valor numérico es menor o mayor que algún punto de división; con igualdad (=) paraverificar si algún valor cae dentro de algún intervalo limitado por dos puntos de división consecutivos, p.e.V alor ∈ Intervalo = [d 1 ..d 2 ]; y por último verificando si un valor se encuentra en un intervalo creado pordos puntos de división no consecutivos.En [19, 20], los autores adaptan el algoritmo de discretización MDLP exactamente igual que en TILDE,pero el esquema de aprendizaje es el de Inductive Constraint Logic - ICL.Ent MDL o ECL-GSDEl sistema Entropy Minimization plus Minimum Description Length Principle - Ent MDL [9] (llamado ECLwith Global Univariate Supervised Discretization - ECL-GSD en [11]), utiliza el algoritmo MDLP paradiscretizar el rango de de cada atributo numérico. Al igual que TILDE e ICL la discretización es a priori,aunque no se menciona ninguna modificación al algoritmo original. En este caso cada intervalo creado esutilizado como un valor categórico durante el aprendizaje.Aprendizaje Multivalores en ILP (AMILP)En nuestro trabajo de maestría llevamos a cabo una discretización global (antes del proceso de aprendizaje)de los atributos categóricos y numéricos. Esta discretización es binaria y para cada atributo numérico obtenemosun punto de división d, y para cada atributo categórico se obtienen dos subconjuntos de categorías.Esta discretización se lleva a cabo con el algoritmo de división de nodo de dos inductores de árbolesde decisión: QUEST (Quick Unbiased Efficient Statistical Tree) [22] y CRUISE (Classification Rule withUnbiased Interaction Selection and Estimation) [18].Después de discretizar los atributos, se crean nuevas variables (multivalores) que son agregadas alconocimiento previo del conjunto de entrenamiento.Por último se ejecuta el proceso de aprendizaje utilizando dos de los sistemas más populares en ILP:Aleph [26] y FOIL [25].
Page 1: Posgrado en Ciencias y Tecnologías
Page 4 and 5: Capítulo 1IntroducciónDentro de l
Page 6 and 7: 1. Introducción 3p (X, Z) ← r (X
Page 8 and 9: 2. Problemática 52.2 Operadores de
Page 12 and 13: 3. Revisión de métodos 93.2 Progr
Page 14 and 15: 3. Revisión de métodos 11Para mod
Page 16 and 17: 3. Revisión de métodos 13analizar
Page 18 and 19: 4. Propuesta 15- A. Sistema ILP∗
Page 20 and 21: Referencias[1] S. ANTHONY AND A. M.
Page 22 and 23: Apéndice ALógica de Primer OrdenA

enriquecimiento del conocimiento previo en programaciÃ³n lÃ³gica ...

Create successful ePaper yourself

Delete template?

Save as template?