t - Grupo de Sistemas Inteligentes DIT-UPM - Universidad ...
t - Grupo de Sistemas Inteligentes DIT-UPM - Universidad ...
t - Grupo de Sistemas Inteligentes DIT-UPM - Universidad ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
dit<br />
<strong>UPM</strong><br />
Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 1<br />
5 Febrero 1998<br />
Antonio J. Gómez Flechoso<br />
DEPARTAMENTO DE INGENIERÍA DE SISTEMAS TELEMÁTICOS<br />
ESCUELA TÉCNICA SUPERIOR DE INGENIEROS DE TELECOMUNICACIÓN<br />
UNIVERSIDAD POLITÉCNICA DE MADRID<br />
INDUCCIÓN DE CONOCIMIENTO CON<br />
INCERTIDUMBRE EN BASES DE DATOS<br />
RELACIONALES BORROSAS<br />
TESIS DOCTORAL<br />
Autor:<br />
Director:<br />
Antonio José Gómez Flechoso<br />
Gregorio Fernán<strong>de</strong>z Fernán<strong>de</strong>z<br />
Madrid, 1998
dit<br />
<strong>UPM</strong><br />
Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 2<br />
5 Febrero 1998<br />
Antonio J. Gómez Flechoso<br />
ÍNDICE<br />
❒ Introducción: Necesida<strong>de</strong>s y objetivos<br />
❒ FOIL<br />
❒ Mejoras <strong>de</strong> FOIL sobre BD<br />
❒ Extensión <strong>de</strong> FOIL hacia la lógica borrosa: FZFOIL<br />
❒ Ejemplo <strong>de</strong> aplicación: proyecto SEIC<br />
❒ Conclusiones y futuras líneas <strong>de</strong> investigación
dit<br />
<strong>UPM</strong><br />
Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 3<br />
5 Febrero 1998<br />
Antonio J. Gómez Flechoso<br />
NECESIDADES Y OBJETIVOS<br />
❒ Necesida<strong>de</strong>s:<br />
♦ Análisis inteligente <strong>de</strong> datos → minería <strong>de</strong> datos, ILP<br />
♦ Evaluar calidad <strong>de</strong>l propio conocimiento → medidas <strong>de</strong> incertidumbre<br />
❒ Objetivos:<br />
♦ Mejoras <strong>de</strong> FOIL para aplicarlo sobre BD:<br />
• Corrección <strong>de</strong> errores <strong>de</strong> evaluación<br />
• Conocimiento <strong>de</strong> base (relaciones intensionales)<br />
♦ Extensiones hacia lógica borrosa <strong>de</strong> primer or<strong>de</strong>n:<br />
• Entrada: relaciones borrosas<br />
• Salida:<strong>de</strong>finiciones con incertidumbre (literales borrosos y medida <strong>de</strong> precisión)
dit<br />
<strong>UPM</strong><br />
ESTADO DEL ARTE (1)<br />
Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 4<br />
5 Febrero 1998<br />
Antonio J. Gómez Flechoso<br />
❒ FOIL: First Or<strong>de</strong>r Inductive Learner ([Quinlan, 90])<br />
♦ Búsqueda por especialización en grafos refinados<br />
♦ Aplicable sobre BD relacionales<br />
♦ Definición lógica <strong>de</strong> relación objetivo, formada por cláusulas <strong>de</strong> Horn<br />
p(V 1 , ..., V k ) :- L 1 , L 2 , ..., L n<br />
❒ Algunas <strong>de</strong>finiciones preliminares<br />
♦ Satisfacción <strong>de</strong> L = q(V 1 , ..., V n ):<br />
|= t (L) ⇔ ∈ Q<br />
♦ Conjunto cubierto por C = [L 0 :- L 1 , ... L n ]: T c (C) = {t | |= t (L 1 ∧...∧L n )}<br />
♦ Consistencia: C consistente ⇔ (∀t ∈ T − ) (¬ |= t (L 1 ∧...∧L n ))<br />
♦ Completitud: C completa ⇔ (∀t ∈ T + ) (|= t (L 1 ∧...∧L n ))
dit<br />
<strong>UPM</strong><br />
ESTADO DEL ARTE (2)<br />
Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 5<br />
5 Febrero 1998<br />
Antonio J. Gómez Flechoso<br />
❒ FOIL: Algoritmo<br />
Definicion& FOIL (T + ,T - , p, q 1 , q 2 ...);<br />
D 0 := FALSE;<br />
T<br />
0<br />
C = ∅;<br />
repetir<br />
Clausula C = construyeC();<br />
D i = D i-1 ∨ C; /* nueva cláusula */<br />
T i C = T i-1 C ∪ T C (C)<br />
hasta completa(D i );<br />
return D i ;<br />
Clausula& construyeC(T R ,T - ,p, ...);<br />
C:= p;<br />
repetir<br />
L i = buscaAntece<strong>de</strong>nte();<br />
C i =C i-1 ∨ ¬L i ; /*nuevo antec*/<br />
T i+1 = actualizarT(T i , L i );<br />
hasta consistente(C i );<br />
return C i ;<br />
Bucle externo: <strong>de</strong>finición completa<br />
Bucle interno: cláusula consistente
dit<br />
<strong>UPM</strong><br />
ESTADO DEL ARTE (3)<br />
Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 6<br />
5 Febrero 1998<br />
Antonio J. Gómez Flechoso<br />
❒ FOIL: Heurísticos<br />
♦ Para evaluar literales:<br />
Ganancia(L i ) = N ++ i ⋅ (Info(T i ) - Info(T i+1 ))<br />
siendo: Info(T i ) = −log 2 (N + i /(N<br />
+<br />
i + N - i ))<br />
♦ Para buscar literales:<br />
• L i <strong>de</strong>be tener al menos una variable existente (en la cláusula en construcción)<br />
• Restricción <strong>de</strong> argumentos <strong>de</strong> L i en <strong>de</strong>finiciones recursivas<br />
• Uso <strong>de</strong> “literales <strong>de</strong>terminados”<br />
• Poda alpha-beta para simplificar la búsqueda<br />
• Definiciones inconsistentes y/o incompletas (principio <strong>de</strong> Rissanen)
dit<br />
<strong>UPM</strong><br />
ANÁLISIS DE FOIL: EVALUACIÓN LITERALES (1)<br />
Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 7<br />
5 Febrero 1998<br />
Antonio J. Gómez Flechoso<br />
Error I: Ganancia insensible a T C<br />
-<br />
T i<br />
+p2<br />
+p1<br />
+p3<br />
−n1 −n2<br />
C i-1 = [P :- L 1 ,..., L i-1 ]<br />
Info(T i ) = 0.737<br />
+p2<br />
+p1<br />
+p3<br />
−n1 −n2<br />
L i<br />
a<br />
L i<br />
b<br />
T i+1<br />
a<br />
+p1’’<br />
+p1’<br />
−n2’<br />
−n1’<br />
C i = [P :- L 1 ,..., L a i ]<br />
Info(T a i+1 ) = 0.585<br />
N ++<br />
i = 2<br />
+p2’<br />
+p2’’<br />
C i = [P :- L 1 ,..., L b i ]<br />
Info(T b i+1 ) = 0.585<br />
N ++<br />
i = 2<br />
+p1’’<br />
+p1’<br />
−n1’’<br />
−n1’<br />
+p2’<br />
+p2’’<br />
T i<br />
T i+1<br />
b<br />
Ganancia(L i a ) = 0.304<br />
Interés(L i a ) = −0.408<br />
Ganancia(L b i ) = 0.304<br />
Interés(L b i ) = 0.167<br />
2 tuplas + y 2 tuplas − satisfacen L i<br />
a<br />
2 tuplas + y 1 tupla − satisfacen L i<br />
b<br />
sin embargo, Ganancia es igual
dit<br />
<strong>UPM</strong><br />
ANÁLISIS DE FOIL: EVALUACIÓN LITERALES (2)<br />
Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 8<br />
5 Febrero 1998<br />
Antonio J. Gómez Flechoso<br />
Error II: Ganancia no proporcional a T C<br />
+<br />
+p1 iv)<br />
T i<br />
C i-1 = [P :- L 1 ,..., L i-1 ]<br />
+p1<br />
+p2 +p3<br />
Info(T i ) = 0.737<br />
−n1 −n2<br />
+p1’’’<br />
−n1’<br />
L a<br />
i L b<br />
i<br />
C i = [P :- L 1 ,..., L a i ] C i = [P :- L 1 ,..., L b i ]<br />
T a<br />
Info(T a i+1 ) = 0.322 Info(T b i+1 ) = 0.585<br />
i+1 N ++<br />
i = 1<br />
N ++<br />
i = 2<br />
+p1’ +p1’’<br />
Ganancia(L a i ) = 0.415<br />
Interés(L a i ) = −0.167<br />
T i<br />
+p2<br />
+p1<br />
+p3<br />
−n1 −n2<br />
T b<br />
i+1<br />
+p1’<br />
−n1’<br />
+p2’<br />
Ganancia(L b i ) = 0.304<br />
Interés(L b i ) = 0.167<br />
1 tupla + y 1 tupla − satisfacen L i<br />
a<br />
2 tuplas + y 1 tupla − satisfacen L i<br />
b<br />
pero Ganancia(L ai ) es mayor
dit<br />
<strong>UPM</strong><br />
Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 9<br />
5 Febrero 1998<br />
Antonio J. Gómez Flechoso<br />
EVALUACIÓN DE LITERALES: SOLUCIÓN (1)<br />
Medida <strong>de</strong> interés (RI) (Piatetsky-Shapiro,89)<br />
Sea A → B una regla lógica<br />
Entonces N ≡ tamaño conjunto entrenamiento (nº tuplas)<br />
N A , N B<br />
N A∧Β<br />
≡ nº tuplas satisfacen condición A, B<br />
≡ nº tuplas satisfacen condición A∧B<br />
Requisitos <strong>de</strong> RI:<br />
• A y B in<strong>de</strong>pendientes ⇒ RI = 0<br />
• N A , N B ↓ ⇒ RI ↑<br />
• N A∧B ↑ ⇒ RI ↑<br />
RI 1 = N A ∧ B – ( N A ⋅ N B ) ⁄ N<br />
RI 2 =<br />
N A∧ B – ( N A ⋅ N B ) ⁄ N<br />
---------------------------------------------------------------------------------------------<br />
N A ⋅ N B ⋅( 1 – N A ⁄ N ) ⋅( 1 – N B ⁄ N )
dit<br />
<strong>UPM</strong><br />
Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 10<br />
5 Febrero 1998<br />
Antonio J. Gómez Flechoso<br />
EVALUACIÓN DE LITERALES: SOLUCIÓN (2)<br />
Interés = RI para evaluar literales<br />
C i C i ↔ P∨¬(L 1 ∧¬L 2 ∧...∧¬L i-1 ∧¬L i )<br />
≡ [P:- L 1 ,...L i ≡ A → B]<br />
↔ ...<br />
↔ L i → (L 1 ∧ L 2 ∧ ... ∧ L i-1 → P)<br />
N = N<br />
+<br />
i + N<br />
-<br />
i<br />
N A = N<br />
++<br />
i + N<br />
-+<br />
i<br />
N B = N<br />
+<br />
i<br />
N A∧B = N<br />
++<br />
i<br />
{<br />
A ≡ L i<br />
B ≡ P:-L 1 ,...L i-1<br />
Interés = f(N i + , N i - , N i ++ , N i -+ ) usa N i<br />
-+<br />
Interés mi<strong>de</strong> <strong>de</strong>pen<strong>de</strong>ncia entre N A y N B<br />
⇒ no error I<br />
⇒ no error II
dit<br />
<strong>UPM</strong><br />
Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 11<br />
5 Febrero 1998<br />
Antonio J. Gómez Flechoso<br />
ANÁLISIS DE FOIL: EVALUACIÓN LITERALES (3)<br />
Error III: Argumentos no representan a T C<br />
+<br />
T 1<br />
+p1<br />
+p2<br />
+p3<br />
−n2<br />
−n1<br />
C 0 = [P :- TRUE]<br />
Info(T 1 ) = 0.737<br />
T 1<br />
+p1<br />
+p2<br />
+p3<br />
−n2<br />
−n1<br />
L 1<br />
C 1 = [P :- L 1 ]<br />
T 2<br />
T 3<br />
a<br />
+p1’ +p2’’<br />
+p3’<br />
+p2’<br />
+p3’’’<br />
−n1’<br />
+p3’’<br />
Info(T 2 ) = 0.222<br />
N 1<br />
++ = 3<br />
T 2<br />
T 3<br />
b<br />
+p1’ +p2’’<br />
+p3’’’<br />
+p3’<br />
+p2’<br />
−n1’<br />
+p3’’<br />
L 2<br />
a<br />
L 2<br />
b<br />
+p3’<br />
+p3’’’<br />
+p3’’<br />
C 2a = [P :- L 1 , L 2 a ]<br />
Info(T 3 ) = 0<br />
C 2b = [P :- L 1 , L 2 b ]<br />
Info(T 3 ) = 0<br />
+p1’<br />
+p2’<br />
+p3’’<br />
Ganancia(L 2 a ) = 0.667<br />
N 2 ++ = 3<br />
N 2 ++ = 3<br />
Ganancia(L 2 b ) = 0.667<br />
Interés(L 2 a ) = 0.354<br />
Interés(L 2 b ) = 0.354<br />
Interés * (L 2 a ) = 0.333<br />
Interés * (L 2 b ) = 1.000<br />
L 1 ,L 2<br />
a<br />
cubre 1 tupla + en T 1<br />
L 1 ,L 2<br />
b<br />
cubre 3 tuplas + en T 1<br />
sin embargo, Ganancia es igual
dit<br />
<strong>UPM</strong><br />
Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 12<br />
5 Febrero 1998<br />
Antonio J. Gómez Flechoso<br />
EVALUACIÓN DE LITERALES: SOLUCIÓN (3)<br />
Interés* = Interés + conjuntos proyectados<br />
T 1<br />
[i]<br />
= T C (C i-1 ) ⊆ T 1<br />
N<br />
+<br />
i =⏐T + i ⏐<br />
N<br />
−<br />
i =⏐T − i ⏐<br />
N<br />
[i+1]+<br />
i =⏐T [i+1]+ i ⏐<br />
N<br />
[i+1]−<br />
i =⏐T [i+1]− i ⏐<br />
T 1<br />
T 1<br />
[i]<br />
T 1<br />
[i+1]<br />
T i<br />
T i+1<br />
L i<br />
1) T 1 [i] = conj. entrenamiento para L i<br />
2) Aplicar Interés sobre T 1<br />
[i]<br />
⇒ Interés* soluciona errores I, II y III
dit<br />
<strong>UPM</strong><br />
Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 13<br />
5 Febrero 1998<br />
Antonio J. Gómez Flechoso<br />
Relación “padre_<strong>de</strong>”<br />
EVALUACIÓN DE LITERALES: EJEMPLO<br />
Relación “jefe_<strong>de</strong>”<br />
a1 a2 a3 a4<br />
a1 a2 a3 a4<br />
b1 b2 b3 b4<br />
b1 b2 b3 b4<br />
c1<br />
c2<br />
c3<br />
c4<br />
c5<br />
c1<br />
c2<br />
c3<br />
c4<br />
c5<br />
d1 d2 d3<br />
d4<br />
d1 d2 d3<br />
d4<br />
Relaciones:<br />
enfermo = , , , , , , , <br />
padre_<strong>de</strong> = , , , , , , ...<br />
jefe_<strong>de</strong> = , , , , , , , ...<br />
fumador = , , <br />
barbudo = , , , , , , ,
dit<br />
<strong>UPM</strong><br />
Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 14<br />
5 Febrero 1998<br />
Antonio J. Gómez Flechoso<br />
EVALUACIÓN DE LITERALES: RESULTADOS<br />
♦ Regla inducida por FOIL:<br />
enfermo(A):- jefe_<strong>de</strong>(B,A), enfermo(B), ¬fumador(B)<br />
enfermo(A):- fumador(A)<br />
enfermo(A):- jefe_<strong>de</strong>(B,A), enfermo(B), padre_<strong>de</strong>(B,A)<br />
(consistente pero incompleta: no cubre 2 tuplas ⊕)<br />
♦ Regla inducida modificando FOIL con función Interés:<br />
enfermo(A):- padre_<strong>de</strong>(B,A), barbudo(B), fumador(A)<br />
enfermo(A):- padre_<strong>de</strong>(B,A), enfermo(B)<br />
(consistente y completa, pero compleja)<br />
♦ Regla inducida modificando FOIL con función Interés*:<br />
enfermo(A):- padre_<strong>de</strong>(B,A), enfermo(B)<br />
enfermo(A):- fumador(A)<br />
(consistente, completa y sencilla)
dit<br />
<strong>UPM</strong><br />
Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 15<br />
5 Febrero 1998<br />
Antonio J. Gómez Flechoso<br />
LÓGICA BORROSA Y MUNDO REAL<br />
❒ Complejidad <strong>de</strong>l mundo real = volumen + incertidumbre ⇒ Compromiso<br />
información / incertidumbre<br />
♦ Conceptos humanos ≈ conjuntos borrosos [Za<strong>de</strong>h,65]<br />
♦ Lenguaje humano impreciso (incompatibilidad precisión / significación)<br />
❒ Lógica borrosa [Za<strong>de</strong>h,75] (isomorfa con conjuntos borrosos)<br />
♦ Necesaria para inferencias imprecisas<br />
♦ Método natural <strong>de</strong> representar el mundo real<br />
❒ <strong>Sistemas</strong> expertos borrosos, BD relacionales borrosas, etc
dit<br />
<strong>UPM</strong><br />
Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 16<br />
5 Febrero 1998<br />
Antonio J. Gómez Flechoso<br />
LÓGICA BORROSA DE PRIMER ORDEN<br />
❒ Lógica borrosa <strong>de</strong> proposiciones formal<br />
❒ ¿Lógica borrosa <strong>de</strong> predicados?<br />
♦ Sintaxis <strong>de</strong> lógica <strong>de</strong> predicados<br />
♦ ¿Semántica?<br />
• Conjunto valores <strong>de</strong> verdad: V = [0, 1]<br />
• Satisfacción en grado σ: ⎥= iA (S, σ)⇔ E(S, A, i) = σ<br />
• Calif. borrosos <strong>de</strong> verdad: “verda<strong>de</strong>ro”, “muy verda<strong>de</strong>ro”, “algo falso”,...<br />
S’ = “S es V”; ⎥= iA (S’, σ V ) ⇔σ V = V(σ)<br />
• Calif. borrosos <strong>de</strong> prob. (“muy probable”, “poco probable”,...): S’ = “Pro(S) es P”
dit<br />
<strong>UPM</strong><br />
INDUCCIÓN DE CONOCIMIENTO CON INCERTIDUMBRE<br />
Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 17<br />
5 Febrero 1998<br />
Antonio J. Gómez Flechoso<br />
❒ Salida:<br />
♦ Probabilidad: asignable a una regla a partir <strong>de</strong> conj. entrenamiento o <strong>de</strong> prueba<br />
(ID3, C4.5, etc), aplicable en sistemas <strong>de</strong> ILP<br />
❒ Entrada<br />
♦ Incertidumbre en antece<strong>de</strong>ntes: pue<strong>de</strong> ser un atributo más (lógica “0+”)<br />
♦ Incertidumbre en relaciones: ¿?<br />
• No hay sistemas que induzcan reglas borrosas en ILP<br />
• Borrosidad en valor <strong>de</strong> los atributos ≠ Borrosidad en relaciones<br />
Ej: enfermo(A) :- MUY_fumador(A)<br />
Ej: amigos(A,B) :- amigos(A,C), MUY_amigos(C,B)
dit<br />
<strong>UPM</strong><br />
FZFOIL: FUZZY FIRST ORDER INDUCTIVE LEARNER<br />
Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 18<br />
5 Febrero 1998<br />
Antonio J. Gómez Flechoso<br />
Definiciones<br />
❒ Signo borroso <strong>de</strong> una tupla: SB(t) = µ P (t) ∈ [0, 1]<br />
❒ Conjunto entrenamiento: T = T + ∪ T − ∪ T ∼<br />
❒ t satisface L en grado σ: ⎥= t (L, σ)⇔ µ Q (t) = σ<br />
❒ Cláusula C = p(X 1 ,...,X k ):-L 1 ,...,L n cubre t en grado σ⇔ |= t (L 1 ∧...∧L n , σ)<br />
❒ Conjunto cubierto por C: T C (C) = {< t, σ >}<br />
♦ Condición <strong>de</strong> k-cobertura: σ = µ TC(C) (t) ≥ k · SB(t)<br />
❒ Condición <strong>de</strong> consistencia borrosa: (∀t ∈ T) (SB(t) ≥µ TC(C) (t))<br />
♦ Condición <strong>de</strong> k-consistencia<br />
❒ Condición <strong>de</strong> completitud borrosa: (∀t ∈ T) ( µ TC(C) (t) ≥ SB(t))<br />
♦ Condición <strong>de</strong> k-completitud
dit<br />
<strong>UPM</strong><br />
FZFOIL<br />
Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 19<br />
5 Febrero 1998<br />
Antonio J. Gómez Flechoso<br />
Definicion& FZFOIL (T + ,T - ,T ~ ,k,p,...)<br />
D 0 := FALSE;<br />
T<br />
0<br />
C = ∅;<br />
repetir<br />
Clausula C = construyeC();<br />
Algoritmo<br />
Clausula& construyeC(T R ,T - ,k,p, ...)<br />
C:= p;<br />
repetir<br />
L i = buscaAntece<strong>de</strong>nte();<br />
C i =C i-1 ∨ ¬L i ; /*nuevo antec*/<br />
D i = D i-1 ∨ C; /* nueva cláusula */<br />
T i C = T i-1 C ∪ T C (C)<br />
hasta k-completa(D i , k);<br />
return D i ;<br />
B. externo: <strong>de</strong>finición k-completa<br />
T<br />
[i+1]<br />
1 = actualizarT(T [i] 1 , L i );<br />
T C = proyectarT(T 1 , T [i+1] 1 );<br />
hasta k-consistente(C i , k);<br />
return C i ;<br />
B. interno: cláusula k-consistente
dit<br />
<strong>UPM</strong><br />
FZFOIL<br />
Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 20<br />
5 Febrero 1998<br />
Antonio J. Gómez Flechoso<br />
Evaluación <strong>de</strong> literales<br />
❒ Función <strong>de</strong> evaluación basada en Interés*, adaptada a conjuntos borrosos<br />
{<br />
N = ⏐T 1 ⏐ N B = SB()<br />
t<br />
N A∧<br />
B – ( N A ⋅ N B ) ⁄ N<br />
∑<br />
t ∈ T<br />
FRI = ---------------------------------------------------------------------------------------------<br />
1<br />
N<br />
N A∩B = ∑min( SB()µ t , N A = ⏐T [i+1] A ⋅ N B ⋅( 1 – N A ⁄ N ) ⋅( 1 – N B ⁄ N )<br />
[ i + 1] () t ) T 1 ⏐<br />
1<br />
t<br />
Conjuntos <strong>de</strong> entrenamiento<br />
❒ T 1 ordinario; T i borrosos, construidos modificando grado <strong>de</strong> pertenencia con<br />
grado <strong>de</strong> satisfacción (σ) <strong>de</strong> L i : () = min { µ T () t<br />
i<br />
, σ}, siendo ⎥= t (L i , σ)<br />
µ T i 1<br />
Invención <strong>de</strong> literales: etiquetas lingüísticas<br />
❒ En FZFOIL se utilizan etiquetas: MUY(σ 2 ), ALGO(σ 0.5 ), NO(1-σ),<br />
NO_MUY(1−σ 2 ), NO_ALGO(1−σ 0.5 )<br />
+<br />
t
dit<br />
<strong>UPM</strong><br />
enfermo (persona)<br />
b3 : 0.9<br />
b4 : 0.72<br />
c3 :0.9<br />
c4 :0.8<br />
c5 :0.88<br />
d2 :0.9<br />
d3 :0.85<br />
d4 : 0.75<br />
*barbudo (persona)<br />
a3 :0.4<br />
a4 :0.7<br />
b4 :0.88<br />
c1 :0.9<br />
c2 :0.5<br />
c4 :0.95<br />
d1 :0.6<br />
d2 :1<br />
*jefe_<strong>de</strong> (persona,persona)<br />
a1,b1<br />
a2,b2<br />
a2,b3<br />
a3,b2<br />
a3,b3<br />
a4,b3<br />
b1,c1<br />
b2,c2<br />
b2,c3<br />
b2,c4<br />
b3,c2<br />
b3,c3<br />
b3,c4<br />
b4,c4<br />
b4,c5<br />
c1,d1<br />
c2,d1<br />
c3,d2<br />
c3,d3<br />
c3,d4<br />
c4,d2<br />
c4,d3<br />
c4,d4<br />
c5,d4<br />
FZFOIL: Ejemplo<br />
[D1] {8.951 bits} TC: [6.58/7.04]; TR: [0.12]<br />
[C1] {7.953 bits} [6.70/19.00]-> [5.04/5.37]<br />
enfermo (A) :-<br />
padre_<strong>de</strong> (B A),<br />
ALGO_enfermo (B).<br />
[C2] {3.584 bits} [1.62/13.00]-> [1.54/1.67]<br />
enfermo (A) :-<br />
*I_nieto_<strong>de</strong>(persona, persona)<br />
nieto_<strong>de</strong>(A,B):-<br />
padre_<strong>de</strong>(C,A), padre_<strong>de</strong>(B,C)<br />
Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 21<br />
5 Febrero 1998<br />
Antonio J. Gómez Flechoso<br />
*padre_<strong>de</strong> (persona,persona)<br />
a1,b1<br />
b3,c3<br />
a2,b1<br />
b4,c4<br />
a1,b2<br />
b4,c5<br />
a2,b2<br />
c1,d1<br />
a3,b3<br />
c2,d1<br />
a3,b4<br />
c2,d2<br />
a4,b3<br />
c2,d3<br />
a4,b4<br />
c4,d2<br />
b1,c1<br />
c4,d3<br />
b1,c2<br />
c5,d4<br />
b2,c3<br />
*fumador (persona)<br />
d2 :0.4<br />
b3 :0.95<br />
c1 :0.2<br />
b4 :0.8<br />
a2 :0.3<br />
d4 :0.75<br />
MUY_fumador (A).
dit<br />
<strong>UPM</strong><br />
FZFOIL<br />
Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 22<br />
5 Febrero 1998<br />
Antonio J. Gómez Flechoso<br />
Análisis <strong>de</strong> la complejidad<br />
❒ Coste(L i ) = CT ⋅ CE<br />
• Tamaño <strong>de</strong> espacio <strong>de</strong> búsqueda o coste teórico (CT)<br />
• Tamaño <strong>de</strong>l conjunto intermedio <strong>de</strong> tuplas o coste <strong>de</strong> evaluación (CE)<br />
{<br />
❒ En FOIL:<br />
linealmente con nº predicados <strong>de</strong> BD<br />
• CT crece: polinómicamente con nº variables <strong>de</strong> la cláusula<br />
exponencialmente con grado <strong>de</strong> predicados <strong>de</strong> la BD<br />
• CE máximo limitado por literales que introducen nuevas variables<br />
❒ En FZFOIL:<br />
• CT crece <strong>de</strong>l mismo modo que en FOIL (algo más por etiquetas borrosas)<br />
conjuntos borrosos: mismo CE que FOIL<br />
• CE{conjuntos<br />
ordinarios: CE menor que en FOIL (conjuntos proyectados)
dit<br />
<strong>UPM</strong><br />
RESULTADOS: PROYECTO SEIC (1)<br />
Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 23<br />
5 Febrero 1998<br />
Antonio J. Gómez Flechoso<br />
❒ SEIC (Servicio <strong>de</strong> Información Ciudadana) “PASO, PC-183”<br />
❒ Problema “Usos y Demandas”: Análisis inteligente <strong>de</strong> consultas <strong>de</strong> usuarios<br />
❒ Datos <strong>de</strong> entrada: 40000 consultas, con 14 atributos:<br />
• Ubicación <strong>de</strong> PIC (Alonso Martínez, Atocha Renfe, Callao, Av. América, etc)<br />
• Mes: “Julio”, “Agosto”, “Septiembre”, “Octubre”, “Noviembre”<br />
• Día <strong>de</strong>l mes: [1 ... 31]<br />
• Día <strong>de</strong> semana: “Lunes”, ..., “Domingo”<br />
• Origen/<strong>de</strong>stino: “Aquí”, “Calle”, “Cruce”, “Estación metro”<br />
• Modo transporte: “Cualquiera”, “sólo bus”, “sólo metro”<br />
• Criterio <strong>de</strong> camino: “Óptimo”, “mín. transbordos”, “mín. tiempo”,<br />
• etc.
dit<br />
<strong>UPM</strong><br />
RESULTADOS: PROYECTO SEIC (2)<br />
Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 24<br />
5 Febrero 1998<br />
Antonio J. Gómez Flechoso<br />
❒ Selección y preprocesado: muestreo y 10 atributos ordinarios (2 borrosos)<br />
❒ Transformación <strong>de</strong> los datos:<br />
• 8 relaciones ordinarias: <strong>de</strong>stino, origen, fecha, rest_tte, rest_optim, etc.<br />
• 6 relaciones borrosas: cuando_mañana, cuando_tar<strong>de</strong>, cuando_noche,<br />
duración_larga, duración_corta, duración_media<br />
µ<br />
1<br />
Noche Mañana Tar<strong>de</strong> Noche<br />
0<br />
2 4 6 8 10 12 14 16 18 20 22 24 Hora_día<br />
❒ Relaciones intensionales:<br />
bus_mintransbordos(X):-<br />
rest_tte(X,Y), Y=”solo_bus”, rest_optim(X,Z), Z=”min_transbordos”
dit<br />
<strong>UPM</strong><br />
RESULTADOS: PROYECTO SEIC (3)<br />
Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 25<br />
5 Febrero 1998<br />
Antonio J. Gómez Flechoso<br />
❒ Algunas <strong>de</strong>finiciones borrosas:<br />
[C1] {17.062 bits} [694.00/1694.00]→ [346.28/772.71]<br />
min_tiempo ( A ) :-<br />
cuando_tar<strong>de</strong> ( A B C ),<br />
¬ =_const ( C Viernes )...<br />
[C1] {5.392 bits} [232.00/1232.00]→ [232.00/232.00]<br />
bus_mintransbordos ( A ) :-<br />
sólo_bus ( A ).
dit<br />
<strong>UPM</strong><br />
RESULTADOS: PROYECTO SEIC (4)<br />
Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 26<br />
5 Febrero 1998<br />
Antonio J. Gómez Flechoso<br />
Comparación <strong>de</strong>l valor <strong>de</strong> LDI<br />
Ordinaria Borrosas<br />
Ejemplo 1 121.035 bits 17.062 bits<br />
Ejemplo 2 151.411 bits 31.291 bits<br />
Ejemplo 3 38.016 bits 31.291 bits<br />
Ejemplo 4 18.195 bits 65.925 bits<br />
Ejemplo 5 4.907 bits 5.392 bits<br />
Ejemplo 6 114.186 bits 9.155 bits
dit<br />
<strong>UPM</strong><br />
Comparación <strong>de</strong>l valor <strong>de</strong> k-completitud<br />
Ordinarias<br />
RESULTADOS: PROYECTO SEIC (5)<br />
Borrosas<br />
Ejemplo 1 0.2017 0.4990<br />
Ejemplo 2 0.5845 0.2443<br />
Ejemplo 3 0.0259 0.4001<br />
Ejemplo 4 0.1143 0.5477<br />
Ejemplo 5 1.0000 1.0000<br />
Ejemplo 6 0.3023 1.0000<br />
Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 27<br />
5 Febrero 1998<br />
Antonio J. Gómez Flechoso<br />
Comparación <strong>de</strong>l valor <strong>de</strong> k-consistencia<br />
Ordinaria Borrosas<br />
Ejemplo 1 0.6220 0.4481<br />
Ejemplo 2 0.7275 0.6254<br />
Ejemplo 3 0.5000 0.2291<br />
Ejemplo 4 0.6154 0.1158<br />
Ejemplo 5 1.0000 1.0000<br />
Ejemplo 6 0.2626 0.2456
dit<br />
<strong>UPM</strong><br />
Comparación <strong>de</strong> k-completitud / LDI<br />
RESULTADOS: PROYECTO SEIC (6)<br />
Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 28<br />
5 Febrero 1998<br />
Antonio J. Gómez Flechoso<br />
Ordinarias<br />
Borrosas<br />
Ejemplo 1 0.0017 0.0293<br />
Ejemplo 2 0.0039 0.0078<br />
Ejemplo 3 0.0007 0.0128<br />
Ejemplo 4 0.0063 0.0083<br />
Ejemplo 5 0.2038 0.1854<br />
Ejemplo 6 0.0026 0.1095<br />
Comparación <strong>de</strong> k-consistencia / LDI<br />
Ordinaria<br />
Borrosas<br />
Ejemplo 1 0.0051 0.0263<br />
Ejemplo 2 0.0048 0.0200<br />
Ejemplo 3 0.0132 0.0073<br />
Ejemplo 4 0.0338 0.0018<br />
Ejemplo 5 0.2038 0.1854<br />
Ejemplo 6 0.0023 0.0269
dit<br />
<strong>UPM</strong><br />
Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 29<br />
5 Febrero 1998<br />
Antonio J. Gómez Flechoso<br />
RESUMEN<br />
❒ Aportaciones <strong>de</strong> FZFOIL:<br />
♦ Corrige errores <strong>de</strong> evaluación <strong>de</strong> literales <strong>de</strong> FOIL (función Interés*).<br />
♦ Permite introducir conocimiento <strong>de</strong> base (relaciones intensionales).<br />
♦ Aplicable sobre BD relacionales ordinarias y borrosas.<br />
♦ Definiciones lógicas pue<strong>de</strong>n ser borrosas (lógica borrosa <strong>de</strong> predicados). A<strong>de</strong>más<br />
incluye otras medidas <strong>de</strong> incertidumbre: precisión borrosa.<br />
❒ Resultados<br />
♦ Mejora <strong>de</strong> resultados con relaciones borrosas y <strong>de</strong>finiciones borrosas.
dit<br />
<strong>UPM</strong><br />
Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 30<br />
5 Febrero 1998<br />
Antonio J. Gómez Flechoso<br />
CONCLUSIONES<br />
❒ Funciones basadas en medidas <strong>de</strong> interés mejoran la calidad <strong>de</strong> las reglas<br />
inducidas por FOIL y FZFOIL (corrigen algunos errores).<br />
❒ La lógica borrosa facilita el mo<strong>de</strong>lado <strong>de</strong> datos <strong>de</strong> entrada y simplifica las <strong>de</strong>finiciones<br />
lógicas inducidas.<br />
❒ El coste computacional asociado a FZFOIL (con relaciones borrosas):<br />
♦ El espacio <strong>de</strong> búsqueda crece un poco más (factor lineal, <strong>de</strong>bido a etiquetas <strong>de</strong><br />
literales borrosos)<br />
♦ El coste <strong>de</strong> evaluación no crece más (con relaciones ordinarias crecen menos,<br />
gracias a los conjuntos proyectados)
dit<br />
<strong>UPM</strong><br />
Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 31<br />
5 Febrero 1998<br />
Antonio J. Gómez Flechoso<br />
FUTURAS LÍNEAS DE INVESTIGACIÓN<br />
❒ Modificaciones en función Interés para cuantificar otros aspectos: complejidad<br />
<strong>de</strong> la regla, favorecer a ciertos predicados, etc.<br />
❒ Nuevos algoritmos <strong>de</strong> búsqueda <strong>de</strong> <strong>de</strong>scripciones, para evitar máximos locales<br />
y simplificar el espacio <strong>de</strong> búsqueda: algoritmos genéticos, por ejemplo.<br />
❒ Ampliaciones en lenguaje <strong>de</strong> representación <strong>de</strong>l conocimiento: uso <strong>de</strong> funciones<br />
en lógica <strong>de</strong> predicados.<br />
❒ Mayor flexibilidad en representación <strong>de</strong> incertidumbre: relaciones borrosas<br />
generalizadas (distribuciones <strong>de</strong> posibilidad, etiquetas lingüísticas, funciones,<br />
etc.)<br />
❒ Mejoras en el proceso <strong>de</strong> inducción: formación <strong>de</strong> conceptos
dit<br />
<strong>UPM</strong><br />
Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 32<br />
5 Febrero 1998<br />
Antonio J. Gómez Flechoso<br />
T i<br />
C i-1 = [P :- L 1 ,..., L i-1 ]<br />
+p1<br />
+p2<br />
+p3<br />
Info(T i ) = 0.737<br />
+p1<br />
+p2<br />
+p3<br />
−n1<br />
−n2<br />
−n1<br />
−n2<br />
L i<br />
a<br />
L i<br />
b<br />
C i = [P :- L 1 ,..., L i a ]<br />
C i = [P :- L 1 ,..., L i b ]<br />
T i+1<br />
a<br />
+p1’<br />
−n2’<br />
+p2’<br />
Info(T i+1 a ) = 0.585<br />
N i ++ = 2<br />
Info(T i+1 b ) = 0.585<br />
N i ++ = 2<br />
+p1’<br />
−n1’’<br />
+p2’<br />
T i<br />
T i+1<br />
b<br />
+p1’’<br />
−n1’<br />
+p2’’<br />
+p1’’<br />
−n1’<br />
+p2’’<br />
Ganancia(L i a ) = 0.304<br />
Interés(L i a ) = −0.408<br />
Ganancia(L i b ) = 0.304<br />
Interés(L i b ) = 0.167
dit<br />
<strong>UPM</strong><br />
Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 33<br />
5 Febrero 1998<br />
Antonio J. Gómez Flechoso<br />
T i<br />
C i-1 = [P :- L 1 ,..., L i-1 ]<br />
+p1<br />
+p2<br />
+p3<br />
Info(T i ) = 0.737<br />
+p1<br />
+p2<br />
+p3<br />
−n1<br />
−n2<br />
−n1<br />
−n2<br />
T i+1<br />
a<br />
+p1’’’<br />
+p1’<br />
a<br />
L i<br />
C i = [P :- L 1 ,..., L a i ]<br />
Info(T a i+1 ) = 0.322<br />
N ++ i = 1<br />
+p1’’<br />
−n1’<br />
+p1 iv)<br />
b<br />
L i<br />
C i = [P :- L 1 ,..., L b i ]<br />
Info(T b i+1 ) = 0.585<br />
N ++ i = 2<br />
+p1’<br />
+p2’<br />
−n1’<br />
T i<br />
T i+1<br />
b<br />
Ganancia(L i a ) = 0.415<br />
Interés(L i a ) = −0.167<br />
Ganancia(L i b ) = 0.304<br />
Interés(L i b ) = 0.167
dit<br />
<strong>UPM</strong><br />
Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 34<br />
5 Febrero 1998<br />
Antonio J. Gómez Flechoso<br />
T 1<br />
+p1<br />
+p2 −n2<br />
+p3<br />
−n1<br />
C 0 = [P :- TRUE]<br />
Info(T 1 ) = 0.737<br />
T 1<br />
+p1<br />
+p2 −n2<br />
+p3<br />
−n1<br />
L 1<br />
T 2<br />
C 1 = [P :- L 1 ]<br />
T 2<br />
+p1’ +p2’’<br />
+p3’’’<br />
+p3’<br />
+p2’<br />
−n1’<br />
+p3’’<br />
Info(T 2 ) = 0.222<br />
N 1 ++ = 3<br />
+p1’ +p2’’<br />
+p3’’’<br />
+p3’<br />
+p2’<br />
−n1’<br />
+p3’’<br />
T 3<br />
a<br />
L 2<br />
a<br />
L 2<br />
b<br />
T 3<br />
b<br />
+p3’<br />
+p3’’’<br />
+p3’’<br />
C 2a = [P :- L 1 , L 2 a ]<br />
Info(T 3 ) = 0<br />
C 2b = [P :- L 1 , L 2 b ]<br />
Info(T 3 ) = 0<br />
+p1’<br />
+p2’<br />
+p3’’<br />
Ganancia(L 2 a ) = 0.667<br />
N 2<br />
++<br />
= 3<br />
N 2<br />
++<br />
= 3<br />
Ganancia(L 2 b ) = 0.667<br />
Interés(L 2 a ) = 0.354<br />
Interés(L 2 b ) = 0.354<br />
Interés * (L 2 a ) = 0.333<br />
Interés * (L 2 b ) = 1.000