02.11.2014 Views

t - Grupo de Sistemas Inteligentes DIT-UPM - Universidad ...

t - Grupo de Sistemas Inteligentes DIT-UPM - Universidad ...

t - Grupo de Sistemas Inteligentes DIT-UPM - Universidad ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

dit<br />

<strong>UPM</strong><br />

Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 1<br />

5 Febrero 1998<br />

Antonio J. Gómez Flechoso<br />

DEPARTAMENTO DE INGENIERÍA DE SISTEMAS TELEMÁTICOS<br />

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS DE TELECOMUNICACIÓN<br />

UNIVERSIDAD POLITÉCNICA DE MADRID<br />

INDUCCIÓN DE CONOCIMIENTO CON<br />

INCERTIDUMBRE EN BASES DE DATOS<br />

RELACIONALES BORROSAS<br />

TESIS DOCTORAL<br />

Autor:<br />

Director:<br />

Antonio José Gómez Flechoso<br />

Gregorio Fernán<strong>de</strong>z Fernán<strong>de</strong>z<br />

Madrid, 1998


dit<br />

<strong>UPM</strong><br />

Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 2<br />

5 Febrero 1998<br />

Antonio J. Gómez Flechoso<br />

ÍNDICE<br />

❒ Introducción: Necesida<strong>de</strong>s y objetivos<br />

❒ FOIL<br />

❒ Mejoras <strong>de</strong> FOIL sobre BD<br />

❒ Extensión <strong>de</strong> FOIL hacia la lógica borrosa: FZFOIL<br />

❒ Ejemplo <strong>de</strong> aplicación: proyecto SEIC<br />

❒ Conclusiones y futuras líneas <strong>de</strong> investigación


dit<br />

<strong>UPM</strong><br />

Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 3<br />

5 Febrero 1998<br />

Antonio J. Gómez Flechoso<br />

NECESIDADES Y OBJETIVOS<br />

❒ Necesida<strong>de</strong>s:<br />

♦ Análisis inteligente <strong>de</strong> datos → minería <strong>de</strong> datos, ILP<br />

♦ Evaluar calidad <strong>de</strong>l propio conocimiento → medidas <strong>de</strong> incertidumbre<br />

❒ Objetivos:<br />

♦ Mejoras <strong>de</strong> FOIL para aplicarlo sobre BD:<br />

• Corrección <strong>de</strong> errores <strong>de</strong> evaluación<br />

• Conocimiento <strong>de</strong> base (relaciones intensionales)<br />

♦ Extensiones hacia lógica borrosa <strong>de</strong> primer or<strong>de</strong>n:<br />

• Entrada: relaciones borrosas<br />

• Salida:<strong>de</strong>finiciones con incertidumbre (literales borrosos y medida <strong>de</strong> precisión)


dit<br />

<strong>UPM</strong><br />

ESTADO DEL ARTE (1)<br />

Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 4<br />

5 Febrero 1998<br />

Antonio J. Gómez Flechoso<br />

❒ FOIL: First Or<strong>de</strong>r Inductive Learner ([Quinlan, 90])<br />

♦ Búsqueda por especialización en grafos refinados<br />

♦ Aplicable sobre BD relacionales<br />

♦ Definición lógica <strong>de</strong> relación objetivo, formada por cláusulas <strong>de</strong> Horn<br />

p(V 1 , ..., V k ) :- L 1 , L 2 , ..., L n<br />

❒ Algunas <strong>de</strong>finiciones preliminares<br />

♦ Satisfacción <strong>de</strong> L = q(V 1 , ..., V n ):<br />

|= t (L) ⇔ ∈ Q<br />

♦ Conjunto cubierto por C = [L 0 :- L 1 , ... L n ]: T c (C) = {t | |= t (L 1 ∧...∧L n )}<br />

♦ Consistencia: C consistente ⇔ (∀t ∈ T − ) (¬ |= t (L 1 ∧...∧L n ))<br />

♦ Completitud: C completa ⇔ (∀t ∈ T + ) (|= t (L 1 ∧...∧L n ))


dit<br />

<strong>UPM</strong><br />

ESTADO DEL ARTE (2)<br />

Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 5<br />

5 Febrero 1998<br />

Antonio J. Gómez Flechoso<br />

❒ FOIL: Algoritmo<br />

Definicion& FOIL (T + ,T - , p, q 1 , q 2 ...);<br />

D 0 := FALSE;<br />

T<br />

0<br />

C = ∅;<br />

repetir<br />

Clausula C = construyeC();<br />

D i = D i-1 ∨ C; /* nueva cláusula */<br />

T i C = T i-1 C ∪ T C (C)<br />

hasta completa(D i );<br />

return D i ;<br />

Clausula& construyeC(T R ,T - ,p, ...);<br />

C:= p;<br />

repetir<br />

L i = buscaAntece<strong>de</strong>nte();<br />

C i =C i-1 ∨ ¬L i ; /*nuevo antec*/<br />

T i+1 = actualizarT(T i , L i );<br />

hasta consistente(C i );<br />

return C i ;<br />

Bucle externo: <strong>de</strong>finición completa<br />

Bucle interno: cláusula consistente


dit<br />

<strong>UPM</strong><br />

ESTADO DEL ARTE (3)<br />

Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 6<br />

5 Febrero 1998<br />

Antonio J. Gómez Flechoso<br />

❒ FOIL: Heurísticos<br />

♦ Para evaluar literales:<br />

Ganancia(L i ) = N ++ i ⋅ (Info(T i ) - Info(T i+1 ))<br />

siendo: Info(T i ) = −log 2 (N + i /(N<br />

+<br />

i + N - i ))<br />

♦ Para buscar literales:<br />

• L i <strong>de</strong>be tener al menos una variable existente (en la cláusula en construcción)<br />

• Restricción <strong>de</strong> argumentos <strong>de</strong> L i en <strong>de</strong>finiciones recursivas<br />

• Uso <strong>de</strong> “literales <strong>de</strong>terminados”<br />

• Poda alpha-beta para simplificar la búsqueda<br />

• Definiciones inconsistentes y/o incompletas (principio <strong>de</strong> Rissanen)


dit<br />

<strong>UPM</strong><br />

ANÁLISIS DE FOIL: EVALUACIÓN LITERALES (1)<br />

Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 7<br />

5 Febrero 1998<br />

Antonio J. Gómez Flechoso<br />

Error I: Ganancia insensible a T C<br />

-<br />

T i<br />

+p2<br />

+p1<br />

+p3<br />

−n1 −n2<br />

C i-1 = [P :- L 1 ,..., L i-1 ]<br />

Info(T i ) = 0.737<br />

+p2<br />

+p1<br />

+p3<br />

−n1 −n2<br />

L i<br />

a<br />

L i<br />

b<br />

T i+1<br />

a<br />

+p1’’<br />

+p1’<br />

−n2’<br />

−n1’<br />

C i = [P :- L 1 ,..., L a i ]<br />

Info(T a i+1 ) = 0.585<br />

N ++<br />

i = 2<br />

+p2’<br />

+p2’’<br />

C i = [P :- L 1 ,..., L b i ]<br />

Info(T b i+1 ) = 0.585<br />

N ++<br />

i = 2<br />

+p1’’<br />

+p1’<br />

−n1’’<br />

−n1’<br />

+p2’<br />

+p2’’<br />

T i<br />

T i+1<br />

b<br />

Ganancia(L i a ) = 0.304<br />

Interés(L i a ) = −0.408<br />

Ganancia(L b i ) = 0.304<br />

Interés(L b i ) = 0.167<br />

2 tuplas + y 2 tuplas − satisfacen L i<br />

a<br />

2 tuplas + y 1 tupla − satisfacen L i<br />

b<br />

sin embargo, Ganancia es igual


dit<br />

<strong>UPM</strong><br />

ANÁLISIS DE FOIL: EVALUACIÓN LITERALES (2)<br />

Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 8<br />

5 Febrero 1998<br />

Antonio J. Gómez Flechoso<br />

Error II: Ganancia no proporcional a T C<br />

+<br />

+p1 iv)<br />

T i<br />

C i-1 = [P :- L 1 ,..., L i-1 ]<br />

+p1<br />

+p2 +p3<br />

Info(T i ) = 0.737<br />

−n1 −n2<br />

+p1’’’<br />

−n1’<br />

L a<br />

i L b<br />

i<br />

C i = [P :- L 1 ,..., L a i ] C i = [P :- L 1 ,..., L b i ]<br />

T a<br />

Info(T a i+1 ) = 0.322 Info(T b i+1 ) = 0.585<br />

i+1 N ++<br />

i = 1<br />

N ++<br />

i = 2<br />

+p1’ +p1’’<br />

Ganancia(L a i ) = 0.415<br />

Interés(L a i ) = −0.167<br />

T i<br />

+p2<br />

+p1<br />

+p3<br />

−n1 −n2<br />

T b<br />

i+1<br />

+p1’<br />

−n1’<br />

+p2’<br />

Ganancia(L b i ) = 0.304<br />

Interés(L b i ) = 0.167<br />

1 tupla + y 1 tupla − satisfacen L i<br />

a<br />

2 tuplas + y 1 tupla − satisfacen L i<br />

b<br />

pero Ganancia(L ai ) es mayor


dit<br />

<strong>UPM</strong><br />

Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 9<br />

5 Febrero 1998<br />

Antonio J. Gómez Flechoso<br />

EVALUACIÓN DE LITERALES: SOLUCIÓN (1)<br />

Medida <strong>de</strong> interés (RI) (Piatetsky-Shapiro,89)<br />

Sea A → B una regla lógica<br />

Entonces N ≡ tamaño conjunto entrenamiento (nº tuplas)<br />

N A , N B<br />

N A∧Β<br />

≡ nº tuplas satisfacen condición A, B<br />

≡ nº tuplas satisfacen condición A∧B<br />

Requisitos <strong>de</strong> RI:<br />

• A y B in<strong>de</strong>pendientes ⇒ RI = 0<br />

• N A , N B ↓ ⇒ RI ↑<br />

• N A∧B ↑ ⇒ RI ↑<br />

RI 1 = N A ∧ B – ( N A ⋅ N B ) ⁄ N<br />

RI 2 =<br />

N A∧ B – ( N A ⋅ N B ) ⁄ N<br />

---------------------------------------------------------------------------------------------<br />

N A ⋅ N B ⋅( 1 – N A ⁄ N ) ⋅( 1 – N B ⁄ N )


dit<br />

<strong>UPM</strong><br />

Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 10<br />

5 Febrero 1998<br />

Antonio J. Gómez Flechoso<br />

EVALUACIÓN DE LITERALES: SOLUCIÓN (2)<br />

Interés = RI para evaluar literales<br />

C i C i ↔ P∨¬(L 1 ∧¬L 2 ∧...∧¬L i-1 ∧¬L i )<br />

≡ [P:- L 1 ,...L i ≡ A → B]<br />

↔ ...<br />

↔ L i → (L 1 ∧ L 2 ∧ ... ∧ L i-1 → P)<br />

N = N<br />

+<br />

i + N<br />

-<br />

i<br />

N A = N<br />

++<br />

i + N<br />

-+<br />

i<br />

N B = N<br />

+<br />

i<br />

N A∧B = N<br />

++<br />

i<br />

{<br />

A ≡ L i<br />

B ≡ P:-L 1 ,...L i-1<br />

Interés = f(N i + , N i - , N i ++ , N i -+ ) usa N i<br />

-+<br />

Interés mi<strong>de</strong> <strong>de</strong>pen<strong>de</strong>ncia entre N A y N B<br />

⇒ no error I<br />

⇒ no error II


dit<br />

<strong>UPM</strong><br />

Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 11<br />

5 Febrero 1998<br />

Antonio J. Gómez Flechoso<br />

ANÁLISIS DE FOIL: EVALUACIÓN LITERALES (3)<br />

Error III: Argumentos no representan a T C<br />

+<br />

T 1<br />

+p1<br />

+p2<br />

+p3<br />

−n2<br />

−n1<br />

C 0 = [P :- TRUE]<br />

Info(T 1 ) = 0.737<br />

T 1<br />

+p1<br />

+p2<br />

+p3<br />

−n2<br />

−n1<br />

L 1<br />

C 1 = [P :- L 1 ]<br />

T 2<br />

T 3<br />

a<br />

+p1’ +p2’’<br />

+p3’<br />

+p2’<br />

+p3’’’<br />

−n1’<br />

+p3’’<br />

Info(T 2 ) = 0.222<br />

N 1<br />

++ = 3<br />

T 2<br />

T 3<br />

b<br />

+p1’ +p2’’<br />

+p3’’’<br />

+p3’<br />

+p2’<br />

−n1’<br />

+p3’’<br />

L 2<br />

a<br />

L 2<br />

b<br />

+p3’<br />

+p3’’’<br />

+p3’’<br />

C 2a = [P :- L 1 , L 2 a ]<br />

Info(T 3 ) = 0<br />

C 2b = [P :- L 1 , L 2 b ]<br />

Info(T 3 ) = 0<br />

+p1’<br />

+p2’<br />

+p3’’<br />

Ganancia(L 2 a ) = 0.667<br />

N 2 ++ = 3<br />

N 2 ++ = 3<br />

Ganancia(L 2 b ) = 0.667<br />

Interés(L 2 a ) = 0.354<br />

Interés(L 2 b ) = 0.354<br />

Interés * (L 2 a ) = 0.333<br />

Interés * (L 2 b ) = 1.000<br />

L 1 ,L 2<br />

a<br />

cubre 1 tupla + en T 1<br />

L 1 ,L 2<br />

b<br />

cubre 3 tuplas + en T 1<br />

sin embargo, Ganancia es igual


dit<br />

<strong>UPM</strong><br />

Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 12<br />

5 Febrero 1998<br />

Antonio J. Gómez Flechoso<br />

EVALUACIÓN DE LITERALES: SOLUCIÓN (3)<br />

Interés* = Interés + conjuntos proyectados<br />

T 1<br />

[i]<br />

= T C (C i-1 ) ⊆ T 1<br />

N<br />

+<br />

i =⏐T + i ⏐<br />

N<br />

−<br />

i =⏐T − i ⏐<br />

N<br />

[i+1]+<br />

i =⏐T [i+1]+ i ⏐<br />

N<br />

[i+1]−<br />

i =⏐T [i+1]− i ⏐<br />

T 1<br />

T 1<br />

[i]<br />

T 1<br />

[i+1]<br />

T i<br />

T i+1<br />

L i<br />

1) T 1 [i] = conj. entrenamiento para L i<br />

2) Aplicar Interés sobre T 1<br />

[i]<br />

⇒ Interés* soluciona errores I, II y III


dit<br />

<strong>UPM</strong><br />

Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 13<br />

5 Febrero 1998<br />

Antonio J. Gómez Flechoso<br />

Relación “padre_<strong>de</strong>”<br />

EVALUACIÓN DE LITERALES: EJEMPLO<br />

Relación “jefe_<strong>de</strong>”<br />

a1 a2 a3 a4<br />

a1 a2 a3 a4<br />

b1 b2 b3 b4<br />

b1 b2 b3 b4<br />

c1<br />

c2<br />

c3<br />

c4<br />

c5<br />

c1<br />

c2<br />

c3<br />

c4<br />

c5<br />

d1 d2 d3<br />

d4<br />

d1 d2 d3<br />

d4<br />

Relaciones:<br />

enfermo = , , , , , , , <br />

padre_<strong>de</strong> = , , , , , , ...<br />

jefe_<strong>de</strong> = , , , , , , , ...<br />

fumador = , , <br />

barbudo = , , , , , , ,


dit<br />

<strong>UPM</strong><br />

Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 14<br />

5 Febrero 1998<br />

Antonio J. Gómez Flechoso<br />

EVALUACIÓN DE LITERALES: RESULTADOS<br />

♦ Regla inducida por FOIL:<br />

enfermo(A):- jefe_<strong>de</strong>(B,A), enfermo(B), ¬fumador(B)<br />

enfermo(A):- fumador(A)<br />

enfermo(A):- jefe_<strong>de</strong>(B,A), enfermo(B), padre_<strong>de</strong>(B,A)<br />

(consistente pero incompleta: no cubre 2 tuplas ⊕)<br />

♦ Regla inducida modificando FOIL con función Interés:<br />

enfermo(A):- padre_<strong>de</strong>(B,A), barbudo(B), fumador(A)<br />

enfermo(A):- padre_<strong>de</strong>(B,A), enfermo(B)<br />

(consistente y completa, pero compleja)<br />

♦ Regla inducida modificando FOIL con función Interés*:<br />

enfermo(A):- padre_<strong>de</strong>(B,A), enfermo(B)<br />

enfermo(A):- fumador(A)<br />

(consistente, completa y sencilla)


dit<br />

<strong>UPM</strong><br />

Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 15<br />

5 Febrero 1998<br />

Antonio J. Gómez Flechoso<br />

LÓGICA BORROSA Y MUNDO REAL<br />

❒ Complejidad <strong>de</strong>l mundo real = volumen + incertidumbre ⇒ Compromiso<br />

información / incertidumbre<br />

♦ Conceptos humanos ≈ conjuntos borrosos [Za<strong>de</strong>h,65]<br />

♦ Lenguaje humano impreciso (incompatibilidad precisión / significación)<br />

❒ Lógica borrosa [Za<strong>de</strong>h,75] (isomorfa con conjuntos borrosos)<br />

♦ Necesaria para inferencias imprecisas<br />

♦ Método natural <strong>de</strong> representar el mundo real<br />

❒ <strong>Sistemas</strong> expertos borrosos, BD relacionales borrosas, etc


dit<br />

<strong>UPM</strong><br />

Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 16<br />

5 Febrero 1998<br />

Antonio J. Gómez Flechoso<br />

LÓGICA BORROSA DE PRIMER ORDEN<br />

❒ Lógica borrosa <strong>de</strong> proposiciones formal<br />

❒ ¿Lógica borrosa <strong>de</strong> predicados?<br />

♦ Sintaxis <strong>de</strong> lógica <strong>de</strong> predicados<br />

♦ ¿Semántica?<br />

• Conjunto valores <strong>de</strong> verdad: V = [0, 1]<br />

• Satisfacción en grado σ: ⎥= iA (S, σ)⇔ E(S, A, i) = σ<br />

• Calif. borrosos <strong>de</strong> verdad: “verda<strong>de</strong>ro”, “muy verda<strong>de</strong>ro”, “algo falso”,...<br />

S’ = “S es V”; ⎥= iA (S’, σ V ) ⇔σ V = V(σ)<br />

• Calif. borrosos <strong>de</strong> prob. (“muy probable”, “poco probable”,...): S’ = “Pro(S) es P”


dit<br />

<strong>UPM</strong><br />

INDUCCIÓN DE CONOCIMIENTO CON INCERTIDUMBRE<br />

Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 17<br />

5 Febrero 1998<br />

Antonio J. Gómez Flechoso<br />

❒ Salida:<br />

♦ Probabilidad: asignable a una regla a partir <strong>de</strong> conj. entrenamiento o <strong>de</strong> prueba<br />

(ID3, C4.5, etc), aplicable en sistemas <strong>de</strong> ILP<br />

❒ Entrada<br />

♦ Incertidumbre en antece<strong>de</strong>ntes: pue<strong>de</strong> ser un atributo más (lógica “0+”)<br />

♦ Incertidumbre en relaciones: ¿?<br />

• No hay sistemas que induzcan reglas borrosas en ILP<br />

• Borrosidad en valor <strong>de</strong> los atributos ≠ Borrosidad en relaciones<br />

Ej: enfermo(A) :- MUY_fumador(A)<br />

Ej: amigos(A,B) :- amigos(A,C), MUY_amigos(C,B)


dit<br />

<strong>UPM</strong><br />

FZFOIL: FUZZY FIRST ORDER INDUCTIVE LEARNER<br />

Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 18<br />

5 Febrero 1998<br />

Antonio J. Gómez Flechoso<br />

Definiciones<br />

❒ Signo borroso <strong>de</strong> una tupla: SB(t) = µ P (t) ∈ [0, 1]<br />

❒ Conjunto entrenamiento: T = T + ∪ T − ∪ T ∼<br />

❒ t satisface L en grado σ: ⎥= t (L, σ)⇔ µ Q (t) = σ<br />

❒ Cláusula C = p(X 1 ,...,X k ):-L 1 ,...,L n cubre t en grado σ⇔ |= t (L 1 ∧...∧L n , σ)<br />

❒ Conjunto cubierto por C: T C (C) = {< t, σ >}<br />

♦ Condición <strong>de</strong> k-cobertura: σ = µ TC(C) (t) ≥ k · SB(t)<br />

❒ Condición <strong>de</strong> consistencia borrosa: (∀t ∈ T) (SB(t) ≥µ TC(C) (t))<br />

♦ Condición <strong>de</strong> k-consistencia<br />

❒ Condición <strong>de</strong> completitud borrosa: (∀t ∈ T) ( µ TC(C) (t) ≥ SB(t))<br />

♦ Condición <strong>de</strong> k-completitud


dit<br />

<strong>UPM</strong><br />

FZFOIL<br />

Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 19<br />

5 Febrero 1998<br />

Antonio J. Gómez Flechoso<br />

Definicion& FZFOIL (T + ,T - ,T ~ ,k,p,...)<br />

D 0 := FALSE;<br />

T<br />

0<br />

C = ∅;<br />

repetir<br />

Clausula C = construyeC();<br />

Algoritmo<br />

Clausula& construyeC(T R ,T - ,k,p, ...)<br />

C:= p;<br />

repetir<br />

L i = buscaAntece<strong>de</strong>nte();<br />

C i =C i-1 ∨ ¬L i ; /*nuevo antec*/<br />

D i = D i-1 ∨ C; /* nueva cláusula */<br />

T i C = T i-1 C ∪ T C (C)<br />

hasta k-completa(D i , k);<br />

return D i ;<br />

B. externo: <strong>de</strong>finición k-completa<br />

T<br />

[i+1]<br />

1 = actualizarT(T [i] 1 , L i );<br />

T C = proyectarT(T 1 , T [i+1] 1 );<br />

hasta k-consistente(C i , k);<br />

return C i ;<br />

B. interno: cláusula k-consistente


dit<br />

<strong>UPM</strong><br />

FZFOIL<br />

Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 20<br />

5 Febrero 1998<br />

Antonio J. Gómez Flechoso<br />

Evaluación <strong>de</strong> literales<br />

❒ Función <strong>de</strong> evaluación basada en Interés*, adaptada a conjuntos borrosos<br />

{<br />

N = ⏐T 1 ⏐ N B = SB()<br />

t<br />

N A∧<br />

B – ( N A ⋅ N B ) ⁄ N<br />

∑<br />

t ∈ T<br />

FRI = ---------------------------------------------------------------------------------------------<br />

1<br />

N<br />

N A∩B = ∑min( SB()µ t , N A = ⏐T [i+1] A ⋅ N B ⋅( 1 – N A ⁄ N ) ⋅( 1 – N B ⁄ N )<br />

[ i + 1] () t ) T 1 ⏐<br />

1<br />

t<br />

Conjuntos <strong>de</strong> entrenamiento<br />

❒ T 1 ordinario; T i borrosos, construidos modificando grado <strong>de</strong> pertenencia con<br />

grado <strong>de</strong> satisfacción (σ) <strong>de</strong> L i : () = min { µ T () t<br />

i<br />

, σ}, siendo ⎥= t (L i , σ)<br />

µ T i 1<br />

Invención <strong>de</strong> literales: etiquetas lingüísticas<br />

❒ En FZFOIL se utilizan etiquetas: MUY(σ 2 ), ALGO(σ 0.5 ), NO(1-σ),<br />

NO_MUY(1−σ 2 ), NO_ALGO(1−σ 0.5 )<br />

+<br />

t


dit<br />

<strong>UPM</strong><br />

enfermo (persona)<br />

b3 : 0.9<br />

b4 : 0.72<br />

c3 :0.9<br />

c4 :0.8<br />

c5 :0.88<br />

d2 :0.9<br />

d3 :0.85<br />

d4 : 0.75<br />

*barbudo (persona)<br />

a3 :0.4<br />

a4 :0.7<br />

b4 :0.88<br />

c1 :0.9<br />

c2 :0.5<br />

c4 :0.95<br />

d1 :0.6<br />

d2 :1<br />

*jefe_<strong>de</strong> (persona,persona)<br />

a1,b1<br />

a2,b2<br />

a2,b3<br />

a3,b2<br />

a3,b3<br />

a4,b3<br />

b1,c1<br />

b2,c2<br />

b2,c3<br />

b2,c4<br />

b3,c2<br />

b3,c3<br />

b3,c4<br />

b4,c4<br />

b4,c5<br />

c1,d1<br />

c2,d1<br />

c3,d2<br />

c3,d3<br />

c3,d4<br />

c4,d2<br />

c4,d3<br />

c4,d4<br />

c5,d4<br />

FZFOIL: Ejemplo<br />

[D1] {8.951 bits} TC: [6.58/7.04]; TR: [0.12]<br />

[C1] {7.953 bits} [6.70/19.00]-> [5.04/5.37]<br />

enfermo (A) :-<br />

padre_<strong>de</strong> (B A),<br />

ALGO_enfermo (B).<br />

[C2] {3.584 bits} [1.62/13.00]-> [1.54/1.67]<br />

enfermo (A) :-<br />

*I_nieto_<strong>de</strong>(persona, persona)<br />

nieto_<strong>de</strong>(A,B):-<br />

padre_<strong>de</strong>(C,A), padre_<strong>de</strong>(B,C)<br />

Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 21<br />

5 Febrero 1998<br />

Antonio J. Gómez Flechoso<br />

*padre_<strong>de</strong> (persona,persona)<br />

a1,b1<br />

b3,c3<br />

a2,b1<br />

b4,c4<br />

a1,b2<br />

b4,c5<br />

a2,b2<br />

c1,d1<br />

a3,b3<br />

c2,d1<br />

a3,b4<br />

c2,d2<br />

a4,b3<br />

c2,d3<br />

a4,b4<br />

c4,d2<br />

b1,c1<br />

c4,d3<br />

b1,c2<br />

c5,d4<br />

b2,c3<br />

*fumador (persona)<br />

d2 :0.4<br />

b3 :0.95<br />

c1 :0.2<br />

b4 :0.8<br />

a2 :0.3<br />

d4 :0.75<br />

MUY_fumador (A).


dit<br />

<strong>UPM</strong><br />

FZFOIL<br />

Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 22<br />

5 Febrero 1998<br />

Antonio J. Gómez Flechoso<br />

Análisis <strong>de</strong> la complejidad<br />

❒ Coste(L i ) = CT ⋅ CE<br />

• Tamaño <strong>de</strong> espacio <strong>de</strong> búsqueda o coste teórico (CT)<br />

• Tamaño <strong>de</strong>l conjunto intermedio <strong>de</strong> tuplas o coste <strong>de</strong> evaluación (CE)<br />

{<br />

❒ En FOIL:<br />

linealmente con nº predicados <strong>de</strong> BD<br />

• CT crece: polinómicamente con nº variables <strong>de</strong> la cláusula<br />

exponencialmente con grado <strong>de</strong> predicados <strong>de</strong> la BD<br />

• CE máximo limitado por literales que introducen nuevas variables<br />

❒ En FZFOIL:<br />

• CT crece <strong>de</strong>l mismo modo que en FOIL (algo más por etiquetas borrosas)<br />

conjuntos borrosos: mismo CE que FOIL<br />

• CE{conjuntos<br />

ordinarios: CE menor que en FOIL (conjuntos proyectados)


dit<br />

<strong>UPM</strong><br />

RESULTADOS: PROYECTO SEIC (1)<br />

Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 23<br />

5 Febrero 1998<br />

Antonio J. Gómez Flechoso<br />

❒ SEIC (Servicio <strong>de</strong> Información Ciudadana) “PASO, PC-183”<br />

❒ Problema “Usos y Demandas”: Análisis inteligente <strong>de</strong> consultas <strong>de</strong> usuarios<br />

❒ Datos <strong>de</strong> entrada: 40000 consultas, con 14 atributos:<br />

• Ubicación <strong>de</strong> PIC (Alonso Martínez, Atocha Renfe, Callao, Av. América, etc)<br />

• Mes: “Julio”, “Agosto”, “Septiembre”, “Octubre”, “Noviembre”<br />

• Día <strong>de</strong>l mes: [1 ... 31]<br />

• Día <strong>de</strong> semana: “Lunes”, ..., “Domingo”<br />

• Origen/<strong>de</strong>stino: “Aquí”, “Calle”, “Cruce”, “Estación metro”<br />

• Modo transporte: “Cualquiera”, “sólo bus”, “sólo metro”<br />

• Criterio <strong>de</strong> camino: “Óptimo”, “mín. transbordos”, “mín. tiempo”,<br />

• etc.


dit<br />

<strong>UPM</strong><br />

RESULTADOS: PROYECTO SEIC (2)<br />

Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 24<br />

5 Febrero 1998<br />

Antonio J. Gómez Flechoso<br />

❒ Selección y preprocesado: muestreo y 10 atributos ordinarios (2 borrosos)<br />

❒ Transformación <strong>de</strong> los datos:<br />

• 8 relaciones ordinarias: <strong>de</strong>stino, origen, fecha, rest_tte, rest_optim, etc.<br />

• 6 relaciones borrosas: cuando_mañana, cuando_tar<strong>de</strong>, cuando_noche,<br />

duración_larga, duración_corta, duración_media<br />

µ<br />

1<br />

Noche Mañana Tar<strong>de</strong> Noche<br />

0<br />

2 4 6 8 10 12 14 16 18 20 22 24 Hora_día<br />

❒ Relaciones intensionales:<br />

bus_mintransbordos(X):-<br />

rest_tte(X,Y), Y=”solo_bus”, rest_optim(X,Z), Z=”min_transbordos”


dit<br />

<strong>UPM</strong><br />

RESULTADOS: PROYECTO SEIC (3)<br />

Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 25<br />

5 Febrero 1998<br />

Antonio J. Gómez Flechoso<br />

❒ Algunas <strong>de</strong>finiciones borrosas:<br />

[C1] {17.062 bits} [694.00/1694.00]→ [346.28/772.71]<br />

min_tiempo ( A ) :-<br />

cuando_tar<strong>de</strong> ( A B C ),<br />

¬ =_const ( C Viernes )...<br />

[C1] {5.392 bits} [232.00/1232.00]→ [232.00/232.00]<br />

bus_mintransbordos ( A ) :-<br />

sólo_bus ( A ).


dit<br />

<strong>UPM</strong><br />

RESULTADOS: PROYECTO SEIC (4)<br />

Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 26<br />

5 Febrero 1998<br />

Antonio J. Gómez Flechoso<br />

Comparación <strong>de</strong>l valor <strong>de</strong> LDI<br />

Ordinaria Borrosas<br />

Ejemplo 1 121.035 bits 17.062 bits<br />

Ejemplo 2 151.411 bits 31.291 bits<br />

Ejemplo 3 38.016 bits 31.291 bits<br />

Ejemplo 4 18.195 bits 65.925 bits<br />

Ejemplo 5 4.907 bits 5.392 bits<br />

Ejemplo 6 114.186 bits 9.155 bits


dit<br />

<strong>UPM</strong><br />

Comparación <strong>de</strong>l valor <strong>de</strong> k-completitud<br />

Ordinarias<br />

RESULTADOS: PROYECTO SEIC (5)<br />

Borrosas<br />

Ejemplo 1 0.2017 0.4990<br />

Ejemplo 2 0.5845 0.2443<br />

Ejemplo 3 0.0259 0.4001<br />

Ejemplo 4 0.1143 0.5477<br />

Ejemplo 5 1.0000 1.0000<br />

Ejemplo 6 0.3023 1.0000<br />

Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 27<br />

5 Febrero 1998<br />

Antonio J. Gómez Flechoso<br />

Comparación <strong>de</strong>l valor <strong>de</strong> k-consistencia<br />

Ordinaria Borrosas<br />

Ejemplo 1 0.6220 0.4481<br />

Ejemplo 2 0.7275 0.6254<br />

Ejemplo 3 0.5000 0.2291<br />

Ejemplo 4 0.6154 0.1158<br />

Ejemplo 5 1.0000 1.0000<br />

Ejemplo 6 0.2626 0.2456


dit<br />

<strong>UPM</strong><br />

Comparación <strong>de</strong> k-completitud / LDI<br />

RESULTADOS: PROYECTO SEIC (6)<br />

Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 28<br />

5 Febrero 1998<br />

Antonio J. Gómez Flechoso<br />

Ordinarias<br />

Borrosas<br />

Ejemplo 1 0.0017 0.0293<br />

Ejemplo 2 0.0039 0.0078<br />

Ejemplo 3 0.0007 0.0128<br />

Ejemplo 4 0.0063 0.0083<br />

Ejemplo 5 0.2038 0.1854<br />

Ejemplo 6 0.0026 0.1095<br />

Comparación <strong>de</strong> k-consistencia / LDI<br />

Ordinaria<br />

Borrosas<br />

Ejemplo 1 0.0051 0.0263<br />

Ejemplo 2 0.0048 0.0200<br />

Ejemplo 3 0.0132 0.0073<br />

Ejemplo 4 0.0338 0.0018<br />

Ejemplo 5 0.2038 0.1854<br />

Ejemplo 6 0.0023 0.0269


dit<br />

<strong>UPM</strong><br />

Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 29<br />

5 Febrero 1998<br />

Antonio J. Gómez Flechoso<br />

RESUMEN<br />

❒ Aportaciones <strong>de</strong> FZFOIL:<br />

♦ Corrige errores <strong>de</strong> evaluación <strong>de</strong> literales <strong>de</strong> FOIL (función Interés*).<br />

♦ Permite introducir conocimiento <strong>de</strong> base (relaciones intensionales).<br />

♦ Aplicable sobre BD relacionales ordinarias y borrosas.<br />

♦ Definiciones lógicas pue<strong>de</strong>n ser borrosas (lógica borrosa <strong>de</strong> predicados). A<strong>de</strong>más<br />

incluye otras medidas <strong>de</strong> incertidumbre: precisión borrosa.<br />

❒ Resultados<br />

♦ Mejora <strong>de</strong> resultados con relaciones borrosas y <strong>de</strong>finiciones borrosas.


dit<br />

<strong>UPM</strong><br />

Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 30<br />

5 Febrero 1998<br />

Antonio J. Gómez Flechoso<br />

CONCLUSIONES<br />

❒ Funciones basadas en medidas <strong>de</strong> interés mejoran la calidad <strong>de</strong> las reglas<br />

inducidas por FOIL y FZFOIL (corrigen algunos errores).<br />

❒ La lógica borrosa facilita el mo<strong>de</strong>lado <strong>de</strong> datos <strong>de</strong> entrada y simplifica las <strong>de</strong>finiciones<br />

lógicas inducidas.<br />

❒ El coste computacional asociado a FZFOIL (con relaciones borrosas):<br />

♦ El espacio <strong>de</strong> búsqueda crece un poco más (factor lineal, <strong>de</strong>bido a etiquetas <strong>de</strong><br />

literales borrosos)<br />

♦ El coste <strong>de</strong> evaluación no crece más (con relaciones ordinarias crecen menos,<br />

gracias a los conjuntos proyectados)


dit<br />

<strong>UPM</strong><br />

Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 31<br />

5 Febrero 1998<br />

Antonio J. Gómez Flechoso<br />

FUTURAS LÍNEAS DE INVESTIGACIÓN<br />

❒ Modificaciones en función Interés para cuantificar otros aspectos: complejidad<br />

<strong>de</strong> la regla, favorecer a ciertos predicados, etc.<br />

❒ Nuevos algoritmos <strong>de</strong> búsqueda <strong>de</strong> <strong>de</strong>scripciones, para evitar máximos locales<br />

y simplificar el espacio <strong>de</strong> búsqueda: algoritmos genéticos, por ejemplo.<br />

❒ Ampliaciones en lenguaje <strong>de</strong> representación <strong>de</strong>l conocimiento: uso <strong>de</strong> funciones<br />

en lógica <strong>de</strong> predicados.<br />

❒ Mayor flexibilidad en representación <strong>de</strong> incertidumbre: relaciones borrosas<br />

generalizadas (distribuciones <strong>de</strong> posibilidad, etiquetas lingüísticas, funciones,<br />

etc.)<br />

❒ Mejoras en el proceso <strong>de</strong> inducción: formación <strong>de</strong> conceptos


dit<br />

<strong>UPM</strong><br />

Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 32<br />

5 Febrero 1998<br />

Antonio J. Gómez Flechoso<br />

T i<br />

C i-1 = [P :- L 1 ,..., L i-1 ]<br />

+p1<br />

+p2<br />

+p3<br />

Info(T i ) = 0.737<br />

+p1<br />

+p2<br />

+p3<br />

−n1<br />

−n2<br />

−n1<br />

−n2<br />

L i<br />

a<br />

L i<br />

b<br />

C i = [P :- L 1 ,..., L i a ]<br />

C i = [P :- L 1 ,..., L i b ]<br />

T i+1<br />

a<br />

+p1’<br />

−n2’<br />

+p2’<br />

Info(T i+1 a ) = 0.585<br />

N i ++ = 2<br />

Info(T i+1 b ) = 0.585<br />

N i ++ = 2<br />

+p1’<br />

−n1’’<br />

+p2’<br />

T i<br />

T i+1<br />

b<br />

+p1’’<br />

−n1’<br />

+p2’’<br />

+p1’’<br />

−n1’<br />

+p2’’<br />

Ganancia(L i a ) = 0.304<br />

Interés(L i a ) = −0.408<br />

Ganancia(L i b ) = 0.304<br />

Interés(L i b ) = 0.167


dit<br />

<strong>UPM</strong><br />

Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 33<br />

5 Febrero 1998<br />

Antonio J. Gómez Flechoso<br />

T i<br />

C i-1 = [P :- L 1 ,..., L i-1 ]<br />

+p1<br />

+p2<br />

+p3<br />

Info(T i ) = 0.737<br />

+p1<br />

+p2<br />

+p3<br />

−n1<br />

−n2<br />

−n1<br />

−n2<br />

T i+1<br />

a<br />

+p1’’’<br />

+p1’<br />

a<br />

L i<br />

C i = [P :- L 1 ,..., L a i ]<br />

Info(T a i+1 ) = 0.322<br />

N ++ i = 1<br />

+p1’’<br />

−n1’<br />

+p1 iv)<br />

b<br />

L i<br />

C i = [P :- L 1 ,..., L b i ]<br />

Info(T b i+1 ) = 0.585<br />

N ++ i = 2<br />

+p1’<br />

+p2’<br />

−n1’<br />

T i<br />

T i+1<br />

b<br />

Ganancia(L i a ) = 0.415<br />

Interés(L i a ) = −0.167<br />

Ganancia(L i b ) = 0.304<br />

Interés(L i b ) = 0.167


dit<br />

<strong>UPM</strong><br />

Inducción <strong>de</strong> conocimiento con incertidumbre en BD relacionales borrosas. Pág. 34<br />

5 Febrero 1998<br />

Antonio J. Gómez Flechoso<br />

T 1<br />

+p1<br />

+p2 −n2<br />

+p3<br />

−n1<br />

C 0 = [P :- TRUE]<br />

Info(T 1 ) = 0.737<br />

T 1<br />

+p1<br />

+p2 −n2<br />

+p3<br />

−n1<br />

L 1<br />

T 2<br />

C 1 = [P :- L 1 ]<br />

T 2<br />

+p1’ +p2’’<br />

+p3’’’<br />

+p3’<br />

+p2’<br />

−n1’<br />

+p3’’<br />

Info(T 2 ) = 0.222<br />

N 1 ++ = 3<br />

+p1’ +p2’’<br />

+p3’’’<br />

+p3’<br />

+p2’<br />

−n1’<br />

+p3’’<br />

T 3<br />

a<br />

L 2<br />

a<br />

L 2<br />

b<br />

T 3<br />

b<br />

+p3’<br />

+p3’’’<br />

+p3’’<br />

C 2a = [P :- L 1 , L 2 a ]<br />

Info(T 3 ) = 0<br />

C 2b = [P :- L 1 , L 2 b ]<br />

Info(T 3 ) = 0<br />

+p1’<br />

+p2’<br />

+p3’’<br />

Ganancia(L 2 a ) = 0.667<br />

N 2<br />

++<br />

= 3<br />

N 2<br />

++<br />

= 3<br />

Ganancia(L 2 b ) = 0.667<br />

Interés(L 2 a ) = 0.354<br />

Interés(L 2 b ) = 0.354<br />

Interés * (L 2 a ) = 0.333<br />

Interés * (L 2 b ) = 1.000

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!