20.07.2013 Views

Evaluación de Reglas de Asociación en Text Mining Utilizando ...

Evaluación de Reglas de Asociación en Text Mining Utilizando ...

Evaluación de Reglas de Asociación en Text Mining Utilizando ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Algoritmo Aclose<br />

El algoritmo Aclose o Close Algorithm [29,30] se basa <strong>en</strong> un método <strong>de</strong> minado <strong>de</strong><br />

reglas <strong>de</strong> asociación <strong>de</strong>nominado “podado <strong>de</strong>l conjunto lattice cerrado”. Un Lattice o retículo<br />

es un conjunto or<strong>de</strong>nado <strong>de</strong> ítems (A, ≤) si para cada par <strong>de</strong> ítems (a, b) A existe un<br />

supremo {a, b} e ínfimo {a, b}. En Aclose se <strong>de</strong>fin<strong>en</strong> los sigui<strong>en</strong>tes conceptos:<br />

1) Contexto minería <strong>de</strong> datos: correspon<strong>de</strong> a una tupla D=(O, I, R), don<strong>de</strong> O es un conjunto<br />

finito <strong>de</strong> Objetos, I un conjunto finito <strong>de</strong> ítems <strong>de</strong> una base <strong>de</strong> datos y R es la relación binaria<br />

R OxI. Cada par (o, i) R repres<strong>en</strong>ta el hecho que el objeto o O ti<strong>en</strong>e el ítem i I.<br />

Un contexto es una repres<strong>en</strong>tación <strong>de</strong> la base <strong>de</strong> datos, don<strong>de</strong> los objetos correspon<strong>de</strong>n<br />

a las transacciones, y la relación R establece si una transacción posee o no cierto atributo<br />

(ítem). En tareas <strong>de</strong> Minería <strong>de</strong> <strong>Text</strong>os, los objetos correspon<strong>de</strong>n a docum<strong>en</strong>tos, los ítems a<br />

features (palabras, términos, párrafos, oraciones, etc.), y la relación R establece los features<br />

que posee cada docum<strong>en</strong>to.<br />

2) Conexión <strong>de</strong> Galois: correspon<strong>de</strong> a una estructura conceptual que permite agrupar<br />

transacciones (objetos) <strong>de</strong> una base <strong>de</strong> datos que pose<strong>en</strong> ítems comunes con el fin <strong>de</strong> g<strong>en</strong>erar<br />

conexiones conceptuales <strong>en</strong> un espacio <strong>de</strong> g<strong>en</strong>eralización y especialización. Dado un contexto<br />

<strong>de</strong> minería <strong>de</strong> datos D=(O, I, R). Para O’ O y I’ I una Conexión <strong>de</strong> Galois se obti<strong>en</strong>e<br />

aplicando las sigui<strong>en</strong>tes funciones:<br />

f (O')<br />

: P( O)<br />

P(<br />

I )<br />

g (I ')<br />

: P( I)<br />

P(<br />

O)<br />

f ( O')<br />

{ i I | o<br />

O',<br />

( o,<br />

i)<br />

R}<br />

g( I'<br />

) { o O<br />

| i<br />

I',<br />

( o,<br />

i)<br />

R}<br />

La función <strong>de</strong> mapeo f (O')<br />

asocia con O todos los ítems comunes con todos los<br />

objetos oO. Por otro lado g (I ')<br />

asocia con I todos los objetos que conti<strong>en</strong><strong>en</strong> todos los ítems<br />

i I. Entonces la aplicación <strong>de</strong> ( f , g)<br />

<strong>en</strong> el conjunto O se <strong>de</strong>nomina Conexión <strong>de</strong> Galois.<br />

3) Itemset Cerrado: Dado un conjunto <strong>de</strong> ítems <strong>en</strong> una base <strong>de</strong> datos, un itemset es cerrado si<br />

es el mayor conjunto <strong>de</strong> ítems comunes a ciertas transacciones, es <strong>de</strong>cir, no existe otro<br />

conjunto mayor <strong>de</strong> ítems comunes a esas transacciones. Dado C I. El conjunto C <strong>de</strong> items es<br />

cerrado si y sólo si g f ( C)<br />

C . A<strong>de</strong>más, el itemset cerrado minimal que conti<strong>en</strong>e un itemset<br />

I’ se obti<strong>en</strong>e aplicando g f <strong>en</strong> I’.<br />

4) Lattice Itemset Cerrado: correspon<strong>de</strong> un diagrama <strong>de</strong> tipo Lattice <strong>en</strong> el cual sólo se<br />

<strong>en</strong>cu<strong>en</strong>tran los conjuntos <strong>de</strong> ítems cerrados. Dado C’ el conjunto <strong>de</strong> itemsets cerrados<br />

obt<strong>en</strong>idos <strong>de</strong> D al usar la Conexión <strong>de</strong> Galois. Al aplicar <strong>en</strong> C’ una relación <strong>de</strong> or<strong>de</strong>n se<br />

obti<strong>en</strong>e el par Lc= (C’, ≤) que es un lattice completo <strong>de</strong>nominado Lattice Itemset Cerrado.<br />

22

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!