20.07.2013 Views

Evaluación de Reglas de Asociación en Text Mining Utilizando ...

Evaluación de Reglas de Asociación en Text Mining Utilizando ...

Evaluación de Reglas de Asociación en Text Mining Utilizando ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

a<br />

d<br />

c<br />

Figura 13: Lattice Conceptual<br />

Esta estructura conceptual repres<strong>en</strong>ta relaciones <strong>de</strong> g<strong>en</strong>eralización/especialización<br />

<strong>en</strong>tre sus elem<strong>en</strong>tos. Por ejemplo, el nodo c es más g<strong>en</strong>eral que el nodo a, es <strong>de</strong>cir a c, lo<br />

que implica que cada instancia <strong>de</strong> a también es instancia <strong>de</strong> c. Los elem<strong>en</strong>tos que no posean<br />

vértices <strong>en</strong>tre sí no pose<strong>en</strong> ningún tipo <strong>de</strong> relación <strong>de</strong> <strong>de</strong>p<strong>en</strong><strong>de</strong>ncia <strong>en</strong>tre sí, tal es el caso <strong>de</strong> los<br />

nodos b con e.<br />

En este <strong>en</strong>foque, la g<strong>en</strong>eración <strong>de</strong> los conjuntos cerrados frecu<strong>en</strong>tes se realiza por<br />

medio <strong>de</strong>l algoritmo Aclose [29,30], el cual recibe como <strong>en</strong>trada los features <strong>en</strong>contrados <strong>en</strong><br />

el corpus <strong>de</strong> textos. Para g<strong>en</strong>erar las reglas se utilizó el algoritmo <strong>de</strong> g<strong>en</strong>eración <strong>de</strong> reglas <strong>de</strong><br />

asociación informativas pres<strong>en</strong>tado por Toussaint et al. [6, 7, 20]. Este algoritmo se utiliza<br />

para eliminar redundancia <strong>en</strong> las reglas <strong>de</strong> asociación.<br />

Se dice que una regla <strong>de</strong> asociación R: A B es informativa ssi no existe otra regla<br />

R’: A’ B’ tal que:<br />

support(R) = support(R’)<br />

confi<strong>de</strong>nce (R) = confi<strong>de</strong>nce(R’)<br />

A A’ y B B’<br />

b<br />

El algoritmo <strong>de</strong> g<strong>en</strong>eración <strong>de</strong> reglas <strong>de</strong> asociación informativas se aplica una vez que<br />

se han obt<strong>en</strong>ido los conjuntos cerrados frecu<strong>en</strong>tes. Las reglas g<strong>en</strong>eradas son <strong>de</strong>l tipo A B/ A.<br />

Estas se obti<strong>en</strong><strong>en</strong> eliminando <strong>de</strong>l conjunto cerrado frecu<strong>en</strong>te B los términos que se <strong>en</strong>cu<strong>en</strong>tran<br />

<strong>en</strong> A. La estructura g<strong>en</strong>eral <strong>de</strong>l algoritmo para g<strong>en</strong>erar reglas <strong>de</strong> asociación informativas es la<br />

sigui<strong>en</strong>te:<br />

Entrada:<br />

K: conjunto <strong>de</strong> tríos (G: conjunto g<strong>en</strong>erador, support, FG: Conjunto cerrado)<br />

resultantes <strong>de</strong> la ejecución <strong>de</strong> Aclose.<br />

Salida:<br />

RA: conjunto <strong>de</strong> reglas <strong>de</strong> asociación <strong>de</strong>scubiertas.<br />

Por cada Conjunto g<strong>en</strong>erador G K hacer<br />

Encontrar conjuntos cerrados candidatos CG = {FG / G FG};<br />

Or<strong>de</strong>nar el conjunto CG por cardinalidad creci<strong>en</strong>te;<br />

Por cada conjunto cerrado FG CG hacer<br />

si confi<strong>de</strong>nce (r: G FG /G ) ≥ minconfi<strong>de</strong>nce <strong>en</strong>tonces<br />

agregar regla r a RA<br />

38<br />

e

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!