20.07.2013 Views

Evaluación de Reglas de Asociación en Text Mining Utilizando ...

Evaluación de Reglas de Asociación en Text Mining Utilizando ...

Evaluación de Reglas de Asociación en Text Mining Utilizando ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Como se aprecia <strong>en</strong> la figura 6, el Lattice <strong>de</strong> itemsets cerrados es un subconjunto <strong>de</strong>l<br />

lattice <strong>de</strong> itemsets <strong>de</strong> la figura 5, razón por lo cual, se dice que es un conjunto <strong>de</strong> m<strong>en</strong>or or<strong>de</strong>n<br />

respecto lattice completo <strong>de</strong> itemsets.<br />

La g<strong>en</strong>eración <strong>de</strong> las reglas <strong>de</strong> asociación con AClose se lleva a cabo por medio <strong>de</strong> las<br />

sigui<strong>en</strong>tes etapas:<br />

1) Encontrar todos los itemsets cerrados frecu<strong>en</strong>tes (todos los itemsets que son cerrados<br />

y ti<strong>en</strong><strong>en</strong> un support mayor o igual que el minsupport).<br />

2) Derivar todos los itemsets frecu<strong>en</strong>tes a partir <strong>de</strong> los itemsets cerrados frecu<strong>en</strong>tes<br />

<strong>de</strong>scubiertos <strong>en</strong> la etapa 1.<br />

3) G<strong>en</strong>erar todas las reglas <strong>de</strong> asociación que se pue<strong>de</strong>n <strong>de</strong>rivar a partir <strong>de</strong> los itemsets<br />

frecu<strong>en</strong>tes que ti<strong>en</strong><strong>en</strong> un confi<strong>de</strong>nce mayor que el minconfi<strong>de</strong>nce.<br />

El número <strong>de</strong> conjuntos cerrados frecu<strong>en</strong>tes g<strong>en</strong>erados con Aclose es muy inferior al<br />

número <strong>de</strong> conjuntos frecu<strong>en</strong>tes que se g<strong>en</strong>eran con Apriori. Por lo tanto, la g<strong>en</strong>eración <strong>de</strong><br />

conjuntos cerrados frecu<strong>en</strong>tes ti<strong>en</strong>e un costo <strong>de</strong> cómputo m<strong>en</strong>or que la g<strong>en</strong>eración <strong>de</strong><br />

conjuntos frecu<strong>en</strong>tes. Al utilizar Lattice <strong>de</strong> Itemsets Cerrados para <strong>en</strong>contrar los itemsets<br />

frecu<strong>en</strong>tes se mejora la efici<strong>en</strong>cia <strong>de</strong>l <strong>de</strong>scubrimi<strong>en</strong>to <strong>de</strong> reglas <strong>de</strong> asociación <strong>en</strong> comparación<br />

con Apriori. Esto se <strong>de</strong>be al hecho que minimizando el espacio <strong>de</strong> búsqueda se logra reducir<br />

tanto el número <strong>de</strong> accesos a la base <strong>de</strong> datos como la sobrecarga <strong>en</strong> la cpu al g<strong>en</strong>erar los<br />

itemsets frecu<strong>en</strong>tes.<br />

<strong>Evaluación</strong> e Interpretación <strong>de</strong> los Patrones Descubiertos<br />

La última etapa <strong>de</strong> un proceso <strong>de</strong> minería <strong>de</strong> textos (ver figura 1) correspon<strong>de</strong> a<br />

evaluar e interpretar los patrones <strong>de</strong>scubiertos, puesto que los sistemas <strong>de</strong> Minería <strong>de</strong> <strong>Text</strong>os<br />

g<strong>en</strong>eralm<strong>en</strong>te no son “accionables”, es <strong>de</strong>cir, a partir <strong>de</strong> los patrones <strong>en</strong>contrados no pue<strong>de</strong>n<br />

tomar <strong>de</strong>cisiones <strong>de</strong> manera automática. Estos requier<strong>en</strong> <strong>de</strong> expertos humanos que analic<strong>en</strong> el<br />

conocimi<strong>en</strong>to <strong>de</strong>scubierto y los evalú<strong>en</strong>.<br />

En esta etapa final <strong>de</strong>l proceso <strong>de</strong> Minería <strong>de</strong> <strong>Text</strong>os, expertos humanos <strong>de</strong>b<strong>en</strong><br />

interpretar el conocimi<strong>en</strong>to <strong>de</strong>scubierto, es <strong>de</strong>cir, darles significado a los patrones que fueron<br />

<strong>en</strong>contrados y <strong>de</strong>scubrir las razones <strong>de</strong> su <strong>de</strong>scubrimi<strong>en</strong>to. En el conocimi<strong>en</strong>to <strong>de</strong>scubierto<br />

exist<strong>en</strong> patrones que son más interesantes que otros, razón por la cual, los expertos humanos<br />

<strong>de</strong>b<strong>en</strong> evaluar cuáles <strong>de</strong> ellos son los que le aportan conocimi<strong>en</strong>to que le sean <strong>de</strong> utilidad <strong>en</strong> la<br />

toma <strong>de</strong> <strong>de</strong>cisiones. Esto es clave <strong>de</strong>bido al hecho que se pue<strong>de</strong>n g<strong>en</strong>erar <strong>de</strong>masiados patrones<br />

irrelevantes.<br />

En g<strong>en</strong>eral, se espera que los sistemas <strong>de</strong> Minería <strong>de</strong> <strong>Text</strong>os g<strong>en</strong>er<strong>en</strong> conocimi<strong>en</strong>tos<br />

que sean <strong>de</strong> utilidad a los expertos humanos. Algunos <strong>en</strong>foques actuales [3, 4, 6, 7, 8] buscan<br />

mejorar el proceso <strong>de</strong> evaluación <strong>de</strong>l conocimi<strong>en</strong>to <strong>de</strong>scubierto antes <strong>de</strong> ser pres<strong>en</strong>tado a los<br />

expertos humanos que toman <strong>de</strong>cisiones. En estos <strong>en</strong>foques, las reglas <strong>de</strong> asociación<br />

<strong>de</strong>scubiertas se evalúan con métricas que consi<strong>de</strong>ran aspectos más allá <strong>de</strong> los estadísticos<br />

utilizados <strong>en</strong> las medidas tradicionales <strong>de</strong> support y confi<strong>de</strong>nce.<br />

24

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!