20.07.2013 Views

Evaluación de Reglas de Asociación en Text Mining Utilizando ...

Evaluación de Reglas de Asociación en Text Mining Utilizando ...

Evaluación de Reglas de Asociación en Text Mining Utilizando ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Clasificación y Predicción<br />

Clasificación y predicción repres<strong>en</strong>tan dos formas <strong>de</strong> análisis <strong>de</strong> datos. La primera se<br />

utiliza para extraer mo<strong>de</strong>los que <strong>de</strong>scrib<strong>en</strong> relaciones <strong>en</strong>tre los datos, y la segunda para<br />

pre<strong>de</strong>cir la t<strong>en</strong><strong>de</strong>ncia futura <strong>de</strong> éstos. Por ejemplo, un mo<strong>de</strong>lo <strong>de</strong> clasificación se podría<br />

utilizar <strong>en</strong> un banco para categorizar los créditos <strong>en</strong> justos o excel<strong>en</strong>tes, <strong>en</strong> cambio, un mo<strong>de</strong>lo<br />

<strong>de</strong> predicción podría pre<strong>de</strong>cir los gastos <strong>de</strong> pot<strong>en</strong>ciales cli<strong>en</strong>tes <strong>en</strong> equipami<strong>en</strong>tos<br />

computacionales dados sus ingresos y ocupación. El método <strong>de</strong> clasificación y predicción, a<br />

difer<strong>en</strong>cia <strong>de</strong>l Clustering, es un método <strong>de</strong> apr<strong>en</strong>dizaje supervisado, ya que los datos <strong>de</strong><br />

<strong>en</strong>tr<strong>en</strong>ami<strong>en</strong>to <strong>de</strong>b<strong>en</strong> estar acompañados por rótulos que indican la clase <strong>de</strong> las observaciones,<br />

a<strong>de</strong>más los datos nuevos se clasifican basados <strong>en</strong> el set <strong>de</strong> <strong>en</strong>tr<strong>en</strong>ami<strong>en</strong>to.<br />

Este método se compone <strong>de</strong> dos etapas: primero, se realiza la construcción <strong>de</strong>l mo<strong>de</strong>lo<br />

<strong>de</strong> clasificación, el cual <strong>de</strong>scribe un conjunto <strong>de</strong> clases pre<strong>de</strong>terminadas (ver figura 2). Este<br />

mo<strong>de</strong>lo se g<strong>en</strong>era por medio <strong>de</strong> reglas <strong>de</strong> clasificación, árboles <strong>de</strong> <strong>de</strong>cisión, etc. En el segundo<br />

paso (ver figura 3) se utiliza el mo<strong>de</strong>lo <strong>de</strong> clasificación para clasificar objetos <strong>de</strong>sconocidos o<br />

futuros. En esta etapa para estimar la precisión <strong>de</strong>l mo<strong>de</strong>lo se compara el rótulo <strong>de</strong>sconocido<br />

<strong>de</strong> las muestras <strong>de</strong> prueba con el resultado clasificado por el mo<strong>de</strong>lo. La tasa <strong>de</strong> precisión <strong>de</strong>l<br />

mo<strong>de</strong>lo es la proporción <strong>de</strong> las muestras <strong>de</strong> prueba que fueron correctam<strong>en</strong>te clasificadas por<br />

el mo<strong>de</strong>lo. Aquí, el set <strong>de</strong> prueba es in<strong>de</strong>p<strong>en</strong>di<strong>en</strong>te <strong>de</strong>l set <strong>de</strong> <strong>en</strong>tr<strong>en</strong>ami<strong>en</strong>to para evitar<br />

problemas <strong>de</strong> over-fitting, es <strong>de</strong>cir, evitar errores <strong>en</strong> la clasificación por causas <strong>de</strong>l set <strong>de</strong><br />

<strong>en</strong>tr<strong>en</strong>ami<strong>en</strong>to [17].<br />

Figura 2: Proceso <strong>de</strong> Clasificación: etapa <strong>de</strong> apr<strong>en</strong>dizaje.<br />

16

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!