30.12.2012 Views

geração (semi)automática de metadados - Universidad Autónoma ...

geração (semi)automática de metadados - Universidad Autónoma ...

geração (semi)automática de metadados - Universidad Autónoma ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

EXTRACCIÓN DE PERFILES BASADA EN<br />

AGRUPAMIENTO GENETICO PARA RECOMENDACIÓN<br />

DE CONTENIDO<br />

Sandra Patricia Tocarruncho Tocarruncho<br />

Ingeniería <strong>de</strong> Sistemas y Computación – <strong>Universidad</strong> Pedagógica y Tecnológica <strong>de</strong> Colombia<br />

tt_sandra@yahoo.com<br />

Fredy Andrés Aponte Novoa<br />

Ingeniería <strong>de</strong> Sistemas y Computación – <strong>Universidad</strong> Pedagógica y Tecnológica <strong>de</strong> Colombia<br />

fredy_aponte@yahoo.com<br />

Arturo Tocarruncho Tocarruncho<br />

Licenciatura en Informática Educativa- <strong>Universidad</strong> Pedagógica y Tecnológica <strong>de</strong> Colombia<br />

atocarruncho@tunja.uptc.edu.co<br />

RESUMEN<br />

Los sistemas <strong>de</strong> recomendación son estrategias <strong>de</strong> personalización utilizadas para sugerir productos y/o contenido a los<br />

visitantes <strong>de</strong> sitios Web a partir <strong>de</strong> sus preferencias. El comportamiento <strong>de</strong> navegación que presentan los usuarios es un<br />

indicador <strong>de</strong> estos gustos y es la base para extraer patrones <strong>de</strong> uso frecuente, también llamados perfiles <strong>de</strong> usuario. En<br />

este documento se explica el proceso <strong>de</strong> generación <strong>de</strong> perfiles <strong>de</strong> usuario aplicando dos técnicas <strong>de</strong> agrupamiento: k-<br />

Means y Agrupamiento Genético. Los resultados obtenidos muestran un mejor <strong>de</strong>sempeño <strong>de</strong>l agrupamiento genético<br />

frente a k-Means, evaluados por medio <strong>de</strong> las métricas Recall y Precision.<br />

PALABRAS CLAVE<br />

Agrupamiento, Perfil <strong>de</strong> usuario, Sistema <strong>de</strong> recomendación<br />

1. INTRODUCCIÓN<br />

Conferência IADIS Ibero-Americana WWW/Internet 2007<br />

La evolución e importancia que ha tomado Internet como medio <strong>de</strong> información y comunicación global, ha<br />

originado un interés general por personalizar el entorno Web, es <strong>de</strong>cir, ofrecer sitios adaptativos en los cuales<br />

los usuarios reciben servicios e información <strong>de</strong> acuerdo con sus preferencias. Bajo este mismo principio y<br />

enmarcados en el área <strong>de</strong> la minería <strong>de</strong>l uso web, surgen los sistemas <strong>de</strong> recomendación que se basan en la<br />

información particular <strong>de</strong> cada individuo para construir patrones <strong>de</strong> comportamiento <strong>de</strong> navegación que<br />

conlleven a sugerencias <strong>de</strong> contenido, productos, servicios, que sean <strong>de</strong> interés para los usuarios. Para esto,<br />

ha sido necesaria la construcción <strong>de</strong> los perfiles <strong>de</strong> usuario con base en el comportamiento <strong>de</strong> navegación que<br />

presentan los mismos cuando visitan el sitio web. El objetivo es fragmentar los datos e i<strong>de</strong>ntificar grupos<br />

homogéneos <strong>de</strong> sesiones, <strong>de</strong> tal forma que se pueda asociar un usuario particular a uno <strong>de</strong> los perfiles creados<br />

y ofrecer una recomendación apropiada. Algunos autores han aplicado varias técnicas para generar perfiles<br />

<strong>de</strong> usuarios, como en [Nas99] que utilizan el algoritmo <strong>de</strong> aglomeración competitiva, en [Sar00] usan el<br />

método <strong>de</strong>l vecindario agregado, en [Sha05] utilizan clustering sustractivo difuso relacional y en [Lab03] los<br />

perfiles son generados aplicando el algoritmo AntClust. En este documento utilizamos dos técnicas para<br />

realizar el agrupamiento: k-Means y Agrupamiento Genético para datos con formas no esféricas.<br />

El documento está organizado como sigue: en la sección 2 se explican las tareas ejecutadas para realizar<br />

el preprocesamiento <strong>de</strong> los datos; la sección 3 <strong>de</strong>scribe las técnicas k-Means y Agrupamiento Genético<br />

aplicadas sobre las sesiones <strong>de</strong> usuario para generar los perfiles; la sección 4 muestra el algoritmo<br />

299

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!