30.12.2012 Views

geração (semi)automática de metadados - Universidad Autónoma ...

geração (semi)automática de metadados - Universidad Autónoma ...

geração (semi)automática de metadados - Universidad Autónoma ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

ISBN: 978–972–8924–45-4 © 2007 IADIS<br />

4. RECOMENDACIÓN DE CONTENIDO<br />

La generación <strong>de</strong> recomendaciones inicia cuando un usuario entra al sitio; <strong>de</strong> forma <strong>automática</strong> se crea una<br />

sesión <strong>de</strong> usuario don<strong>de</strong> se van guardando las páginas a las que acce<strong>de</strong> mientras permanece en el sitio. Cada<br />

vez que es agregada una página a la sesión, se calcula la similitud entre dicha sesión y los centros <strong>de</strong> los<br />

grupos generados en la etapa anterior, con el fin <strong>de</strong> establecer cual grupo o perfil <strong>de</strong>finen mejor el<br />

comportamiento <strong>de</strong> navegación <strong>de</strong>l usuario. Cuanto mayor sea el número <strong>de</strong> páginas visitadas por el usuario,<br />

más apropiado será el perfil con el cuál se vincule. Una vez se ha <strong>de</strong>terminado el grupo, se realiza el cálculo<br />

<strong>de</strong> los elementos más frecuentes [Sar00]. Cada grupo es un conjunto <strong>de</strong> sesiones similares entre sí por lo que<br />

los elementos más frecuentes serán las páginas con mayor número <strong>de</strong> visitas. La recomendación <strong>de</strong> contenido<br />

que el usuario recibe correspon<strong>de</strong> a las primeras N páginas que presentan mayor frecuencia <strong>de</strong> visita.<br />

5. PRUEBAS Y RESULTADOS<br />

5.1 Conjunto <strong>de</strong> Datos<br />

Los datos utilizados para realizar las pruebas fueron obtenidos <strong>de</strong> archivos log <strong>de</strong> acceso <strong>de</strong>l sitio<br />

www.zonaoracle.com <strong>de</strong>dicado a la publicación <strong>de</strong> contenido didáctico relacionado con bases <strong>de</strong> datos<br />

Oracle. Los archivos log fueron tomados aproximadamente <strong>de</strong> un período <strong>de</strong> 15 días, con 248557 solicitu<strong>de</strong>s<br />

realizadas al servidor. Después <strong>de</strong> realizada la limpieza y transformación <strong>de</strong> los datos, se obtuvieron 1360<br />

sesiones <strong>de</strong> usuario y 238 dominios <strong>de</strong> páginas diferentes.<br />

5.2 Perfiles Obtenidos<br />

Tabla 1. Perfiles generados al aplicar los algoritmos k-Means y Agrupamiento Genético<br />

PERFILES OBTENIDOS CON<br />

PERFILES OBTENIDOS CON AGRUPAMIENTO<br />

K-MEANS<br />

GENÉTICO<br />

Integración <strong>de</strong> datawarehouse, OLAP y Data Mining Introducción a Oracle Warehouse Buil<strong>de</strong>r 10g<br />

Implementación <strong>de</strong> un Datawarehouse Metodología para el <strong>de</strong>sarrollo <strong>de</strong> datawarehouses<br />

Metodología para el <strong>de</strong>sarrollo <strong>de</strong> datawarehouses Implementación <strong>de</strong> un Datawarehouse<br />

Como <strong>de</strong>be ser un CRM completo? Integración <strong>de</strong> datawarehouse, OLAP y Data Mining<br />

Implementando un datawarehouse Implementando un datawarehouse -<br />

Cree su primer aplicación en j<strong>de</strong>veloper El concepto datawarehouse -<br />

Desarrollo <strong>de</strong> aplicaciones empresariales con oracle Listar las sentencias SQL <strong>de</strong> una sesión<br />

ADF Data warehousing con Discoverer -<br />

Introducción a Business Component - Parte I<br />

Data Warehousing con Discoverer<br />

Introducción a Business Component - Parte I -<br />

Introducción a Business Component – Parte II<br />

qué es Oracle Web Db? -<br />

Los 4 principios <strong>de</strong>l datawarehouse -<br />

Desarrollar aplicaciones con j<strong>de</strong>veloper<br />

Cree su primer aplicación en j<strong>de</strong>veloper -<br />

Introducción a Business Component - Parte II -<br />

J<strong>de</strong>veloper - Construir una lista <strong>de</strong> valores con ADF Desarrollar aplicaciones con j<strong>de</strong>veloper -<br />

Desarrollo <strong>de</strong> aplicaciones empresariales con oracle ADF -<br />

Desarrollando Componentes JavaBeans con Oracle Introducción a Business Component - Parte I -<br />

J<strong>de</strong>veloper 10g J<strong>de</strong>veloper - Construir una lista lista <strong>de</strong> valores con ADF -<br />

5.3 Evaluación <strong>de</strong> los Perfiles<br />

Las métricas Recall y Precisión utilizadas en el área <strong>de</strong> recuperación <strong>de</strong> información [Sar00] fueron utilizadas<br />

para evaluar los perfiles obtenidos por k-Means como por Agrupamiento Genético. El recall es una medida<br />

que correspon<strong>de</strong> al porcentaje <strong>de</strong> ítems que son correctamente recomendados, mientras que la precisión mi<strong>de</strong><br />

la calidad promedio <strong>de</strong> una recomendación individual [Sha05]. Para efectuar la evaluación, el conjunto <strong>de</strong><br />

302

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!