30.12.2012 Views

geração (semi)automática de metadados - Universidad Autónoma ...

geração (semi)automática de metadados - Universidad Autónoma ...

geração (semi)automática de metadados - Universidad Autónoma ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

ISBN: 978–972–8924–45-4 © 2007 IADIS<br />

4. CONCLUSIONES Y TRABAJO FUTURO<br />

En este trabajo se ha evaluado la posibilidad <strong>de</strong> emplear conceptos <strong>de</strong>rivados <strong>de</strong> la teoría <strong>de</strong> la información<br />

para mejorar el funcionamiento <strong>de</strong> los filtros antispam. Durante las pruebas realizadas, se mostró la<br />

efectividad <strong>de</strong> la modificación llevada a cabo <strong>de</strong> cara a la reducción <strong>de</strong> la cantidad <strong>de</strong> errores cometidos por<br />

los clasificadores. Para ello se emplearon dos <strong>de</strong> los corpus más conocidos en el campo <strong>de</strong>l filtrado <strong>de</strong> correo<br />

spam.<br />

Aunque los resultados obtenidos utilizando conceptos <strong>de</strong> teoría <strong>de</strong> la información resultan a<strong>de</strong>cuados para<br />

reducir la cantidad global <strong>de</strong> errores cometidos por el clasificador analizado, las modificaciones realizadas<br />

sobre este no parecen a<strong>de</strong>cuadas cuando la pérdida <strong>de</strong> mensajes legítimos resulta crítica para el usuario final.<br />

Por lo tanto, <strong>de</strong>pendiendo <strong>de</strong>l perfil <strong>de</strong> los usuarios <strong>de</strong>l sistema, se <strong>de</strong>be escoger entre aplicar o no la mejora<br />

propuesta.<br />

De cara a lograr erradicar el corro spam, la investigación se <strong>de</strong>be encaminar hacia la utilización <strong>de</strong><br />

tesauros para incorporar información semántica en el proceso <strong>de</strong> filtrado, así como la elaboración <strong>de</strong> filtros<br />

específicos para la i<strong>de</strong>ntificación <strong>de</strong> imágenes spam.<br />

AGRADECIMIENTOS<br />

Este trabajo ha sido financiado en parte por el proyecto <strong>de</strong> investigación <strong>de</strong> la <strong>Universidad</strong> <strong>de</strong> Vigo titulado<br />

SAEICS: sistema adaptativo con etiquetado inteligente para correo spam.<br />

REFERENCIAS<br />

Androutsopoulos, I. et al., 2000a. Corpus Ling Spam (online).<br />

http://www.iit.<strong>de</strong>mokritos.gr/~ionandr/lingspam_public.tar.gz. Consultado el 21.07.2007.<br />

Androutsopoulos, I. et al., 2000b. An evaluation of Naïve Bayesian anti-spam filtering. Proceedings of the Workshop on<br />

Machine Learning in the New Information Age, 11th European Conference on Machine Learning. Barcelona, Spain,<br />

pp. 9-17.<br />

ComputerWorld, 2007. Former spammer: 'I know I'm going to hell' (online).<br />

http://www.computerworld.com.au/in<strong>de</strong>x.php/id;1762205842;fp;2;fpid;1. Consultado en: 21.07.07.<br />

F<strong>de</strong>z-Riverola, F. et al., 2007. SpamHunting: An Instance-Based Reasoning System for Spam Labelling and Filtering. In<br />

Decission Support Systems. Vol. 43, No. 3, pp. 722-736.<br />

Kohavi, R., 1995. A Study of Cross-validation and Bootstrap for Accuracy Estimation and Mo<strong>de</strong>l Selection. In<br />

Proceedings of the 14th International Joint Conference on Artificial Intelligence, IJCAI-1995. Montreal, Canada, pp.<br />

1137-1143.<br />

Mason, J., 2005. The Apache SpamAssassin Project (online). http://spamassassin.apache.org/. Consultado el 25.05.2007.<br />

Mén<strong>de</strong>z, J. R. et al., 2006. Tracking Concept Drift at Feature Selection Stage in SpamHunting: an Anti-Spam Instance-<br />

Based Reasoning System. In Proceedings of the 8th European Conference on Case-Based Reasoning.<br />

Ölü<strong>de</strong>niz/Fethiye, Turkey, pp. 504-518.<br />

Shannon, C. E., 1997. The mathematical theory of communication. In Bell Syst. Tech. J, Vol. 27, pp. 379–423 and 623–<br />

656.<br />

Watson, I., y Marir, F., 1994. Case-based reasoning: A review. In The knowledge Engineering Review, Vol. 9, No. 4, pp.<br />

327-354.<br />

298

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!