30.07.2015 Views

Actas JP2011 - Universidad de La Laguna

Actas JP2011 - Universidad de La Laguna

Actas JP2011 - Universidad de La Laguna

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>Actas</strong> XXII Jornadas <strong>de</strong> Paralelismo (<strong>JP2011</strong>) , <strong>La</strong> <strong>La</strong>guna, Tenerife, 7-9 septiembre 2011valores para cada clave, con el fin <strong>de</strong> disminuir lacantidad <strong>de</strong> datos para procesar y ahorrar espacio enmemoria. Cuando el buffer <strong>de</strong> la memoria alcanza un<strong>de</strong>terminado umbral <strong>de</strong> utilización disponible <strong>de</strong>finidopor el usuario, estos datos <strong>de</strong>ben ser enviados al disco,como se muestra en la figura 7. Antes <strong>de</strong> enviar los datosal disco se realizará una or<strong>de</strong>nación en las claves.Fig. 7. Flujo <strong>de</strong> datos en la fase Map.En la ejecución <strong>de</strong> la fase Reduce, cargamos los datosque están en el disco en los buffers <strong>de</strong> memoria <strong>de</strong> lastareas reduce. Cuando los datos están en la memoria, serealiza una agregación <strong>de</strong> todos los datos a través <strong>de</strong> unafunción merge. Si la cantidad <strong>de</strong> datos ocupa másespacio que la cantidad <strong>de</strong> memoria disponible, se envíanuevamente al disco <strong>de</strong>spués <strong>de</strong> la fusión.Después <strong>de</strong> combinar los datos en un conjunto, losdatos son enviados a las tareas Reduce, como se muestraen la figura 8. Los datos <strong>de</strong> entrada <strong>de</strong> las tareas Reduceestán or<strong>de</strong>nados por clave. <strong>La</strong> salida final <strong>de</strong> esta fase seescribe directamente en el disco.AGRADECIMIENTOSEl presente trabajo ha sido financiado por el MEC(Ministerio <strong>de</strong> Educación y Ciencia) mediante elproyecto con referencia TIN2007-64974.REFERENCIAS[1] J. Dean, S. Ghemawat, “MapReduce: simplified data processingon large clusters”, Commun. ACM, 2008.[2] T. White, “Hadoop: The Definitive Gui<strong>de</strong>”, 2009.[3] B. He, W. Fang, Q. Luo, N. K. Govindaraju, T. Wang, “Mars: aMapReduce framework on graphics processors”, Proceedings ofthe 17th international conference on Parallel architectures andcompilation techniques, 2008.[4] R.M. Yoo, A. Romano, C. Kozyrakis, “Phoenix Rebirth:Scalable MapReduce on a <strong>La</strong>rge-Scale Shared-Memory System”,Proceedings of the IEEE International Symposium on WorkloadCharacterization (IISWC), 2009.[5] Y. Mao, R. Morris, M.F. Kaashoek, “Optimizing MapReduce forMulticore Architectures”, MIT technical report MIT-CSAIL-TR-2010-020, 2010.[6] C. Ranger, R. Raghuraman, A. Penmetsa, G. Bradski,C.Kozyrakis, “Evaluating MapReduce for Multi-core andMultiprocessor Systems”, Proceedings of the 13th InternationalSymposium on High-Performance Computer Architecture, 2007.Fig. 8. Flujo <strong>de</strong> datos en la fase Reduce.V. CONCLUSIONESHemos propuesto un mo<strong>de</strong>lo que tiene como i<strong>de</strong>aprincipal el uso <strong>de</strong> los recursos en aplicacionesMapReduce bajo una arquitectura multi-core.<strong>La</strong> i<strong>de</strong>a <strong>de</strong> este mo<strong>de</strong>lo, es evitar la saturación <strong>de</strong>lrecurso <strong>de</strong> memoria, utilizando el disco comodispositivo auxiliar para el almacenamiento yor<strong>de</strong>nación <strong>de</strong> las claves intermedias. Sabiendo que paraun conjunto <strong>de</strong> datos muy gran<strong>de</strong>s, no siempre haymemoria disponible, la i<strong>de</strong>a <strong>de</strong> utilizar el acceso al disco<strong>de</strong> manera or<strong>de</strong>nada se convierte en una solución a teneren cuenta y a ser contrastada con el resto <strong>de</strong> alternativasexistentes.<strong>JP2011</strong>-254

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!