07.05.2013 Views

UNIDAD ZACATENCO DEPARTAMENTO DE ... - Cinvestav

UNIDAD ZACATENCO DEPARTAMENTO DE ... - Cinvestav

UNIDAD ZACATENCO DEPARTAMENTO DE ... - Cinvestav

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

proceso NameNode del sistema de archivos HDFS.<br />

MapReduce 19<br />

En el archivo mapred-site.xml se puede configurar, entre otros aspectos, el<br />

nodo y el puerto donde se va a ejecutar el proceso JobTracker, a través de la<br />

propiedad mapred.job.tracker. Además, se puede configurar la cantidad de memoria<br />

heap que pueden utilizar las tareas map y reduce, a través de la propiedad<br />

mapred.child.java.opts. La memoria heap es el área de memoria dinámica donde se<br />

cargan los programas mapreduce y los datos a procesar. Por defecto, se asignan 200<br />

Megabytes a cada tarea map o reduce. Ver código 2.4.<br />

1 <br />

2 <br />

3 mapred . job . t r a c k e r <br />

4 nodo s e r v i d o r : p u e r t o <br />

5 <br />

6 <br />

7 mapred . c h i l d . java . opts <br />

8 −Xmx200m <br />

9 <br />

10 <br />

Código 2.4: Estructura interna del archivo de configuración mapred-site.xml<br />

En el archivo hdfs-site.xml se puede especificar, entre otros aspectos, el tamaño de<br />

cada split de un archivo, a través de la propiedad dfs.block.size (por defecto el valor<br />

es de 67108864 bytes que corresponden a 64MB). Por otra parte, también se puede<br />

configurar el factor de replicación de los splits (por defecto el valor es de 3), a través,<br />

de la propiedad dfs.replication. Ver código 2.5.<br />

<strong>Cinvestav</strong> Departamento de Computación

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!