07.05.2013 Views

UNIDAD ZACATENCO DEPARTAMENTO DE ... - Cinvestav

UNIDAD ZACATENCO DEPARTAMENTO DE ... - Cinvestav

UNIDAD ZACATENCO DEPARTAMENTO DE ... - Cinvestav

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

MapReduce 17<br />

Figura 2.6: Interacción de NameNode y DataNodes en HDFS [3]. Los números entre<br />

paréntesis corresponden a los ids de los DataNodes.<br />

representados por la numeración 4,5. El proceso NameNode mantiene los metadatos<br />

del sistema HDFS que contiene la información de los directorios, en cuantos splits fue<br />

divido un archivo, donde se encuentra cada split, etcétera. Por otra parte, los procesos<br />

DataNodes se comunican entre ellos para realizar la réplica de datos, por ejemplo, del<br />

splits 3 se tienen 3 réplicas una en el nodo 1, otra en el nodo 2 y una última en el<br />

nodo 3. Esto asegura, que si un DataNode falla o es inaccesible en la red, se tenga<br />

otra copia del mismo split en otro nodo y se pueda leer.<br />

2.3.2. Configuración de Hadoop<br />

Hadoop permite configurar el ambiente de ejecución de MapReduce y el sistema<br />

de archivos distribuido HDFS. La configuración de Hadoop determina el modo de<br />

ejecución y el desempeño de los programas mapreduce.<br />

La configuración de Hadoop se realiza a través de archivos .xml y archivos de texto.<br />

La estructura interna de un archivo de configuración .xml se observa en el código 2.2.<br />

<strong>Cinvestav</strong> Departamento de Computación

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!