07.05.2013 Views

UNIDAD ZACATENCO DEPARTAMENTO DE ... - Cinvestav

UNIDAD ZACATENCO DEPARTAMENTO DE ... - Cinvestav

UNIDAD ZACATENCO DEPARTAMENTO DE ... - Cinvestav

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Figura 3.1: Arquitectura de hive [4].<br />

3.1. Arquitectura de Hive<br />

Hive 31<br />

Hive es un datawarehouse de código abierto implementado sobre Hadoop. Fue<br />

desarrollado por Facebook con el objetivo de eficientar el acceso a los datos y<br />

optimizar su modelo de negocios [4]. El procesamiento de los datos se realiza a<br />

través de sentencias parecidas al SQL llamadas sentencias HiveQL. Estas sentencias<br />

pueden involucrar scripts MapReduce dentro de sí mismas, de manera que es posible<br />

especificar el procesamiento de datos estructurados y no estructurados.<br />

Hive está constituido por 3 grupos de componentes como se observa en la figura<br />

3.1: Metastore, interfaces de usuario y Driver.<br />

El componente Metastore mantiene la infraestructura del datawarehouse y guarda<br />

información relacionada con las estructuras de Hive. Por ejemplo, guarda la ubicación<br />

de las bases de datos y tablas, los permisos de los usuarios sobre las base de datos<br />

y tablas, los tipos de datos de las columnas, etcétera. Esta información se le conoce<br />

como metadatos. Los metadatos se almacenan en un sistema de archivos local o en<br />

un SGBD como MySQL o PostgreSQL. Si se desea almacenar los metadatos en un<br />

SGBD, entonces Hive utiliza un framework llamado DataNucleus que convierte un<br />

objeto que contiene los metadatos en registros de una tabla o relación y viceversa.<br />

<strong>Cinvestav</strong> Departamento de Computación

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!