UNIDAD ZACATENCO DEPARTAMENTO DE ... - Cinvestav
UNIDAD ZACATENCO DEPARTAMENTO DE ... - Cinvestav
UNIDAD ZACATENCO DEPARTAMENTO DE ... - Cinvestav
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Figura 3.1: Arquitectura de hive [4].<br />
3.1. Arquitectura de Hive<br />
Hive 31<br />
Hive es un datawarehouse de código abierto implementado sobre Hadoop. Fue<br />
desarrollado por Facebook con el objetivo de eficientar el acceso a los datos y<br />
optimizar su modelo de negocios [4]. El procesamiento de los datos se realiza a<br />
través de sentencias parecidas al SQL llamadas sentencias HiveQL. Estas sentencias<br />
pueden involucrar scripts MapReduce dentro de sí mismas, de manera que es posible<br />
especificar el procesamiento de datos estructurados y no estructurados.<br />
Hive está constituido por 3 grupos de componentes como se observa en la figura<br />
3.1: Metastore, interfaces de usuario y Driver.<br />
El componente Metastore mantiene la infraestructura del datawarehouse y guarda<br />
información relacionada con las estructuras de Hive. Por ejemplo, guarda la ubicación<br />
de las bases de datos y tablas, los permisos de los usuarios sobre las base de datos<br />
y tablas, los tipos de datos de las columnas, etcétera. Esta información se le conoce<br />
como metadatos. Los metadatos se almacenan en un sistema de archivos local o en<br />
un SGBD como MySQL o PostgreSQL. Si se desea almacenar los metadatos en un<br />
SGBD, entonces Hive utiliza un framework llamado DataNucleus que convierte un<br />
objeto que contiene los metadatos en registros de una tabla o relación y viceversa.<br />
<strong>Cinvestav</strong> Departamento de Computación