27.12.2012 Views

Pentaho BI Suite - Cognus

Pentaho BI Suite - Cognus

Pentaho BI Suite - Cognus

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>Pentaho</strong> <strong>BI</strong> <strong>Suite</strong><br />

DESCRIPCION DE LA SUITE ENTERPRISE<br />

1


Índice<br />

<strong>Pentaho</strong> <strong>BI</strong> <strong>Suite</strong> ................................................................................................................ 3<br />

1.1. Descripción general ............................................................................................. 3<br />

1.2. Funcionalidades principales ............................................................................... 11<br />

1.3. Herramientas de visualización y análisis ............................................................ 12<br />

2<br />

1.3.1. Tableros de control ..................................................................................... 12<br />

1.3.2. Análisis ....................................................................................................... 17<br />

1.3.3. Reportes ..................................................................................................... 23<br />

1.3.4. Minería de Datos ........................................................................................ 27<br />

1.4. Herramientas de desarrollo <strong>Pentaho</strong> .................................................................. 29<br />

1.4.1. <strong>Pentaho</strong> Data Integration ............................................................................ 29<br />

1.4.2. <strong>Pentaho</strong> Report Designer ........................................................................... 34<br />

1.4.3. <strong>Pentaho</strong> Schema Workbench ..................................................................... 38<br />

1.4.5. <strong>Pentaho</strong> Metadata Editor ............................................................................ 41<br />

1.4.6. <strong>Pentaho</strong> Aggregation Designer ................................................................... 42<br />

1.4.7. <strong>Pentaho</strong> Design Studio ............................................................................... 43<br />

1.5. Herramientas Servidor ....................................................................................... 44<br />

1.5.1. <strong>Pentaho</strong> <strong>BI</strong> Server, <strong>Pentaho</strong> Data Integration Server y <strong>Pentaho</strong> Enterprise<br />

Console 44<br />

1.6. Base de conocimientos ...................................................................................... 47


<strong>Pentaho</strong> <strong>BI</strong> <strong>Suite</strong><br />

En este capítulo detallaremos el potencial y las funcionalidades de la suite de <strong>BI</strong> <strong>Pentaho</strong><br />

Enterprise Edition.<br />

1.1. Descripción general<br />

<strong>Pentaho</strong> es una suite de Herramientas de código abierto comercial para Inteligencia de<br />

Negocios que cuenta con todas las herramientas necesarias para cubrir el espectro<br />

completo de Inteligencia de Negocios dentro de una organización: Análisis interactivo<br />

(OLAP), Reportes, Integración de datos (ETL), Tableros de Control y Minería de datos.<br />

Adicionalmente, la plataforma provee integración con Hadoop para grandes cantidades de<br />

datos.<br />

<strong>Pentaho</strong> Corp., empresa dueña de <strong>Pentaho</strong>, fue fundada en el año 2004 por pioneros en<br />

Business Intelligence Open Source comercial provenientes de empresas como: Business<br />

Objects, Cognos, Hyperion, Jboss, Oracle, Red Hat y SAS.<br />

<strong>Pentaho</strong> hoy es socio de una amplia gama de empresas del ámbito tecnológico que, o<br />

bien integra la tecnología de <strong>Pentaho</strong> en sus aplicaciones, o empaqueta productos de<br />

<strong>Pentaho</strong> como parte de su estrategia de “go-to-market”. Estos socios han trabajado<br />

estrechamente con <strong>Pentaho</strong> para ofrecer soluciones integrales, ya sea como un software<br />

o como un servicio de implementación y consultoría estratégica. Estos socios de <strong>Pentaho</strong><br />

tienen importantes acuerdos de nivel de relación y servicio (SLA) para garantizar el éxito<br />

de sus implementaciones en clientes.<br />

3


La empresa ha sustentado su éxito en base a una astuta estrategia comercial fundada en<br />

un modelo de desarrollo de código abierto que permite la rápida innovación, obtener<br />

productos finales de alta calidad, y una reducción importante en los costos de desarrollo.<br />

Su comunidad mundial pone a prueba y contribuye constantemente al desarrollo de un<br />

producto de clase mundial.<br />

<strong>Pentaho</strong> ofrece dos versiones de su solución en base al modelo anteriormente descrito:<br />

una versión comunitaria gratuita orientada principalmente al mundo académico, y una<br />

versión Enterprise comercial orientada a la implementación profesional tanto en empresas<br />

privadas como en instituciones gubernamentales u otras sin fines de lucros que pretendan<br />

potenciar sus capacidades analíticas para mejorar su gestión. El siguiente esquema<br />

resume el modelo:<br />

Open Source Community<br />

<strong>Pentaho</strong> provee lead developers y<br />

lineamientos técnicos para el desarrollo del<br />

producto<br />

La comunidad contribuye con nuevas<br />

soluciones y se utiliza como un “test bed”<br />

para estas innovaciones<br />

Mejora eficazmente la calidad del producto<br />

mediante una rápida identificación de<br />

defectos u oportunidades de mejora<br />

4<br />

Enterprise Edition<br />

<strong>Pentaho</strong> certifica estos productos<br />

como listos para una implementación<br />

empresarial<br />

Agrega funcionalidades mejoradas y<br />

una mayor facilidad de uso e<br />

implementación.<br />

Provee soporte técnico profesional<br />

para la herramienta con altos niveles<br />

de servicio a un bajo costo de<br />

suscripción


La versión Enterprise surge luego de una importante fase de testeo interno y desarrollo<br />

propio del personal profesional de <strong>Pentaho</strong>, quien también integra sus componentes,<br />

selecciona las funcionalidades adecuadas, estabiliza el código y su instalación, crea<br />

documentación profesional, y asegura que el producto final sea robusto y esté listo para<br />

una implementación profesional.<br />

Esta estrategia ha resultado en que hoy <strong>Pentaho</strong> sea globalmente reconocido como el<br />

líder mundial en <strong>BI</strong> Open Source a través de una gran cantidad de premios:<br />

5<br />

- InfoWorld Bossie Awards<br />

- Red Herring 100 winner,<br />

- Google Code,<br />

- Top 10 Information Week,<br />

- Project of the month SourceForge.net,<br />

- Jboss Innovation,<br />

- Jolt Productivity Award,<br />

- Miss Strategic 100,<br />

- Tech 50,<br />

- Editor’s Choice Award Intelligent Enterprise,<br />

- Product of the year Searchdatamanagement.com,<br />

- InformationWeek Startup 50.<br />

La suite <strong>Pentaho</strong> está fundada en altos estándares, es modular, de plataforma embebible<br />

y se basa en una metodología de desarrollo corporativa que incluye un plan de trabajo<br />

detallado y transparente, además de un control de calidad extensivo.


A continuación presentamos una tabla con una descripción detallada según la versión:<br />

Software y Servicios Community Edition Enterprise Edition<br />

Reporting Open Source Certificado<br />

Analysis Open Source Certificado<br />

Dashboards Open Source Certificado<br />

Data Integration / ETL Open Source Certificado<br />

Business Intelligence Platform Open Source Certificado<br />

Data Mining Open Source Certificado (Add-On)<br />

Interacción con foros de la comunidad<br />

Ambiente de desarrollo unificado para<br />

Agile <strong>BI</strong><br />

Documentación Web comunitaria (wiki)<br />

Soporte profesional<br />

6<br />

� Soporte telefónico<br />

� Soporte a través de e-mail<br />

� Acuerdo de nivel de servicios (SLA)<br />

� Ilimitados casos de soporte<br />

Mantención del software<br />

� Mantención del software Por personal interno<br />

� Acceso a parches<br />

� Fixes incluidos en futuras versiones<br />

Por ingenieros<br />

<strong>Pentaho</strong>


Funcionalidades mejoradas<br />

7<br />

� <strong>Pentaho</strong> Analyzer<br />

� Formateo condicional<br />

� Navegación en profundidad de<br />

detalle<br />

� Dashboard Designer para usuarios<br />

finales, drag and drop.<br />

� <strong>Pentaho</strong> Enterprise Console<br />

� Single Sign-On<br />

� Configuración de seguridad<br />

simplificada<br />

� Diagnóstico de la aplicación<br />

� Herramientas del repositorio<br />

� Administración del ciclo de vida<br />

� Reportes de auditoría<br />

� Expiración de contenido automática<br />

� Clustering<br />

� Monitoreo de desempeño<br />

� Administración y monitoreo de ETL<br />

� Seguridad avanzada<br />

� Integración con LDAP/MSAD de<br />

terceros<br />

� Administración de usuarios y roles<br />

controlando las acciones de<br />

usuarios y roles


8<br />

� Seguridad de permisos al contenido<br />

(dueño, crear, leer, actualizar,<br />

borrar)<br />

� Seguridad del repositorio mejorada<br />

� Administración de contenido<br />

mejorada<br />

� Administración y programación de<br />

tareas remota<br />

� Repositorio del equipo de desarrollo<br />

incluyendo versionamiento y locking<br />

� <strong>BI</strong> suite para Hadoop<br />

Software certificado<br />

� Software estabilizado<br />

� Ciclo de versiones administrado<br />

� Builds optimizados<br />

Expertise en el producto<br />

� Documentación profesional<br />

� Base de conocimiento<br />

� Soporte a consultas<br />

� Paquetes de asistencia remota<br />

� Paquetes de<br />

Instalación/configuración<br />

� Paquetes de diseño e integración<br />

� Paquetes de resolución de<br />

problemas y optimización<br />

� Foro en línea Enterprise Edition<br />

� Entrenamiento basado en Web<br />

(Add-on)


Company Size<br />

Adoptado por clientes de diversas industrias, <strong>Pentaho</strong> es actualmente la solución de <strong>BI</strong><br />

con mayor crecimiento anual en el mundo. Algunos de los clientes <strong>Pentaho</strong> con permiso<br />

de mención:<br />

$5 Million $1 Billion $5 Billion +<br />

En lo que sigue del documento se presentarán los distintos módulos que contiene la<br />

solución. Cabe destacar que éstos permiten el desarrollo de una solución completa e<br />

integral sin requerir de otros complementos.<br />

Dentro de sus módulos se incluye:<br />

<strong>Pentaho</strong> Data Integration: Limpia e integra datos desde donde sea que se<br />

encuentren.<br />

<strong>Pentaho</strong> Reporting: Accede a los datos y provee información de alto valor a la<br />

organización.<br />

<strong>Pentaho</strong> Analysis: Permite explorar y analizar los datos de manera interactiva,<br />

rápida y ágil.<br />

9<br />

Industry<br />

Retail Manufacturing Pharma Healthcare Financial Telecom Transportation Education Government


<strong>Pentaho</strong> Dashboards: Entrega resúmenes de información y métricas de alto valor<br />

a través de una interfaz interactiva y fácil de comprender<br />

<strong>Pentaho</strong> Data Mining: Descubre patrones escondidos en los datos, y permite<br />

predecir eventos futuros.<br />

10


1.2. Funcionalidades principales<br />

La suite de herramientas de <strong>Pentaho</strong> permite elegir entre el uso completo de las<br />

herramientas o la utilización específica de ciertas herramientas para resolver los<br />

problemas de negocio.<br />

La arquitectura de la solución puede ser representada mediante el siguiente esquema:<br />

Como se puede ver, sus componentes permiten el desarrollo e implementación de un<br />

proyecto completo de Business Intelligence, sin la necesidad de herramientas adicionales.<br />

Una especificación de herramientas por área se detalla a continuación:<br />

11


1.3. Herramientas de visualización y análisis<br />

1.3.1. Tableros de control<br />

La herramienta de tableros de control de <strong>Pentaho</strong> provee inmediatas ideas para el<br />

rendimiento individual, departamental o empresarial. A través de la definición de métricas<br />

claves en una interfaz visual atractiva e intuitiva, los tableros de control de <strong>Pentaho</strong><br />

entregan a los usuarios de negocio la información crítica necesaria para entender y<br />

mejorar el rendimiento organizacional.<br />

Una de sus características más atractivas es la integración nativa con Google Maps que le<br />

entregan capacidades de visualización geográfica. Estas capacidades permiten el<br />

desarrollo de potentes soluciones de geomarketing, sistemas de gestión territorial,<br />

tableros de control georreferenciados y mapeo de indicadores a lugares geográficos para<br />

modelos de gestión que incorporan la variable de localización.<br />

Los tableros de control de <strong>Pentaho</strong> proveen:<br />

� Interfaz rica e interactiva incluyendo visualizaciones basadas en Adobe Flash para<br />

que los usuarios de negocio puedan inmediatamente realizar un seguimiento de las<br />

métricas de negocio definidas, y ver cuáles necesitan atención. Diseñador de tableros<br />

de control que permite a los usuarios de negocio crear tableros personalizados y sin<br />

entrenamiento<br />

� Integración con Reportes de <strong>Pentaho</strong>, y Análisis de <strong>Pentaho</strong> para que los usuarios<br />

puedan navegar a través de la información de los reportes y análisis para entender<br />

que factores contribuyen para bien o para mal en el rendimiento.<br />

� Integración con el Portal que hace más fácil la entrega de métricas relevantes para el<br />

negocio a grandes cantidades de usuarios, integradas de manera transparente en su<br />

aplicación.<br />

� Alertas integradas para monitorear continuamente las excepciones y notificar a los<br />

usuarios para tomar decisiones.<br />

� Capacidades intuitivas de administración de métricas que permiten la definición y<br />

seguimiento de indicadores críticos a nivel individual, departamental u organizacional.<br />

12


A continuación presentamos algunos ejemplos:<br />

13


1.3.2. Análisis<br />

La herramienta de análisis de <strong>Pentaho</strong> entrega el poder analítico en las manos de los<br />

usuarios del negocio, ayudándolos a obtener ideas y entender las necesidades para<br />

realiza óptimas decisiones de negocio. Por ejemplo, si un reporte muestra que las ventas<br />

están por bajo lo esperado, los usuarios de negocio necesitan ser capaces de fácilmente<br />

descubrir el problema subyacente a través de la obtención de respuestas como:<br />

� ¿Es el problema específico a una línea de productos o ciertas regiones?<br />

� ¿Cuál es la diferencia entre productos o regiones con poco rendimiento y aquellos<br />

17<br />

con buen rendimiento?<br />

� ¿Existe un problema relacionado con la plantilla de ventas? ¿Campañas de<br />

marketing? ¿Algo más?<br />

La herramienta de análisis de <strong>Pentaho</strong> permite responder este tipo de preguntas de<br />

negocio a través de:<br />

� Facilitar a los usuarios la exploración libre y completa de la información de negocio a<br />

través de un análisis interactivo con distintos grados de profundidad y horizontalidad<br />

de la información.<br />

� Proveer rápidos tiempos de respuesta para consultas analíticas complejas.<br />

� Presentar multidimensionalmente los datos y permitiendo que los usuarios<br />

seleccionar que dimensiones y medidas desean explorar.<br />

� Ofrecer completa integración con otros productos en la suite <strong>Pentaho</strong><br />

� Resultados explorables y navegables incluso en los gráficos<br />

� Sofisticadas capacidades OLAP, arquitectura ROLAP<br />

� Técnicas de optimización para mejoras de tiempos de respuesta<br />

� Capacidad de manejo de gran número de dimensiones para análisis por múltiples<br />

atributos<br />

� Soporte a estándares como MDX y OLAP4J y arquitectura moderna basada 100% en<br />

J2EE, repositorio basado en XML<br />

� Soporta conectividad vía JDBC con bases de datos propietarias y open source.<br />

� Todos los componentes expuestos vía Web Services para integración con SOA’s


<strong>Pentaho</strong> Analyzer: Tecnología de análisis de vanguardia<br />

El análisis exploratorio de datos (EDA) en las herramientas de Business Intelligence<br />

típicamente se realiza por medio de la manipulación de cubos multidimensionales OLAP.<br />

Estos cubos son básicamente una manera de representar los datos a trabajar, separando<br />

las variables en Dimensiones y Medidas.<br />

<strong>Pentaho</strong> tradicionalmente ha ofrecido la herramienta JPivot para hacer este tipo de<br />

análisis, pero recientemente se ha anunciado la integración de una nueva herramienta:<br />

<strong>Pentaho</strong> Analyzer. Ésta ofrece importantes mejoras de funcionalidad y facilidad de uso<br />

para los usuarios finales, entre los que podemos mencionar:<br />

18<br />

� Drag and Drop de Campos (se arrastran)<br />

� Panel de filtros<br />

� Ordenamiento y Filtrado (inclusión/exclusión) con un click<br />

� Medidas definidas por el usuario<br />

� Permite cambiar tamaño y formatos de columnas dinámicamente<br />

� Agregar/quitar subtotales<br />

� Gráficos mejorados<br />

Además de mantener otras características como ser 100% web, permitir guardar las vistas<br />

y compartirlas con otros analistas y exportar a Excel, PDF o CSV.<br />

Otras características técnicas para destacar<br />

� Componentes 100% J2EE para mayor escalabilidad, portabilidad e<br />

integración.<br />

� Repositorios basados en XML<br />

� JDBC 2.0 compilant<br />

� Soporta conectividad vía JDBC a bases de datos propietarias como Oracle,<br />

IBM DB2, Microsoft SQL Server, NCR Teradata, entre otros.<br />

� Soporta conectividad vía JDBC a distintas bases de datos libres como<br />

MySQL, PostgreSQL, EnterpriseDB, entre otras.<br />

� Soporta OLAP4J API<br />

� Todos los componentes son expuestos a través de Web Services para una<br />

fácil integración en Arquitecturas Orientadas a Servicios (SOAs)<br />

Otra componente de <strong>Pentaho</strong> Analyzer es el Ad Hoc Reporting Interface. Esta<br />

componente es una interfaz web interactiva “drag and drop” para que el usuario genere<br />

sus propios reportes en base a los data sources que estén disponibles. Crear reportes es<br />

tan fácil como seguir los pasos propuestos: elegir los datos, ordenarlos, seleccionar los<br />

filtros que se necesiten y asignar un template. Para customizarlos, es posible integrar la<br />

solución con <strong>Pentaho</strong> Report Designer.


Interfas de Wizard de Ad Hoc Reporting:<br />

Finalmente, en esta misma herramienta se incluye <strong>Pentaho</strong> Dashboard Designer, que<br />

permite a los usuarios de negocios crear dashboars personalizados de manera rápida y<br />

fácil para controlar las estadísticas de la organización, indicadores, etc. Seleccionando<br />

sobre en una biblioteca de plantillas o simplemente arrastrando y soltando elementos al<br />

tablero de instrumentos, los usuarios pueden incorporar sus informes favoritos, gráficos y<br />

vistas interactivas de análisis.<br />

<strong>Pentaho</strong> Dashboard Designer también permite a los usuarios de negocio crear nuevas<br />

visualizaciones de datos tabulares y gráficos desde cero mediante la utilización de la capa<br />

de metadatos centralizada de <strong>Pentaho</strong> para consultar los datos sin el conocimiento de las<br />

estructuras de base de datos subyacente o SQL. Controles de filtro incorporados permiten<br />

a los usuarios definir el nivel de información a mostrar en el tablero, la sincronización de<br />

todos los indicadores para una región específica, período de tiempo, entre otros.<br />

19


Vista de <strong>Pentaho</strong> Dashboard Designer:<br />

20


A continuación presentamos algunos ejemplos de la visualización en Analyzer:<br />

Vista de panel de trabajo drag and drop sobre un cubo OLAP:<br />

21


Vista de construcción de gráficas drag and drop sobre un cubo OLAP:<br />

Vista de construcción de gráficas drag and drop sobre un cubo OLAP:<br />

22


Vista de construcción de paneles en Jpivot drag and drop sobre un cubo OLAP:<br />

1.3.3. Reportes<br />

Todas las organizaciones utilizan reportes de una u otra manera. Por lo que los reportes<br />

son considerados una necesidad principal de la Inteligencia de Negocio, y son<br />

frecuentemente la primera aplicación utilizada. Los reportes de <strong>Pentaho</strong> permiten a las<br />

organizaciones fácil acceso, formato y distribución de la información hacia los empleados,<br />

proveedores, etc.<br />

Las características principales de la herramienta de reportes de <strong>Pentaho</strong> son:<br />

23<br />

� Implementación flexible, desde solución standalone de escritorio, a<br />

reportes interactivos<br />

� Amplio soporte a fuentes de datos incluyendo datos relacionales, OLAP o<br />

basados en XML<br />

� Opciones de formato de salida de reportes flexible, incluyendo Adobe PDF,<br />

HTML, Microsoft Excel, Rich Text Format o archivos de texto plano<br />

� Herramienta gráfica (Report Designer) para desarrolladores de reportes.<br />

Diseño de reportes asistido (wizard) para creación fácil y rápida<br />

� Consultas y reportes ad hoc basados en web para usuarios de negocio<br />

� Diseñador de reportes gráfico completo para desarrolladores de reportes.<br />

A continuación presentamos algunos ejemplos:


Visualización de reportes en la consola de usuario (panel de trabajo):<br />

24


Ejemplo de reporte imprimible en formato PDF:<br />

25


1.3.4. Minería de Datos<br />

Una vez que se cuenta con análisis, reportes y tableros de control, es tiempo de llevar la<br />

Inteligencia de Negocios al próximo nivel, a través de los análisis avanzados y la minería<br />

de datos.<br />

Este nivel de excelencia de Inteligencia de Negocios no ha sido conseguido por muchas<br />

grandes organizaciones, y es por esto, que no se debe subestimar la importancia de<br />

trabajar con avanzadas capacidades, ya que estas proveen una ventaja verdadera<br />

sostenible y competitiva que permite a la organización maximizar la eficiencia y eficacia.<br />

El proceso de minería de datos consiste en aplicar sofisticados algoritmos sobre los datos<br />

para descubrir patrones y correlaciones significativos que de otra manera pueden seguir<br />

estando ocultos. Estos pueden ser utilizados para ayudar a comprender mejor el negocio<br />

y también explotar y mejorar el rendimiento futuro a través del análisis predictivo.<br />

Por ejemplo, la minería de datos puede alertar que existe una alta probabilidad de que un<br />

cliente específico no pague en el plazo basado en los análisis de clientes con similares<br />

características<br />

Para ayudar a utilizar completamente la ventaja que entrega la minería de datos en la<br />

organización, el equipo de proyecto de <strong>Pentaho</strong> ha trabajado en conjunto con las<br />

comunidades de desarrollo y negocio para integrar las capacidades del flujo principal de<br />

Inteligencia de Negocios con avanzada minería de datos.<br />

La minería de datos de <strong>Pentaho</strong> es diferenciada por ser abierta, cumplir con los<br />

estándares, utilizar la tecnología de minería de datos de la Aplicación “Weka”, y por su<br />

integración con núcleos de Inteligencia de Negocio como Reportes, Análisis y Tableros de<br />

Control. Otras herramientas de minería de datos no poseen este nivel de sofisticación e<br />

integración.<br />

27<br />

� Poderoso motor de minería de datos provee de un set de algoritmos de<br />

aprendizaje del proyecto Weka incluyendo clustering, segmentación,<br />

árboles de decisión, random forests, redes neuronales y análisis de<br />

componentes principales, entre otros<br />

� Integración de <strong>Pentaho</strong> Data Integration, automatización de procesos de<br />

transformación de datos al formato que requiere el motor de data mining<br />

� Los algoritmos pueden ser aplicados directamente a un set de datos o<br />

invocados desde código Java<br />

� Provee filtros para discretización, normalización, re-muestreo, selección de<br />

atributos, transformación y combinación de atributos<br />

� Modelos para predicción de variables nominales o numéricas<br />

� Herramientas gráficas de diseño para pre procesamiento de datos,<br />

regresión, clustering, reglas de asociación


La herramienta de minería de datos de <strong>Pentaho</strong> puede ser utilizada como:<br />

28<br />

� Una solución innovadora para la utilización inmediata por parte de los<br />

analistas. Para la preocupación de los operadores de minería de datos,<br />

ésta opera completamente en segundo plano, los usuarios ven los<br />

resultados y recomendaciones a través de correos y otras páginas web, las<br />

cuales pueden incluir tableros de control de <strong>Pentaho</strong>.<br />

� Un conjunto de componente que permite a los desarrolladores Java<br />

rápidamente crear soluciones de reportes personalizables usando objetos<br />

Java o Java Server Pages (JSPs). Estos pueden ser integrados con otras<br />

aplicaciones o portales.<br />

� En conjunto con otros componentes de la suite de herramientas de<br />

<strong>Pentaho</strong>.


1.4. Herramientas de desarrollo <strong>Pentaho</strong><br />

1.4.1. <strong>Pentaho</strong> Data Integration<br />

Los datos se encuentran en todos lados. Proveer una versión consistente y única de la<br />

verdad a través de distintas fuentes de información es uno de los retos más grandes que<br />

las organizaciones deben enfrentar. La herramienta de integración de datos de <strong>Pentaho</strong><br />

entrega una poderosa capacidad de Extracción, Transformación y Carga de datos<br />

usando una solución innovadora basada en metadatos. Esta herramienta provee un<br />

ambiente de diseño intuitivo, gráfico y de tipo “drag and drop”, además de una<br />

arquitectura escalable, basada en altos estándares.<br />

Esta herramienta ha sido catalogada por la comunidad <strong>BI</strong> a nivel mundial como de<br />

altísima calidad. En resumen, permite rápida y eficientemente extraer datos,<br />

transformarlos, limpiarlos, validarlos, cargarlos, etc. desde donde quiera que se<br />

encuentren.<br />

Algunas características:<br />

29<br />

� Librería de transformaciones completa con más de 100 objetos de mapeo.<br />

� 100% Java, amplio soporte multi plataforma y soporte de una amplia<br />

cantidad de fuentes de datos, incluyendo aplicaciones integradas, sobre 30<br />

plataformas propietarias y open source, archivos planos, documentos<br />

Excel, y más.<br />

� Soporte avanzado de “warehousing” para cambios lentos y dimensiones<br />

basura.<br />

� Rendimiento y escalabilidad probado de nivel empresarial.<br />

� Herramienta gráfica de muy fácil uso (control lógico de flujo).<br />

� Basado en repositorio facilita re uso de componentes de transformación,<br />

colaboración y administración de modelos, conexiones, logs, etc.<br />

� Performance y escalabilidad de clase Enterprise con soporte a<br />

procesamiento masivo paralelo (MPP) a través de ejecución en cluster.<br />

� Monitoreo y Debugger integrado<br />

� Scheduler (Calendario programador de transformaciones y jobs)


Algunas de las conexiones a bases de datos que soporta:<br />

30<br />

� AS/400<br />

� Apache Derby<br />

� Borland Interbase<br />

� Calpont InfiniDB<br />

� Firebird SQL<br />

� Generic database<br />

� Greenplum<br />

� Gupta SQL Base<br />

� H2<br />

� Hypersonic<br />

� IBM DB2<br />

� Infobright<br />

� Informix<br />

� Ingres<br />

� Inersystems Cache<br />

� KingbaseES<br />

� Lucid DB<br />

� MS Acces<br />

� MS SQL Server<br />

� MS SQL Server (Native)<br />

� MaxDB (SAP DB)<br />

� Monet DB<br />

� MySQL<br />

� Neoview<br />

� Netezza<br />

� Oracle<br />

� Oracle RDB<br />

� Palo MOLAP Server<br />

� PosrtgreSQL<br />

� Remedy Action Request System<br />

� Sap ERP System<br />

� SQLite<br />

� Sybase<br />

� SybaseIQ<br />

� Teradata<br />

� UniVerse database<br />

� Vertica<br />

� dBase III, IV o 5.


A continuación presentamos algunos ejemplos:<br />

Construcción de ETL mediante flujo lógico:<br />

Validación de datos en el flujo:<br />

31


Conexiones a bases de datos:<br />

Job de tareas y transformaciones programadas:<br />

32


Calendarización y programación de rutinas automatizadas:<br />

33


1.4.2. <strong>Pentaho</strong> Report Designer<br />

Todas las empresas o instituciones necesitan consultar reportes. En general, esta labor<br />

no se encuentra automatizada, lo que finalmente genera que el área de TI esté saturada<br />

con peticiones de reportes, dedicando gran parte de sus recursos a esta labor. Esta<br />

aplicación de <strong>Pentaho</strong> proporciona todas las herramientas necesarias para que estos<br />

sean diseñados y publicados para ser consultados fácilmente via web por quienes lo<br />

requieran.<br />

Dentro de sus características destacamos:<br />

34<br />

� Diseñador gráfico Drag-and-drop que proporciona un control completo de<br />

acceso a datos, diseño, agrupación, cálculos, gráficos y formato para<br />

informes “pixel-perfect”<br />

� Incorpora un wizard paso a paso, que guía al usuario durante el proceso de<br />

diseño<br />

� Provee plantillas de alto nivel, predefinidas para agilizar el proceso de<br />

diseño del reporte sin mermar la consistencia de este mismo ni su look<br />

� Permite crear parámetros para que el usuario final personalice la<br />

información que quiere desplegar en el reporte<br />

� Permite que los reportes sean publicados al <strong>BI</strong> Server desde la misma<br />

interfaz para que los usuarios seleccionados puedan ver los reportes a<br />

través de su cuenta <strong>Pentaho</strong> Analyzer


A continuación presentamos algunos ejemplos:<br />

Wizard guiado para fácil construcción de reportes:<br />

35


Personalizacion del reporte:<br />

Ejemplo producto final:<br />

36


1.4.3. <strong>Pentaho</strong> Schema Workbench<br />

Esta herramienta de la suite <strong>Pentaho</strong> tiene como objetivo facilitar la tarea de diseño de<br />

cubos OLAP. Su sencilla interfaz permite modelar un XML con el diseño del cubo a través<br />

de opciones lógicas e intuitivas que no requieren de un manejo avanzado de este formato<br />

de archivo.<br />

Dentro de sus características destacamos:<br />

38<br />

� Diseñador intuitivo de esquemas OLAP<br />

� Permite crear, editar, actualizar y publicar esquemas OLAP para ser<br />

desplegados por aplicaciones de visualización <strong>Pentaho</strong>.<br />

� Acelera de manera considerable la construcción e implementación de este<br />

tipo de soluciones.<br />

<strong>Pentaho</strong> Schema Workbench permite mejorar considerablemente los tiempos de<br />

desarrollo y deployment en la implementacion de proyectos de soluciones analíticas.


A continuación presentamos algunos ejemplos:<br />

Construyendo y publicando un XML con el diseño de un cubo OLAP a través de un menú<br />

intuitivo:<br />

39


Generando una query MDX:<br />

40


1.4.5. <strong>Pentaho</strong> Metadata Editor<br />

Esta herramienta de <strong>Pentaho</strong> permite definir modelos de negocio integrando datos de<br />

distintas fuentes para posteriormente ser utilizado en reportaría de auto servicio (ad-oc),<br />

tableros de control, gráficos y tablas.<br />

<strong>Pentaho</strong> Metadata Editor (PME) es una herramienta que permite crear dominios de<br />

metadatos y modelos. El objetivo es mapear la estructura física de la base de datos a un<br />

modelo lógico de negocio. Estas asignaciones se almacenan en un repositorio de<br />

metadatos centralizados que permite a los administradores<br />

41<br />

� Crea definiciones o reglas para tablas de bases de datos complejas o<br />

crípticas<br />

� Reduce el costo y el impacto asociado a los cambios de bajo nivel en las<br />

base de datos<br />

� Define parámetros de seguridad para limitar el acceso de los usuarios a<br />

los datos<br />

A continuación presentamos una vista de la aplicación:


1.4.6. <strong>Pentaho</strong> Aggregation Designer<br />

Esta herramienta de <strong>Pentaho</strong> permite optimizar la performance y los tiempos de respuesta<br />

de un cubo multidimensional. Si la consultas que se pretenden realizar son muy costosas<br />

en términos de rendimiento, la herramienta entrega una recomendación para crear tablas<br />

agregadas y pre guardar ciertos niveles de agregación.<br />

Dentro de sus características destacamos:<br />

42<br />

� <strong>Pentaho</strong> Aggregation Designer analiza la estructura de la base de datos en<br />

cuestión o del esquema OLAP y automáticamente genera tablas agregadas<br />

para un mayor performance en la ejecución de querys<br />

� Identifica costos y beneficios de las recomendaciones en base al tamaño de las<br />

tablas que pretende agregar y a las mejoras en tiempo de respuesta.<br />

� Automáticamente crea las tablas recomendadas, las puebla, y actualiza el<br />

esquema OLAP.<br />

A continuación presentamos una vista de la aplicación:


1.4.7. <strong>Pentaho</strong> Design Studio<br />

<strong>Pentaho</strong> Design Studio es una colección de editores, viewers, y módulos de<br />

administración, integrados en una sola aplicación que ofrece un entorno gráfico para crear<br />

y probar Action Sequences y JFree reports. La herramienta permite extender las<br />

potencialidades de la suite, y customizar de manera considerable las soluciones por<br />

desarrollar.<br />

Se basa en Eclipse software de desarrollo de código abierto que proporciona un sólido<br />

ambiente, con funciones de calidad comercial para el desarrollo de herramientas<br />

altamente integradas.<br />

A continuación presentamos una vista de la aplicación:<br />

43


1.5. Herramientas Servidor<br />

1.5.1. <strong>Pentaho</strong> <strong>BI</strong> Server, <strong>Pentaho</strong> Data Integration Server y <strong>Pentaho</strong> Enterprise<br />

Console<br />

La suite <strong>BI</strong> de <strong>Pentaho</strong> en su versión Enterprise incluye herramientas de administración<br />

que reducen los costos de operación al simplificar el despliegue, mejorar la fiabilidad y la<br />

facilidad de uso, mejorar el rendimiento y la escalabilidad de la solución.<br />

Dentro de las características que proporcionan estas 3 herramientas de administración<br />

destacamos:<br />

Configuraciones de seguridad<br />

Las organizaciones tanto, grandes como pequeñas, siempre desean integrar a sus<br />

sistemas de business intelligence sus directorios o sistemas de seguridad. La Enterprise<br />

Console de <strong>Pentaho</strong> provee un directorio centralizado desde donde es posible manejar las<br />

configuraciones de seguridad e integración con directorios ya existentes (por ejemplo<br />

LDAP).<br />

44


Diagnósticos de las aplicaciones<br />

Para minimizar los costos de las caídas o “downtime” de las aplicaciones <strong>BI</strong>, la Enterprise<br />

Console (consola de administración) de <strong>Pentaho</strong> incluye aplicaciones capases de<br />

diagnosticar el estado de los servicios. Esta característica provee a los usuarios<br />

administradores de herramientas para validar las configuraciones de sistemas incluyendo<br />

el acceso a repositorios, configuraciones de sistema, aplicaciones web, e email.<br />

Utilidades de repositorios<br />

La consola de administración de <strong>Pentaho</strong> (Enterprise Console, PEC) provee un set de<br />

utilidades para simplificar backups, migraciones, y para restaurar repositorios relevantes<br />

de información. La configuración de import/export permite a los administradores identificar<br />

fuentes y destinos para estos respaldos, además de especificar exactamente que se<br />

desea importar o exportar para respaldar.<br />

Manejo del ciclo de vida de la aplicación<br />

Típicamente, los administradores de sistemas no se atreven a realizar cambios en un<br />

sistema en producción de <strong>BI</strong>, por temor a una caída u otros errores. El gestor de ciclo de<br />

vida de <strong>Pentaho</strong> <strong>BI</strong> <strong>Suite</strong> Enterprise Edition permite a los administradores hacer cambios<br />

en un sistema de prueba o desarrollo, validar esos cambios, y luego implementar los<br />

cambios a los sistemas <strong>BI</strong> en producción. Adicionalmente, permite que versiones<br />

anteriores puedan ser restauradas en caso de error y/o auditadas.<br />

45


Reportes de auditoria<br />

Estos reportes ayudan a los administradores a entender y optimizar sus aplicaciones de<br />

Business Intelligence. Los reportes de auditorías proveen de insights inmediatos de la<br />

actividad de los usuarios, el rendimiento del sistema, las aplicaciones más demandadas,<br />

entre otros. Estos análisis son muy útiles para indagar sobre la utilización de las<br />

aplicaciones y el uso de los recursos de acuerdo con las políticas de uso y seguridad de la<br />

información de las empresas o instituciones. Adicionalmente, estos reportes entregan<br />

información relevante a los administradores de sistemas para constantemente optimizar y<br />

mejorar la performance de las aplicaciones.<br />

Usuarios y roles<br />

La consola de administración de <strong>Pentaho</strong> permite definir en detalle los usuarios que<br />

tendrán acceso a las aplicaciones, junto con el nivel de acceso que estos tendrán a la<br />

información. Esto se realiza a través de la configuración de usuarios y roles, en el que se<br />

define que permisos tendrá cada uno de ellos en el sistema <strong>BI</strong>. Esta configuración de<br />

cuentas de usuario puede ser rescatada a partir de sistema u repositorios que ya estén<br />

presentes en la empresa o institución. Esto finalmente, permite que cada usuario tenga<br />

acceso a la información que corresponda de acuerdo a las políticas de seguridad de la<br />

información vigentes.<br />

46


1.6. Base de conocimientos<br />

<strong>Pentaho</strong> provee a sus usuarios Enterprise de una rica base de conocimientos en línea<br />

donde encontrará manuales, videos instructivos, casos de usos, explicaciones y otro tipo<br />

de material relacionado para cada herramienta y versión de los softwares o aplicaciones<br />

<strong>Pentaho</strong>. Adicionalmente, <strong>Pentaho</strong> pone a disposición de sus usuarios un foro de consulta<br />

a la comunidad y un sistema Jira para la gestión de problemas o bugs detectados.<br />

<strong>Pentaho</strong> en su versión Enterprise responde de manera profesional a estas situaciones<br />

según las prioridades de los defectos encontrados acorde a la modalidad de suscripción<br />

del usuario.<br />

47

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!