Pentaho BI Suite - Cognus
Pentaho BI Suite - Cognus
Pentaho BI Suite - Cognus
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
<strong>Pentaho</strong> <strong>BI</strong> <strong>Suite</strong><br />
DESCRIPCION DE LA SUITE ENTERPRISE<br />
1
Índice<br />
<strong>Pentaho</strong> <strong>BI</strong> <strong>Suite</strong> ................................................................................................................ 3<br />
1.1. Descripción general ............................................................................................. 3<br />
1.2. Funcionalidades principales ............................................................................... 11<br />
1.3. Herramientas de visualización y análisis ............................................................ 12<br />
2<br />
1.3.1. Tableros de control ..................................................................................... 12<br />
1.3.2. Análisis ....................................................................................................... 17<br />
1.3.3. Reportes ..................................................................................................... 23<br />
1.3.4. Minería de Datos ........................................................................................ 27<br />
1.4. Herramientas de desarrollo <strong>Pentaho</strong> .................................................................. 29<br />
1.4.1. <strong>Pentaho</strong> Data Integration ............................................................................ 29<br />
1.4.2. <strong>Pentaho</strong> Report Designer ........................................................................... 34<br />
1.4.3. <strong>Pentaho</strong> Schema Workbench ..................................................................... 38<br />
1.4.5. <strong>Pentaho</strong> Metadata Editor ............................................................................ 41<br />
1.4.6. <strong>Pentaho</strong> Aggregation Designer ................................................................... 42<br />
1.4.7. <strong>Pentaho</strong> Design Studio ............................................................................... 43<br />
1.5. Herramientas Servidor ....................................................................................... 44<br />
1.5.1. <strong>Pentaho</strong> <strong>BI</strong> Server, <strong>Pentaho</strong> Data Integration Server y <strong>Pentaho</strong> Enterprise<br />
Console 44<br />
1.6. Base de conocimientos ...................................................................................... 47
<strong>Pentaho</strong> <strong>BI</strong> <strong>Suite</strong><br />
En este capítulo detallaremos el potencial y las funcionalidades de la suite de <strong>BI</strong> <strong>Pentaho</strong><br />
Enterprise Edition.<br />
1.1. Descripción general<br />
<strong>Pentaho</strong> es una suite de Herramientas de código abierto comercial para Inteligencia de<br />
Negocios que cuenta con todas las herramientas necesarias para cubrir el espectro<br />
completo de Inteligencia de Negocios dentro de una organización: Análisis interactivo<br />
(OLAP), Reportes, Integración de datos (ETL), Tableros de Control y Minería de datos.<br />
Adicionalmente, la plataforma provee integración con Hadoop para grandes cantidades de<br />
datos.<br />
<strong>Pentaho</strong> Corp., empresa dueña de <strong>Pentaho</strong>, fue fundada en el año 2004 por pioneros en<br />
Business Intelligence Open Source comercial provenientes de empresas como: Business<br />
Objects, Cognos, Hyperion, Jboss, Oracle, Red Hat y SAS.<br />
<strong>Pentaho</strong> hoy es socio de una amplia gama de empresas del ámbito tecnológico que, o<br />
bien integra la tecnología de <strong>Pentaho</strong> en sus aplicaciones, o empaqueta productos de<br />
<strong>Pentaho</strong> como parte de su estrategia de “go-to-market”. Estos socios han trabajado<br />
estrechamente con <strong>Pentaho</strong> para ofrecer soluciones integrales, ya sea como un software<br />
o como un servicio de implementación y consultoría estratégica. Estos socios de <strong>Pentaho</strong><br />
tienen importantes acuerdos de nivel de relación y servicio (SLA) para garantizar el éxito<br />
de sus implementaciones en clientes.<br />
3
La empresa ha sustentado su éxito en base a una astuta estrategia comercial fundada en<br />
un modelo de desarrollo de código abierto que permite la rápida innovación, obtener<br />
productos finales de alta calidad, y una reducción importante en los costos de desarrollo.<br />
Su comunidad mundial pone a prueba y contribuye constantemente al desarrollo de un<br />
producto de clase mundial.<br />
<strong>Pentaho</strong> ofrece dos versiones de su solución en base al modelo anteriormente descrito:<br />
una versión comunitaria gratuita orientada principalmente al mundo académico, y una<br />
versión Enterprise comercial orientada a la implementación profesional tanto en empresas<br />
privadas como en instituciones gubernamentales u otras sin fines de lucros que pretendan<br />
potenciar sus capacidades analíticas para mejorar su gestión. El siguiente esquema<br />
resume el modelo:<br />
Open Source Community<br />
<strong>Pentaho</strong> provee lead developers y<br />
lineamientos técnicos para el desarrollo del<br />
producto<br />
La comunidad contribuye con nuevas<br />
soluciones y se utiliza como un “test bed”<br />
para estas innovaciones<br />
Mejora eficazmente la calidad del producto<br />
mediante una rápida identificación de<br />
defectos u oportunidades de mejora<br />
4<br />
Enterprise Edition<br />
<strong>Pentaho</strong> certifica estos productos<br />
como listos para una implementación<br />
empresarial<br />
Agrega funcionalidades mejoradas y<br />
una mayor facilidad de uso e<br />
implementación.<br />
Provee soporte técnico profesional<br />
para la herramienta con altos niveles<br />
de servicio a un bajo costo de<br />
suscripción
La versión Enterprise surge luego de una importante fase de testeo interno y desarrollo<br />
propio del personal profesional de <strong>Pentaho</strong>, quien también integra sus componentes,<br />
selecciona las funcionalidades adecuadas, estabiliza el código y su instalación, crea<br />
documentación profesional, y asegura que el producto final sea robusto y esté listo para<br />
una implementación profesional.<br />
Esta estrategia ha resultado en que hoy <strong>Pentaho</strong> sea globalmente reconocido como el<br />
líder mundial en <strong>BI</strong> Open Source a través de una gran cantidad de premios:<br />
5<br />
- InfoWorld Bossie Awards<br />
- Red Herring 100 winner,<br />
- Google Code,<br />
- Top 10 Information Week,<br />
- Project of the month SourceForge.net,<br />
- Jboss Innovation,<br />
- Jolt Productivity Award,<br />
- Miss Strategic 100,<br />
- Tech 50,<br />
- Editor’s Choice Award Intelligent Enterprise,<br />
- Product of the year Searchdatamanagement.com,<br />
- InformationWeek Startup 50.<br />
La suite <strong>Pentaho</strong> está fundada en altos estándares, es modular, de plataforma embebible<br />
y se basa en una metodología de desarrollo corporativa que incluye un plan de trabajo<br />
detallado y transparente, además de un control de calidad extensivo.
A continuación presentamos una tabla con una descripción detallada según la versión:<br />
Software y Servicios Community Edition Enterprise Edition<br />
Reporting Open Source Certificado<br />
Analysis Open Source Certificado<br />
Dashboards Open Source Certificado<br />
Data Integration / ETL Open Source Certificado<br />
Business Intelligence Platform Open Source Certificado<br />
Data Mining Open Source Certificado (Add-On)<br />
Interacción con foros de la comunidad<br />
Ambiente de desarrollo unificado para<br />
Agile <strong>BI</strong><br />
Documentación Web comunitaria (wiki)<br />
Soporte profesional<br />
6<br />
� Soporte telefónico<br />
� Soporte a través de e-mail<br />
� Acuerdo de nivel de servicios (SLA)<br />
� Ilimitados casos de soporte<br />
Mantención del software<br />
� Mantención del software Por personal interno<br />
� Acceso a parches<br />
� Fixes incluidos en futuras versiones<br />
Por ingenieros<br />
<strong>Pentaho</strong>
Funcionalidades mejoradas<br />
7<br />
� <strong>Pentaho</strong> Analyzer<br />
� Formateo condicional<br />
� Navegación en profundidad de<br />
detalle<br />
� Dashboard Designer para usuarios<br />
finales, drag and drop.<br />
� <strong>Pentaho</strong> Enterprise Console<br />
� Single Sign-On<br />
� Configuración de seguridad<br />
simplificada<br />
� Diagnóstico de la aplicación<br />
� Herramientas del repositorio<br />
� Administración del ciclo de vida<br />
� Reportes de auditoría<br />
� Expiración de contenido automática<br />
� Clustering<br />
� Monitoreo de desempeño<br />
� Administración y monitoreo de ETL<br />
� Seguridad avanzada<br />
� Integración con LDAP/MSAD de<br />
terceros<br />
� Administración de usuarios y roles<br />
controlando las acciones de<br />
usuarios y roles
8<br />
� Seguridad de permisos al contenido<br />
(dueño, crear, leer, actualizar,<br />
borrar)<br />
� Seguridad del repositorio mejorada<br />
� Administración de contenido<br />
mejorada<br />
� Administración y programación de<br />
tareas remota<br />
� Repositorio del equipo de desarrollo<br />
incluyendo versionamiento y locking<br />
� <strong>BI</strong> suite para Hadoop<br />
Software certificado<br />
� Software estabilizado<br />
� Ciclo de versiones administrado<br />
� Builds optimizados<br />
Expertise en el producto<br />
� Documentación profesional<br />
� Base de conocimiento<br />
� Soporte a consultas<br />
� Paquetes de asistencia remota<br />
� Paquetes de<br />
Instalación/configuración<br />
� Paquetes de diseño e integración<br />
� Paquetes de resolución de<br />
problemas y optimización<br />
� Foro en línea Enterprise Edition<br />
� Entrenamiento basado en Web<br />
(Add-on)
Company Size<br />
Adoptado por clientes de diversas industrias, <strong>Pentaho</strong> es actualmente la solución de <strong>BI</strong><br />
con mayor crecimiento anual en el mundo. Algunos de los clientes <strong>Pentaho</strong> con permiso<br />
de mención:<br />
$5 Million $1 Billion $5 Billion +<br />
En lo que sigue del documento se presentarán los distintos módulos que contiene la<br />
solución. Cabe destacar que éstos permiten el desarrollo de una solución completa e<br />
integral sin requerir de otros complementos.<br />
Dentro de sus módulos se incluye:<br />
<strong>Pentaho</strong> Data Integration: Limpia e integra datos desde donde sea que se<br />
encuentren.<br />
<strong>Pentaho</strong> Reporting: Accede a los datos y provee información de alto valor a la<br />
organización.<br />
<strong>Pentaho</strong> Analysis: Permite explorar y analizar los datos de manera interactiva,<br />
rápida y ágil.<br />
9<br />
Industry<br />
Retail Manufacturing Pharma Healthcare Financial Telecom Transportation Education Government
<strong>Pentaho</strong> Dashboards: Entrega resúmenes de información y métricas de alto valor<br />
a través de una interfaz interactiva y fácil de comprender<br />
<strong>Pentaho</strong> Data Mining: Descubre patrones escondidos en los datos, y permite<br />
predecir eventos futuros.<br />
10
1.2. Funcionalidades principales<br />
La suite de herramientas de <strong>Pentaho</strong> permite elegir entre el uso completo de las<br />
herramientas o la utilización específica de ciertas herramientas para resolver los<br />
problemas de negocio.<br />
La arquitectura de la solución puede ser representada mediante el siguiente esquema:<br />
Como se puede ver, sus componentes permiten el desarrollo e implementación de un<br />
proyecto completo de Business Intelligence, sin la necesidad de herramientas adicionales.<br />
Una especificación de herramientas por área se detalla a continuación:<br />
11
1.3. Herramientas de visualización y análisis<br />
1.3.1. Tableros de control<br />
La herramienta de tableros de control de <strong>Pentaho</strong> provee inmediatas ideas para el<br />
rendimiento individual, departamental o empresarial. A través de la definición de métricas<br />
claves en una interfaz visual atractiva e intuitiva, los tableros de control de <strong>Pentaho</strong><br />
entregan a los usuarios de negocio la información crítica necesaria para entender y<br />
mejorar el rendimiento organizacional.<br />
Una de sus características más atractivas es la integración nativa con Google Maps que le<br />
entregan capacidades de visualización geográfica. Estas capacidades permiten el<br />
desarrollo de potentes soluciones de geomarketing, sistemas de gestión territorial,<br />
tableros de control georreferenciados y mapeo de indicadores a lugares geográficos para<br />
modelos de gestión que incorporan la variable de localización.<br />
Los tableros de control de <strong>Pentaho</strong> proveen:<br />
� Interfaz rica e interactiva incluyendo visualizaciones basadas en Adobe Flash para<br />
que los usuarios de negocio puedan inmediatamente realizar un seguimiento de las<br />
métricas de negocio definidas, y ver cuáles necesitan atención. Diseñador de tableros<br />
de control que permite a los usuarios de negocio crear tableros personalizados y sin<br />
entrenamiento<br />
� Integración con Reportes de <strong>Pentaho</strong>, y Análisis de <strong>Pentaho</strong> para que los usuarios<br />
puedan navegar a través de la información de los reportes y análisis para entender<br />
que factores contribuyen para bien o para mal en el rendimiento.<br />
� Integración con el Portal que hace más fácil la entrega de métricas relevantes para el<br />
negocio a grandes cantidades de usuarios, integradas de manera transparente en su<br />
aplicación.<br />
� Alertas integradas para monitorear continuamente las excepciones y notificar a los<br />
usuarios para tomar decisiones.<br />
� Capacidades intuitivas de administración de métricas que permiten la definición y<br />
seguimiento de indicadores críticos a nivel individual, departamental u organizacional.<br />
12
A continuación presentamos algunos ejemplos:<br />
13
1.3.2. Análisis<br />
La herramienta de análisis de <strong>Pentaho</strong> entrega el poder analítico en las manos de los<br />
usuarios del negocio, ayudándolos a obtener ideas y entender las necesidades para<br />
realiza óptimas decisiones de negocio. Por ejemplo, si un reporte muestra que las ventas<br />
están por bajo lo esperado, los usuarios de negocio necesitan ser capaces de fácilmente<br />
descubrir el problema subyacente a través de la obtención de respuestas como:<br />
� ¿Es el problema específico a una línea de productos o ciertas regiones?<br />
� ¿Cuál es la diferencia entre productos o regiones con poco rendimiento y aquellos<br />
17<br />
con buen rendimiento?<br />
� ¿Existe un problema relacionado con la plantilla de ventas? ¿Campañas de<br />
marketing? ¿Algo más?<br />
La herramienta de análisis de <strong>Pentaho</strong> permite responder este tipo de preguntas de<br />
negocio a través de:<br />
� Facilitar a los usuarios la exploración libre y completa de la información de negocio a<br />
través de un análisis interactivo con distintos grados de profundidad y horizontalidad<br />
de la información.<br />
� Proveer rápidos tiempos de respuesta para consultas analíticas complejas.<br />
� Presentar multidimensionalmente los datos y permitiendo que los usuarios<br />
seleccionar que dimensiones y medidas desean explorar.<br />
� Ofrecer completa integración con otros productos en la suite <strong>Pentaho</strong><br />
� Resultados explorables y navegables incluso en los gráficos<br />
� Sofisticadas capacidades OLAP, arquitectura ROLAP<br />
� Técnicas de optimización para mejoras de tiempos de respuesta<br />
� Capacidad de manejo de gran número de dimensiones para análisis por múltiples<br />
atributos<br />
� Soporte a estándares como MDX y OLAP4J y arquitectura moderna basada 100% en<br />
J2EE, repositorio basado en XML<br />
� Soporta conectividad vía JDBC con bases de datos propietarias y open source.<br />
� Todos los componentes expuestos vía Web Services para integración con SOA’s
<strong>Pentaho</strong> Analyzer: Tecnología de análisis de vanguardia<br />
El análisis exploratorio de datos (EDA) en las herramientas de Business Intelligence<br />
típicamente se realiza por medio de la manipulación de cubos multidimensionales OLAP.<br />
Estos cubos son básicamente una manera de representar los datos a trabajar, separando<br />
las variables en Dimensiones y Medidas.<br />
<strong>Pentaho</strong> tradicionalmente ha ofrecido la herramienta JPivot para hacer este tipo de<br />
análisis, pero recientemente se ha anunciado la integración de una nueva herramienta:<br />
<strong>Pentaho</strong> Analyzer. Ésta ofrece importantes mejoras de funcionalidad y facilidad de uso<br />
para los usuarios finales, entre los que podemos mencionar:<br />
18<br />
� Drag and Drop de Campos (se arrastran)<br />
� Panel de filtros<br />
� Ordenamiento y Filtrado (inclusión/exclusión) con un click<br />
� Medidas definidas por el usuario<br />
� Permite cambiar tamaño y formatos de columnas dinámicamente<br />
� Agregar/quitar subtotales<br />
� Gráficos mejorados<br />
Además de mantener otras características como ser 100% web, permitir guardar las vistas<br />
y compartirlas con otros analistas y exportar a Excel, PDF o CSV.<br />
Otras características técnicas para destacar<br />
� Componentes 100% J2EE para mayor escalabilidad, portabilidad e<br />
integración.<br />
� Repositorios basados en XML<br />
� JDBC 2.0 compilant<br />
� Soporta conectividad vía JDBC a bases de datos propietarias como Oracle,<br />
IBM DB2, Microsoft SQL Server, NCR Teradata, entre otros.<br />
� Soporta conectividad vía JDBC a distintas bases de datos libres como<br />
MySQL, PostgreSQL, EnterpriseDB, entre otras.<br />
� Soporta OLAP4J API<br />
� Todos los componentes son expuestos a través de Web Services para una<br />
fácil integración en Arquitecturas Orientadas a Servicios (SOAs)<br />
Otra componente de <strong>Pentaho</strong> Analyzer es el Ad Hoc Reporting Interface. Esta<br />
componente es una interfaz web interactiva “drag and drop” para que el usuario genere<br />
sus propios reportes en base a los data sources que estén disponibles. Crear reportes es<br />
tan fácil como seguir los pasos propuestos: elegir los datos, ordenarlos, seleccionar los<br />
filtros que se necesiten y asignar un template. Para customizarlos, es posible integrar la<br />
solución con <strong>Pentaho</strong> Report Designer.
Interfas de Wizard de Ad Hoc Reporting:<br />
Finalmente, en esta misma herramienta se incluye <strong>Pentaho</strong> Dashboard Designer, que<br />
permite a los usuarios de negocios crear dashboars personalizados de manera rápida y<br />
fácil para controlar las estadísticas de la organización, indicadores, etc. Seleccionando<br />
sobre en una biblioteca de plantillas o simplemente arrastrando y soltando elementos al<br />
tablero de instrumentos, los usuarios pueden incorporar sus informes favoritos, gráficos y<br />
vistas interactivas de análisis.<br />
<strong>Pentaho</strong> Dashboard Designer también permite a los usuarios de negocio crear nuevas<br />
visualizaciones de datos tabulares y gráficos desde cero mediante la utilización de la capa<br />
de metadatos centralizada de <strong>Pentaho</strong> para consultar los datos sin el conocimiento de las<br />
estructuras de base de datos subyacente o SQL. Controles de filtro incorporados permiten<br />
a los usuarios definir el nivel de información a mostrar en el tablero, la sincronización de<br />
todos los indicadores para una región específica, período de tiempo, entre otros.<br />
19
Vista de <strong>Pentaho</strong> Dashboard Designer:<br />
20
A continuación presentamos algunos ejemplos de la visualización en Analyzer:<br />
Vista de panel de trabajo drag and drop sobre un cubo OLAP:<br />
21
Vista de construcción de gráficas drag and drop sobre un cubo OLAP:<br />
Vista de construcción de gráficas drag and drop sobre un cubo OLAP:<br />
22
Vista de construcción de paneles en Jpivot drag and drop sobre un cubo OLAP:<br />
1.3.3. Reportes<br />
Todas las organizaciones utilizan reportes de una u otra manera. Por lo que los reportes<br />
son considerados una necesidad principal de la Inteligencia de Negocio, y son<br />
frecuentemente la primera aplicación utilizada. Los reportes de <strong>Pentaho</strong> permiten a las<br />
organizaciones fácil acceso, formato y distribución de la información hacia los empleados,<br />
proveedores, etc.<br />
Las características principales de la herramienta de reportes de <strong>Pentaho</strong> son:<br />
23<br />
� Implementación flexible, desde solución standalone de escritorio, a<br />
reportes interactivos<br />
� Amplio soporte a fuentes de datos incluyendo datos relacionales, OLAP o<br />
basados en XML<br />
� Opciones de formato de salida de reportes flexible, incluyendo Adobe PDF,<br />
HTML, Microsoft Excel, Rich Text Format o archivos de texto plano<br />
� Herramienta gráfica (Report Designer) para desarrolladores de reportes.<br />
Diseño de reportes asistido (wizard) para creación fácil y rápida<br />
� Consultas y reportes ad hoc basados en web para usuarios de negocio<br />
� Diseñador de reportes gráfico completo para desarrolladores de reportes.<br />
A continuación presentamos algunos ejemplos:
Visualización de reportes en la consola de usuario (panel de trabajo):<br />
24
Ejemplo de reporte imprimible en formato PDF:<br />
25
1.3.4. Minería de Datos<br />
Una vez que se cuenta con análisis, reportes y tableros de control, es tiempo de llevar la<br />
Inteligencia de Negocios al próximo nivel, a través de los análisis avanzados y la minería<br />
de datos.<br />
Este nivel de excelencia de Inteligencia de Negocios no ha sido conseguido por muchas<br />
grandes organizaciones, y es por esto, que no se debe subestimar la importancia de<br />
trabajar con avanzadas capacidades, ya que estas proveen una ventaja verdadera<br />
sostenible y competitiva que permite a la organización maximizar la eficiencia y eficacia.<br />
El proceso de minería de datos consiste en aplicar sofisticados algoritmos sobre los datos<br />
para descubrir patrones y correlaciones significativos que de otra manera pueden seguir<br />
estando ocultos. Estos pueden ser utilizados para ayudar a comprender mejor el negocio<br />
y también explotar y mejorar el rendimiento futuro a través del análisis predictivo.<br />
Por ejemplo, la minería de datos puede alertar que existe una alta probabilidad de que un<br />
cliente específico no pague en el plazo basado en los análisis de clientes con similares<br />
características<br />
Para ayudar a utilizar completamente la ventaja que entrega la minería de datos en la<br />
organización, el equipo de proyecto de <strong>Pentaho</strong> ha trabajado en conjunto con las<br />
comunidades de desarrollo y negocio para integrar las capacidades del flujo principal de<br />
Inteligencia de Negocios con avanzada minería de datos.<br />
La minería de datos de <strong>Pentaho</strong> es diferenciada por ser abierta, cumplir con los<br />
estándares, utilizar la tecnología de minería de datos de la Aplicación “Weka”, y por su<br />
integración con núcleos de Inteligencia de Negocio como Reportes, Análisis y Tableros de<br />
Control. Otras herramientas de minería de datos no poseen este nivel de sofisticación e<br />
integración.<br />
27<br />
� Poderoso motor de minería de datos provee de un set de algoritmos de<br />
aprendizaje del proyecto Weka incluyendo clustering, segmentación,<br />
árboles de decisión, random forests, redes neuronales y análisis de<br />
componentes principales, entre otros<br />
� Integración de <strong>Pentaho</strong> Data Integration, automatización de procesos de<br />
transformación de datos al formato que requiere el motor de data mining<br />
� Los algoritmos pueden ser aplicados directamente a un set de datos o<br />
invocados desde código Java<br />
� Provee filtros para discretización, normalización, re-muestreo, selección de<br />
atributos, transformación y combinación de atributos<br />
� Modelos para predicción de variables nominales o numéricas<br />
� Herramientas gráficas de diseño para pre procesamiento de datos,<br />
regresión, clustering, reglas de asociación
La herramienta de minería de datos de <strong>Pentaho</strong> puede ser utilizada como:<br />
28<br />
� Una solución innovadora para la utilización inmediata por parte de los<br />
analistas. Para la preocupación de los operadores de minería de datos,<br />
ésta opera completamente en segundo plano, los usuarios ven los<br />
resultados y recomendaciones a través de correos y otras páginas web, las<br />
cuales pueden incluir tableros de control de <strong>Pentaho</strong>.<br />
� Un conjunto de componente que permite a los desarrolladores Java<br />
rápidamente crear soluciones de reportes personalizables usando objetos<br />
Java o Java Server Pages (JSPs). Estos pueden ser integrados con otras<br />
aplicaciones o portales.<br />
� En conjunto con otros componentes de la suite de herramientas de<br />
<strong>Pentaho</strong>.
1.4. Herramientas de desarrollo <strong>Pentaho</strong><br />
1.4.1. <strong>Pentaho</strong> Data Integration<br />
Los datos se encuentran en todos lados. Proveer una versión consistente y única de la<br />
verdad a través de distintas fuentes de información es uno de los retos más grandes que<br />
las organizaciones deben enfrentar. La herramienta de integración de datos de <strong>Pentaho</strong><br />
entrega una poderosa capacidad de Extracción, Transformación y Carga de datos<br />
usando una solución innovadora basada en metadatos. Esta herramienta provee un<br />
ambiente de diseño intuitivo, gráfico y de tipo “drag and drop”, además de una<br />
arquitectura escalable, basada en altos estándares.<br />
Esta herramienta ha sido catalogada por la comunidad <strong>BI</strong> a nivel mundial como de<br />
altísima calidad. En resumen, permite rápida y eficientemente extraer datos,<br />
transformarlos, limpiarlos, validarlos, cargarlos, etc. desde donde quiera que se<br />
encuentren.<br />
Algunas características:<br />
29<br />
� Librería de transformaciones completa con más de 100 objetos de mapeo.<br />
� 100% Java, amplio soporte multi plataforma y soporte de una amplia<br />
cantidad de fuentes de datos, incluyendo aplicaciones integradas, sobre 30<br />
plataformas propietarias y open source, archivos planos, documentos<br />
Excel, y más.<br />
� Soporte avanzado de “warehousing” para cambios lentos y dimensiones<br />
basura.<br />
� Rendimiento y escalabilidad probado de nivel empresarial.<br />
� Herramienta gráfica de muy fácil uso (control lógico de flujo).<br />
� Basado en repositorio facilita re uso de componentes de transformación,<br />
colaboración y administración de modelos, conexiones, logs, etc.<br />
� Performance y escalabilidad de clase Enterprise con soporte a<br />
procesamiento masivo paralelo (MPP) a través de ejecución en cluster.<br />
� Monitoreo y Debugger integrado<br />
� Scheduler (Calendario programador de transformaciones y jobs)
Algunas de las conexiones a bases de datos que soporta:<br />
30<br />
� AS/400<br />
� Apache Derby<br />
� Borland Interbase<br />
� Calpont InfiniDB<br />
� Firebird SQL<br />
� Generic database<br />
� Greenplum<br />
� Gupta SQL Base<br />
� H2<br />
� Hypersonic<br />
� IBM DB2<br />
� Infobright<br />
� Informix<br />
� Ingres<br />
� Inersystems Cache<br />
� KingbaseES<br />
� Lucid DB<br />
� MS Acces<br />
� MS SQL Server<br />
� MS SQL Server (Native)<br />
� MaxDB (SAP DB)<br />
� Monet DB<br />
� MySQL<br />
� Neoview<br />
� Netezza<br />
� Oracle<br />
� Oracle RDB<br />
� Palo MOLAP Server<br />
� PosrtgreSQL<br />
� Remedy Action Request System<br />
� Sap ERP System<br />
� SQLite<br />
� Sybase<br />
� SybaseIQ<br />
� Teradata<br />
� UniVerse database<br />
� Vertica<br />
� dBase III, IV o 5.
A continuación presentamos algunos ejemplos:<br />
Construcción de ETL mediante flujo lógico:<br />
Validación de datos en el flujo:<br />
31
Conexiones a bases de datos:<br />
Job de tareas y transformaciones programadas:<br />
32
Calendarización y programación de rutinas automatizadas:<br />
33
1.4.2. <strong>Pentaho</strong> Report Designer<br />
Todas las empresas o instituciones necesitan consultar reportes. En general, esta labor<br />
no se encuentra automatizada, lo que finalmente genera que el área de TI esté saturada<br />
con peticiones de reportes, dedicando gran parte de sus recursos a esta labor. Esta<br />
aplicación de <strong>Pentaho</strong> proporciona todas las herramientas necesarias para que estos<br />
sean diseñados y publicados para ser consultados fácilmente via web por quienes lo<br />
requieran.<br />
Dentro de sus características destacamos:<br />
34<br />
� Diseñador gráfico Drag-and-drop que proporciona un control completo de<br />
acceso a datos, diseño, agrupación, cálculos, gráficos y formato para<br />
informes “pixel-perfect”<br />
� Incorpora un wizard paso a paso, que guía al usuario durante el proceso de<br />
diseño<br />
� Provee plantillas de alto nivel, predefinidas para agilizar el proceso de<br />
diseño del reporte sin mermar la consistencia de este mismo ni su look<br />
� Permite crear parámetros para que el usuario final personalice la<br />
información que quiere desplegar en el reporte<br />
� Permite que los reportes sean publicados al <strong>BI</strong> Server desde la misma<br />
interfaz para que los usuarios seleccionados puedan ver los reportes a<br />
través de su cuenta <strong>Pentaho</strong> Analyzer
A continuación presentamos algunos ejemplos:<br />
Wizard guiado para fácil construcción de reportes:<br />
35
Personalizacion del reporte:<br />
Ejemplo producto final:<br />
36
1.4.3. <strong>Pentaho</strong> Schema Workbench<br />
Esta herramienta de la suite <strong>Pentaho</strong> tiene como objetivo facilitar la tarea de diseño de<br />
cubos OLAP. Su sencilla interfaz permite modelar un XML con el diseño del cubo a través<br />
de opciones lógicas e intuitivas que no requieren de un manejo avanzado de este formato<br />
de archivo.<br />
Dentro de sus características destacamos:<br />
38<br />
� Diseñador intuitivo de esquemas OLAP<br />
� Permite crear, editar, actualizar y publicar esquemas OLAP para ser<br />
desplegados por aplicaciones de visualización <strong>Pentaho</strong>.<br />
� Acelera de manera considerable la construcción e implementación de este<br />
tipo de soluciones.<br />
<strong>Pentaho</strong> Schema Workbench permite mejorar considerablemente los tiempos de<br />
desarrollo y deployment en la implementacion de proyectos de soluciones analíticas.
A continuación presentamos algunos ejemplos:<br />
Construyendo y publicando un XML con el diseño de un cubo OLAP a través de un menú<br />
intuitivo:<br />
39
Generando una query MDX:<br />
40
1.4.5. <strong>Pentaho</strong> Metadata Editor<br />
Esta herramienta de <strong>Pentaho</strong> permite definir modelos de negocio integrando datos de<br />
distintas fuentes para posteriormente ser utilizado en reportaría de auto servicio (ad-oc),<br />
tableros de control, gráficos y tablas.<br />
<strong>Pentaho</strong> Metadata Editor (PME) es una herramienta que permite crear dominios de<br />
metadatos y modelos. El objetivo es mapear la estructura física de la base de datos a un<br />
modelo lógico de negocio. Estas asignaciones se almacenan en un repositorio de<br />
metadatos centralizados que permite a los administradores<br />
41<br />
� Crea definiciones o reglas para tablas de bases de datos complejas o<br />
crípticas<br />
� Reduce el costo y el impacto asociado a los cambios de bajo nivel en las<br />
base de datos<br />
� Define parámetros de seguridad para limitar el acceso de los usuarios a<br />
los datos<br />
A continuación presentamos una vista de la aplicación:
1.4.6. <strong>Pentaho</strong> Aggregation Designer<br />
Esta herramienta de <strong>Pentaho</strong> permite optimizar la performance y los tiempos de respuesta<br />
de un cubo multidimensional. Si la consultas que se pretenden realizar son muy costosas<br />
en términos de rendimiento, la herramienta entrega una recomendación para crear tablas<br />
agregadas y pre guardar ciertos niveles de agregación.<br />
Dentro de sus características destacamos:<br />
42<br />
� <strong>Pentaho</strong> Aggregation Designer analiza la estructura de la base de datos en<br />
cuestión o del esquema OLAP y automáticamente genera tablas agregadas<br />
para un mayor performance en la ejecución de querys<br />
� Identifica costos y beneficios de las recomendaciones en base al tamaño de las<br />
tablas que pretende agregar y a las mejoras en tiempo de respuesta.<br />
� Automáticamente crea las tablas recomendadas, las puebla, y actualiza el<br />
esquema OLAP.<br />
A continuación presentamos una vista de la aplicación:
1.4.7. <strong>Pentaho</strong> Design Studio<br />
<strong>Pentaho</strong> Design Studio es una colección de editores, viewers, y módulos de<br />
administración, integrados en una sola aplicación que ofrece un entorno gráfico para crear<br />
y probar Action Sequences y JFree reports. La herramienta permite extender las<br />
potencialidades de la suite, y customizar de manera considerable las soluciones por<br />
desarrollar.<br />
Se basa en Eclipse software de desarrollo de código abierto que proporciona un sólido<br />
ambiente, con funciones de calidad comercial para el desarrollo de herramientas<br />
altamente integradas.<br />
A continuación presentamos una vista de la aplicación:<br />
43
1.5. Herramientas Servidor<br />
1.5.1. <strong>Pentaho</strong> <strong>BI</strong> Server, <strong>Pentaho</strong> Data Integration Server y <strong>Pentaho</strong> Enterprise<br />
Console<br />
La suite <strong>BI</strong> de <strong>Pentaho</strong> en su versión Enterprise incluye herramientas de administración<br />
que reducen los costos de operación al simplificar el despliegue, mejorar la fiabilidad y la<br />
facilidad de uso, mejorar el rendimiento y la escalabilidad de la solución.<br />
Dentro de las características que proporcionan estas 3 herramientas de administración<br />
destacamos:<br />
Configuraciones de seguridad<br />
Las organizaciones tanto, grandes como pequeñas, siempre desean integrar a sus<br />
sistemas de business intelligence sus directorios o sistemas de seguridad. La Enterprise<br />
Console de <strong>Pentaho</strong> provee un directorio centralizado desde donde es posible manejar las<br />
configuraciones de seguridad e integración con directorios ya existentes (por ejemplo<br />
LDAP).<br />
44
Diagnósticos de las aplicaciones<br />
Para minimizar los costos de las caídas o “downtime” de las aplicaciones <strong>BI</strong>, la Enterprise<br />
Console (consola de administración) de <strong>Pentaho</strong> incluye aplicaciones capases de<br />
diagnosticar el estado de los servicios. Esta característica provee a los usuarios<br />
administradores de herramientas para validar las configuraciones de sistemas incluyendo<br />
el acceso a repositorios, configuraciones de sistema, aplicaciones web, e email.<br />
Utilidades de repositorios<br />
La consola de administración de <strong>Pentaho</strong> (Enterprise Console, PEC) provee un set de<br />
utilidades para simplificar backups, migraciones, y para restaurar repositorios relevantes<br />
de información. La configuración de import/export permite a los administradores identificar<br />
fuentes y destinos para estos respaldos, además de especificar exactamente que se<br />
desea importar o exportar para respaldar.<br />
Manejo del ciclo de vida de la aplicación<br />
Típicamente, los administradores de sistemas no se atreven a realizar cambios en un<br />
sistema en producción de <strong>BI</strong>, por temor a una caída u otros errores. El gestor de ciclo de<br />
vida de <strong>Pentaho</strong> <strong>BI</strong> <strong>Suite</strong> Enterprise Edition permite a los administradores hacer cambios<br />
en un sistema de prueba o desarrollo, validar esos cambios, y luego implementar los<br />
cambios a los sistemas <strong>BI</strong> en producción. Adicionalmente, permite que versiones<br />
anteriores puedan ser restauradas en caso de error y/o auditadas.<br />
45
Reportes de auditoria<br />
Estos reportes ayudan a los administradores a entender y optimizar sus aplicaciones de<br />
Business Intelligence. Los reportes de auditorías proveen de insights inmediatos de la<br />
actividad de los usuarios, el rendimiento del sistema, las aplicaciones más demandadas,<br />
entre otros. Estos análisis son muy útiles para indagar sobre la utilización de las<br />
aplicaciones y el uso de los recursos de acuerdo con las políticas de uso y seguridad de la<br />
información de las empresas o instituciones. Adicionalmente, estos reportes entregan<br />
información relevante a los administradores de sistemas para constantemente optimizar y<br />
mejorar la performance de las aplicaciones.<br />
Usuarios y roles<br />
La consola de administración de <strong>Pentaho</strong> permite definir en detalle los usuarios que<br />
tendrán acceso a las aplicaciones, junto con el nivel de acceso que estos tendrán a la<br />
información. Esto se realiza a través de la configuración de usuarios y roles, en el que se<br />
define que permisos tendrá cada uno de ellos en el sistema <strong>BI</strong>. Esta configuración de<br />
cuentas de usuario puede ser rescatada a partir de sistema u repositorios que ya estén<br />
presentes en la empresa o institución. Esto finalmente, permite que cada usuario tenga<br />
acceso a la información que corresponda de acuerdo a las políticas de seguridad de la<br />
información vigentes.<br />
46
1.6. Base de conocimientos<br />
<strong>Pentaho</strong> provee a sus usuarios Enterprise de una rica base de conocimientos en línea<br />
donde encontrará manuales, videos instructivos, casos de usos, explicaciones y otro tipo<br />
de material relacionado para cada herramienta y versión de los softwares o aplicaciones<br />
<strong>Pentaho</strong>. Adicionalmente, <strong>Pentaho</strong> pone a disposición de sus usuarios un foro de consulta<br />
a la comunidad y un sistema Jira para la gestión de problemas o bugs detectados.<br />
<strong>Pentaho</strong> en su versión Enterprise responde de manera profesional a estas situaciones<br />
según las prioridades de los defectos encontrados acorde a la modalidad de suscripción<br />
del usuario.<br />
47