PENTAHO BI (Open Source) Introducción Taller Técnicos PENTAHO – Junio 2011

PENTAHO BI (Open Source)
Introducción
Taller Técnicos PENTAHO – Junio 2011

Introducción a Pentaho BI:


Componentes de la Plataforma






Enterprise & Community.
Pentaho Reporting
Análisis de Datos (Mondrian – JPIVOT)
Dashboard
Pentaho Data Integration
Data Mining - WEKA
Instalación y Administración de Pentaho BI Comunity:

Consola administrativa:





Definición de Datasource
Usuarios y Roles
Repositorio
Consola de Usuario
Taller Pentaho Junio 2011
UNNOBA
¿Qué es Business Intelligence?

“Inteligencia de Negocios es el proceso de convertir datos en
conocimientos y el conocimiento en acción, para la toma de
decisiones”
DATOS

ANÁLISIS
CONOCIMIENTO
Tecnologías involucradas:

Data Warehouse

Reporting

Análisis OLAP (On-line Analytical Processing)

Dashboards

Integración de datos (ETL – Extract, Transform and load)

Minería de datos
Taller Pentaho Junio 2011
UNNOBA
Círculo virtuoso de la información
DATOS
ANÁLISIS
¿Qué pasó? - ¿Qué pasa ahora? - ¿Por qué pasó? - ¿Qué pasará?
Taller Pentaho Junio 2011
UNNOBA
Beneficios






Crear un círculo virtuoso de la información ( datos – información –
mejores decisiones – generan nuevos datos)
Permite una visión única, histórica, persistente y de calidad de la
información.
Crear, manejar y mantener KPI (indicadores de rendimiento) y KGI
ATOS
ANÁLISIS
CONOCIMIENTO
(indicadores de metas).
Aporta información actualizada.
Reduce la brecha de orientación de negocios entre el departamento de
IT y la organización.
Mejorar la competitividad como resultado de ser capaces de:
 Diferenciar lo relevante de lo superfluo
 Acceder más rápido a la información
 Tener mayor agilidad en la toma de decisiones.
Taller Pentaho Junio 2011
UNNOBA
¿Cuándo es necesaria la inteligencia de negocio?

La toma de decisiones es realizada en forma intuitiva.

Se detectan problemas de calidad de información.

ATOS
Excel Caos
= uso intensivo deANÁLISIS
Excel como herramienta
de análisis.
CONOCIMIENTO
Cada usuario con un archivo personalizado, por lo que la información
es inconsistente entre las áreas y el costo de sincronización elevado.

Necesidad de cruzar información entre áreas.

Se ha alcanzado una masa crítica de datos.

Es necesario automatizar los procesos de extracción y distribución de
la información.
Taller Pentaho Junio 2011
UNNOBA
¿Cómo detectar que no existe una estrategia de BI?

Los usuarios identifican al departamento de IT como origen de sus problemas
de inteligencia de negocios.

El nivel jerárquico más alto considera que BI representa otro centro de costo.

El departamento de IT continúa preguntando a los usuarios finales sobre las
ATOS
ANÁLISIS
CONOCIMIENTO
necesidades
de los reportes.

El sistema de BI está soportado por una Mesa de Ayuda

No es posible medir el uso del sistema de BI

No hay un plan para desarrollar, contratar, retener y aumentar el equipo de BI.

No existe un responsable funcional (o bien el asignado no es el adecuado).

Existen múltiples soluciones que repiten funcionalidad.

Alguien cree que es un éxito que la información consolidada esté disponible a
los usuarios finales al cabo de 2 semanas.

Los usuarios creen que la información en el DW no es correcta.
Taller Pentaho Junio 2011
UNNOBA
Fases de un Proceso BI
DATOS
ANÁLISIS

Fase 1: recolectar los requerimientos de información específicos

Fase 2: extraer de las diferentes fuentes de información.

Fase 3: se integran y cargan los datos en crudo en un formato utilizable para el
análisis.

Fase 4: se obtendrán las respuestas a las preguntas, mediante la creación de
reportes, indicadores de rendimiento, cuadros de mando, gráficos estadísticos, etc.

Fase 5: explorar los datos de manera sencilla e intuitiva.
Taller Pentaho Junio 2011
UNNOBA
¿Porqué Open Source BI?

La solución elegida debería ser evaluada según los siguientes
criterios:
 Adaptabilidad a todos los entornos.
 Sin costos de licencias
 Independencia
del proveedor
DATOS
ANÁLISIS
 Garantías de permanencia. Upgrades y mejoras frecuentes
 Tendencia a la calidad y utilización de estándares (XML –
MDX)
 Dedicación full a los servicios y a la solución de negocios.
 Gran aprovechamiento de Web Services.
 La comunidad del software libre
Taller Pentaho Junio 2011
UNNOBA
Plataforma Pentaho Open Source BI

Características más importantes:
 Aplicación web desarrollada en J2EE. Modular.
 Servidor Web: puede correr en servidores compatibles
con J2EE como JBOSS AS, WebSphere, Tomcat,
WebLogic
y Oracle AS.
DATOS
ANÁLISIS
 Base de datos: vía JDBC, DB2, Microsft SQL Server,
MySQL, Oracle, PostgreSQL, Firebird, etc.
 Sistema operativo: Multiplataforma.
 Repositorio de datos basado en XML.
 Todos los componentes están expuestos vía Web Services
 Incluye: ETL, Reporting, OLAP, Data mining, Dashboards, etc.
 Licencia: GNU GPL.
Taller Pentaho Junio 2011
UNNOBA
Plataforma Pentaho Open Source BI

Estrategia “open core”: a partir de un núcleo open source se
ofrecen servicios y módulos mejorados.

Existen dos versiones disponibles de Pentaho:
DATOS

ANÁLISIS
Pentaho Community Edition
Completamente gratuita

Pentaho Enterprise Edition
Se ofrece bajo modalidad de subscripción
Taller Pentaho Junio 2011
UNNOBA
Plataforma Pentaho Open Source BI

Pentaho Community Edition
Versión comunitaria, sin costos de licencia, sin servicios de
soporte asociados.
 Es una suite completa con todas las funcionalidades necesarias
DATOS
ANÁLISIS
para el correcto desarrollo de proyectos de BI.
 AfPentaho soló la recomienda para:
 Aficionados al BI
 Académicos
 Programadores de Software Abierto
 Es totalmente software de código abierto, la licencia en su
mayoría bajo la versión GNU.
 http://community.pentaho.com/

Taller Pentaho Junio 2011
UNNOBA
Plataforma Pentaho Open Source BI


Pentaho Enterprise Edition
Versión empresarial, sin costos de licencia.
Tiene asociados
servicios de soporte y mantención que se
DATOS
ANÁLISIS
pagan a través de una suscripción anual.

Es una versión certificada que además posee algunas
funcionalidades mejoradas para la consola de administración, y
para la construcción de tableros de control.


http://www.pentaho.com
Taller Pentaho Junio 2011
UNNOBA
Componentes de la Plataforma
DATOS
Taller Pentaho Junio 2011
ANÁLISIS
UNNOBA
Componentes de la Plataforma
Pentaho Reporting

Existen productos con diferentes enfoques y dirigidos a
diferentes tipos de usuarios.
 Pentaho Report Designer: Contiene dos componentes:
DATOS
ANÁLISIS
 Un editor basado con prestaciones profesionales
destinado a desarrolladores.
 Un Wizard que facilita el trabajo y permite a los usuarios
obtener resultados de forma inmediata. Está destinada a
usuarios con menos conocimientos técnicos.
 Web ad-hoc Reporting: es un Wizard vía Web basado en
metadatos que extiende la capacidad de los usuarios finales
para la creación de informes sencillos.
Taller Pentaho Junio 2011
UNNOBA
Componentes de la Plataforma
Pentaho Análisis OLAP de Datos

Carácterísticas Generales:
 Modelado Multi Dimensional de Datos:




Utiliza
MONDRIAN como servidor OLAP de tipo ROLAP.
DATOS
ANÁLISIS
El modelo de los cubos se guarda en archivos XML
Lenguaje de consulta MDX
Navegación y Exploración de Datos:


utiliza JPIVOT, el cual permite análisis Ad-Hoc de los cubos de
Mondrian.
Este componente como otros puede ser reemplazado por otras
soluciones que se integran a Pentaho, p.e. PAT
Taller Pentaho Junio 2011
UNNOBA
Componentes de la Plataforma
Pentaho Análisis OLAP de Datos
DATOS
Taller Pentaho Junio 2011
ANÁLISIS
UNNOBA
Componentes de la Plataforma
Pentaho Dashboard

Todos los componentes del modulo Pentaho Reporting y
Pentaho Analysis (JPIVOT) pueden formar parte de un
Dashboard.
DATOS
ANÁLISIS
 Identificación de Indicadores (KPI’s, Key Performance
Indicators)


Investigar detalles subyacentes


Monitoreo / Métricas
Drill a reportes de soporte
Seguimiento de excepciones

Alertas basadas en reglas del negocio
Taller Pentaho Junio 2011
UNNOBA
Componentes de la Plataforma
Pentaho Data Integration




Poderosa herramienta de ETL (Extracción, Transformación y
Carga del DW).
Entorno gráfico de desarrollo . Multiplataforma
DATOS
ANÁLISIS
Basado en dos tipos de objetos: Transformaciones (colección
de pasos en un proceso ETL) y trabajos (colección de
transformaciones)
Incluye cuatro herramientas:




SPOON: para diseñar transformaciones usando el entorno gráfico
PAN: para ejecutar transformaciones diseñadas con SPOON.
CHEF: para crear trabajos
KITCHEN: para ejecutar trabajos
Taller Pentaho Junio 2011
UNNOBA
Componentes de la Plataforma
Data Mining - WEKA

Se utiliza para:


Descubrir patrones ocultos y correlaciónales en los datos
Prevenir eventos futuros basados en patrones históricos
DATOS
Taller Pentaho Junio 2011
UNNOBA
Instalación

¿Qué necesitamos descargar para poder ver la solución
propuesta?

El servidor BI:



http://sourceforge.net/projects/pentaho/files/Business%20Intelligence%20Server
/3.6.0-stable/
DATOS
ANÁLISIS
 Biserver-ce-3.6.0-stable.zip para Windows
 Biserver-ce-3.6.0-stable.tar.gz para Linux
El motor Postgresql 8.3 o superior y su correspondiente JDBC
Pentaho Data Integration 4.1.0:
http://sourceforge.net/projects/pentaho/files/Data%20Integration/4.1.0-stable/
 Pdi-ce-4.1.0-stable.zip para Windows
 Pdi-ce-41.0-stable.tar.gz para Linux
Taller Pentaho Junio 2011
UNNOBA
Instalación
Al descomprimir el bi-server tendrán los siguientes directorios:
Pentaho/
administrationconsole/
biserver-ce/


DATOS
ANÁLISIS
Necesitarán configurar la siguiente variable de entorno:
 SET JAVA_HOME= /pentaho/biserver-ce/tomcat/jre en windows

Y copiar el driver jdbc de postgresql a:


C:\pentaho360\administration-console\jdbc
en Windows
Verificar que también esté el driver en:

c:\pentaho360\biserver-ce\tomcat\lib
Taller Pentaho Junio 2011
en Windows
UNNOBA
Referencias Bibliográficas y Otros….

Introducción al Business Intelligence – Josep Curto Díaz – ISBN: 978-84-9788-886-8 – Mayo
2010

Pentaho 3.2 Data Integration – María Carina Roldán - ISBN 978-1-847199-54-6 – 2010

“Proyecto de implementación de un Data Warehouse para universidades nacionales “ - Trabajo
Final De Grado - Del Giudice Glenda, Della Mea (principalmente el Anexo 1)

Toda la documentación producida por el Ing. Darío Bernabeu.

Pentaho Solutions Business Intelligence and Data Warehousing with Pentaho and MySQL –
Parte III - Roland Bouman, Jos van Dongen - ISBN: 978-0-470-48432-6

http://kettle.pentaho.org/ de la Community.

http://Sourceforge.net/projects/pentaho/files
Taller Pentaho Junio 2011
UNNOBA