CREANDO UN REPOSITORIO DE KETTLE

Un repositorio de Kettle es una base de datos que contiene las tablas necesarias para poder almacenar todos los “objetos” Kettle que creemos. Transformaciones, trabajos, conexiones estarán disponibles de forma centralizada, facilitando la reutilización y gestión de cambios.
Para crear el repositorio seguiremos nos iremos a las opciones:
Curso Pentaho Edicion Especial Peru 2013
Empieza el 2013 aprendiendo Pentaho Analytics, la solución de Inteligencia de Negocios Nro 1 en el mundo, deja de perder dinero por no conocer la solución de inteligencia de negocios más solicitada por las empresas actuales, capaz de integrarse con diversos orígenes de datos, brindando características similares a las de Business Objects, Microstrategy, Oracle BI y similares.
Migracion entre bases de datos con PDI – Pentaho Data Integration
Resulta muy común que se requiera en diferentes entornos de desarrollo y producción mirar datos de una base de datos de origen a una destino, ya sea por que se esta migrando a un nuevo sistema, una nueva plataforma, o porque se esta integrando aplicaciones y ciertos datos maestros son necesarios.
Para cualquiera que fuer el caso las herramientas ETL, en este caso Pentaho Data Integration - PDI, permite la integración de diversas bases de datos cuyos origenes o plataformas pueden ser heterogéneas, por ejemplo migrar de Oracle a postgresql, access a MySQL, etc.
En este artículo encontrarás un caso práctico de cómo realizar una migración de forma sencilla de PostgreSQL a MySQL
Integrando Saiku en Pentaho
Saiku se proyecta como el visor OLAP Open source por excelencia, que proporciona al usuario final una magnifica herramienta para realizar análisis de forma fácil e intuitiva.
Este proyecto entrega un producto de calidad capaz de no sólo utilizarse de forma independiente de Pentaho, sino que incluso puede integrarse de forma muy sencilla siguiendo los pasos descritos a continuación:
Configurar Shema Workbench para publicar cubos
Una de las primeras acciones que se deben realizar para poder publicar en PENTAHO nuestros cubos diseñados empleando Schema Workbench es la definicion de la clave de pulblicación, esto se logra modificando el archivo XML publisheer_config.xml.
El archivo debe modificarse en la sección <publisher-password>Mi Clave de Publicacion</publisher-password>, a continuación la ruta y un ejemplo
Multiples instancias Pentaho: cambiando el puerto 8080
Uno de los inconvenientes mas frecuentes cuando trabajamos con con diversas soluciones en un mismo equipo, es el de los conflicto de puertos, otro escenario es el de tener la necesidad de contar con varias instancias de una misma aplicacion, digamos que queremos probar mas una versión de Pentaho en simultaneo.
Otro ejemplo podria ser estar utilizando el ERP ADempiere u Openbravo donde ambos por defecto utilizan para desplegar las interfaces web el puerto 8080, en el caso de Adempiere con el servidor de aplicacion jboos y en el caso de openbravo con tomcat.
En este articulo explicamos paso a paso como proceder a cambiar el puerto que utiliza por defecto Pentaho Business Analytics.
Iniciando con Pentaho Business Analytics (Version Comunity)
Ya están disponibles las nuevas versiones de los principales componentes de Pentaho en su versión Community; estas versiones vienen con grandes y abiertas novedades, como una nueva y mejorada interfaz de usuario, el acceso a bases relacionales para generar schemas y metadatos, un gran paso en el Agile BI abierto.
En el caso de Kettle ya hemos venido contando recientemente que sigue mejorando y convirtiéndose en una herramienta imprescindible.
Instalacion y Conexion de Schema Workbench
Instalación y Conexión de Schema Workbench para la creación de cubos
1) Instalación:
Lo primero que debemos hacer es descargar Mondrian Schema Workbench (a.k.a Pentaho Schema Workbench -PSW-) de la siguiente direccion:
http://sourceforge.net/projects/mondrian/files/schema%20workbench/3.3.0-stable/
La ultima version al dia de hoy es la 3.3.0-estable:
- · En Windows: seleccionar el archivo psw-ce-3.3.0.14703.zip
- · En GNU/Linux: seleccionar el archivo psw-ce-3.3.0.14703.tar.gz
Una vez que se descargo el archivo, procedemos a descomprimirlo en algún lugar apropiado.
Terminología BI
Es un almacén de datos.
Han surgido como respuesta a la problemática de extraer información sintética a partir de datos atómicos almacenados en bases de datos de producción. Uno de los objetivos principales de este tipo de sistemas es servir como base de información para la toma de decisiones.
¿Que es ETL?
ETL. Este término en inglés viene de las siglas Extract, Transform, Load (Extraer, Transformar, Cargar).
¿Pero qué es exacatamente ETL?. Una definición sencilla podría ser: "Es el conjunto de procesos para obtener datos desde sistemas OLTP (OnLine Transaction Processing) hacia un data warehouse".
Pero esta definición simplifica simplifica demasiado lo que es ETL. Por ejemplo los datos no solo provienen de sistemas OLTP, también pueden ser archivos planos, hojas de cálculo, emails, etc. Además ETL no solo se usa para cargar un data warehouse también se puede usar para cargar hojas de cálculo, generar archivos planos, cargar datos en sistemas OLTP.






