Blog: Josep Curto Díaz Subscribe to this blog's RSS feed!

Josep Curto Díaz

Bienvenidos a mi blog en BeyeNETWORK, en el que focalizaré sobre las novedades del mercado Business Intelligence Open Source respecto software, tendencias de mercado, conferencias, mejores prácticas y cualquier novedad que permita a nuestros lectores estar informados con mayor frecuencia.

About the author >

Josep Curto es Area Manager en ICNET Consulting. Está focalizado en la implantación de Sistemas Business Intelligence, incidiendo en ofrecer la solución adecuada a las necesidades de sus clientes, con especial atención a las del emergente mercado Business Intelligence Open Source. Es Master en Business Intelligence y Master en Dirección y Gestión en Sistemas y Tecnologías de la Información por la UOC y licenciado en Matemáticas. Ha conjugado su carrera profesional con una clara vocación por educación superior siendo profesor en la Universidad Autónoma de Barcelona (UAB) y en la Universitat Oberta de Catalunya (UOC). Autor del blog Information Management. Es colaborador esporádico en la revista Gestión del Rendimiento. Josep puede ser contactado mediante Josep.curto@icnetconsulting.com.

Recently in Pentaho Category

La siguiente versión de weka (3.7.2) trae una revisión de la plataforma hacia un core mucho más simple y liviano (con los algoritmos tradicionales) y la disponibilidad del resto de algoritmos como descargas (soportados por el equipo de Weka y por los que los han creado).

El objetivo es simplificar los primeros pasos en Weka al tener una interficie con menos algoritmos de entrada. De paso también se consigue mejorar el mantenimiento de la solución al hacerla modular.

Son buenas noticias que Pentaho continue realizando acciones relacionadas con Weka que faciliten tanto su desarrollo como su usabilidad (como por ejemplo, la posibilidad de lanzar procesos de Weka vía Pentaho Data Integration). Esperemos que poco a poco vayan incorporando más funcionalidades de Weka hacia la suite de Pentaho y sus componentes.

Fuente: Pentaho Wiki

Posted March 16, 2010 5:26 AM
Permalink | No Comments |
Uno de los puntos que frecuentemente preocupa en los desarrollos de BI es el tiempo de desarrollo. Ya sabemos que uno de los puntos dónde se gasta más tiempo es en el desarrollo del Data Warehouse.

Existen soluciones que abordan ese problema desde diferentes enfoques:

  • Creación de data marts in-memory (pero está claro que no es un data warehouse).
  • Desplegar soluciones SaaS enfocadas al self-service BI que frecuentemente tampoco incluyen la construcción del data warehouse sino de pequeños data marts.
  • Reducir el tiempo de desarrollo mediante propuestas de desarrollo ágil.
Es este última tendencia a la que apunta el equipo de Pentaho al presentar su propuesta de diseño ágil.

¿En qué consiste su propuesta? En aunar en la herramienta de ETL, las capacidades de crear la capa de metadatos OLAP y la creación de elementos / vistas de análisis. Se persigue, por lo tanto, reducir el tiempo de desarrollo de soluciones analíticas sin menospreciar el desarrollo incremental del data warehouse.

Actualmente se halla en fase de Milestone (y contiene desarrollos no open source), pero debemos tenerlo en cuenta en el futuro dado que es una buena innovación por parte de Pentaho para facilitar el despliegue de soluciones de inteligencia de negocio con sus herramientas.

Fuente: Wiki Pentaho

Posted March 6, 2010 10:31 AM
Permalink | No Comments |
De nuevo me pongo a hablar de la comunidad de Pentaho que está trabajando muy intensamente estos últimos meses para mejorar esta herramienta open source. A los proyectos CDF, CDF-DE y PAT se une CDA.

Este proyecto consiste en crear una capa de acceso basada en llamadas URL de diferentes fuentes de datos: SQL, MDX, Metadatos, Kettle,... e incluso composiciones proporcionando diferentes formatos de salida: JSON, XML, CSV, XLS, HTML.

El beneficio de CDA es crear una capa independiente a ser usada por CDF y CDF-DE u otros proyectos en el futuro.

Si bien aún no está disponible para descarga está previsto que sea integrado directamente en Pentaho.

Esperemos que la comunidad siga participando en esta solución y esto incida también en que la propia empresa también se motive para ofrecer nuevas mejoras y características innovadores como Pentaho Agile BI. Sólo cabe agradecerles su esfuerzo a todos.

Proyecto: http://code.google.com/p/pentaho-cda/

Posted February 19, 2010 2:44 AM
Permalink | No Comments |
Durante el año 2009, la comunidad de Pentaho bajo el auspicio de la compañía ha estado muy activa realizando eventos online (vía WebEx) explicando aspectos de las componentes de la suite o de las herramientas de desarrollo. Cabe destacar que los contenidos son frecuentemente muy interesantes y los ponentes son profesionales del mundo del Business Intelligence con una gran experiencia.

Para este 2010, continúan con este tipo de eventos y ya tenemos las fechas y contenidos de las dos primeras:


Posted January 4, 2010 11:58 PM
Permalink | No Comments |
Muchas veces no sabemos cómo empezar a trabajar con pentaho. Qué mejor que hacerlo con una imagen virtual. 

Desde el grupo eGlu, Bernabeu R. Daría y Mariona García Mattío han creado una imagen virtual para vmware que contiene lo siguiente:

  • Sistema Operativo: Ubuntu 8.10
  • Plataforma: Pentaho 2.0
  • Base de datos: MySQL
Bien seguro que será de utilidad. Muy buena iniciativa.

Posted June 7, 2009 1:04 PM
Permalink | No Comments |
Justo ha salido una nueva versión de Pentaho Data Integration, la solución para integración de datos de Pentaho. Es versión (3.2 GA) incluye:

  • Mejoras visuales en el entorno de trabajo.
  • Nuevos transformaciones y trabajos.
  • Inclusión de pasos existentes como plugins: formula, reservoir sampling,...
  • Mejoras de rendimiento.
  • Mejoras en los pasos existentes.
  • Corrección de bugs identificados.
  • Dynamic clustering

Fuente: Sourceforge

Posted May 8, 2009 10:04 AM
Permalink | No Comments |
GeoBI es un proyecto open source para integrar información geoespacial en procesos Business Intelligence auspiciado por Innova

Está basado en Pentaho y extiende las herramientas del mismo mediante plugins o capas de negocio para soportar dicho tipo de información. Consiste en integrar Pentaho, GeoServer y Mapfish. A parte hay ciertas herramientas de Pentaho que se han modificado para facilitar los proyectos geoespaciales:

  • GeoKettle: herramienta de ETL que permite extraer y manipular información de soluciones GIS o Spatial DBMS.
  • GeoMondrian: se está trabajando en una versión de mondrian para que soporte la información geoespacial.
Una propuesta muy interesante factible gracias a la integración de diferentes soluciones open source.


Posted April 10, 2009 3:53 AM
Permalink | No Comments |
Los días 17, 18 y 19 de Abril tendrá lugar la Openbravo World Conference. Para los que conocen Openbravo es un ERP Open Source. Hace unos meses anunciaron una cooperación con Pentaho para ofrecer una solución Business Intelligence para su ERP.

Para los interesados, Richad Daley, CEO de Pentaho participará en el evento. También asistirá Sandra Massé de Talend y Tim Cloonan de JasperSoft entre otros. Los lazos con la comunidad Open Source Business Intelligence como podéis apreciar son fuertes.

Posted April 9, 2009 3:37 AM
Permalink | 1 Comment |

Pentaho ha presentado la versión 3.0 de su suite de Business Intelligence Enterprise Edition. A las características base de Pentaho (certificadas en su versión enterprise):

* Analysis
* Dashboards
* Data Integration / ETL
* Business Intelligence Platform
* Data Mining


Se han sumado las siguientes características:

* Pentaho Enterprise Console
* Pentaho Dashboard Designer
* Single Sign-On
* Streamlined security configuration
* Application diagnostics
* Repositoru utilities
* Lifecycle management
* Audit reports
* Automated content expiraton
* Clustering
* Performance monitoring
* ETL management and monitoring


Destacan además el soporte para Amazon EC2 de dicha versión.

Pronto tendremos la versión community en la cuál tendremos las características nuevas de la versión con los añadidos de la communidad: soporte para openflash carts o CDF (Community Dashboard Framework). Pero mientras,...

¿No queréis probarla?


Posted March 23, 2009 2:59 PM
Permalink | No Comments |