Usamos cookies y otras tecnologias similares (Cookies) para mejorar su experiencia y proporcionarle contenido y anuncios relevantes para usted. Al utilizar nuestro sitio web, acepta el uso de Cookies. Puede cambiar su configuracion en cualquier momento. Politica de cookies.


Entrevista a Matt Casters de Pentaho

Originally published julio 21, 2008

Iniciamos con la presente una seríe de artículos que comprenden entrevistas con responsables de algunas de las herramientas Open Source Business Intelligence del Mercado más importantes. Los diferentes perfiles entrevistados nos proporcionan interesantes opiniones sobre sus productos.

Matt Casters, Chief Data Integration de Pentaho, ha concedido una entrevista al canal Open Source Business Intelligence de B•Eye Network.

Matt Casters tiene una dilatada carrera profesional como consultor independiente de BI y ha implementado numerosos Data Warehouses y soluciones BI para grandes compañías . En los últimos 6 años se ha centrado en el desarrollo de Kettle, herramienta Open Source adquirida por Pentaho en 2006. En la actualidad es el Chief Data Integration para Pentaho, donde principalmente lidera el desarrollo de Kettle a.k.a. Pentaho Data Integration.

Entrevista:

JC: ¿Cuando comenzó el proyecto Pentaho Data Integration (PDI)?

MC: El proyecto PDI empezó como “el proyecto Kettle” a principios de 2003. Previamente pasé un año trabajando, haciendo tests de puesta en marcha y analizando varios de los problemas que quería resolver con un motor de transformación. Finalmente el código del proyecto se liberalizó cuando alcanzó un grado de arquitectura y estabilidad considerable en Diciembre del 2005.

JC: ¿Cuánta gente tenéis destinada para trabajar en el proyecto?

Alrededor de 25 contribuidores regulares, desde empleados a tiempo completo de Pentaho, como es mi caso, hasta varios voluntarios como traductores y gente de BI de todo el mundo. Además, también tenemos personas de Pentaho ayudando con el diseño de UI, haciendo control de calidad, documentación, product management (roadmap) y por supuesto una persona que hace de enlace con la comunidad (community pointman).

JC: ¿Por qué Kettle está bajo licencia Open Source?, y  en concreto, ¿qué tipo de licencia utiliza?

MC: Kettle utiliza una licencia LGPL porque quería alcanzar el mayor porcentaje de adopción posible para el software. De hecho, este tipo de licencia permite a la gente integrar nuestras librerías en otros proyectos. En mi opinión, creo que esto permite un crecimiento más rápido de nuestra comunidad porque estimula una mayor diversidad dentro de los perfiles que componen la misma.

JC: ¿Cómo se llevan a cabo las contribuciones en el proyecto por parte de la comunidad?

MC: La comunidad contribuye de maneras muy diversas. Además de los colaboradores que mencioné previamente, poseemos un sistema para reportar los “bugs”. Es más, a través de nuestro sistema JIRA (http://jira.pentaho.org/browse/PDI) recibimos muchos avisos importantes de bugs cada día. Por otra parte tenemos el foro del proyecto, el cual en la actualidad cuenta aproximadamente con 22.000 posts acumulados en los últimos dos años y medio. El foro nos ha aportado discusiones muy interesantes y muchos otros ofrecimientos de colaboración. Más allá de todo, los integrantes de la comunidad participa en eventos y contribuye con papers, suben material a la wiki, escriben plugins y presentan Kettle en conferencias. Incluso existe un grupo que creó un espectacular GeoKettle fork. (http://geosoa.scg.ulaval.ca).

JC: Es sabido que PDI es un proyecto exitoso, ¿podría decirnos cuantas organizaciones utilizan la herramienta?

MC: Es muy difícil de decir. Evidentemente, está claro que muchas de las personas que forman parte de nuestra comunidad utilizan PDI en un entorno relacionado con el contexto de los negocios. También existen aplicaciones de Kettle para entornos de enseñanza, pero estoy seguro que eso es sólo un porcentaje muy pequeño. Por lo tanto, debemos remitirnos al número de descargas (aunque, a decir verdad ya no sigo la pista de dichos valores).
El proyecto fue lanzado y ahora tenemos una comunidad fuerte, lo cual se traduce en cientos y miles de descargas a través de las diferentes versiones de Kettle. Sin embargo, una actualización como la 3.0.3  tuvo alrededor de 8500 de descargas, cuando en realidad se que muchas personas todavía están usando antiguas versiones como las 2.5, 2.4 o incluso la 2.3 que tiene años de antigüedad.
Ha habido una evolución en el tipo de uso y el feedback que vemos en la comunidad. En los primeros años después de la liberalización del código (Diciembre del 2005) se hicieron pruebas de conceptos y tests, ahora estamos viendo muchísima más instalaciones y problemas avanzados, etc. También vemos cada vez más clientes y casos de referencias como estos:

• Lifetime Networks, quienes eligieron PDI en lugas de Informática y Business Objects Data Integrator (y aplicaciones de Business Objects para herramientas BI): http://www.pentaho.com/about/customers/index.php?c=19&v=

• Loma Linda University Healthcare, como se describe en Database Trends y Applications:  http://www.dbta.com/casestudies/pentaho_10-07.pdf

• MySQL: http://www.pentaho.com/about/customers/index.php?c=9&v=

• ZipRealty, quienes utilizan PDI para la integración de datos y Microstrategy para BI: http://www.pentaho.com/about/customers/index.php?c=1&v=

Todo esto me lleva a creer que estamos haciendo un progreso importante en el mundo empresarial.

JC: ¿Cuál es el modelo de negocio detrás del proyecto?

MC: Pentaho vende subscripciones de apoyo profesional, formación y otros servicios. Desde la perspectiva del proyecto esto ha sido una cosa muy buena, dado que recibimos un feedback muy valioso de nuestro cada vez mayor número clientes. Esto también nos ha permitido establecer muy buenas sinergias con el resto de las secciones de Pentaho BI (Platform, Reporting, Analysis y Mining) a traves de un mayor volumen de desarrollo compartido.

JC: Por favor, dinos las características más importante de Kettle

MC: He sido un consultor BI por muchos años ahora, obviamente he tocado muchas herramientas ETL en este tiempo. Por eso mismo, desde las primeras líneas de código el objetivo de Kettle ha sido ser lo más “libre” posible;

• Open Source con licencia LGPL
• Formato abierto y de fácil lectura tanto para los xml que recogen transformaciones y jobs como para el repositorio relacional de objetos ETL.
• API
• Fácil de instalar (menos de dos minutos).
• Aplicable a todos los tipos de bases de datos.
• GUI fácil de usar.
• Facilidad para  la importación de datos.
• Facilidad para exportar datos de un formato a otro cualquiera.
• Facilitar la extensión de código mediante plugins

Esas caracteristícas hacen posible para gente no muy experimentada en BI realizar contribuciones muy valiosas al proyecto, incluso en la forma de código Java, plugins, etc. porque simplemente es sencillo hacerlo.

JC: ¿Cuál es el futuro roadmap de Kettle?

MC: Aunque somos un proyecto altamente dirigido por nuestra comunidad, y como tal, los requerimientos futuros provienen de todas las partes involucradas, tenemos cosas en nuestro roadmap como Data Quality, profiling, lifecycle, gestión de recursos y versiones, monotorización y servicios de management.

Agradecemos a Matt Casters el tiempo concedido en esta entrevista.

  • Josep Curto DíazJosep Curto Díaz
    Josep Curto es Area Manager en ICNET Consulting. Está focalizado en la implantación de Sistemas Business Intelligence, incidiendo en ofrecer la solución adecuada a las necesidades de sus clientes, con especial atención a las del emergente mercado Business Intelligence Open Source. Es Master en Business Intelligence y Master en Dirección y Gestión en Sistemas y Tecnologías de la Información por la UOC y licenciado en Matemáticas. Ha conjugado su carrera profesional con una clara vocación por educación superior siendo profesor en la Universidad Autónoma de Barcelona (UAB) y en la Universitat Oberta de Catalunya (UOC). Autor del blog Information Management. Es colaborador esporádico en la revista Gestión del Rendimiento. Josep puede ser contactado mediante Josep.curto@icnetconsulting.com.

Recent articles by Josep Curto Díaz


Related Stories


 

Comments

Want to post a comment? Login or become a member today!

Be the first to comment!