Entrevista a Matt Casters de PentahoOriginally published julio 21, 2008 Iniciamos con la presente una seríe de artículos que comprenden entrevistas con responsables de algunas de las herramientas Open Source Business Intelligence del Mercado más importantes. Los diferentes perfiles entrevistados nos proporcionan interesantes opiniones sobre sus productos. Matt Casters, Chief Data Integration de Pentaho, ha concedido una entrevista al canal Open Source Business Intelligence de B•Eye Network. Matt Casters tiene una dilatada carrera profesional como consultor independiente de BI y ha implementado numerosos Data Warehouses y soluciones BI para grandes compañías . En los últimos 6 años se ha centrado en el desarrollo de Kettle, herramienta Open Source adquirida por Pentaho en 2006. En la actualidad es el Chief Data Integration para Pentaho, donde principalmente lidera el desarrollo de Kettle a.k.a. Pentaho Data Integration. -----
Entrevista: JC: ¿Cuando comenzó el proyecto Pentaho Data Integration (PDI)? MC: El proyecto PDI empezó como “el proyecto Kettle” a principios de 2003. Previamente pasé un año trabajando, haciendo tests de puesta en marcha y analizando varios de los problemas que quería resolver con un motor de transformación. Finalmente el código del proyecto se liberalizó cuando alcanzó un grado de arquitectura y estabilidad considerable en Diciembre del 2005. JC: ¿Cuánta gente tenéis destinada para trabajar en el proyecto? Alrededor de 25 contribuidores regulares, desde empleados a tiempo completo de Pentaho, como es mi caso, hasta varios voluntarios como traductores y gente de BI de todo el mundo. Además, también tenemos personas de Pentaho ayudando con el diseño de UI, haciendo control de calidad, documentación, product management (roadmap) y por supuesto una persona que hace de enlace con la comunidad (community pointman). JC: ¿Por qué Kettle está bajo licencia Open Source?, y en concreto, ¿qué tipo de licencia utiliza? MC: Kettle utiliza una licencia LGPL porque quería alcanzar el mayor porcentaje de adopción posible para el software. De hecho, este tipo de licencia permite a la gente integrar nuestras librerías en otros proyectos. En mi opinión, creo que esto permite un crecimiento más rápido de nuestra comunidad porque estimula una mayor diversidad dentro de los perfiles que componen la misma. JC: ¿Cómo se llevan a cabo las contribuciones en el proyecto por parte de la comunidad? MC: La comunidad contribuye de maneras muy diversas. Además de los colaboradores que mencioné previamente, poseemos un sistema para reportar los “bugs”. Es más, a través de nuestro sistema JIRA (http://jira.pentaho.org/browse/PDI) recibimos muchos avisos importantes de bugs cada día. Por otra parte tenemos el foro del proyecto, el cual en la actualidad cuenta aproximadamente con 22.000 posts acumulados en los últimos dos años y medio. El foro nos ha aportado discusiones muy interesantes y muchos otros ofrecimientos de colaboración. Más allá de todo, los integrantes de la comunidad participa en eventos y contribuye con papers, suben material a la wiki, escriben plugins y presentan Kettle en conferencias. Incluso existe un grupo que creó un espectacular GeoKettle fork. (http://geosoa.scg.ulaval.ca). JC: Es sabido que PDI es un proyecto exitoso, ¿podría decirnos cuantas organizaciones utilizan la herramienta?
MC: Es muy difícil de decir. Evidentemente, está claro que muchas de las personas que forman parte de nuestra comunidad utilizan PDI en un entorno relacionado con el
contexto de los negocios. También existen aplicaciones de Kettle para entornos de enseñanza, pero estoy seguro que eso es sólo un porcentaje muy pequeño. Por lo tanto,
debemos remitirnos al número de descargas (aunque, a decir verdad ya no sigo la pista de dichos valores). • Lifetime Networks, quienes eligieron PDI en lugas de Informática y Business Objects Data Integrator (y aplicaciones de Business Objects para herramientas BI): http://www.pentaho.com/about/customers/index.php?c=19&v= • Loma Linda University Healthcare, como se describe en Database Trends y Applications: http://www.dbta.com/casestudies/pentaho_10-07.pdf • MySQL: http://www.pentaho.com/about/customers/index.php?c=9&v= • ZipRealty, quienes utilizan PDI para la integración de datos y Microstrategy para BI: http://www.pentaho.com/about/customers/index.php?c=1&v= Todo esto me lleva a creer que estamos haciendo un progreso importante en el mundo empresarial. JC: ¿Cuál es el modelo de negocio detrás del proyecto? MC: Pentaho vende subscripciones de apoyo profesional, formación y otros servicios. Desde la perspectiva del proyecto esto ha sido una cosa muy buena, dado que recibimos un feedback muy valioso de nuestro cada vez mayor número clientes. Esto también nos ha permitido establecer muy buenas sinergias con el resto de las secciones de Pentaho BI (Platform, Reporting, Analysis y Mining) a traves de un mayor volumen de desarrollo compartido. JC: Por favor, dinos las características más importante de Kettle MC: He sido un consultor BI por muchos años ahora, obviamente he tocado muchas herramientas ETL en este tiempo. Por eso mismo, desde las primeras líneas de código el objetivo de Kettle ha sido ser lo más “libre” posible;
• Open Source con licencia LGPL Esas caracteristícas hacen posible para gente no muy experimentada en BI realizar contribuciones muy valiosas al proyecto, incluso en la forma de código Java, plugins, etc. porque simplemente es sencillo hacerlo. JC: ¿Cuál es el futuro roadmap de Kettle? MC: Aunque somos un proyecto altamente dirigido por nuestra comunidad, y como tal, los requerimientos futuros provienen de todas las partes involucradas, tenemos cosas en nuestro roadmap como Data Quality, profiling, lifecycle, gestión de recursos y versiones, monotorización y servicios de management.
Agradecemos a Matt Casters el tiempo concedido en esta entrevista. Recent articles by Josep Curto Díaz |
Copyright 2004 — 2010. Powell Media, LLC. All rights reserved.
BeyeNETWORK™ is a trademark of Powell Media, LLC
Comments
Want to post a comment? Login or become a member today!
Be the first to comment!