Blog: Josep Curto Díaz http://www.beyenetwork.es/blogs/curtodiaz/ Bienvenidos a mi blog en BeyeNETWORK, en el que focalizaré sobre las novedades del mercado Business Intelligence Open Source respecto software, tendencias de mercado, conferencias, mejores prácticas y cualquier novedad que permita a nuestros lectores estar informados con mayor frecuencia. Copyright 2010 Tue, 16 Mar 2010 05:26:20 -0700 http://www.movabletype.org/?v=4.261 http://blogs.law.harvard.edu/tech/rss Weka Lite - el futuro
El objetivo es simplificar los primeros pasos en Weka al tener una interficie con menos algoritmos de entrada. De paso también se consigue mejorar el mantenimiento de la solución al hacerla modular.

Son buenas noticias que Pentaho continue realizando acciones relacionadas con Weka que faciliten tanto su desarrollo como su usabilidad (como por ejemplo, la posibilidad de lanzar procesos de Weka vía Pentaho Data Integration). Esperemos que poco a poco vayan incorporando más funcionalidades de Weka hacia la suite de Pentaho y sus componentes.

Fuente: Pentaho Wiki ]]>
http://www.beyenetwork.es/blogs/curtodiaz/archives/2010/03/weka_lite_-_el.php http://www.beyenetwork.es/blogs/curtodiaz/archives/2010/03/weka_lite_-_el.php Pentaho Tue, 16 Mar 2010 05:26:20 -0700
Otras opciones OSBI: SQLPower Software
Esta empresa ha creado una colección de herramientas open source basadas en java y por lo tanto multiplataforma que responden a las necesidades usuales de un proyecto de inteligencia de negocio. A saber:

  • SQL Power Architect (Data Modeling & Profiling Tool): herramienta de modelización de datos que nos permite diseñar el data mart o data warehouse e incluso hacer profiling de los datos cargados.
  • SQL Power Loader (ETL Tool): una herramienta de ETL que permite alimentar de datos al data warehouse o data mart.
  • SQL Power DQguru (Data Cleansing & MDM Tool): para realizar procesos de limpieza de datos y gestión de datos maestros.
  • SQL Power Wabit (The Intuitive BI Reporting Tool): para realizar self-service BI / ad-hoc querys.
  • SQL Power Dashboard (Executive Dashboard): para el diseño de scorecard e informes para la alta dirección.
  • SQL Power XBRL forms: para enviar y gestionar datos XBRL.

Como podemos ver ofrece aire fresco respecto otras soluciones incluyendo tanto MDM (que por ahora sólo incluye Talend) como XBRL (por primera vez tenido en cuenta en una solución open source). Es decir, buenas ideas desde Canada.

Cabe comentar que algunas de ellas cuentan con una versión de subscripción con características premium.

Fuente: http://www.sqlpower.ca ]]>
http://www.beyenetwork.es/blogs/curtodiaz/archives/2010/03/sqlpower.php http://www.beyenetwork.es/blogs/curtodiaz/archives/2010/03/sqlpower.php Mon, 08 Mar 2010 07:34:08 -0700
Agile BI
Existen soluciones que abordan ese problema desde diferentes enfoques:

  • Creación de data marts in-memory (pero está claro que no es un data warehouse).
  • Desplegar soluciones SaaS enfocadas al self-service BI que frecuentemente tampoco incluyen la construcción del data warehouse sino de pequeños data marts.
  • Reducir el tiempo de desarrollo mediante propuestas de desarrollo ágil.
Es este última tendencia a la que apunta el equipo de Pentaho al presentar su propuesta de diseño ágil.

¿En qué consiste su propuesta? En aunar en la herramienta de ETL, las capacidades de crear la capa de metadatos OLAP y la creación de elementos / vistas de análisis. Se persigue, por lo tanto, reducir el tiempo de desarrollo de soluciones analíticas sin menospreciar el desarrollo incremental del data warehouse.

Actualmente se halla en fase de Milestone (y contiene desarrollos no open source), pero debemos tenerlo en cuenta en el futuro dado que es una buena innovación por parte de Pentaho para facilitar el despliegue de soluciones de inteligencia de negocio con sus herramientas.

Fuente: Wiki Pentaho
]]>
http://www.beyenetwork.es/blogs/curtodiaz/archives/2010/03/agile_bi.php http://www.beyenetwork.es/blogs/curtodiaz/archives/2010/03/agile_bi.php Pentaho Sat, 06 Mar 2010 10:31:46 -0700
Intelligence Enterprise destaca Actuate, Jaspersoft, R-Project y Talend como empresas BI a seguir Intelligence Enterprise ha publicado un interesante donde lista una série de empresas que es necesario seguir. Se centran en los siguientes sectores:

  • Business Intelligence
  • Enterprise Applications
  • Information Management

Y han sido asesorados por los colaboradores habituales:

  • Rajan Chandras, integration expert and author
  • Seth Grimes, Alta Plana
  • Cindi Howson, BI Scorecard
  • David Linthicum, data integration and cloud computing expert
  • Curt Monash, Monash Research
  • Alan Pelz-Sharpe, CMS Watch
  • David Stodder, Perceptive Information Strategies

Vamos a centrarnos en las empresas Open Source:

  • Actuate: Actuate es conocida en el ámbito OSBI (Open Source Business Intelligence) por BIRT una de las soluciones de reporting open source más versátiles y potentes del mercado OSBI que anualmente se actualiza siguiendo el roadmap del IDE Eclipse. Esta solución realmente ha revolucionado el nicho de herramientas de Reporting haciendo que las soluciones de otros fabricantes se deban poner las pilas. Vale la pena echar un vistazo al resto de sus productos. Y destacar la comunidad de intercambio de BIRT.
  • Jaspersoft: Este empresa conocida por su solución de reporting llamada iReport (una de las primeras soluciones de reporting open source) ofrece una suite completa de BI que integra Reporting, Cuadros de Mando y OLAP. Cabe comentar que Jaspersoft anunció el pasado 23 de febrero que superó los diez millones de descargas, que contribuye a 350 proyectos open source y que tiene una comunidad de 120.000 miembros registrados. Son cifras muy interesantes que refuerzan el mensaje que el Open Source Business Intelligence está viviendo un momento importante. Lo que es cierto es Jaspersoft proclama que es ecosistema BI más grande del mundo y si bien eso se debe coger con pinzas, es importante tener en cuenta que estamos hablando de uno de los actores importantes del sector OSBI.
  • R-Project: es una potente solución de análisis estadístico que presenta múltiple módulos especializados. A parte de su uso intensivo en proyectos universitarios, es necesario destacar que es una herramienta de gran solvencia en minería de datos. De ello, se ha percatado incluso otras compañías Business Intelligence como Information Builders que la han integrado en su suite.
  • Talend: Talend ofrece soluciones de integración de datos, de MDM (Master Data Management) y Data Quality. Recientemente, ha sido incluida en el Cuadrante Mágico de Gartner de integración de datos como empresa visionaria y eso es un punto a tener en cuenta de esta empresa que está alcanzando cuotas muy importantes en poco tiempo gracias a un trabajo bien hecho.
]]>
http://www.beyenetwork.es/blogs/curtodiaz/archives/2010/02/intelligence_en.php http://www.beyenetwork.es/blogs/curtodiaz/archives/2010/02/intelligence_en.php BIRT Wed, 24 Feb 2010 04:58:07 -0700
CDA (Community Data Access) CDF, CDF-DE y PAT se une CDA.

Este proyecto consiste en crear una capa de acceso basada en llamadas URL de diferentes fuentes de datos: SQL, MDX, Metadatos, Kettle,... e incluso composiciones proporcionando diferentes formatos de salida: JSON, XML, CSV, XLS, HTML.

El beneficio de CDA es crear una capa independiente a ser usada por CDF y CDF-DE u otros proyectos en el futuro.

Si bien aún no está disponible para descarga está previsto que sea integrado directamente en Pentaho.

Esperemos que la comunidad siga participando en esta solución y esto incida también en que la propia empresa también se motive para ofrecer nuevas mejoras y características innovadores como Pentaho Agile BI. Sólo cabe agradecerles su esfuerzo a todos.

Proyecto: http://code.google.com/p/pentaho-cda/ ]]>
http://www.beyenetwork.es/blogs/curtodiaz/archives/2010/02/cda_community_d.php http://www.beyenetwork.es/blogs/curtodiaz/archives/2010/02/cda_community_d.php Pentaho Fri, 19 Feb 2010 02:44:07 -0700
CDF-DE Otro interesante proyecto de la comunidad de Pentaho: CDF-DE. La comunidad de Pentaho es un pilar importante para potenciar la funcionalidad de esta solución OSBI. Últimamente esta comunidad está muy activa creando mejoras para la solución.

De los creadores de CDF (en particular, Pedro Alves), tenemos un nuevo proyecto CDF-DE. Un editor online de cuadros de mando para Pentaho. Si bien se encuentra en una versión muy inicial, este editor se encuentra completamente funcional y eso es un paso significativo en el camino de facilitar la creación tanto para desarrolladores como para usuarios avanzados.

Una vez instalado, desde el servidor de Pentaho es posible la creación si bien es necesario conocer un poco la estructura de un dashboard basado en CDF. Soporta la creación de todos los objetos que actualmente soporta CDF.

Es una buena aportación que conjuntamente con PAT augura un gran futuro de las aportaciones de la comunidad de Pentaho.

Web del proyecto: http://code.google.com/p/cdf-de/
Descargar: http://code.google.com/p/cdf-de/downloads/list
]]>
http://www.beyenetwork.es/blogs/curtodiaz/archives/2010/02/cdf-de.php http://www.beyenetwork.es/blogs/curtodiaz/archives/2010/02/cdf-de.php Sun, 07 Feb 2010 09:21:19 -0700
MDM para el resto de los mortales Talend anunció la compra de una solución MDM. Hace unos días está disponible la versión community de esta solución para su descarga. Así mismo la enterprise que incluye múltiples características más que su anónimo como podemos consultar aquí.

MDM es uno de los puntos calientes del mercado BI y también en el open source se está teniendo en cuenta. Para conocer más sobre la solución de Talend consultad su página.

Le echaremos un vistazo para poder opinar en profundidad.
]]>
http://www.beyenetwork.es/blogs/curtodiaz/archives/2010/02/mdm_para_el_res.php http://www.beyenetwork.es/blogs/curtodiaz/archives/2010/02/mdm_para_el_res.php Talend Mon, 01 Feb 2010 15:32:16 -0700
Novedades en Weka 3.7.1
Empezamos por Weka. Este producto, como ya sabemos, fue adquirido por Pentaho si bien aún se mantiene como producto independiente. En la última versión (disponible aquí), podemos encontrar interesantes mejoras con la inclusión de nuevos algoritmos entre los que destacamos:

  • SPegasus: Es un algoritmo que a través de la descendiente del gradiente estocástico, permite aprendizaje de support vector machine. Para más información consultad el artículo: S. Shalev-Shwartz, Y. Singer, N. Srebro: Pegasos: Primal Estimated sub-GrAdient SOlver for SVM. In: 24th International Conference on MachineLearning, 807-814, 2007. 
  • RealAdaBoost: algoritmo de clasificación de Friedman que usa el método Real Adaboost. Para más información: J. Friedman, T. Hastie, R. Tibshirani (2000). Additive Logistic Regression: a Statistical View of Boosting. Annals of Statistics. 95(2):337-407. 
  • Furia (Fuzzy Unordered Rule Induction Algorithm): aprendizaje de reglas fuzzy basado en el algoritmo RIPPER. Para más información: Jens Christian Huehn, Eyke Huellermeier (2009). FURIA: An Algorithm for Unordered Fuzzy Rule Induction. Data Mining and Knowledge Discovery. 
Para más información consulta en la wiki de pentaho.

Son buenas noticias que este tipo de productos continúe mejorando año tras año.
]]>
http://www.beyenetwork.es/blogs/curtodiaz/archives/2010/01/novedades_en_we.php http://www.beyenetwork.es/blogs/curtodiaz/archives/2010/01/novedades_en_we.php Sat, 16 Jan 2010 03:13:32 -0700
Pentaho Community Technical WebEx
Para este 2010, continúan con este tipo de eventos y ya tenemos las fechas y contenidos de las dos primeras:

]]>
http://www.beyenetwork.es/blogs/curtodiaz/archives/2010/01/pentaho_communi_1.php http://www.beyenetwork.es/blogs/curtodiaz/archives/2010/01/pentaho_communi_1.php Pentaho Mon, 04 Jan 2010 23:58:27 -0700
Coloquio UOC - Introducción a la inteligencia de negocio  Desde la semana pasada en la UOC estoy realizando un coloquio sobre el uso de herramientas open source de inteligencia de negocio. El título del coloquio es “Herramientas Open Source de Business Intelligence”.
El coloquio se divide en tres partes:
  • La primera parte introducirá el concepto y la finalidad de la inteligencia de negocio.
  • Posteriormente se presentará el estado actual del mercado open source en este ámbito.
  • Finalmente, se usará un caso práctico para mostrar el uso y funcionalidades de una de las soluciones open source más maduras del mercado: Pentaho.

Dado que creo que es un material interesante de adjunto el enlace a la presentación en slideshare así como al canal youtube de la UOC.

Links: Slideshare - Introducción a Business Intelligence - Pentaho

]]>
http://www.beyenetwork.es/blogs/curtodiaz/archives/2009/12/coloquio_uoc_-.php http://www.beyenetwork.es/blogs/curtodiaz/archives/2009/12/coloquio_uoc_-.php UOC Fri, 18 Dec 2009 17:05:29 -0700
Estudios de la evolución del mercado OSBI

Hola a todos.

Una de las preguntas más frecuentes es cuál es el estado del mercado Open Source. Desde BeyeNETWORK se han realizado diversos estudios. Os recomiendo dos de sus últimos análisis de mercado:

Estos dos estudios nos permiten comparar la evolución de los últimos seis meses.

Un cordial saludo.

]]>
http://www.beyenetwork.es/blogs/curtodiaz/archives/2009/12/estudios_de_la.php http://www.beyenetwork.es/blogs/curtodiaz/archives/2009/12/estudios_de_la.php Wed, 09 Dec 2009 04:59:52 -0700
Jaspersoft se une a OSSI Jaspersoft, una de los principales empresas OSBI del mercado, se unió al Open Source Software Institute (OSSI) con el objetivo de extender el uso del software libre en la administración de los Estados Unidos.

Es un signo de madurez que cada vez más organizaciones consideren que sus necesidades de negocio pueden ser cubiertas por soluciones open source.

Sin duda, es un buen paso para Jaspersoft para estar posicionados.

Fuente: Jaspersoft
]]>
http://www.beyenetwork.es/blogs/curtodiaz/archives/2009/11/jaspersoft_se_u.php http://www.beyenetwork.es/blogs/curtodiaz/archives/2009/11/jaspersoft_se_u.php JasperSoft Sat, 07 Nov 2009 08:00:55 -0700
Pentaho Analyzer
Este visor sólo formará parte de la versión enterprise, dotando de mayor valor añadido esta versión y diferenciándola respecto la versión community.

Es un buen paso dado que Jpivot si bien es una herramienta muy solvente no está tan enfocada al usuario final.

¿Qué opinais al respecto?

Fuente: Julian Hyde hablando sobre Pentaho Analyser 
]]>
http://www.beyenetwork.es/blogs/curtodiaz/archives/2009/10/pentaho_analyze.php http://www.beyenetwork.es/blogs/curtodiaz/archives/2009/10/pentaho_analyze.php Mon, 05 Oct 2009 21:42:25 -0700
Colaborador destacado en Talend Babili

Como ya he comentado más de una vez, suelo colaborar en diversos proyectos de inteligencia de negocio open source ya sea a través de su divulgación vía BeyeNETWORK Spain o bien participando de una forma más activa (comunicar algún bug identificado durante su uso,...).

En el caso particular de Talend, decidí participar en el proceso de traducción de sus soluciones (una de ellas de ETL, otra de Data Profiling) a través de la magnifica herramienta web que pone a la disposición: Talend Babili.

Es un placer comentar que he sido escogido como uno de los colaboradores destacados de este año. Os animo a participar.

]]>
http://www.beyenetwork.es/blogs/curtodiaz/archives/2009/09/colaborador_des.php http://www.beyenetwork.es/blogs/curtodiaz/archives/2009/09/colaborador_des.php Talend Sun, 27 Sep 2009 04:09:34 -0700
Pentaho Community Gathering - Barcelona 2009
Una oportunidad muy interesante de conocer tanto a gente de pentaho como a su comunidad así como hacía qué dirección va esta solución.

El evento es gratuito.

Dónde apuntarse: Pentaho Community Event 2009
Más información: Wiki de pentaho
]]>
http://www.beyenetwork.es/blogs/curtodiaz/archives/2009/09/pentaho_communi.php http://www.beyenetwork.es/blogs/curtodiaz/archives/2009/09/pentaho_communi.php Wed, 09 Sep 2009 15:40:53 -0700