Usamos cookies y otras tecnologias similares (Cookies) para mejorar su experiencia y proporcionarle contenido y anuncios relevantes para usted. Al utilizar nuestro sitio web, acepta el uso de Cookies. Puede cambiar su configuracion en cualquier momento. Politica de cookies.


Blog: Josep Curto Díaz Subscribe to this blog's RSS feed!

Josep Curto Díaz

Bienvenidos a mi blog en BeyeNETWORK, en el que focalizaré sobre las novedades del mercado Business Intelligence Open Source respecto software, tendencias de mercado, conferencias, mejores prácticas y cualquier novedad que permita a nuestros lectores estar informados con mayor frecuencia.

About the author >

Josep Curto es Area Manager en ICNET Consulting. Está focalizado en la implantación de Sistemas Business Intelligence, incidiendo en ofrecer la solución adecuada a las necesidades de sus clientes, con especial atención a las del emergente mercado Business Intelligence Open Source. Es Master en Business Intelligence y Master en Dirección y Gestión en Sistemas y Tecnologías de la Información por la UOC y licenciado en Matemáticas. Ha conjugado su carrera profesional con una clara vocación por educación superior siendo profesor en la Universidad Autónoma de Barcelona (UAB) y en la Universitat Oberta de Catalunya (UOC). Autor del blog Information Management. Es colaborador esporádico en la revista Gestión del Rendimiento. Josep puede ser contactado mediante Josep.curto@icnetconsulting.com.

March 2009 Archives

Como es bien sabido, R-project es una de las soluciones con mayor documentación en el ámbito open source (y que podéis encontrar aquí). La empresa Burns-stats ofrece también algunos documentos interesantes por ser introductorios:

Espero que os sean de utilidad.

Posted March 30, 2009 6:22 AM
Permalink | No Comments |
Una pregunta que frecuentemente me hacen es la siguiente: ¿existen soluciones de minería de datos open source?

Existen muchas soluciones. Con diferentes enfoques. Casi todas ellas coinciden en que surgen como proyectos en el contexto universitario y siguen teniendo profundos lazos.

  • Weka: herramienta creada por la Universidad de Waikato en el lenguaje Java (y por lo tanto multiplataforma) y que ha sido comprada por Pentaho. Esta herramienta hace foco en tareas de minería de datos y algoritmos de aprendizaje automático. Puede usarse de manera independiente o bien en el contexto de Pentaho. Desde Pentaho ofrecen servicios especializados.
  • Rapid Miner: es otra solución de minería de datos desarrollada con el lenguaje java. Exsten dos soluciones: comunidad y enterprise. La diferencia, como en el caso anterior reside en los servicios. Soporta los algoritmos desarrollados con weka. Incluye características que lo hacen sumamente interesante como Text Mining.
  • Alpha Miner: es una solución desarrollada por E-Business Technology Institute (ETI) of the University of Hong Kong bajo el auspicio de Innovation and Technology Fund (ITF). Sólo es una solución para Windows. Sin embargo, no hay novedades de la misma desde 2005.
  • R project: uno de los proyectos más conocidos y con más solera. Está escrito en C y es una implementación open source del lenguaje S. Es una potente herramienta de análisis estadístico extensible (con lo que soporta también métodos de minería de datos). Dada su potencia, soluciones propietarias como la de Information Builders la incluyen.
  • Keel: es una solución desarrollada en España bajo proyectos de investigación financiados. Se destaca por ser la primera solución open source en incluir algoritmos de evolución. Como la gran mayoría de soluciones, está desarrollada en Java.
  • Knime: el enfoque de esta situación difiere de los demás en varios aspectos. El primero de todos es que su IDE está basado en eclipse. Segundo que permite la ejecución tanto de rutinas de Weka como de R dando una gran versatilidad a esta herramienta. Así mismo incluye BIRT como motor de reporting.
Como veis el mercado está lleno de soluciones interesantes. 

Posted March 29, 2009 2:58 PM
Permalink | No Comments |

Pentaho ha presentado la versión 3.0 de su suite de Business Intelligence Enterprise Edition. A las características base de Pentaho (certificadas en su versión enterprise):

* Analysis
* Dashboards
* Data Integration / ETL
* Business Intelligence Platform
* Data Mining


Se han sumado las siguientes características:

* Pentaho Enterprise Console
* Pentaho Dashboard Designer
* Single Sign-On
* Streamlined security configuration
* Application diagnostics
* Repositoru utilities
* Lifecycle management
* Audit reports
* Automated content expiraton
* Clustering
* Performance monitoring
* ETL management and monitoring


Destacan además el soporte para Amazon EC2 de dicha versión.

Pronto tendremos la versión community en la cuál tendremos las características nuevas de la versión con los añadidos de la communidad: soporte para openflash carts o CDF (Community Dashboard Framework). Pero mientras,...

¿No queréis probarla?


Posted March 23, 2009 2:59 PM
Permalink | No Comments |
Como cada año por estas fechas se pone en marcha el Google Summer of Code. También en el tenemos algunos proyectos de Business Intelligence Open Source. La lista de organizaciones aceptadas son (por ahora):

  • OpenMRS: este proyecto proporciona una herramienta de análisis y gestión de Hospitales para el tercer mundo. Esta basado en Pentaho.
  • OSGEO: fundación para la Open Source GeoSpatial Community. Gestiona 16 proyectos diferentes relacionados con dicho tema.
  • R Foundation For Statical Computing: una de las herramientas más potentes Open Source para la minería de datos.
  • OpenStreetMap: proyecto con el objetivo de crear una capa de datos geográfica open source integrable con todo tipo de aplicaciones.
  • MySQL: la solución líder en bases de datos Open Source.
  • Pentaho: una de las soluciones más importantes en el mercado Business Intelligence Open Source.
Estas iniciativas son muy interesantes para hacer madurar estos productos. Esperemos que cada horma encuentre su zapato.

Posted March 20, 2009 10:11 AM
Permalink | No Comments |
Desde Talend tienen una muy buena iniciativa para la comunidad: Talend Babili.

¿En qué consiste esta iniciativa? Es un proyecto de traducción de las soluciones de Talend a través de la comunidad. Actualmente soporta inglés, francés, alemán, castellano, italiano, brasileño / portugués, chino, japonés y ruso.

Frecuentemente el hecho de que las soluciones open source del mercado no estén traducidas es un agravante para su difusión. También existen otros aspectos que trataremos en el futuro.

¿Cómo podemos participar? Es tan fácil como darse de alta en la web (usuario y password) eligiendo el proyecto en el que queremos participar. Y elegir el idioma en el que participar y empezar a participar. Muy sencillo y claro. Os recomiendo antes de ponerse, haber leído la guía de estilo para traducir exactamente lo adecuado.

Talend os necesita,... ¿algún voluntario?

Posted March 18, 2009 3:31 PM
Permalink | No Comments |

Como os podéis imaginar, ha sido un honor poder participar en BeyeNETWORK durante los últimos meses como experto en el área de Business Intelligence Open Source y espero que mis artículos hayan sido de utilidad para dar a conocer las soluciones existentes y empezar a profundizar en las mismas.


Como complemento a la formalidad presente en el canal, a partir de ahora también tendré un blog que me proporcionará un par de cosas muy importantes: flexibilidad y frecuencia. El objetivo es cubrir todos aquellos aspectos que no encajaban directamente en el formato de artículo. Ya fuera por su brevedad, estructura u otros.


Agradezco a BeyeNEWORK por la posibilidad ofrecida y espero que sea interesante para todos. Estamos en contacto.


Posted March 18, 2009 11:56 AM
Permalink | No Comments |