Usamos cookies y otras tecnologias similares (Cookies) para mejorar su experiencia y proporcionarle contenido y anuncios relevantes para usted. Al utilizar nuestro sitio web, acepta el uso de Cookies. Puede cambiar su configuracion en cualquier momento. Politica de cookies.


Blog: Josep Curto Díaz Subscribe to this blog's RSS feed!

Josep Curto Díaz

Bienvenidos a mi blog en BeyeNETWORK, en el que focalizaré sobre las novedades del mercado Business Intelligence Open Source respecto software, tendencias de mercado, conferencias, mejores prácticas y cualquier novedad que permita a nuestros lectores estar informados con mayor frecuencia.

About the author >

Josep Curto es Area Manager en ICNET Consulting. Está focalizado en la implantación de Sistemas Business Intelligence, incidiendo en ofrecer la solución adecuada a las necesidades de sus clientes, con especial atención a las del emergente mercado Business Intelligence Open Source. Es Master en Business Intelligence y Master en Dirección y Gestión en Sistemas y Tecnologías de la Información por la UOC y licenciado en Matemáticas. Ha conjugado su carrera profesional con una clara vocación por educación superior siendo profesor en la Universidad Autónoma de Barcelona (UAB) y en la Universitat Oberta de Catalunya (UOC). Autor del blog Information Management. Es colaborador esporádico en la revista Gestión del Rendimiento. Josep puede ser contactado mediante Josep.curto@icnetconsulting.com.

Una pregunta que frecuentemente me hacen es la siguiente: ¿existen soluciones de minería de datos open source?

Existen muchas soluciones. Con diferentes enfoques. Casi todas ellas coinciden en que surgen como proyectos en el contexto universitario y siguen teniendo profundos lazos.

  • Weka: herramienta creada por la Universidad de Waikato en el lenguaje Java (y por lo tanto multiplataforma) y que ha sido comprada por Pentaho. Esta herramienta hace foco en tareas de minería de datos y algoritmos de aprendizaje automático. Puede usarse de manera independiente o bien en el contexto de Pentaho. Desde Pentaho ofrecen servicios especializados.
  • Rapid Miner: es otra solución de minería de datos desarrollada con el lenguaje java. Exsten dos soluciones: comunidad y enterprise. La diferencia, como en el caso anterior reside en los servicios. Soporta los algoritmos desarrollados con weka. Incluye características que lo hacen sumamente interesante como Text Mining.
  • Alpha Miner: es una solución desarrollada por E-Business Technology Institute (ETI) of the University of Hong Kong bajo el auspicio de Innovation and Technology Fund (ITF). Sólo es una solución para Windows. Sin embargo, no hay novedades de la misma desde 2005.
  • R project: uno de los proyectos más conocidos y con más solera. Está escrito en C y es una implementación open source del lenguaje S. Es una potente herramienta de análisis estadístico extensible (con lo que soporta también métodos de minería de datos). Dada su potencia, soluciones propietarias como la de Information Builders la incluyen.
  • Keel: es una solución desarrollada en España bajo proyectos de investigación financiados. Se destaca por ser la primera solución open source en incluir algoritmos de evolución. Como la gran mayoría de soluciones, está desarrollada en Java.
  • Knime: el enfoque de esta situación difiere de los demás en varios aspectos. El primero de todos es que su IDE está basado en eclipse. Segundo que permite la ejecución tanto de rutinas de Weka como de R dando una gran versatilidad a esta herramienta. Así mismo incluye BIRT como motor de reporting.
Como veis el mercado está lleno de soluciones interesantes. 

Posted March 29, 2009 2:58 PM
Permalink | No Comments |

Leave a comment