Usamos cookies y otras tecnologias similares (Cookies) para mejorar su experiencia y proporcionarle contenido y anuncios relevantes para usted. Al utilizar nuestro sitio web, acepta el uso de Cookies. Puede cambiar su configuracion en cualquier momento. Politica de cookies.


Blog: Josep Curto Díaz Subscribe to this blog's RSS feed!

Josep Curto Díaz

Bienvenidos a mi blog en BeyeNETWORK, en el que focalizaré sobre las novedades del mercado Business Intelligence Open Source respecto software, tendencias de mercado, conferencias, mejores prácticas y cualquier novedad que permita a nuestros lectores estar informados con mayor frecuencia.

About the author >

Josep Curto es Area Manager en ICNET Consulting. Está focalizado en la implantación de Sistemas Business Intelligence, incidiendo en ofrecer la solución adecuada a las necesidades de sus clientes, con especial atención a las del emergente mercado Business Intelligence Open Source. Es Master en Business Intelligence y Master en Dirección y Gestión en Sistemas y Tecnologías de la Información por la UOC y licenciado en Matemáticas. Ha conjugado su carrera profesional con una clara vocación por educación superior siendo profesor en la Universidad Autónoma de Barcelona (UAB) y en la Universitat Oberta de Catalunya (UOC). Autor del blog Information Management. Es colaborador esporádico en la revista Gestión del Rendimiento. Josep puede ser contactado mediante Josep.curto@icnetconsulting.com.

Recently in Data Mining Category

Weka, la conocida herramienta de Data Mining, ha alcanzado una nueva versión: la 3.7. A parte de mejorar el rendimiento de algoritmos y corrección de bugs, entre otras nuevas características podemos destacar:

  • Soporte para la carga y testeo de clasificadores PMML.
  • Implementación de SMOTE.
  • Implementación de Rotation Forest.

Són muchos cambios para la presente versión, para conocer todas consultad aquí y para los interesados en la descarga aquí.

Posted June 18, 2009 11:33 AM
Permalink | No Comments |
R, uno de los proyectos de minería de datos más sólidos, ha alcanzado la versión 2.9. ¿Qué nuevas características presenta?

  • Mejoras en las opciones de las características disponibles.
  • Mejoras en la precisión de ciertas operaciones (como cumsum() o cumprod()).
  • Corrección de bugs
  • ...

El listado completo de las novedades se puede consultar aquí.


Posted May 3, 2009 8:10 AM
Permalink | No Comments |
Estos días casi todas las soluciones open source están presentando nuevas versiones de sus herramientas. Así mismo es para las soluciones de minería de datos de las que hablabamos hace unos días

En este caso concreto hablaremos de Rapid Miner. Ha salido la versión 4.4. Dicha versión tiene mejoras en:

  • Usabilidad (a nivel de trabajo).
  • Funcionalidad (más de 30 nuevas funcionalidades).
  • Correción de bugs (como consumo disparado de memoria en algunas operaciones).
  • Visualización (nuevos tipos y mejoras en los existentes).
  • Modelos (mayor rendimiento, más parámetros en algunos algoritmos,...).
Como vemos es una solución de evolución rápida dado versión anterior data de noviembre, 2008.



Posted April 8, 2009 3:30 AM
Permalink | No Comments |
Como es bien sabido, R-project es una de las soluciones con mayor documentación en el ámbito open source (y que podéis encontrar aquí). La empresa Burns-stats ofrece también algunos documentos interesantes por ser introductorios:

Espero que os sean de utilidad.

Posted March 30, 2009 6:22 AM
Permalink | No Comments |
Una pregunta que frecuentemente me hacen es la siguiente: ¿existen soluciones de minería de datos open source?

Existen muchas soluciones. Con diferentes enfoques. Casi todas ellas coinciden en que surgen como proyectos en el contexto universitario y siguen teniendo profundos lazos.

  • Weka: herramienta creada por la Universidad de Waikato en el lenguaje Java (y por lo tanto multiplataforma) y que ha sido comprada por Pentaho. Esta herramienta hace foco en tareas de minería de datos y algoritmos de aprendizaje automático. Puede usarse de manera independiente o bien en el contexto de Pentaho. Desde Pentaho ofrecen servicios especializados.
  • Rapid Miner: es otra solución de minería de datos desarrollada con el lenguaje java. Exsten dos soluciones: comunidad y enterprise. La diferencia, como en el caso anterior reside en los servicios. Soporta los algoritmos desarrollados con weka. Incluye características que lo hacen sumamente interesante como Text Mining.
  • Alpha Miner: es una solución desarrollada por E-Business Technology Institute (ETI) of the University of Hong Kong bajo el auspicio de Innovation and Technology Fund (ITF). Sólo es una solución para Windows. Sin embargo, no hay novedades de la misma desde 2005.
  • R project: uno de los proyectos más conocidos y con más solera. Está escrito en C y es una implementación open source del lenguaje S. Es una potente herramienta de análisis estadístico extensible (con lo que soporta también métodos de minería de datos). Dada su potencia, soluciones propietarias como la de Information Builders la incluyen.
  • Keel: es una solución desarrollada en España bajo proyectos de investigación financiados. Se destaca por ser la primera solución open source en incluir algoritmos de evolución. Como la gran mayoría de soluciones, está desarrollada en Java.
  • Knime: el enfoque de esta situación difiere de los demás en varios aspectos. El primero de todos es que su IDE está basado en eclipse. Segundo que permite la ejecución tanto de rutinas de Weka como de R dando una gran versatilidad a esta herramienta. Así mismo incluye BIRT como motor de reporting.
Como veis el mercado está lleno de soluciones interesantes. 

Posted March 29, 2009 2:58 PM
Permalink | No Comments |