Blog: Josep Curto Díaz Subscribe to this blog's RSS feed!

Josep Curto Díaz

Bienvenidos a mi blog en BeyeNETWORK, en el que focalizaré sobre las novedades del mercado Business Intelligence Open Source respecto software, tendencias de mercado, conferencias, mejores prácticas y cualquier novedad que permita a nuestros lectores estar informados con mayor frecuencia.

About the author >

Josep Curto es Area Manager en ICNET Consulting. Está focalizado en la implantación de Sistemas Business Intelligence, incidiendo en ofrecer la solución adecuada a las necesidades de sus clientes, con especial atención a las del emergente mercado Business Intelligence Open Source. Es Master en Business Intelligence y Master en Dirección y Gestión en Sistemas y Tecnologías de la Información por la UOC y licenciado en Matemáticas. Ha conjugado su carrera profesional con una clara vocación por educación superior siendo profesor en la Universidad Autónoma de Barcelona (UAB) y en la Universitat Oberta de Catalunya (UOC). Autor del blog Information Management. Es colaborador esporádico en la revista Gestión del Rendimiento. Josep puede ser contactado mediante Josep.curto@icnetconsulting.com.

Nuevo año, nuevas versiones de productos Open Source. Iremos hablando de todas ellas dado que tenemos novedades interesantes.

Empezamos por Weka. Este producto, como ya sabemos, fue adquirido por Pentaho si bien aún se mantiene como producto independiente. En la última versión (disponible aquí), podemos encontrar interesantes mejoras con la inclusión de nuevos algoritmos entre los que destacamos:

  • SPegasus: Es un algoritmo que a través de la descendiente del gradiente estocástico, permite aprendizaje de support vector machine. Para más información consultad el artículo: S. Shalev-Shwartz, Y. Singer, N. Srebro: Pegasos: Primal Estimated sub-GrAdient SOlver for SVM. In: 24th International Conference on MachineLearning, 807-814, 2007. 
  • RealAdaBoost: algoritmo de clasificación de Friedman que usa el método Real Adaboost. Para más información: J. Friedman, T. Hastie, R. Tibshirani (2000). Additive Logistic Regression: a Statistical View of Boosting. Annals of Statistics. 95(2):337-407. 
  • Furia (Fuzzy Unordered Rule Induction Algorithm): aprendizaje de reglas fuzzy basado en el algoritmo RIPPER. Para más información: Jens Christian Huehn, Eyke Huellermeier (2009). FURIA: An Algorithm for Unordered Fuzzy Rule Induction. Data Mining and Knowledge Discovery. 
Para más información consulta en la wiki de pentaho.

Son buenas noticias que este tipo de productos continúe mejorando año tras año.

Posted January 16, 2010 3:13 AM
Permalink | 1 Comment |

1 Comment

Voy a hacerme una camiseta con esta frase:
"Un algoritmo que a través de la descendiente del gradiente estocástico permite aprendizaje de Support Vector Machine"
Lo van a flipar... :-)

Leave a comment