Muchas felicidades a Héctor Xavier Limón Riaño, quien obtuvo el Doctorado en Inteligencia Artificial con mención honorífica, por su tesis titulada “JaCa-DDM: a framework for Distributed Data Mining based on the Agents & Artifacts paradigm”, bajo mi dirección y la co-dirección del Dr. Nicandro Cruz Ramírez.
La tesis propone un marco conceptual para el diseño, implementación y despliegue de sistemas de minería de datos distribuidos, basado en agentes y artefactos. Los agentes deciden el flujo de trabajo a seguir, mientras que los artefactos encapsulan herramientas de minería de datos que estos pueden usar. JaCa-DDM (X. Limón, A. Guerra-Hernández, N. Cruz-Ramírez, and F. Grimaldo. An agents & artifacts approach to distributed data mining. In F. Castro, A. Gelbukh, and M. G. Mendoza, editors, MICAI 2013: Eleventh Mexican International Conference on Artificial Intelligence, volume 8266 of Lecture Notes in Artificial Intelligence, pages 338–349, Berlin Heidelberg, 2013. Springer Verlag) es la implementación en Jason y CArtAgO, de este marco conceptual. En este sistema, los artefactos encapsula objetos de Weka para que puedan ser usados por los agentes BDI implementados en Jason.
Se ha usado JaCa-DDM para implementar diversas estrategias bien conocidas en la minería de datos distribuida, como las basadas en centralizar datos y las basadas en meta-aprendizaje, p. ej., bosques de árboles aleatorios, demostrando así su pertinencia. Se ha usado también para explorar nuevas estrategias en torno a la inducción de árboles de decisión y la técnica conocida como Windowing, demostrando así su flexibilidad.
En este contexto, el Windowing se explota aprendiendo en un sitio una hipótesis inicial, para luego refinarla con los contra ejemplos que se puedan encontrar en los demás sitios. Diferentes estrategias son posibles dependiendo de qué se comunica en el sistema, p. ej., la hipótesis ó los contra ejemplos y en qué orden. La tesis presenta un análisis exhaustivo de todas estas posibilidades.
La tesis identifica un cuello de botella en el Windowing, al momento de buscar los contra ejemplos de una hipótesis. Esta limitante es superada usando GPUs para optimizar esta tarea (X. Limón, A. Guerra-Hernández, N. Cruz-Ramírez, H. G. Acosta-Mesa, and F. Grimaldo. A windowing based GPU optimized strategy for the induction of decision trees. In volume 277 of Frontiers in Artificial Intelligence and Applications, pages 100-109, Amsterdam, NL, 2015. IOS Press). También se mejora el Windowing intentando mantener el tamaño de la ventana lo más pequeño posible.
La estrategia que incorpora estas mejoras, fue probada en un problema de segmentación de imágenes para la detección de cáncer cérvico-uterino vía colposcopia (X. Limón, A. Guerra-Hernández, N. Cruz-Ramírez, H. G. Acosta-Mesa, and F. Grimaldo. A windowing strategy for distributed data mining optimized through gpus. Pattern Recognition Letters, 93:23-30, 2017).
La tesis también explora mejora a CArtAgO, la implementación usada del modelo de Artefactos, para hacer más transparente la implementación de las estrategias de aprendizaje distribuido (X. Limón, A. Guerra-Hernández, and A. Ricci. Distributed transparency in endogeneous environments: The JaCaMo case. In EMAS@AAMAS 2017 Workshop Notes. Engineering Multi Agent Systems, Fifth International Workshop, Sao Paulo, Brasil, May 8th and 9th, 2017., pages 142–157, 2017).
Por lo anterior, podemos afirmar que la tesis presenta avances significativos para las áreas de minería de datos y sistemas multi-agente.