Manuel Martínez Morales*
El campo de la inteligencia artificial surge de la interacción entre varias disciplinas científicas como las neurociencias, psicología, matemática, biología evolutiva, ciencias de la computación y la lógica, entre otras. Si bien no existe una definición universalmente aceptada sobre su contenido y sus alcances, puede decirse, en forma un tanto simplista, que la inteligencia artificial se enfoca a estudiar procesos observados en la naturaleza, que pueden clasificarse como “inteligentes”.
Como parte de dichos procesos se cuentan los mecanismos de comportamiento que aseguran la supervivencia y la adaptación de seres vivos a medios cambiantes y, particularmente, ciertas funciones específicamente humanas como la adquisición y el empleo del lenguaje natural, las formas en que los hombres resuelven problemas mediante representaciones simbólicas (lógicas y/o matemáticas), y la manera en que se estructura y opera el conocimiento –desde el sentido común hasta las teorías científicas–; todo ello con el objetivo de implantar o reproducir estos esquemas y procedimientos en un programa de computadora o en algoritmos para regular la acción de robots.
Aprendizaje automático
Destacan las teorías y métodos conocidos genéricamente como aprendizaje automático, a veces denominado en inglés machine learning. El objetivo de esta rama de la inteligencia artificial es el desarrollo de algoritmos que modifican o adaptan su desempeño con el fin de mejorar la tarea para la cual han sido programados. La mayor parte de los programas computacionales no tiene esta característica. Por ejemplo, se puede escribir un programa para multiplicar números enteros, al programa se le dan como datos de entrada un par de números y se obtiene como salida el producto de éstos. Este programa nunca cambia la función que relaciona la entrada y la salida, siempre que se dé como entrada el par 3,6, el resultado será siempre 18. En este caso no hay aprendizaje.
Pensemos ahora en un algoritmo que “aprenda” a reconocer los números nones sin darle la definición de éstos. Entonces, lo que se hace es darle al programa algunos ejemplos de entrenamiento como se haría con un niño al que se quiere enseñar el concepto. Es decir, se le da una muestra de números pares e impares informando al programa cuáles corresponden a cada categoría. El programa, por sí mismo, debe “descubrir” el concepto de número impar y, eventualmente, aplicarlo a nuevos ejemplos no presentados con anterioridad.
Este programa tiene que ir cambiando su desempeño, modificando la función que relaciona la entrada con la salida; al principio puede cometer errores, pero de lo que se trata es que, eventualmente, “aprenda” el concepto correctamente. Como ejemplos aplicados pueden mencionarse programas que “aprenden” a realizar ciertos diagnósticos médicos –como identificar células cancerosas distinguiéndolas de células sanas– y programas que “descubren” regularidades y patrones en bases de datos. El aprendizaje automático está enfocado a estudiar y desarrollar teorías y métodos para diseñar algoritmos de este tipo.
Aprendizaje de conceptos
Existe un campo especializado, dentro del área de aprendizaje automático, denominado aprendizaje de conceptos, cuyo propósito es identificar conceptos a partir de un conjunto de datos y representar el concepto en forma apropiada. En el caso más sencillo, el concepto se define como una función que hace corresponder a un conjunto de atributos un indicador que toma solamente dos valores, correspondientes a los ejemplos positivos del concepto y a los ejemplos negativos del concepto respectivamente.
Para ilustrar la forma en que operan estos algoritmos, consideremos el siguiente ejemplo hipotético. La Tabla que acompaña este texto muestra datos sobre casos de estallamiento de huelgas en diversas circunstancias y la presencia, o ausencia, de varios factores que se piensa se relacionan con el evento. De este modo, el primer caso (primera línea de la tabla) corresponde a una huelga que tuvo éxito (Éxito=SÍ), en un sitio en el cual el mercado se encontraba en etapa de expansión (Mercado=SÍ), no existía el riesgo de estallamiento de otras huelgas por solidaridad (Solidaridad=NO), y el sindicato responsable de la huelga disponía de un fondo de resistencia sólido (Fondo=SÍ). Los otros casos pueden leerse de la misma manera.
El problema para el sociólogo es intentar determinar algunas hipótesis sobre posibles relaciones causales entre los factores considerados y el éxito (o fracaso) de la huelga. Obviamente, el objetivo no es analizar los efectos de los diversos factores aisladamente, sino que el investigador sabe que está frente a un proceso complejo y lo aborda desde la perspectiva de la multicausalidad. Dado que el caso que presentamos es artificial, no es muy difícil, a partir de una exploración de la tabla, extraer algunas regularidades como, por ejemplo, que siempre que M=SÍ y F=SÍ, la huelga fue exitosa independientemente del valor del tercer factor (S).
Pero note también que existen otras posibilidades. El problema es analizar la relación entre los factores dados y el resultado de la huelga y determinar cuáles combinaciones de atributos son los que se asocian con una huelga exitosa. Aun cuando se trabaje con pocos factores y casos, no es tan sencillo extraer el patrón de las interacciones. En las aplicaciones reales pueden tenerse decenas de atributos y miles de casos, lo que complica el análisis.
Diagrama reticular
Aplicando el algoritmo de aprendizaje M-latiz, diseñado por el autor de este texto, se construye una estructura algebraica denominada retícula (lattice), que puede representarse en un diagrama que muestra los distintos casos y la forma en que se relacionan los atributos considerados, véase el Diagrama 1.
El diagrama reticular se interpreta de la siguiente manera. Se define un concepto como un par ordenado, en el cual la primera parte del par representa los objetos designados por el concepto, y la segunda parte contiene los atributos definitorios de esos objetos, todo ello en un orden jerárquico. Por ejemplo, considere el par {1,2,3,4; E}, que indica que el concepto Huelga Exitosa, representado por la letra E, es un atributo de los objetos 1,2,3 y 4, lo cual puede corroborarse en la Tabla. Estos casos se subdividen, por un lado, en {1,3,4; ME}, que corresponde a los casos en los cuales las huelga fue exitosa y se dan condiciones de mercado favorables, M; y, por otro lado, en {2,3,4; SE} aquéllos en los cuales una huelga exitosa se asocia con la posibilidad de huelgas de solidaridad. En la misma forma pueden interpretarse los otros elementos de la estructura. Una posible conclusión –que podría tomarse como una hipótesis por el sociólogo– sería que las huelgas exitosas tuvieron lugar cuando había condiciones de mercado favorables y podían presentarse huelgas de solidaridad.
Una de tantas posibilidades
El ejemplo presentado es imaginario para que la presentación se simplifique, en la aplicación real se consideran más atributos y éstos pueden tomar más de dos valores.
El aprendizaje de conceptos es solamente una de tantas especialidades dentro del campo de aprendizaje automático. Entre las variantes de este campo pueden mencionarse, además del aprendizaje de conceptos, algoritmos de aprendizaje basados en redes neuronales, los algoritmos genéticos, el aprendizaje bayesiano (probabilista), el aprendizaje por reforzamiento, el aprendizaje de árboles de decisión, entre muchos otros.
*Investigador en el Centro de Investigación en Inteligencia Artificial, UV; actualmente Director de Comunicación de la Ciencia en la misma universidad.
Correo: manuelmm69@hotmail.com
Diseño: L.D.G Francisco J. Cobos Prior