En los últimos años, el avance en campos como el metaverso, la realidad virtual y la inteligencia artificial no se ha hecho esperar. Los pasos agigantados que han dado las diferentes investigaciones relacionadas con la IA son incuestionables y, cada vez más, sorprendentes. La búsqueda por encontrar sistemas que comprendan, analicen y ejecuten actividades propias del ser humano, de manera eficiente y segura, ha llevado hacia desarrollos exitosos y menos limitados. En razón de esto, DeepMind creó un novedoso sistema de IA que no solo cumple con el objetivo anterior, sino que va un paso más allá.

DeepMind, el laboratorio de investigación de Alphabet —empresa matriz de Google— presentó, en los últimos días, a Gato. Esta inteligencia artificial tiene la capacidad de completar hasta 604 tareas. Es esto lo que la diferencia de otros sistemas que solo cumplen un límite de tareas relacionadas a un mismo objetivo. En este artículo de Futuro Eléctrico te lo contamos todo sobre ella.

Tabla de contenidos

DeepMind y Gato: un agente IA generalista

Inteligencia artificial DeepMind

Gato es un agente generalista único que funciona a través del modelado de lenguaje a gran escala. Esta IA tiene la capacidad de funcionar tanto como modelo de visión como modelo de lenguaje. Además, y como característica principal, ha sido entrenado para realizar acciones reales enfocadas en el contexto en el que se encuentre.

Aunque todavía el equipo de DeepMind no ha logrado que su inteligencia artificial pueda responder a problemas creativamente, lo cierto es que el lograr que realice una importante cantidad de tareas bajo la misma programación es cumplir un objetivo bastante difícil y arriesgado. Si bien todavía queda mucho camino por recorrer, esta creación acerca a nuevos avances en el campo de la inteligencia artificial general.

Así funciona la asombrosa inteligencia artificial de DeepMind

Sí, Gato es un agente multimodal que puede cumplir diversas tareas. Dichas tareas pueden ir desde describir imágenes, mantener conversaciones por chat, controlar un brazo robótico hasta jugar videojuegos de Atari. Y aunque llegar a esto es dar un paso agigantado dentro de la industria y en favor de los usuarios, la pregunta que todos nos hacemos es: ¿cómo funciona este sistema?

Gato, a través del modelado de lenguaje a gran escala, serializa la información de las diferentes actividades a realizar en una serie plana de tókenes. Dicha acción se procesa a través de redes neuronales. De esta manera se otorga el mismo peso e importancia a todas las tareas para las que está programado.

El proceso, según lo explicado en el estudio de DeepMind, se lleva a cabo de la siguiente forma:

Gato muestrea el vector de acción autor regresivamente un token a la vez. Una vez que se han muestreado todos los tokens que componen el vector de acción (determinados por la especificación de acción del entorno), la acción se decodifica invirtiendo el procedimiento de tokenización. Esta acción se envía al entorno que da paso y produce una nueva observación. El procedimiento se repite.

¿Y las otras inteligencias artificiales?

Sin duda alguna, el alcance de DeepMind con Gato es una demostración clara de un futuro prometedor en el campo de la inteligencia artificial y la inclusión de mejores tecnologías en procesos como el machine learning y redes neuronales. Aun así, el avance no es solo demostrable con Gato. Otros sistemas de inteligencia artificial han podido cumplir importantes objetivos relacionados con la capacidad de responder a contextos específicos e, incluso, con mayores parámetros que los que maneja la innovación de DeepMind.

En el caso, por ejemplo, del generador de texto de GPT-3 de OpenAi, se encuentran similitudes relacionadas con la aceptación de entrada de usuario y la realización de tareas a partir del aprendizaje basado en entradas anteriores. Además, en términos de parámetros GTP-3 maneja más de 170 billones, mientras que Gato se acerca solamente a los 1.2 billones.

Aún falta un largo camino por recorrer para Gato

Ahora bien, según lo propuesto por los investigadores de DeepMind, Gato se mantuvo pequeño para que pudiera realizar ciertas tareas en tiempo real, como el control del brazo robótico. DeepMind sostiene también que, en caso de ampliarse, Gato sería perfectamente capaz de abordar cualquier tipo de tarea, interés y comportamiento.

Pero la verdad es que todavía quedan varios obstáculos por superar para que Gato sea superior a otras inteligencias artificiales con solo una función. Gato, por ejemplo, no aprende continuamente. Esto se debe a que es un sistema basado en datos de entrenamiento. Dichos datos permanecen estáticos desde el momento en que se programan.

Además, lo anterior supone una limitación en lo referente a la cantidad de información que puede recordar. Limitación que, aunque permite que pueda responder a muchas tareas, no siempre va a dar las respuestas adecuadas o va a tener la ejecución correcta.

Palabras finales

DeepMind es una de las tantas caras de la búsqueda por alcanzar la superinteligencia artificial. Aun teniendo diversas barreras por afrontar, Gato nos lleva a preguntarnos sobre las verdaderas implicaciones de lograr una IAG no solo en lo referente a la industria y la tecnología, sino en la misma evolución humana. ¿Estaremos muy cerca de vivir lo que solo pensábamos posible en las películas sobre inteligencia artificial?

Lecturas sugeridas: