DeepMind presentó hace poco su nueva IA Gato; un sistema de inteligencia artificial multimodal que puede realizar más de 600 tareas distintas. Podría decirse que es el servicio de aprendizaje automático más increíble que nadie haya visto hasta el presente.

La nueva IA Gato es sencillamente impresionante

Sí, nos ha dejado sin palabras, aunque queda por ver qué tal se comporta cuando investigadores externos a DeepMind lo prueben por cuenta propia y jueguen con él.

Y es que Gato es capaz de hacer casi todo lo que te puedas imaginar; desde jugar a juegos de Atari, describir imágenes o chatear con personas. El sistema es entrenado una única vez y emplea los mismos pasos o estados para realizar todas las tareas.

nueva IA Gato
Modelo de Gato, agente multimodal

Gato es considerado un agente multimodal, esto significa que operar sobre diferentes tareas. GPT-3, la IA desarrollada por OpenAI (compañía de Elon Musk) también puede hacerlo, pero la IA de DeepMind va más allá.

El sistema de Gato necesita 1.200 millones de parámetros mientras que GPT-3 necesita 175.000 millones para su funcionamiento. Esta diferencia es asombrosa.

Estamos delante del primer modelo generalista capaz de desempeñar tantas tareas tan bien. Es esperanzador para el futuro del desarrollo de IA ver que aprende a hacer todo ello con la misma red neuronal y los mismos pesos.

nueva IA Gato modelo entrenamiento
Conjunto de datos empleados en el entrenamiento de Gato

Es posible pasarle al modelo una entrada en forma de imagen o de texto. Incluso puedes hacerle aprender nuevos movimientos para controlar un brazo robótico. Gato puede decidir qué tipo de salida proporcionar en función de su contexto.

Se podría decir que el ser humano se está acercando a la querida pero temida IA general (AGI). Esta inteligencia a nivel humano es el objetivo que muchos investigadores persiguen.

¿Qué implicaría esto? De momento es pronto para hablar, pero desde luego, tras ver algunas de las películas de ciencia ficción disponibles podríamos pensar que estamos a punto de recrear Skynet.

Vía DeepMind