OpenAI es una de las empresas más punteras de Inteligencia Artificial. Fundada en diciembre de 2015 es la responsable de proyectos de gran calibre como GPT-3. O también, del superordenador de Microsoft en la nube.
Open AI desarrolla diferentes proyectos y modelos de Inteligencia Artificial especializados en áreas muy concretas. Estos son capaces de desarrollar tareas como crear imágenes a partir de palabras escritas, fabricar música nueva y escribir como un periodista.
Cuáles son los proyectos de OpenAI
OpenAI es una compañía de software, que usa la Inteligencia Artificial como plataforma para desarrollar y crear contenido. Esa es la mejor definición para la empresa, en estos momentos.
Partiendo de la premisa que la Inteligencia Artificial no es el fin, sino el medio, Open AI se ha enfocado en el entrenamiento de algoritmos en los siguientes campos:
- Escritura automática
- Creación de imágenes a través de palabras escritas
- Creación de música de manera automática
- Entrenamiento de asociación de conceptos en redes neuronales (lo explicaremos más adelante)
- Gestión, clasificación y asociación de datos de forma automática
El campo de la Inteligencia Artificial es inconmensurable. Y está en constante evolución. OpenAI es una de las empresas que llevan la batuta en cuanto a avances, y alianzas, tal y como vimos en este post, con su alianza con Microsoft.
El proyecto de OpenAI más conocido es GPT-3. Hasta hace poco, el mayor sistema de escritura automática. Así que, empezando por este, te voy a explicar en qué consiste GPT-3 y por qué es importante.
Qué es y cómo funciona GPT-3
GPT-3 es un sistema de escritura automática, basada en Machine Learning. En otras palabras: un algoritmo capaz de escribir por sí mismo. O más bien, que ha aprendido a hacerlo. Sin pararnos en detalles demasiado técnicos, GPT-3 es uno de los modelos con más parámetros para entrenarse.
Ha supuesto un cambio en la forma en la que se almacenan los datos, en cómo se entrena una Inteligencia Artificial y de lo que es capaz de hacer. Y sobre todo, las sorprendentes aplicaciones que puede llegar a tener. Como es el caso de programar código, o detectar fake news.
En efecto, GPT-3 está tan perfeccionado a día de hoy, que uno de sus "entrenamientos" es escribir noticias inventadas. Y por supuesto, noticias falsas. El objetivo es sencillo: entrenarse a sí mismo para detectar cómo se escriben las noticias y poder detectar cuáles son fake news.
En el caso de la programación, GPT-3 ha derivado en GitHub Copilot, "la famosa IA que sabe programar y que te puede dejar sin trabajo". Más allá de titulares llamativos, Copilot es una derivación de GPT-3 que en vez de ser entrenada con lenguaje natural, ha sido entrenada a base de líneas de código.
Con el tiempo, Copilot aprende a escribir parámetros a partir de las acciones que le indiquemos, en lenguaje natural. Una muestra más, de las aplicaciones que puede llegar a tener el aprendizaje automatizado de la escritura. Es por ello, que las aplicaciones de GPT-3, aun importantes, estamos viendo solo el principio.
Jukebox, Dall·E, Clip y más aplicaciones de la IA
OpenAI no solamente centra sus proyectos en la escritura automática. Sino que también, han irrumpido en el mundo de la música. Jukebox es un modelo de Inteligencia Artificial, capaz de crear nueva música (de forma automatizada, por supuesto), a partir de música ya existente.
El funcionamiento (explicado de forma entendible y resumida) es el siguiente: Hay millones de canciones alojadas en la base de datos de Jukebox. Y todas ellas están clasificadas en base a diferentes parámetros, como por el género musical o el sentimiento que provocan.
Entonces, nosotros le damos una canción a Jukebox, previamente clasificada dentro de su base de datos y que por tanto, "la reconoce", y mediante el conocimiento que ya posee, crea una nueva canción a partir de la canción que se le ha dado. Partiendo de los elementos de dicha canción y del conocimiento de su base de datos.
Para muestra un botón (o varios, en este caso), que los ejemplos más notorios de las creaciones de Jukebox están públicos en Soundcloud y los puedes escuchar en el reproductor de aquí abajo.
No solo de música y escritura va la cosa. Sino que también va de imágenes. Dall·E es un modelo de IA que crea imágenes a partir de parámetros dados, expresados en lenguaje natural. Dicho de otra forma, es un algoritmo en el que le escribes algo, y ese algo se transforma en una imagen.
Una imagen, completamente generada desde cero, y en base al conocimiento del lenguaje natural y de las distintas asociaciones de imágenes que tiene en su base de datos. Pero de asociación de conceptos, hablaremos un poco más adelante.
De hecho, podríamos decir que Dall·E es un 'spin off' de GPT-3. Ya que de hecho, es una versión de GPT-3, entrenada con millones y millones de parámetros, enfocado a la creación de imágenes a partir de texto. En este caso, su base de datos tiene una característica distinta a GPT-3.
Además de imágenes y texto, su base de datos integra imágenes que van ligadas a un texto. Algo tan simple como la foto de un Bulldog Francés, y justo al lado, un texto que pone "Bulldog Francés" (dicho, otra vez, de forma muy rápida).
A día de hoy, Dall·E ha aprendido lo suficiente como para generar imágenes a partir de construcciones lingüísticas más complejas. Por poner un ejemplo, no solamente escribes "Vaso" y te dibuja un vaso. Sino que puedes indicarle frases mucho más largas y complejas. Tal y como puedes ver justo aquí abajo.


CLIP sería el paso intermedio entre GPT-3 y Dall·E porque es la red neuronal que es capaz de conectar (y relacionar) imágenes con texto. En pocas palabras, es el modelo de Inteligencia Artificial que aprende a juntar las imágenes con su texto correspondiente y que aprenda a juntar imágenes con texto, implica que conoce el significado de las imágenes y sabe identificar objetos en si mismos.