Han pasado algo más de cinco años desde que echara a rodar un proyecto que pretende poner a disposición de la humanidad las bondades de la inteligencia artificial. Esas eran las premisas, al menos, con las que Elon Musk, Sam Altman, Ilya Sutskever y Greg Brockman pusieron en marcha OpenAI en diciembre de 2015.

Este mes sus impulsores han dado a conocer un sistema llamado DALL-E, capaz de transformar en imágenes descripciones textuales. El simulador, que puedes probar entrando aquí, genera dispensadores de jabón en forma de fósil, bolsos con forma de ala de mariposa, o lámparas que imitan a un arce japonés.

DALL-E es una red neuronal con 12.000 millones de parámetros de GPT-3, un modelo de machine learning que tan pronto completa frases inacabadas, como que programa, traduce el lenguaje humano a SQL o responde sobre multitud de temas. La tecnología GPT-3, también desarrollada por OpenAI y presentada en verano, se completa hoy con este nuevo hallazgo.

Uno de los retos que presenta el nuevo progreso en inteligencia artificial es conseguir que controle al mismo tiempo varios objetos, sus atributos y sus relaciones espaciales. Si bien es cierto que DALL-E puede crear imágenes variopintas en función de lo que escribamos, a medida que introducimos más objetos tiende a confundir las asociaciones.

A pesar de las depuraciones pendientes, actualmente es posible visualizar perspectiva y tridimensionalidad, jugar con la combinación de conceptos no relacionados (¿un caracol con textura de arpa? ¿Un sillón con forma de aguacate? DALL-E lo hace), diseñar versiones antropomorfizadas de animales u objetos, o realizar tareas de traducción de imagen a imagen.

Creación de imagen a partir de texto inteligencia artificial
Resultados obtenidos al introducir en el simulador la frase «Un sillón en forma de aguacate». openai.com

OpenAI y sus incursiones en inteligencia artificial

Como todo lo que tiene que ver con Elon Musk, OpenAI sorprende desde su nacimiento. Ya hemos mencionado el modelo de lenguaje autorregresivo GPT-3, al que le precedió GPT-2. Aquel invento, que generaba párrafos de texto coherentes y traducciones automáticas, no ha sido el único hallazgo destacable de los últimos tiempos.

No hace muchos meses, por ejemplo, nos enterábamos de que gracias a la inteligencia artificial es posible escuchar temas nuevos de artistas fallecidos imitando su voz con la herramienta “Jukebox” de OpenAI. También han entrenado a una mano robótica para que manipule objetos con una destreza nunca antes vista. Resolver un cubo de rubik figura en su lista de objetivos cumplidos, como se ve en este vídeo.

Todos los proyectos de esta institución pretenden, según sus fundadores, crear sistemas “altamente autónomos” que faciliten la vida de las personas. Lo hacen, según explican, sin ánimo de lucro, y aseguran que darán su misión por cumplida si con su trabajo ayudan a que otros logren el mismo fin que ellos persiguen. Solo el tiempo nos dirá cuánto de útiles y productivos pueden llegar a ser estos avances que nos dejan boquiabiertos cada vez que se cuelan en la agenda mediática.

Deja un comentario