La nueva red neuronal de OpenAI genera imágenes a partir de un texto

Dall-E

En las redes sociales, los algoritmos son capaces (con más o menos eficiencia y, a veces, sesgados) de subtitular el contenido de una foto. Esto equivale a interpretar el contenido de una imagen para obtener una descripción de ella. Una inteligencia artificial llamada Dall-E puede hacer lo contrario: crear una imagen a partir de un texto.

Dall-E fue diseñado por OpenIA . La compañía estadounidense se distinguió recientemente con la herramienta llamada GPT-2, que ha sido controvertida por su capacidad para producir párrafos cercanos a los escritos por un humano; se supone que la IA puede hacer artículos o poemas. Creyendo que este modelo era demasiado peligroso porque era demasiado poderoso , dejaron de publicar el código. Luego finalmente lanzaron una versión más ligera, llamada GPT-3, que sigue siendo bastante poderosa ya que hizo trampa en un sitio como HackerNews este verano de 2020.

 

QUÉ PUEDE HACER DALL-E

Dall-E es una red neuronal artificial basada en el código de GPT-3. Para GPT-3, se deben ingresar varias entradas textuales en el algoritmo, que sirven como temas sobre los cuales la IA extrapola para producir un resultado textual. Dall-E funciona exactamente igual, excepto que el algoritmo responde a la entrada produciendo imágenes en lugar de texto.

Por ejemplo, con la entrada "una silla de oficina con forma de abogado", Dall-E generará una imagen que no podría parecerse más a esta extraña descripción, ya sea en cuanto a colores o formas. Esto refleja, según OpenIA, su "  capacidad para producir un objeto que parece prácticamente funcional  ", así como su capacidad para generar algo a partir de dos ideas que teóricamente no tienen nada que ver entre sí.