Cómo usar Bing Image Creator para generar imágenes con inteligencia artificial: descripción, mecanismo y aplicaciones de esta tecnología

Te presentaremos qué es el Generador de Imágenes de Bing y cómo opera la tecnología de inteligencia artificial desarrollada por Microsoft para producir imágenes a partir de texto. Esta IA se fundamenta en DALL-E y llega para competir contra otros gigantes del sector como Stable Diffusion y MidJourney.

En primer lugar, te explicaremos de manera sencilla qué es precisamente esta tecnología de inteligencia artificial, para que cualquier individuo pueda comprenderla sin muchos términos técnicos. Asimismo, procuraremos resumir su funcionamiento y finalmente te indicaremos cómo puedes probarla y diseñar imágenes con ella.

Qué es Bing Image Creator

El Generador de Imágenes de Bing se trata de un sistema de inteligencia artificial que permite generar imágenes de forma gratuita. Con esta herramienta, simplemente debes redactar lo que deseas en Bing y su IA generará cuatro dibujos a partir de tu solicitud o prompt.

La tecnología de Bing Image Creator emplea una variante avanzada de DALL-E, el modelo de creación de imágenes por IA desarrollado por OpenAI. Esta misma compañía es responsable de ChatGPT y GPT-4, las tecnologías que utiliza Bing Chat para interactuar con los usuarios.

Por consiguiente, Bing Image Creator opera de la misma manera que DALL-E, ya que es una versión propia y avanzada de esta inteligencia artificial. Por lo tanto, es capaz de comprender lo que le estás solicitando utilizando lenguaje natural, ya que ha sido entrenada para entender las estructuras que empleamos al comunicarnos y solicitar lo que deseamos que dibuje.

Our commitment to making the new Image Creator from Microsoft Bing fun and  inclusive for everyone - The Official Microsoft Blog

Debido a que DALL-E ha sido entrenado utilizando una amplia biblioteca de obras de arte y fotografías, Bing Image Creator puede aprovecharlo para crear dibujos con estilos específicos. Es posible solicitarle que dibuje algo con el estilo de un artista famoso o de un movimiento artístico en particular, y sabrá interpretar la petición para dibujar lo deseado.

Asimismo, este sistema de inteligencia artificial es capaz de combinar conceptos, estilos y atributos para una imagen. Por lo tanto, si especificas detalles, estilos, tamaños o elementos que deseas que aparezcan en tu petición, la IA de Microsoft los integrará para crear la imagen.

Además, al estar integrado en Bing Chat, después de que la IA de Bing Image Creator haya generado la imagen solicitada, se puede pedir de manera natural que agregue algún elemento adicional, como una chimenea en una casa. Por tanto, además de crear la imagen, la IA de Microsoft seguirá «escuchando» para realizar cualquier modificación que se le requiera.

Cómo funciona Bing Image Creator

Bing Image Creator se basa en lo que se llama un modelo de difusión, que es un tipo de sistema de inteligencia artificial capaz de generar imágenes desde cero. Durante el proceso de creación, aprende de las estructuras latentes de los datos para entrenarse en la eliminación de ruido gaussiano y las distorsiones presentes en imágenes borrosas.

Bing Chat AI gets Image Creator feature with DALL-E model - Pureinfotech

Por lo tanto, cuando le pidas que cree una imagen, Bing Image Creator no se basará en una imagen existente, sino que generará sus cuatro dibujos a partir de cero utilizando un proceso complejo. Además, si le pides que dibuje lo mismo varias veces, los resultados siempre serán diferentes, ya que se aplican diferentes variaciones.

El proceso de creación de imágenes es el mismo que el de DALL-E, ya que es su versión avanzada. Este proceso se puede resumir en tres pasos. En primer lugar, se codifica y se entiende el texto que se ha escrito en la petición. De esta manera, Bing Image Creator analiza la petición para extraer los términos y nombres que se han utilizado y entiende a qué se refiere, identificando los diferentes rasgos, características y estilos solicitados.

Después de entender la petición, la IA de Bing Image Creator generará información de imagen basada en ella y utilizará un decodificador para pintar la imagen a partir del texto. Aunque este proceso parece complejo, se puede simplificar diciendo que primero entiende la petición, luego determina los elementos de la imagen en función de ella y, finalmente, crea el dibujo desde cero.

Debido a que cada vez que se le pide que dibuje algo, el resultado varía ya que se procesa nuevamente desde cero, es posible hacer varias solicitudes hasta que finalmente se dibuje lo que se desea.

Cómo usar Bing Image Creator

Puedes comenzar a usar Bing Image Creator de inmediato visitando el sitio web bing.com/create. Una vez allí, escribe tu solicitud en el cuadro de búsqueda y haz clic en «Unirse y crear». Entonces, se te pedirá que inicies sesión con tu cuenta de Microsoft. En el futuro, esta herramienta estará disponible para todos los usuarios de Bing que hayan solicitado acceso al nuevo chat. Sin embargo, ten en cuenta que por ahora solo está disponible en inglés, aunque Microsoft planea agregar más idiomas en el futuro.

DALL-E 2 is coming to Microsoft products including a new design app - htxt

Una vez que hayas ingresado con tu cuenta de Microsoft y enviado tu primera solicitud, Bing Image Creator tardará aproximadamente uno o dos minutos en crear cuatro imágenes basadas en la descripción que le hayas proporcionado. Después de su generación, podrás hacer clic en cada una de ellas para ampliarlas y ver los detalles.

Cuando selecciones una imagen, podrás obtenerla a una resolución de 1024×1024 y tendrás la opción de compartirla o descargarla para utilizarla en cualquier momento y lugar. También puedes guardar la imagen en tu cuenta con el botón de guardar proporcionado.

Fuente: