El nuevo generador de imágenes de OpenAI es sorprendente e imperfecto. Aquí te explicamos cómo usar la función beta en ChatGPT Plus y te damos algunos consejos para empezar.
OpenAI acaba de integrar su nuevo generador de imágenes, Dall-E 3, en ChatGPT. La herramienta está actualmente en fase beta para los suscriptores de ChatGPT Plus, el servicio de 20 dólares al mes de OpenAI. Con Dall-E 3 activado, puedes pedirle al chatbot en lenguaje informal que cree un conjunto de cuatro imágenes distintas.
A medida que se ponen a disposición del público generadores de imágenes más potentes, las cuestiones legales y éticas van ganando protagonismo. Por ejemplo, varios artistas han intentado demandar a OpenAI por posible infracción de derechos de autor. Además de las preocupaciones legales, los expertos en seguridad han expresado su temor ante la posibilidad de que los generadores de imágenes de IA permitan una mayor difusión de la desinformación.
Cómo acceder a Dall-E 3 en ChatGPT
Si eres suscriptor de ChatGPT Plus, es bastante sencillo activar las funciones Dall-E 3 del chatbot. En primer lugar, inicia sesión en el sitio web de OpenAI o en la aplicación móvil ChatGPT para Apple o Android. Tras abrir ChatGPT, haz clic en la pestaña GPT-4 en la parte superior de la pantalla. En el menú que se despliega, selecciona Dall-E 3 (Beta).
Hay un límite de uso en la frecuencia con la que puedes interactuar con la versión GPT-4 de ChatGPT (procesar estos prompts o instrucciones requieren de una enorme potencia de computadora). El límite oficial está fijado en 50 mensajes cada tres horas. Si alcanzas este límite, el chatbot muestra un mensaje de error indicando el tiempo que tendrás que esperar antes de recuperar el acceso.
Algunos consejos para experimentar con Dall-E 3
Si alguna vez has experimentado con un generador de imágenes de IA, como Dall-E 2 o Midjourney, una de las principales diferencias es que ahora puedes ver cómo ChatGPT actúa como intermediario, creando múltiples prompts para que Dall-E 3 los complete.
Estas instrucciones creadas por ChatGPT van desde frases largas hasta párrafos enteros, y cada una incluye detalles diferentes para Dall-E 3. Si hay personas en la imagen, el chatbot a menudo mencionará explícitamente el género y la raza de los sujetos. Por ejemplo, esta es uno de los prompts que ChatGPT utilizó cuando solicité una imagen de dos reporteros de WIRED entrevistando a un director general:
«Foto de un grupo diverso de tres personas en un entorno corporativo: una reportera de WIRED de Oriente Medio con una cámara en la mano, una reportera de WIRED africana con un micrófono y un director general caucásico que responde a sus preguntas. El telón de fondo es una elegante sala de oficina».
Si no te gustan los primeros resultados del chatbot, pídele que ajuste algunos aspectos, como la combinación de colores o el ambiente general. Digamos que te gusta mucho la tercera imagen que Dall-E 3 produce a partir de tu pregunta. Después de hacer clic en el botón de descarga en la esquina superior izquierda, puedes solicitar más imágenes similares a la tercera opción.
¿Se ha hecho algo para proteger a los artistas en esta nueva actualización? La verdad es que no. Aunque el chatbot no creará imágenes si le pides que imite a un artista contemporáneo, hay muchas formas de darle la vuelta.
Le pedí a ChatGPT que diseñara una taza de café con arte al estilo de Keith Haring. La herramienta de IA rechazó la petición inicial, pero me ofreció una solución intermedia: “Puedo crear un diseño inspirado en las características generales de su arte, como líneas atrevidas, colores vibrantes y figuras simplistas. ¿Quisieras que proceda con eso?”. Los resultados finales de ChatGPT, en este caso, fueron desordenados y mediocres.