OpenAI sigue en su camino de ‘código rojo’ con un nuevo modelo de generación de imágenes

TechCrunch2025/12/16 18:29

Mostrar el original

Por:TechCrunch

OpenAI está lanzando una nueva versión de ChatGPT Images que promete un mejor seguimiento de instrucciones, edición más precisa y velocidades de generación de imágenes hasta 4 veces más rápidas.

El nuevo modelo, denominado GPT-Image-1.5, estará disponible a partir del martes para todos los usuarios de ChatGPT y a través de la API. Es la última escalada en la competencia con Gemini de Google, después de que el mes pasado el CEO de OpenAI, Sam Altman, declarara un “código rojo” en un memorando interno filtrado. El memo detallaba los planes de OpenAI para recuperar su posición como líder en IA después de que Google comenzara a ganar cuota de mercado tras el lanzamiento de Gemini 3, su último modelo insignia, y Nano Banana Pro, la versión más reciente del generador de imágenes viral de Google, ambos líderes en el ranking de LMArena en múltiples benchmarks.

Google mantiene su liderazgo incluso después de que OpenAI respondiera a su éxito la semana pasada con el lanzamiento de GPT-5.2, presentándolo como su modelo más avanzado hasta la fecha para desarrolladores y uso profesional cotidiano. Según informes, OpenAI había planeado lanzar un nuevo generador de imágenes a principios de enero, acelerando esos planes con el anuncio de esta semana. Su último lanzamiento de modelo de imágenes fue GPT-Image-1 en abril.

GPT-Image-1.5 llega en un momento en que los generadores de imágenes y videos avanzan más allá de los prototipos y adquieren capacidades más listas para producción. Al igual que Nano Banana Pro, ChatGPT Images ofrece funciones de postproducción, brindando controles de edición más detallados para mantener la coherencia visual, como la semejanza facial, la iluminación, la composición y el tono de color a lo largo de las ediciones.

OpenAI sigue en su camino de ‘código rojo’ con un nuevo modelo de generación de imágenes image 0

La misma imagen mostrada arriba con diferentes ediciones para demostrar la mejora en el seguimiento de instrucciones de GPT-Image-1.5. Créditos de la imagen:OpenAI

La mayoría de las herramientas GenAI de imágenes son malas para iterar, por lo que esto sería un gran avance. Cuando se solicita un cambio específico, como “ajustar la expresión facial” o “hacer la iluminación más fría”, los modelos suelen reinterpretar toda la imagen, lo que lleva a una falta de coherencia.

La actualización no solo trata de nuevas funciones. ChatGPT Images ahora también será accesible a través de un punto de entrada dedicado en la barra lateral de ChatGPT que funciona “más como un estudio creativo”, escribió Fidji Simo, CEO de aplicaciones de OpenAI, en una publicación de blog el martes.

“Las nuevas pantallas de visualización y edición de imágenes facilitan la creación de imágenes que coincidan con tu visión o la obtención de inspiración a partir de prompts de tendencia y filtros preestablecidos”, escribió Simo.

Techcrunch event

Sumate a la lista de espera de Disrupt 2026 para ser de los primeros en la fila cuando salgan las entradas Early Bird. Disrupts anteriores han traído a Google Cloud, Netflix, Microsoft, Box, Phia, a16z, ElevenLabs, Wayve, Hugging Face, Elad Gil y Vinod Khosla al escenario — parte de más de 250 líderes de la industria impulsando más de 200 sesiones diseñadas para potenciar tu crecimiento y afilar tu ventaja. Además, conocé a cientos de startups que innovan en todos los sectores.

San Francisco | 13-15 de octubre de 2026

UNITE A LA LISTA AHORA

Además del nuevo generador de imágenes, OpenAI está introduciendo nuevas formas de mejorar la experiencia de ChatGPT con más elementos visuales. El plan es que las consultas de búsqueda muestren más imágenes con fuentes claras, lo que podría ser útil para tareas como convertir medidas o consultar resultados deportivos, según Simo.

“Cuando estás creando, deberías poder ver y moldear lo que estás haciendo. Cuando las imágenes cuentan una historia mejor que solo palabras, ChatGPT debería incluirlas”, escribió Simo. “Cuando necesitás una respuesta rápida o el siguiente paso está en otra herramienta, debería estar ahí mismo. A medida que hacemos esto, podemos seguir acortando la distancia entre lo que está en tu mente y tu capacidad de hacerlo realidad.”

Descargo de responsabilidad: El contenido de este artículo refleja únicamente la opinión del autor y no representa en modo alguno a la plataforma. Este artículo no se pretende servir de referencia para tomar decisiones de inversión.

PoolX: Haz staking y gana nuevos tokens.

APR de hasta 12%. Gana más airdrop bloqueando más.

¡Bloquea ahora!