OpenAI выпускает новую версию ChatGPT Images, которая обещает лучшее следование инструкциям, более точное редактирование и до 4 раз более высокую скорость генерации изображений.
Новая модель, получившая название GPT-Image-1.5, становится доступной с вторника для всех пользователей ChatGPT и через API. Это последний этап обострения конкуренции с Google Gemini после того, как генеральный директор OpenAI Сэм Альтман в прошлом месяце объявил «код красный» во внутренней утечке мемо. В мемо подробно описывались планы OpenAI вернуть себе лидерство в области искусственного интеллекта после того, как Google начал отвоёвывать долю рынка благодаря выпуску Gemini 3, своей последней флагманской модели, и Nano Banana Pro, новой версии вирусного генератора изображений Google — обе модели возглавили рейтинг LMArena по нескольким бенчмаркам.
Google сохраняет лидерство даже после того, как OpenAI отреагировала на его успех на прошлой неделе запуском GPT-5.2, позиционируя его как свою самую продвинутую модель для разработчиков и повседневного профессионального использования. Сообщается, что OpenAI планировала выпустить новый генератор изображений в начале января, ускорив эти планы с объявлением на этой неделе. Последний релиз модели для изображений был GPT-Image-1 в апреле.
GPT-Image-1.5 выходит на фоне того, как генераторы изображений и видео переходят от прототипов к более готовым к производству возможностям. Как и Nano Banana Pro, ChatGPT Images предлагает функции пост-продакшна, предоставляя более детальное управление редактированием для поддержания визуальной согласованности, такой как сходство лиц, освещение, композиция и цветовой тон при редактировании.
То же изображение, показанное выше, с разными вариантами редактирования, чтобы продемонстрировать улучшенное следование инструкциям в GPT-Image-1.5. Image Credits:OpenAI Большинство инструментов GenAI для изображений плохо справляются с итерациями, поэтому это будет значительный шаг вперёд. При запросе на конкретное изменение, например, «изменить выражение лица» или «сделать освещение холоднее», модели часто переосмысливают всё изображение, что приводит к отсутствию согласованности.
Обновление касается не только новых функций. ChatGPT Images теперь также будет доступен через отдельную точку входа в боковой панели ChatGPT, которая работает «больше как креативная студия», написала Фиджи Симо, CEO по приложениям OpenAI, во вторник в блоге.
«Новые экраны просмотра и редактирования изображений упрощают создание изображений, соответствующих вашему видению, или получение вдохновения от популярных запросов и предустановленных фильтров», — написала Симо.
Присоединяйтесь к листу ожидания Disrupt 2026
Добавьте себя в лист ожидания Disrupt 2026, чтобы быть первым в очереди, когда появятся билеты Early Bird. На прошлых Disrupt выступали Google Cloud, Netflix, Microsoft, Box, Phia, a16z, ElevenLabs, Wayve, Hugging Face, Elad Gil и Vinod Khosla — часть более чем 250 лидеров индустрии, проводящих более 200 сессий, созданных для вашего роста и развития. Кроме того, познакомьтесь с сотнями стартапов, внедряющих инновации во всех секторах.
Присоединяйтесь к листу ожидания Disrupt 2026
Добавьте себя в лист ожидания Disrupt 2026, чтобы быть первым в очереди, когда появятся билеты Early Bird. На прошлых Disrupt выступали Google Cloud, Netflix, Microsoft, Box, Phia, a16z, ElevenLabs, Wayve, Hugging Face, Elad Gil и Vinod Khosla — часть более чем 250 лидеров индустрии, проводящих более 200 сессий, созданных для вашего роста и развития. Кроме того, познакомьтесь с сотнями стартапов, внедряющих инновации во всех секторах.
В дополнение к новому генератору изображений OpenAI внедряет новые способы улучшения работы с ChatGPT с помощью большего количества визуальных элементов. План состоит в том, чтобы поисковые запросы отображали больше визуальных материалов с чёткими источниками, что может быть полезно для задач вроде преобразования единиц измерения или проверки спортивных результатов, по словам Симо.
«Когда вы создаёте, вы должны видеть и формировать то, что делаете. Когда визуальные элементы рассказывают историю лучше, чем одни слова, ChatGPT должен их включать», — написала Симо. — «Когда вам нужен быстрый ответ или следующий шаг находится в другом инструменте, он должен быть прямо здесь. Делая это, мы можем сокращать расстояние между тем, что у вас в голове, и вашей способностью воплотить это в жизнь».
