Bitget App
Торгуйте разумнее
Купить криптоРынкиТорговляФьючерсыEarnWeb3ПлощадкаПодробнее
Торговля
Спот
Купить и продать криптовалюту
Маржа
Увеличивайте капитал и эффективность средств
Onchain
Going Onchain, without going Onchain!
Конвертер
Нулевая комиссия за транзакции и отсутствие проскальзывания.
Обзор
Launchhub
Получите преимущество заранее и начните побеждать
Копитрейдинг
Копируйте элитного трейдера в один клик
Боты
Простой, быстрый и надежный торговый бот на базе ИИ
Торговля
Фьючерсы USDT-M
Фьючерсы с расчетами в USDT
Фьючерсы USDC-M
Фьючерсы с расчетами в USDC
Фьючерсы Coin-M
Фьючерсы с расчетами в криптовалютах
Обзор
Руководство по фьючерсам
Путь от новичка до профессионала в торговле фьючерсами
Акции по фьючерсам
Получайте щедрые вознаграждения
Bitget Earn
Продукты для легкого заработка
Simple Earn
Вносите и выводите средства в любое время, чтобы получать гибкий доход без риска
Ончейн-Earn
Получайте прибыль ежедневно, не рискуя основной суммой
Структурированный Earn
Надежные финансовые инновации, чтобы преодолеть рыночные колебания
VIP и Управление капиталом
Премиум-услуги для разумного управления капиталом
Займы
Гибкие условия заимствования с высокой защитой средств
Alibaba выпускает Qwen-Image-Edit: модель с открытым исходным кодом для расширенного редактирования изображений и текста стоимостью 20 млрд долларов

Alibaba выпускает Qwen-Image-Edit: модель с открытым исходным кодом для расширенного редактирования изображений и текста стоимостью 20 млрд долларов

MPOSTMPOST2025/08/20 01:30
Автор:MPOST

Коротко Команда Qwen из Alibaba Cloud запустила Qwen-Image-Edit — современную модель редактирования изображений, которая сочетает в себе семантическое и внешнее редактирование с точной двуязычной модификацией текста, предоставляя расширенные возможности для творческих и практических приложений.

Alibaba Cloud's Qwen Команда разработчиков представила Qwen-Image-Edit — усовершенствованную модель редактирования изображений, созданную на основе фреймворка Qwen-Image 20B. Новая система расширяет уникальные возможности рендеринга текста Qwen-Image, применяя их к редактированию изображений, уделяя особое внимание точности внесения изменений в текст. Qwen-Image-Edit обрабатывает входные изображения с помощью двух параллельных компонентов: Qwen2.5-VL, который управляет визуальной семантикой, и VAE Encoder, который управляет визуальным представлением. Этот двойной подход позволяет модели эффективно выполнять задачи редактирования как на семантическом уровне, так и на уровне представления. Инструмент доступен через чат Qwen в разделе «Редактирование изображений».

Qwen-Image-Edit разработан для работы в различных измерениях. Он поддерживает как корректировки внешнего вида, такие как добавление, удаление или изменение визуальных элементов, сохраняя при этом все остальные области изображения, так и семантические изменения, такие как создание объектов интеллектуальной собственности, поворот объектов или перенос стилей, где допускается более широкое изменение пикселей при сохранении семантической целостности. Он также предоставляет расширенные возможности редактирования текста на китайском и английском языках, позволяя пользователям добавлять, удалять или корректировать текст на изображениях, сохраняя при этом единообразие шрифта, размера и стиля. Тестирование производительности на нескольких широко известных наборах данных показывает, что Qwen-Image-Edit достигает высочайшего уровня производительности в редактировании изображений, что делает его надежной базовой моделью для будущих приложений в этой области.

🚀 Рады представить Qwen-Image-Edit!
Созданный на основе 20B Qwen-Image, он обеспечивает точное редактирование текста на двух языках (китайском и английском), сохраняя при этом стиль, и поддерживает как семантическое, так и внешнее редактирование.

✨ Ключевые особенности
✅ Точное редактирование текста с двуязычной поддержкой
✅… pic.twitter.com/p21KUXoC50

— Квен (@Alibaba_Qwen) 18 августа 2025

Семантическое и внешнее редактирование Qwen-Image-Edit для творческих и практических применений

Один из defiОтличительной особенностью Qwen-Image-Edit является его расширенный функционал как семантического, так и внешнего редактирования. Семантическое редактирование подразумевает изменение содержания изображения с сохранением его визуального смысла. Чтобы наглядно проиллюстрировать эту функцию, команда разработчиков демонстрирует её использование. Qwen Официальный талисман — Капибара — в качестве практического примера.

Наблюдения показывают, что, хотя большинство пикселей на изменённом изображении отличаются от пикселей на исходном входном изображении слева, общая целостность персонажа Капибары полностью сохраняется. Это демонстрирует широкие возможности семантического редактирования Qwen-Image-Edit, поддерживающие гибкую и разнообразную разработку оригинального контента интеллектуальной собственности. Кроме того, в Qwen Chat был создан специальный набор подсказок для редактирования, основанный на 16 типах личности MBTI. С помощью этих подсказок была успешно создана полная коллекция эмодзи-пакетов на тему MBTI с талисманом Капибары, что эффективно расширяет как репрезентативность, так и узнаваемость персонажа.

Более того, синтез новых ракурсов представляет собой ещё один важный пример использования семантического редактирования. Qwen-Image-Edit способен поворачивать объекты на 90 градусов или на 180 градусов, обеспечивая прямую визуализацию обратной стороны объекта. Ещё одним примером семантического редактирования является перенос стиля, когда, например, стандартный портрет может быть переосмыслен в различных художественных эстетических стилях, включая стили, напоминающие стили Studio Ghibli.

Наряду с семантическим редактированием, редактирование внешнего вида часто является необходимой функцией при модификации изображений. Этот подход фокусируется на сохранении определённых областей изображения в неизменном виде при добавлении, удалении или изменении определённых элементов. Как показано на примере вывески, органично вписанной в сцену, редактирование внешнего вида применимо в самых разных областях, например, для корректировки фона для людей или модификации одежды. Ещё defiГлавной возможностью Qwen-Image-Edit является точность редактирования текста, которая является результатом передового опыта Qwen-Image в технологиях рендеринга текста.

0

Дисклеймер: содержание этой статьи отражает исключительно мнение автора и не представляет платформу в каком-либо качестве. Данная статья не должна являться ориентиром при принятии инвестиционных решений.

PoolX: вносите активы и получайте новые токены.
APR до 12%. Аирдропы новых токенов.
Внести!