Alibaba представила более эффективную модель искусственного интеллекта Qwen3-Next

金色财经2025/09/11 22:32

Показать оригинал

Jinse Finance сообщает, что Tongyi Qianwen, дочерняя компания Alibaba, выпустила архитектуру следующего поколения базовой модели Qwen3-Next и открыла исходный код серии моделей Qwen3-Next-80B-A3B, основанных на этой архитектуре. По сравнению с архитектурой MoE модели Qwen3, были внесены следующие ключевые улучшения: гибридный механизм внимания, высокоразреженная структура MoE, ряд оптимизаций, способствующих стабильности обучения, а также механизм многотокенового предсказания для повышения эффективности вывода. На основе архитектуры модели Qwen3-Next Alibaba обучила модель Qwen3-Next-80B-A3B-Base, которая содержит 80 миллиардов параметров, из которых активируются только 3 миллиарда. Эта базовая модель достигает производительности, сопоставимой или даже немного лучшей, чем у плотной модели Qwen3-32B, при этом стоимость обучения (GPU hours) составляет менее одной десятой от Qwen3-32B, а пропускная способность вывода при контексте более 32k превышает Qwen3-32B более чем в десять раз, что обеспечивает исключительное соотношение эффективности обучения и вывода.

Дисклеймер: содержание этой статьи отражает исключительно мнение автора и не представляет платформу в каком-либо качестве. Данная статья не должна являться ориентиром при принятии инвестиционных решений.

PoolX: вносите активы и получайте новые токены.

APR до 12%. Аирдропы новых токенов.

Внести!

Вам также может понравиться

Новый адрес, созданный на бирже, вывел 40 975 ETH и внес их в Aave V3, чтобы занять 63 миллиона USDC.

BlockBeats•2025/12/24 00:23

Мнение: отсутствие экстремального роста bitcoin к концу года означает, что в первом квартале не произойдет обвала

Odaily星球日报•2025/12/24 00:23

Трамп раскритиковал явление «хорошие новости — рынок не растет» и предупредил, что инакомыслящие не смогут возглавить Федеральную резервную систему США

TechFlow深潮•2025/12/24 00:21

Трамп критикует парадокс рынка «хорошие новости, а роста нет», предупреждает инакомыслящих не возглавлять ФРС

BlockBeats•2025/12/24 00:20

Alibaba представила более эффективную модель искусственного интеллекта Qwen3-Next

Вам также может понравиться

Популярное

Цены на крипто