アリババがより効率的なQwen3-Next人工知能モデルを発表
Jinse Financeによると、Alibaba傘下のTongyi Qianwenは次世代基盤モデルアーキテクチャ「Qwen3-Next」を発表し、このアーキテクチャに基づく「Qwen3-Next-80B-A3B」シリーズモデルをオープンソース化しました。この構造はQwen3のMoEモデル構造と比較して、以下のコア改良が行われています:ハイブリッドアテンションメカニズム、高スパースMoE構造、一連のトレーニング安定性に優れた最適化、そして推論効率を向上させるマルチトークン予測メカニズムです。Qwen3-Nextのモデル構造に基づき、Alibabaは「Qwen3-Next-80B-A3B-Base」モデルをトレーニングしました。このモデルは800億(80 billions)パラメータを持ちながら、実際にアクティブになるのは30億(3 billions)パラメータのみです。このBaseモデルはQwen3-32Bのデンスモデルと同等かそれ以上の性能を実現しつつ、トレーニングコスト(GPU hours)はQwen3-32Bの10分の1以下、32k以上のコンテキストでの推論スループットはQwen3-32Bの10倍以上となり、極めて高いトレーニングおよび推論コストパフォーマンスを実現しています。
免責事項:本記事の内容はあくまでも筆者の意見を反映したものであり、いかなる立場においても当プラットフォームを代表するものではありません。また、本記事は投資判断の参考となることを目的としたものではありません。
こちらもいかがですか?
レポート:月間調整後のステーブルコイン取引量がVisaとPayPalを上回る
スタンダードチャータード銀行がブロックチェーンベースのトークン化預金ソリューションを開始
データ:200枚のBTCがある取引所から出金され、中継を経てFalconXに流入
あるクジラアドレスが1時間前に7,654 ETHを全て売却し、約400万ドルの利益を得た
