أصدرت DeepSeek ورقة بحثية جديدة بتوقيع Liang Wenfeng: اقتراح بنية mHC الجديدة لتعزيز استقرار تدريب النماذج الكبيرة
PANews 1 يناير: وفقًا لما ذكرته Jinse Finance، نشرت DeepSeek ورقة بحثية جديدة واقترحت بنية جديدة تُسمى الربط الفائق المقيد على متعدد الشعب (mHC)، وتهدف إلى معالجة المشكلات التي تواجه تقنية الشبكات الفائقة الربط (HC) مثل عدم الاستقرار في التدريب والقيود على قابلية التوسع الناتجة عن تدمير خاصية التعيين المتطابق. تقوم هذه البنية بإعادة خاصية التعيين المتطابق من خلال إسقاط مساحة الاتصال المتبقي لـ HC على متعدد شعب محدد، مع دمج تحسينات بنية تحتية صارمة لضمان الكفاءة، مما أدى إلى تحسينات ملحوظة في الأداء وقابلية التوسع الفائقة. تتوقع DeepSeek أن mHC، باعتبارها توسعة مرنة وعملية لـ HC، ستساهم في فهم أعمق لتصميم البنى الطوبولوجية، وتوجه تطوير نماذج الأساس نحو اتجاهات واعدة. الورقة البحثية كتبها Zhenda Xie (تشيندا شيه)، Yixuan Wei (ييشوان وي)، وHuanqi Cao كمؤلفين أول، كما أُدرج Wenfeng Liang ضمن قائمة المؤلفين.
إخلاء المسؤولية: يعكس محتوى هذه المقالة رأي المؤلف فقط ولا يمثل المنصة بأي صفة. لا يُقصد من هذه المقالة أن تكون بمثابة مرجع لاتخاذ قرارات الاستثمار.
You may also like
تحتفظ فنزويلا بـ 161 طنًا من احتياطيات الذهب، وهي الأكبر في أمريكا اللاتينية.
تم تحويل أكثر من 500 ألف دولار من IRYS من عدة محافظ إلى عنوان واحد
TAO يخترق حاجز 260 دولار
البيانات: بلغ إجمالي حجم التداول في النظام البيئي لأسواق التنبؤ 50.25 مليار دولار
