DeepSeek mHC: الإصلاح المعماري الذي قد يُطلق العنان لنماذج الذكاء الاصطناعي بتريليون معامل
يحل إطار عمل Manifold-Constrained Hyper-Connections الجديد من DeepSeek مشكلة التوسع التي استمرت عقداً من الزمن، مما يتيح تدريباً مستقراً لنماذج بأكثر من 27 مليار معامل مع تكلفة إضافية تبلغ 6.7% فقط.
None