DeepSeek mHC : La correction architecturale qui pourrait débloquer les modèles d'IA à mille milliards de paramètres
Le nouveau framework Manifold-Constrained Hyper-Connections de DeepSeek résout un problème de mise à l'échelle vieux de dix ans, permettant un entraînement stable de modèles de plus de 27 milliards de paramètres avec seulement 6,7 % de surcharge.
None