DeepSeek mHC: De Architectuuroplossing Die Trillion-Parameter AI-Modellen Zou Kunnen Ontsluiten
DeepSeek's nieuwe Manifold-Constrained Hyper-Connections framework lost een tien jaar oud schalingsprobleem op, waardoor stabiele training van 27B+ parameter modellen mogelijk wordt met slechts 6,7% overhead.
None