DeepSeek mHC: Die Architektur-Lösung, die KI-Modelle mit Billionen Parametern ermöglichen könnte
DeepSeeks neues Manifold-Constrained Hyper-Connections Framework löst ein jahrzehntealtes Skalierungsproblem und ermöglicht stabiles Training von Modellen mit über 27 Milliarden Parametern bei nur 6,7% Mehraufwand.
None