Mixture of Experts Infrastruktur: Skalierung von Sparse-Modellen für Produktions-KI
MoE treibt mittlerweile über 60% der Open-Source-KI-Modellveröffentlichungen im Jahr 2025 an. Die Top-10-Modelle auf der Artificial Analysis Rangliste (DeepSeek-R1, Kimi K2, Mistral Large 3) nutzen alle MoE. NVIDIA GB200 NVL72 liefert einen 10-fachen Leistungssprung für MoE gegenüber H200...
None