Optische Netzwerke für KI: 400ZR und Kohärente Optik für GPU-Verbindungen

Googles 8.960-Chip-Supercomputer nutzt optische Switches mit 4Pb/s bei 10ns Schaltzeit. Setzen Sie 400ZR und Silizium-Photonik für 7-fache Energieeffizienz ein.

Blake Crosley

Mar 06, 2026 7 min read Disclaimer

Optische Netzwerke für KI: 400ZR und Kohärente Optik für GPU-Verbindungen

Aktualisiert am 8. Dezember 2025

Update Dezember 2025: 800G kohärente Optik (800ZR+) wird jetzt von mehreren Anbietern ausgeliefert, darunter Cisco, Ciena und Infinera. Co-Packaged Optics (CPO)-Demonstrationen bei 51,2T Switch-Kapazität. Linear-Drive Pluggable Optics reduzieren den Stromverbrauch um 40% gegenüber DSP-basierten Lösungen. NVIDIAs NVLink-C2C verwendet Silizium-Photonik für optische Chip-zu-Chip-Verbindungen in GB200 NVL72-Racks. Der Markt für optische Lösungen in KI-Rechenzentren wird voraussichtlich bis 2028 8,2 Milliarden Dollar erreichen, angetrieben durch Rack-Scale GPU-Verbindungen, die 400G+ pro Link erfordern.

Googles TPU v5p-Supercomputer erreicht 8,5 Exaflops Rechenleistung durch die Verbindung von 8.960 Chips mittels optischer Schaltkreis-Switches, die 4 Petabit pro Sekunde aggregierte Bandbreite bei Schaltzeiten unter 10 Nanosekunden liefern und eine dynamische Topologie-Rekonfiguration ermöglichen, die die Trainingsgeschwindigkeit um das 2,7-fache gegenüber herkömmlichen elektronischen Switches verbessert.¹ Die optische Verbindung des Suchgiganten verbraucht 5 Watt pro 100Gbps-Link gegenüber 35 Watt bei elektronischen Switches – ein 7-facher Energieeffizienzgewinn, der jährlich 24 Millionen Dollar Stromkosten in der gesamten KI-Infrastruktur einspart. Herkömmliche Kupferkabel stoßen bei 3 Metern für 400Gbps-Verbindungen an physikalische Grenzen, was Rechenzentren zur Einführung optischer Verbindungen zwingt, die die Signalintegrität über 2 Kilometer aufrechterhalten und gleichzeitig elektromagnetische Interferenzen eliminieren, die Gradientenberechnungen während des verteilten Trainings verfälschen. Organisationen, die optische Netzwerke für KI einsetzen, berichten von einer 50%igen Reduzierung der Verkabelungskomplexität, 85% geringerer Latenzvarianz und der Fähigkeit, die Netzwerktopologie dynamisch an spezifische Modellarchitekturen anzupassen.²

Das explosive Wachstum der KI-Modellparameter – von GPT-3s 175 Milliarden auf die vermuteten 1,7 Billionen bei GPT-4 – erfordert Netzwerkbandbreite, die sich alle 6 Monate verdoppelt und damit die Verbesserungen durch Moores Gesetz bei der Rechenleistung weit übertrifft.³ Kohärente optische Technologie, entlehnt aus der Langstrecken-Telekommunikation, erscheint nun in Rechenzentren, wobei 400ZR-Transceiver 400Gbps über Singlemode-Glasfaser zu 4 Dollar pro Gigabit liefern, verglichen mit 12 Dollar für herkömmliche Optik. Silizium-Photonik verspricht die direkte Integration optischer Komponenten in GPUs und eliminiert damit die elektrisch-optische Umwandlung, die derzeit 30% des Netzwerk-Strombudgets verbraucht. Organisationen, die optische Verbindungen für KI-Infrastruktur beherrschen, erlangen nachhaltige Vorteile durch überlegene Bandbreitendichte, geringeren Stromverbrauch und Netzwerkflexibilität, die mit kupferbasierten Architekturen unmöglich ist.

Grundlagen kohärenter Optik für Rechenzentren

Kohärente optische Technologie revolutioniert die Rechenzentrumsnetzwerke durch die Kodierung von Informationen sowohl in Amplitude als auch Phase von Lichtwellen:

Prinzipien der kohärenten Detektion: Herkömmliche Direktdetektion misst nur die Lichtintensität und erreicht maximal 100Gbps pro Wellenlänge. Kohärente Detektion erfasst Amplituden-, Phasen- und Polarisationsinformationen und ermöglicht 800Gbps pro Wellenlänge unter Verwendung von 16-QAM-Modulation.⁴ Digitale Signalprozessoren kompensieren chromatische Dispersion und Polarisationsmoden-Dispersion in Echtzeit. Kohärente Empfänger erreichen eine um 20dB bessere Empfindlichkeit als Direktdetektion und verlängern die Reichweite von 10km auf 120km ohne Verstärkung.

400ZR-Standardimplementierung: Die OIF 400ZR-Spezifikation definiert interoperable 400Gbps kohärente Schnittstellen, optimiert für die Rechenzentrumsverbindung.⁵ 16-QAM-Modulation kodiert 4 Bit pro Symbol über duale Polarisation. Verkettete Vorwärtsfehlerkorrektur erreicht eine Bitfehlerrate von 10^-15. Der QSFP-DD-Formfaktor erhält die Abwärtskompatibilität mit bestehender Infrastruktur. Der Stromverbrauch bleibt unter 15 Watt und ermöglicht eine hochdichte Bereitstellung.

Silizium-Photonik-Integration: Intels Silizium-Photonik-Transceiver integrieren Laser, Modulatoren und Detektoren auf einzelnen Chips.⁶ CMOS-Fertigungsprozesse reduzieren die Kosten um 90% gegenüber diskreten Komponenten. In Silizium geätzte Wellenleiter leiten optische Signale mit 0,1dB/cm Verlust. Mikroring-Resonatoren ermöglichen Wellenlängen-Multiplexing auf dem Chip. Monolithische Integration eliminiert 80% der optischen Verbindungen, die Zuverlässigkeitsprobleme verursachen.

Vorteile kohärenter Optik für KI-Workloads: - 8-fache Bandbreite pro Glasfaser gegenüber Direktdetektion - 100km Reichweite ohne Verstärkerstationen - Digitale Kompensation optischer Beeinträchtigungen - Flexible Modulation, anpassbar an Entfernungsanforderungen - Wellenlängen-Abstimmbarkeit ermöglicht dynamisches Routing - Vorwärtsfehlerkorrektur gewährleistet Datenintegrität

Netzwerkarchitektur-Muster

Optische Netzwerke für KI folgen unterschiedlichen Architekturmustern zur Optimierung von Bandbreite und Flexibilität:

Optische Spine-Leaf-Fabric: Volloptische Spine-Leaf-Architektur eliminiert elektronisches Switching im Datenpfad. Leaf-Switches verbinden sich mit GPU-Servern über 400ZR-Transceiver. Die Spine-Schicht verwendet wellenlängenselektive Switches zur Routing spezifischer Lambdas. Jede Spine-Leaf-Verbindung trägt 32 Wellenlängen bei 400Gbps mit insgesamt 12,8Tbps. Optische Verstärker verstärken Signale ohne optisch-elektrisch-optische Umwandlung. Ost-West-Verkehr zwischen GPUs umgeht elektronisches Switching vollständig.

Optisches Circuit Switching: Googles Jupiter-Netzwerk verwendet optische Circuit Switches für Massendatenübertragung.⁷ Ein zentralisierter SDN-Controller programmiert optische Pfade basierend auf Verkehrsanforderungen. Die Schaltkreiserstellung dauert 10 Nanosekunden gegenüber 500 Nanosekunden beim Packet Switching. Dedizierte optische Pfade eliminieren Warteschlangen und Staus. Trainingsjobs reservieren Bandbreite und garantieren konsistente Leistung. Dynamische Rekonfiguration passt sich wechselnden Verkehrsmustern an.

Disaggregierte optische Netzwerke: Trennung von optischem Transport und Paketverarbeitungsfunktionen. Optischer Transport bietet Punkt-zu-Punkt-Wellenlängen. Paketverarbeitung erfolgt nur an Netzwerkkanten. Eliminiert 60% der Netzwerkausrüstung aus dem Datenpfad. Reduziert Latenz von 5 Mikrosekunden auf 200 Nanosekunden. Vereinfacht den Betrieb durch unabhängige Skalierung von optischer und Paketschicht.

Photonische Clos-Netzwerke: Mehrstufige optische Switching-Fabrics inspiriert von Clos-Netzwerken. Silizium-photonische Switches bieten blockierungsfreie Konnektivität. Arrayed Waveguide Gratings routen Wellenlängen ohne Stromverbrauch. Skaliert auf 100.000 Ports mit dreistufiger Architektur. Sub-Nanosekunden-Switching ermöglicht feinkörniges Traffic Engineering. Fehlertoleranz durch mehrere optische Pfade.

Best Practices für die Implementierung

Erfolgreiche Bereitstellungen optischer Netzwerke folgen etablierten Praktiken:

Glasfaser-Infrastrukturplanung: Singlemode-Glasfaser unterstützt Entfernungen bis zu 120km mit kohärenter Optik. OS2-Glasfaserspezifikationen gewährleisten <0,4dB/km Dämpfung. Minimaler Biegeradius von 15mm verhindert Mikrobiegeverluste. Farbcodierungs- und Beschriftungssysteme verhindern Fehlverbindungen. Glasfasercharakterisierung mittels OTDR identifiziert Beeinträchtigungen vor der Bereitstellung. Halten Sie 20% Reservekapazität für zukünftige Erweiterungen vor.

Optisches Leistungsmanagement: Startleistungen zwischen -10dBm und +5dBm verhindern nichtlineare Effekte. Optische Verstärker halten konsistente Leistung über das Wellenlängenspektrum. Variable optische Dämpfungsglieder balancieren die Leistung über parallele Pfade. Leistungsmonitore an jedem Verbindungspunkt ermöglichen Fehlersuche. Automatische Leistungsregelung kompensiert Komponentenalterung. Sicherheitsprotokolle verhindern Augenschäden durch unsichtbares Infrarotlicht.

Wellenlängenplanung und -management: Das ITU-T-Raster definiert Standard-Wellenlängenkanäle zur Vermeidung von Interferenzen. DWDM-Systeme unterstützen 96 Kanäle im C-Band (1530-1565nm). Wellenlängenzuweisungsalgorithmen verhindern Konflikte. Schutzbänder zwischen Kanälen reduzieren Übersprechen. Wellenlängenstabilisatoren halten die Frequenzstabilität innerhalb von 2,5GHz. Wellenlängenkonversion ermöglicht flexibles Routing.

Tests und Validierung: Bitfehlerratentester verifizieren die Linkleistung vor der Produktion. Optische Spektrumanalysatoren messen Signalqualität und OSNR. Polarisationsmoden-Dispersionstests gewährleisten Langzeitstabilität. Augendiagramm-Analyse bestätigt Signalintegrität. Loopback-Tests isolieren Probleme auf spezifische Segmente. Kontinuierliches Monitoring erkennt Degradation vor Ausfällen.

Introl entwirft und implementiert optische Netzwerklösungen für KI-Infrastruktur in unserem globalen Abdeckungsgebiet, mit Expertise in kohärenter Optik und Silizium-Photonik für GPU-Verbindungen.⁸ Unsere Teams für optisches Engineering haben über 200 Hochbandbreiten-KI-Cluster mit fortschrittlichen photonischen Technologien implementiert.

Die Silizium-Photonik-Revolution

Silizium-Photonik bringt optische Komponenten auf dieselben Chips wie Prozessoren:

Co-Packaged Optics: NVIDIAs NVLink verwendet Kupferkabel, die die Reichweite auf 2 Meter begrenzen. Co-Packaged Optics platzieren Transceiver Millimeter von GPU-Dies entfernt. Eliminiert Serialisierer/Deserialisierer, die 10 Watt pro 100Gbps verbrauchen. Reduziert Latenz von 100 Nanosekunden auf 10 Nanosekunden. Ermöglicht 1,6Tbps pro GPU-Package-Kante. Intels OCP 2.0 demonstriert Co-Packaged Optics bei 51,2Tbps.⁹

Rein optische Switches: Photonische Switches routen optische Signale ohne Umwandlung. MEMS-Spiegel leiten Lichtstrahlen in 10 Mikrosekunden um. Silizium-photonische Switches erreichen Nanosekunden-Rekonfiguration. Null Stromverbrauch im stationären Zustand. Skaliert auf 1000x1000 Ports in einem einzelnen Chip. Eliminiert 95% des Stromverbrauchs gegenüber elektronischen Switches.

Optische Compute-Interconnects: Ersetzen PCIe durch optische Links zwischen GPUs und CPUs. CXL über Optik erweitert Speicherkohärenzdomänen auf Rack-Ebene. Cache-kohärente optische Fabrics ermöglichen 10.000 GPU-Cluster. Optische Speicherverbindungen bieten 10TB/s Bandbreite. Direkte optische Anbindung an HBM-Speicherstapel. Lightmatters Passage demonstriert 100Tbps Chip-zu-Chip-Bandbreite.¹⁰

Quantenpunkt-Laser: Auf Silizium integrierte Quantenpunkt-Laser liefern Lichtquellen. Temperaturunempfindlicher Betrieb eliminiert Kühlungsanforderungen. 100.000 Stunden Lebensdauer übertrifft die Zuverlässigkeit elektronischer Komponenten. Arrays von Lasern ermöglichen massive Parallelität. Energieeffizienz von 0,1 Picojoule pro Bit. Massenproduktion mit Standard-Halbleiterprozessen.

Reale optische Bereitstellungen

Metas AI Research SuperCluster: - Umfang: 16.000 A100 GPUs mit 200Gbps optischen Links - Bandbreite: 13 Petabit/Sekunde aggregierte Fabric-Bandbreite - Architektur: Dreistufige Clos mit optischer Spine-Schicht - Technologie: 400ZR kohärente Optik für Verbindungen zwischen Gebäuden - Latenz: 1,5 Mikrosekunden über 600 Meter Campus - Ergebnis: 3-fach schnelleres Modelltraining gegenüber vorheriger Infrastruktur

Microsoft Azures Project Sirius: - Innovation: Rein optisches Switching für KI-Workloads - Leistung: 12,8Tbps pro optischem Switch - Effizienz: 85% Stromreduzierung gegenüber elektronischem Switching - Umfang: Optische Verbindung von 100.000 GPUs - Switching: Sub-Mikrosekunden optische Schaltkreiserstellung - Auswirkung: 40% Reduzierung der Trainingskosten

Alibaba Clouds optisches Rechenzentrum: - Bereitstellung: 400G kohärente Optik in der gesamten Anlage - Reichweite: 40km Campus-Konnektivität ohne Verstärkung - Dichte: 38,4Tbps pro Rack mit optischem Switching - Stromverbrauch: 3 Watt pro 100Gbps optischem Link - Flexibilität: Dynamisches Wellenlängen-Routing basierend auf Workload - Einsparungen: 15 Millionen Dollar jährliche Stromkostenreduzierung

Oak Ridge National Laboratorys Frontier: - Compute: 37.000 AMD MI250X GPUs - Interconnect: Slingshot-Fabric mit optischen Links - Bandbreite: 100GB/s Injektionsbandbreite pro Knoten - Topologie: Dragonfly+ mit optischen Gruppenverbindungen - Entfernung: Optische Links über 300 Meter Anlage - Erfolg: Erstes Exascale-System der Welt

Energieeffizienz-Analyse

Optische Netzwerke reduzieren den Stromverbrauch in Rechenzentren dramatisch:

Link-Stromvergleich (pro 100Gbps): - Kupfer DAC (3m): 35 Watt - Aktives optisches Kabel (100m): 12 Watt - Silizium-Photonik (2km): 5 Watt - Kohärente Optik (40km): 3,5 Watt - Zukünftige Photonik: <1 Watt prognostiziert

Einsparungen auf Systemebene: Facebooks Fabric-Aggregationsschicht verwendet 90% optische Verbindungen. Die Stromnutzungseffektivität verbessert sich mit optischem Switching von 1,4 auf 1,15. Der Stromverbrauch der Netzwerkausrüstung sinkt von 15% auf 5% des

Optische Netzwerke für KI: 400ZR und Kohärente Optik für GPU-Verbindungen

Grundlagen kohärenter Optik für Rechenzentren

Netzwerkarchitektur-Muster

Best Practices für die Implementierung

Die Silizium-Photonik-Revolution

Reale optische Bereitstellungen

Energieeffizienz-Analyse

You Might Also Like

AI Workload Scheduling: GPU-Auslastung über Zeitzonen hinweg...

AI-Infrastruktur-Sicherheitsoperationen: SOC-Anforderungen f...

Der $600B AI-Infrastruktur-Ausbau: Hyperscaler-CapEx, Schuld...

Angebot anfordern_

Anfrage erhalten_