Réseaux optiques pour l'AI : 400ZR et optiques cohérentes pour l'interconnexion GPU
Mis à jour le 8 décembre 2025
Mise à jour décembre 2025 : Les optiques cohérentes 800G (800ZR+) sont maintenant expédiées par plusieurs fournisseurs incluant Cisco, Ciena et Infinera. Démonstrations d'optiques co-packagées (CPO) à 51.2T de capacité de commutation. Les optiques enfichables à pilotage linéaire réduisent la puissance de 40% par rapport aux solutions basées DSP. Le NVLink-C2C de NVIDIA utilise la photonique silicium pour l'interconnexion optique chip-to-chip dans les racks GB200 NVL72. Le marché optique des centres de données AI devrait atteindre 8,2 milliards de dollars d'ici 2028, tiré par les interconnexions GPU à l'échelle rack nécessitant 400G+ par liaison.
Le superordinateur TPU v5p de Google atteint 8,5 exaflops de puissance de calcul en interconnectant 8 960 puces utilisant des commutateurs de circuits optiques qui délivrent 4 pétabits par seconde de bande passante agrégée avec des temps de commutation inférieurs à 10 nanosecondes, permettant une reconfiguration dynamique de topologie qui améliore la vitesse d'entraînement de 2,7x comparé à la commutation électronique traditionnelle.¹ L'interconnexion optique du géant de la recherche consomme 5 watts par liaison 100Gbps contre 35 watts pour les commutateurs électroniques—un gain d'efficacité énergétique de 7x qui économise 24 millions de dollars annuellement en coûts d'électricité à travers leur infrastructure AI. Les câbles cuivre traditionnels atteignent des limites physiques à 3 mètres pour les connexions 400Gbps, forçant les centres de données à adopter des interconnexions optiques qui maintiennent l'intégrité du signal sur 2 kilomètres tout en éliminant l'interférence électromagnétique qui corrompt les calculs de gradient pendant l'entraînement distribué. Les organisations déployant la mise en réseau optique pour l'AI rapportent 50% de réduction de complexité de câblage, 85% de variance de latence plus faible, et la capacité de reconfigurer dynamiquement la topologie réseau pour correspondre aux architectures de modèles spécifiques.²
La croissance explosive des paramètres de modèles AI—des 175 milliards de GPT-3 aux supposés 1,7 trillion de GPT-4—demande une bande passante réseau qui double tous les 6 mois, dépassant largement les améliorations de la loi de Moore en calcul.³ La technologie optique cohérente, empruntée aux télécommunications longue distance, apparaît maintenant à l'intérieur des centres de données avec des transceivers 400ZR délivrant 400Gbps sur fibre monomode à 4$ par gigabit contre 12$ pour l'optique traditionnelle. La photonique silicium promet d'intégrer les composants optiques directement sur les GPU, éliminant la conversion électrique-optique qui consomme actuellement 30% du budget énergétique réseau. Les organisations maîtrisant les interconnexions optiques pour l'infrastructure AI gagnent des avantages durables grâce à une densité de bande passante supérieure, une consommation énergétique plus faible, et une flexibilité réseau impossible avec les architectures basées cuivre.
Fondamentaux des optiques cohérentes pour centres de données
La technologie optique cohérente révolutionne la mise en réseau des centres de données en encodant l'information dans l'amplitude et la phase des ondes lumineuses :
Principes de détection cohérente : La détection directe traditionnelle mesure seulement l'intensité lumineuse, atteignant 100Gbps par longueur d'onde maximum. La détection cohérente capture l'amplitude, la phase et les informations de polarisation, permettant 800Gbps par longueur d'onde utilisant la modulation 16-QAM.⁴ Les processeurs de signal numérique compensent la dispersion chromatique et la dispersion de mode de polarisation en temps réel. Les récepteurs cohérents atteignent une sensibilité 20dB meilleure que la détection directe, étendant la portée de 10km à 120km sans amplification.
Implémentation du standard 400ZR : La spécification OIF 400ZR définit des interfaces cohérentes 400Gbps interopérables optimisées pour l'interconnexion de centres de données.⁵ La modulation 16-QAM encode 4 bits par symbole à travers la double polarisation. La correction d'erreur directe concaténée atteint un taux d'erreur binaire de 10^-15. Le facteur de forme QSFP-DD maintient la compatibilité descendante avec l'infrastructure existante. La consommation énergétique reste sous 15 watts permettant un déploiement haute densité.
Intégration photonique silicium : Les transceivers photoniques silicium d'Intel intègrent lasers, modulateurs et détecteurs sur des puces uniques.⁶ Les processus de fabrication CMOS réduisent les coûts de 90% par rapport aux composants discrets. Les guides d'ondes gravés dans le silicium acheminent les signaux optiques avec 0,1dB/cm de perte. Les résonateurs micro-anneaux permettent le multiplexage par division de longueur d'onde sur puce. L'intégration monolithique élimine 80% des connexions optiques qui causent des problèmes de fiabilité.
Avantages des optiques cohérentes pour les charges de travail AI : - 8x bande passante par fibre contre détection directe - Portée 100km sans stations d'amplification - Compensation numérique pour défauts optiques - Modulation flexible s'adaptant aux exigences de distance - Accordabilité en longueur d'onde permettant le routage dynamique - Correction d'erreur directe assurant l'intégrité des données
Modèles d'architecture réseau
Les réseaux optiques pour AI suivent des modèles architecturaux distincts optimisant pour la bande passante et la flexibilité :
Fabric optique Spine-Leaf : L'architecture spine-leaf tout-optique élimine la commutation électronique dans le chemin de données. Les commutateurs leaf se connectent aux serveurs GPU utilisant des transceivers 400ZR. La couche spine utilise des commutateurs sélectifs en longueur d'onde routant des lambdas spécifiques. Chaque liaison spine-leaf transporte 32 longueurs d'onde à 400Gbps totalisant 12,8Tbps. Les amplificateurs optiques amplifient les signaux sans conversion optique-électrique-optique. Le trafic est-ouest entre GPU contourne entièrement la commutation électronique.
Commutation de circuits optiques : Le réseau Jupiter de Google utilise des commutateurs de circuits optiques pour le transfert de données en vrac.⁷ Le contrôleur SDN centralisé programme les chemins optiques basés sur les demandes de trafic. L'établissement de circuit prend 10 nanosecondes contre 500 nanosecondes pour la commutation de paquets. Les chemins optiques dédiés éliminent la file d'attente et la congestion. Les tâches d'entraînement réservent la bande passante garantissant une performance constante. La reconfiguration dynamique s'adapte aux modèles de trafic changeants.
Réseaux optiques désagrégés : Séparer le transport optique des fonctions de traitement de paquets. Le transport optique fournit des longueurs d'onde point-à-point. Le traitement de paquets n'a lieu qu'aux bords du réseau. Élimine 60% de l'équipement réseau du chemin de données. Réduit la latence de 5 microsecondes à 200 nanosecondes. Simplifie les opérations grâce à la montée en charge indépendante des couches optique et paquet.
Réseaux photoniques Clos : Fabrics de commutation optique multi-étages inspirés des réseaux Clos. Les commutateurs photoniques silicium fournissent une connectivité non-bloquante. Les réseaux de guides d'ondes acheminent les longueurs d'onde sans consommation énergétique. Évolue vers 100 000 ports avec une architecture trois-étages. La commutation sub-nanoseconde permet l'ingénierie de trafic à grain fin. Tolérance aux pannes grâce à plusieurs chemins optiques.
Meilleures pratiques d'implémentation
Les déploiements réseaux optiques réussis suivent des pratiques établies :
Planification de l'infrastructure fibre : La fibre monomode supporte des distances jusqu'à 120km avec l'optique cohérente. Les spécifications fibre grade OS2 assurent <0,4dB/km d'atténuation. Le rayon de courbure minimum de 15mm prévient les pertes de microcourbure. Les systèmes de codage couleur et étiquetage préviennent les mauvaises connexions. La caractérisation fibre utilisant OTDR identifie les défauts avant déploiement. Maintenir 20% de capacité fibre de réserve pour l'expansion future.
Gestion de puissance optique : Les puissances de lancement entre -10dBm et +5dBm préviennent les effets non-linéaires. Les amplificateurs optiques maintiennent une puissance constante à travers le spectre de longueurs d'onde. Les atténuateurs optiques variables équilibrent la puissance à travers les chemins parallèles. Les moniteurs de puissance à chaque point de connexion permettent le dépannage. Le contrôle automatique de puissance compense le vieillissement des composants. Les protocoles de sécurité préviennent les dommages oculaires de la lumière infrarouge invisible.
Planification et gestion des longueurs d'onde : La grille ITU-T définit les canaux de longueurs d'onde standard évitant l'interférence. Les systèmes DWDM supportent 96 canaux en bande C (1530-1565nm). Les algorithmes d'assignation de longueurs d'onde préviennent la contention. Les bandes de garde entre canaux réduisent la diaphonie. Les verrouilleurs de longueur d'onde maintiennent la stabilité de fréquence dans 2,5GHz. La conversion de longueur d'onde permet le routage flexible.
Test et validation : Les testeurs de taux d'erreur binaire vérifient la performance de liaison avant production. Les analyseurs de spectre optique mesurent la qualité de signal et OSNR. Le test de dispersion de mode de polarisation assure la stabilité à long terme. L'analyse de diagramme d'œil confirme l'intégrité du signal. Le test en boucle isole les problèmes à des segments spécifiques. La surveillance continue détecte la dégradation avant les pannes.
Introl conçoit et déploie des solutions de mise en réseau optique pour l'infrastructure AI à travers notre zone de couverture globale, avec une expertise en optiques cohérentes et photonique silicium pour les interconnexions GPU.⁸ Nos équipes d'ingénierie optique ont implémenté plus de 200 clusters AI haute bande passante utilisant des technologies photoniques avancées.
Révolution photonique silicium
La photonique silicium apporte les composants optiques sur les mêmes puces que les processeurs :
Optiques co-packagées : Le NVLink de NVIDIA utilise des câbles cuivre limitant la portée à 2 mètres. Les optiques co-packagées placent les transceivers à des millimètres des puces GPU. Élimine le sérialiseur/désérialiseur consommant 10 watts par 100Gbps. Réduit la latence de 100 nanosecondes à 10 nanosecondes. Permet 1,6Tbps par bord de package GPU. L'OCP 2.0 d'Intel démontre les optiques co-packagées à 51,2Tbps.⁹
Commutateurs tout-optiques : Les commutateurs photoniques routent les signaux optiques sans conversion. Les miroirs MEMS redirigent les faisceaux lumineux en 10 microsecondes. Les commutateurs photoniques silicium atteignent une reconfiguration nanoseconde. Consommation énergétique zéro en état stable. Évolue vers 1000x1000 ports en puce unique. Élimine 95% de la puissance contre les commutateurs électroniques.
Interconnexions de calcul optiques : Remplacer PCIe avec des liaisons optiques entre GPU et CPU. CXL sur optique étend les domaines de cohérence mémoire à l'échelle rack. Les fabrics optiques cache-cohérents permettent des clusters de 10 000 GPU. Les interconnexions mémoire optiques fournissent 10TB/s de bande passante. Attachement optique direct aux piles mémoire HBM. Le Passage de Lightmatter démontre 100Tbps de bande passante chip-to-chip.¹⁰
Lasers à points quantiques : Les lasers à points quantiques intégrés sur silicium fournissent des sources lumineuses. L'opération insensible à la température élimine les exigences de refroidissement. La durée de vie de 100 000 heures dépasse la fiabilité des composants électroniques. Les réseaux de lasers permettent le parallélisme massif. L'efficacité énergétique de 0,1 picojoule par bit. Production de masse utilisant les processus semiconducteurs standard.
Déploiements optiques réels
AI Research SuperCluster de Meta : - Échelle : 16 000 GPU A100 avec liens optiques 200Gbps - Bande passante : 13 pétabits/seconde de bande passante fabric agrégée - Architecture : Clos trois-niveaux avec couche spine optique - Technologie : Optiques cohérentes 400ZR pour liens inter-bâtiments - Latence : 1,5 microsecondes à travers le campus de 2 000 pieds - Résultat : Entraînement de modèle 3x plus rapide contre l'infrastructure précédente
Project Sirius d'Microsoft Azure : - Innovation : Commutation tout-optique pour charges de travail AI - Performance : 12,8Tbps par commutateur optique - Efficacité : Réduction de puissance 85% contre commutation électronique - Échelle : Connexion optique de 100 000 GPU - Commutation : Établissement de circuit optique sub-microseconde - Impact : Réduction de 40% des coûts d'entraînement
Centre de données optique d'Alibaba Cloud : - Déploiement : Optiques cohérentes 400G dans toute l'installation - Portée : Connectivité campus 40km sans amplification - Densité : 38,4Tbps par rack utilisant la commutation optique - Puissance : 3 watts par liaison optique 100Gbps - Flexibilité : Routage de longueur d'onde dynamique basé sur la charge de travail - Économies : Réduction de coût énergétique annuel de 15 millions de dollars
Frontier du Oak Ridge National Laboratory : - Calcul : 37 000 GPU AMD MI250X - Interconnexion : Fabric Slingshot avec liens optiques - Bande passante : 100GB/s de bande passante d'injection par nœud - Topologie : Dragonfly+ avec connexions de groupe optiques - Distance : Liens optiques couvrant l'installation de 300 mètres - Réalisation : Premier système exascale au monde
Analyse d'efficacité énergétique
La mise en réseau optique réduit dramatiquement la consommation énergétique des centres de données :
Comparaison de puissance de liaison (par 100Gbps) : - DAC cuivre (3m) : 35 watts - Câble optique actif (100m) : 12 watts - Photonique silicium (2km) : 5 watts - Optiques cohérentes (40km) : 3,5 watts - Photonique future : <1 watt projeté
Économies au niveau système : La couche d'agrégation fabric de Facebook utilise 90% d'interconnexions optiques. L'efficacité d'usage énergétique s'améliore de 1,4 à 1,15 avec la commutation optique. La puissance d'équipement réseau chute de 15% à 5%