Jaringan Optik untuk AI: 400ZR dan Coherent Optics untuk GPU Interconnect
Diperbarui 8 Desember 2025
Pembaruan Desember 2025: Coherent optics 800G (800ZR+) kini sudah dikirim dari berbagai vendor termasuk Cisco, Ciena, dan Infinera. Demonstrasi co-packaged optics (CPO) pada kapasitas switch 51.2T. Linear-drive pluggable optics mengurangi daya 40% dibandingkan solusi berbasis DSP. NVIDIA's NVLink-C2C menggunakan silicon photonics untuk optical interconnect chip-ke-chip pada rack GB200 NVL72. Pasar optik data center AI diproyeksikan mencapai $8,2B pada 2028, didorong oleh GPU interconnect skala rack yang memerlukan 400G+ per tautan.
Supercomputer TPU v5p Google mencapai kekuatan komputasi 8,5 exaflops dengan menghubungkan 8.960 chip menggunakan optical circuit switches yang memberikan bandwidth agregat 4 petabit per detik dengan waktu switching di bawah 10 nanodetik, memungkinkan rekonfigurasi topologi dinamis yang meningkatkan kecepatan training 2,7x dibandingkan electronic switching tradisional.¹ Optical interconnect perusahaan pencari ini mengonsumsi 5 watt per tautan 100Gbps versus 35 watt untuk electronic switches—efisiensi daya 7x yang menghemat $24 juta per tahun dalam biaya listrik di seluruh infrastruktur AI mereka. Kabel tembaga tradisional mencapai batas fisik pada jarak 3 meter untuk koneksi 400Gbps, memaksa data center untuk mengadopsi optical interconnects yang mempertahankan integritas sinyal di jarak 2 kilometer sambil menghilangkan gangguan elektromagnetik yang merusak perhitungan gradien selama distributed training. Organisasi yang menerapkan optical networking untuk AI melaporkan pengurangan kompleksitas kabel 50%, varian latensi 85% lebih rendah, dan kemampuan untuk merekonfigurasi topologi jaringan secara dinamis agar sesuai dengan arsitektur model spesifik.²
Pertumbuhan eksplosif parameter model AI—dari 175 miliar GPT-3 hingga rumor 1,7 triliun GPT-4—membutuhkan bandwidth jaringan yang berlipat ganda setiap 6 bulan, jauh melampaui peningkatan Hukum Moore dalam komputasi.³ Teknologi coherent optical, yang dipinjam dari telekomunikasi jarak jauh, kini muncul di dalam data center dengan transceiver 400ZR memberikan 400Gbps melalui single-mode fiber seharga $4 per gigabit versus $12 untuk optik tradisional. Silicon photonics berjanji mengintegrasikan komponen optik langsung ke GPU, menghilangkan konversi electrical-ke-optical yang saat ini mengonsumsi 30% anggaran daya jaringan. Organisasi yang menguasai optical interconnects untuk infrastruktur AI mendapatkan keunggulan berkelanjutan melalui kepadatan bandwidth superior, konsumsi daya lebih rendah, dan fleksibilitas jaringan yang tidak mungkin dicapai dengan arsitektur berbasis tembaga.
Fundamental coherent optics untuk data center
Teknologi coherent optical merevolusi jaringan data center dengan mengkode informasi dalam amplitudo dan fase gelombang cahaya:
Prinsip Coherent Detection: Deteksi langsung tradisional hanya mengukur intensitas cahaya, mencapai maksimum 100Gbps per panjang gelombang. Coherent detection menangkap informasi amplitudo, fase, dan polarisasi, memungkinkan 800Gbps per panjang gelombang menggunakan modulasi 16-QAM.⁴ Digital signal processor mengompensasi dispersi kromatik dan dispersi mode polarisasi secara real-time. Coherent receiver mencapai sensitivitas 20dB lebih baik daripada deteksi langsung, memperluas jangkauan dari 10km hingga 120km tanpa amplifikasi.
Implementasi Standar 400ZR: Spesifikasi OIF 400ZR mendefinisikan antarmuka coherent 400Gbps yang dapat beroperasi untuk data center interconnect.⁵ Modulasi 16-QAM mengkode 4 bit per simbol di seluruh dual polarization. Concatenated forward error correction mencapai bit error rate 10^-15. Form factor QSFP-DD mempertahankan kompatibilitas mundur dengan infrastruktur yang ada. Konsumsi daya tetap di bawah 15 watt memungkinkan deployment kepadatan tinggi.
Integrasi Silicon Photonics: Transceiver silicon photonics Intel mengintegrasikan laser, modulator, dan detektor pada chip tunggal.⁶ Proses manufaktur CMOS mengurangi biaya 90% versus komponen diskret. Waveguide yang dietsa dalam silikon merutekan sinyal optik dengan kerugian 0,1dB/cm. Micro-ring resonator memungkinkan wavelength-division multiplexing pada chip. Integrasi monolitik menghilangkan 80% koneksi optik yang menyebabkan masalah keandalan.
Keunggulan coherent optics untuk beban kerja AI: - Bandwidth 8x per fiber versus deteksi langsung - Jangkauan 100km tanpa stasiun amplifikasi - Kompensasi digital untuk gangguan optik - Modulasi fleksibel beradaptasi dengan persyaratan jarak - Tunabilitas panjang gelombang memungkinkan routing dinamis - Forward error correction memastikan integritas data
Pola arsitektur jaringan
Jaringan optik untuk AI mengikuti pola arsitektur yang berbeda untuk mengoptimalkan bandwidth dan fleksibilitas:
Spine-Leaf Optical Fabric: Arsitektur spine-leaf all-optical menghilangkan electronic switching dalam jalur data. Leaf switch terhubung ke server GPU menggunakan transceiver 400ZR. Layer spine menggunakan wavelength-selective switch merutekan lambda spesifik. Setiap tautan spine-leaf membawa 32 panjang gelombang pada 400Gbps total 12,8Tbps. Optical amplifier meningkatkan sinyal tanpa konversi optical-electrical-optical. Lalu lintas east-west antar GPU melewati electronic switching sepenuhnya.
Optical Circuit Switching: Jaringan Jupiter Google menggunakan optical circuit switch untuk transfer data massal.⁷ Controller SDN terpusat memprogram jalur optik berdasarkan permintaan lalu lintas. Pembentukan circuit memerlukan 10 nanodetik versus 500 nanodetik untuk packet switching. Jalur optik khusus menghilangkan antrian dan kemacetan. Job training mereservasi bandwidth menjamin kinerja konsisten. Rekonfigurasi dinamis beradaptasi dengan pola lalu lintas yang berubah.
Disaggregated Optical Networks: Memisahkan transport optik dari fungsi pemrosesan paket. Transport optik menyediakan panjang gelombang point-to-point. Pemrosesan paket hanya terjadi di tepi jaringan. Menghilangkan 60% peralatan jaringan dari jalur data. Mengurangi latensi dari 5 mikrodetik menjadi 200 nanodetik. Menyederhanakan operasi melalui scaling independen layer optik dan paket.
Photonic Clos Networks: Fabric switching optik multi-tahap terinspirasi dari jaringan Clos. Silicon photonic switch menyediakan konektivitas non-blocking. Arrayed waveguide grating merutekan panjang gelombang tanpa konsumsi daya. Scales hingga 100.000 port dengan arsitektur tiga tahap. Switching sub-nanodetik memungkinkan traffic engineering berbutir halus. Toleransi kesalahan melalui beberapa jalur optik.
Best practice implementasi
Deployment jaringan optik yang sukses mengikuti praktik yang telah ditetapkan:
Perencanaan Infrastruktur Fiber: Single-mode fiber mendukung jarak hingga 120km dengan coherent optics. Spesifikasi fiber grade OS2 memastikan atenuasi <0,4dB/km. Radius bend minimum 15mm mencegah kerugian microbending. Sistem kode warna dan pelabelan mencegah kesalahan koneksi. Karakterisasi fiber menggunakan OTDR mengidentifikasi gangguan sebelum deployment. Pertahankan kapasitas fiber cadangan 20% untuk ekspansi masa depan.
Manajemen Daya Optik: Launch power antara -10dBm dan +5dBm mencegah efek nonlinear. Optical amplifier mempertahankan daya konsisten di seluruh spektrum panjang gelombang. Variable optical attenuator menyeimbangkan daya di jalur paralel. Monitor daya di setiap titik koneksi memungkinkan troubleshooting. Kontrol daya otomatis mengompensasi aging komponen. Protokol keselamatan mencegah kerusakan mata dari cahaya inframerah yang tidak terlihat.
Perencanaan dan Manajemen Panjang Gelombang: Grid ITU-T mendefinisikan saluran panjang gelombang standar menghindari interferensi. Sistem DWDM mendukung 96 saluran di C-band (1530-1565nm). Algoritma assignment panjang gelombang mencegah kontention. Guard band antara saluran mengurangi crosstalk. Wavelength locker mempertahankan stabilitas frekuensi dalam 2,5GHz. Konversi panjang gelombang memungkinkan routing fleksibel.
Pengujian dan Validasi: Bit error rate tester memverifikasi kinerja tautan sebelum produksi. Optical spectrum analyzer mengukur kualitas sinyal dan OSNR. Pengujian polarization mode dispersion memastikan stabilitas jangka panjang. Analisis eye diagram mengonfirmasi integritas sinyal. Pengujian loopback mengisolasi masalah ke segmen spesifik. Monitoring berkelanjutan mendeteksi degradasi sebelum kegagalan.
Introl merancang dan menerapkan solusi optical networking untuk infrastruktur AI di seluruh area cakupan global kami, dengan keahlian dalam coherent optics dan silicon photonics untuk GPU interconnects.⁸ Tim optical engineering kami telah mengimplementasikan lebih dari 200 kluster AI bandwidth tinggi menggunakan teknologi photonic canggih.
Revolusi silicon photonics
Silicon photonics membawa komponen optik ke chip yang sama dengan prosesor:
Co-packaged Optics: NVLink NVIDIA menggunakan kabel tembaga membatasi jangkauan hingga 2 meter. Co-packaged optics menempatkan transceiver milimeter dari die GPU. Menghilangkan serializer/deserializer yang mengonsumsi 10 watt per 100Gbps. Mengurangi latensi dari 100 nanodetik menjadi 10 nanodetik. Memungkinkan 1,6Tbps per tepi paket GPU. OCP 2.0 Intel mendemonstrasikan co-packaged optics pada 51,2Tbps.⁹
All-Optical Switches: Photonic switch merutekan sinyal optik tanpa konversi. Mirror MEMS mengarahkan ulang berkas cahaya dalam 10 mikrodetik. Silicon photonic switch mencapai rekonfigurasi nanodetik. Konsumsi daya nol dalam keadaan steady. Scales hingga port 1000x1000 dalam chip tunggal. Menghilangkan 95% daya versus electronic switch.
Optical Compute Interconnects: Mengganti PCIe dengan tautan optik antara GPU dan CPU. CXL melalui optik memperluas domain koherensi memori ke skala rack. Fabric optik cache-coherent memungkinkan kluster 10.000 GPU. Optical memory interconnect menyediakan bandwidth 10TB/s. Attachment optik langsung ke stack memori HBM. Passage Lightmatter mendemonstrasikan bandwidth chip-ke-chip 100Tbps.¹⁰
Quantum Dot Lasers: Quantum dot laser yang terintegrasi pada silikon menyediakan sumber cahaya. Operasi temperature-insensitive menghilangkan persyaratan pendinginan. Lifetime 100.000 jam melampaui keandalan komponen elektronik. Array laser memungkinkan paralelisme masif. Efisiensi energi 0,1 picojoule per bit. Produksi massal menggunakan proses semikonduktor standar.
Deployment optik dunia nyata
Meta's AI Research SuperCluster: - Skala: 16.000 GPU A100 dengan tautan optik 200Gbps - Bandwidth: 13 petabit/detik bandwidth fabric agregat - Arsitektur: Clos tiga tingkat dengan layer spine optik - Teknologi: Coherent optics 400ZR untuk tautan inter-building - Latensi: 1,5 mikrodetik di kampus 2.000 kaki - Hasil: Training model 3x lebih cepat versus infrastruktur sebelumnya
Microsoft Azure's Project Sirius: - Inovasi: All-optical switching untuk beban kerja AI - Kinerja: 12,8Tbps per optical switch - Efisiensi: Pengurangan daya 85% versus electronic switching - Skala: Menghubungkan 100.000 GPU secara optik - Switching: Pembentukan optical circuit sub-mikrodetik - Dampak: Pengurangan biaya training 40%
Alibaba Cloud's Optical Data Center: - Deployment: Coherent optics 400G di seluruh fasilitas - Jangkauan: Konektivitas kampus 40km tanpa amplifikasi - Kepadatan: 38,4Tbps per rack menggunakan optical switching - Daya: 3 watt per tautan optik 100Gbps - Fleksibilitas: Routing panjang gelombang dinamis berdasarkan beban kerja - Penghematan: Pengurangan biaya daya tahunan $15 juta
Oak Ridge National Laboratory's Frontier: - Compute: 37.000 GPU AMD MI250X - Interconnect: Fabric Slingshot dengan tautan optik - Bandwidth: Bandwidth injeksi 100GB/s per node - Topologi: Dragonfly+ dengan koneksi grup optik - Jarak: Tautan optik membentang fasilitas 300 meter - Pencapaian: Sistem exascale pertama di dunia
Analisis efisiensi daya
Optical networking secara dramatis mengurangi konsumsi daya data center:
Perbandingan Daya Tautan (per 100Gbps): - Copper DAC (3m): 35 watt - Active optical cable (100m): 12 watt - Silicon photonics (2km): 5 watt - Coherent optics (40km): 3,5 watt - Photonics masa depan: <1 watt diproyeksikan
Penghematan Tingkat Sistem: Layer agregasi fabric Facebook menggunakan 90% optical interconnect. Power usage effectiveness meningkat dari 1,4 menjadi 1,15 dengan optical switching. Daya peralatan jaringan turun dari 15% menjadi 5%