Mạng Quang Học cho AI: 400ZR và Quang Học Coherent cho Kết Nối GPU
Cập nhật ngày 8 tháng 12 năm 2025
Cập nhật tháng 12/2025: Quang học coherent 800G (800ZR+) hiện đang được xuất xưởng từ nhiều nhà cung cấp bao gồm Cisco, Ciena và Infinera. Các bản demo quang học đóng gói chung (CPO) đạt dung lượng chuyển mạch 51,2T. Quang học cắm được điều khiển tuyến tính giảm 40% công suất so với các giải pháp dựa trên DSP. NVLink-C2C của NVIDIA sử dụng silicon photonics cho kết nối quang chip-to-chip trong các rack GB200 NVL72. Thị trường quang học trung tâm dữ liệu AI dự kiến đạt 8,2 tỷ USD vào năm 2028, được thúc đẩy bởi các kết nối GPU quy mô rack yêu cầu 400G+ mỗi liên kết.
Siêu máy tính TPU v5p của Google đạt 8,5 exaflops sức mạnh tính toán bằng cách kết nối 8.960 chip sử dụng bộ chuyển mạch mạch quang cung cấp 4 petabit mỗi giây băng thông tổng hợp với thời gian chuyển mạch dưới 10 nano giây, cho phép tái cấu hình topology động giúp cải thiện tốc độ huấn luyện 2,7 lần so với chuyển mạch điện tử truyền thống.¹ Kết nối quang của gã khổng lồ tìm kiếm tiêu thụ 5 watt trên 100Gbps liên kết so với 35 watt cho các bộ chuyển mạch điện tử—mức tăng hiệu suất năng lượng 7 lần tiết kiệm 24 triệu USD hàng năm chi phí điện năng trên toàn bộ cơ sở hạ tầng AI của họ. Cáp đồng truyền thống gặp giới hạn vật lý ở 3 mét cho các kết nối 400Gbps, buộc các trung tâm dữ liệu phải áp dụng kết nối quang duy trì tính toàn vẹn tín hiệu trên 2 km trong khi loại bỏ nhiễu điện từ làm hỏng các tính toán gradient trong quá trình huấn luyện phân tán. Các tổ chức triển khai mạng quang cho AI báo cáo giảm 50% độ phức tạp cáp, giảm 85% biến động độ trễ, và khả năng tái cấu hình topology mạng động để phù hợp với kiến trúc mô hình cụ thể.²
Sự tăng trưởng bùng nổ của tham số mô hình AI—từ 175 tỷ của GPT-3 đến 1,7 nghìn tỷ được đồn đoán của GPT-4—đòi hỏi băng thông mạng tăng gấp đôi mỗi 6 tháng, vượt xa các cải tiến Định luật Moore trong tính toán.³ Công nghệ quang học coherent, mượn từ viễn thông đường dài, giờ xuất hiện bên trong các trung tâm dữ liệu với bộ thu phát 400ZR cung cấp 400Gbps qua sợi đơn mode với giá 4 USD mỗi gigabit so với 12 USD cho quang học truyền thống. Silicon photonics hứa hẹn tích hợp các thành phần quang trực tiếp lên GPU, loại bỏ chuyển đổi điện-quang hiện đang tiêu thụ 30% ngân sách năng lượng mạng. Các tổ chức làm chủ kết nối quang cho cơ sở hạ tầng AI đạt được lợi thế bền vững thông qua mật độ băng thông vượt trội, tiêu thụ điện năng thấp hơn và tính linh hoạt mạng không thể đạt được với kiến trúc dựa trên đồng.
Nguyên lý cơ bản về quang học coherent cho trung tâm dữ liệu
Công nghệ quang học coherent cách mạng hóa mạng trung tâm dữ liệu bằng cách mã hóa thông tin trong cả biên độ và pha của sóng ánh sáng:
Nguyên lý phát hiện Coherent: Phát hiện trực tiếp truyền thống chỉ đo cường độ ánh sáng, đạt tối đa 100Gbps mỗi bước sóng. Phát hiện coherent nắm bắt thông tin biên độ, pha và phân cực, cho phép 800Gbps mỗi bước sóng sử dụng điều chế 16-QAM.⁴ Bộ xử lý tín hiệu số bù cho tán sắc màu và tán sắc mode phân cực theo thời gian thực. Bộ thu coherent đạt độ nhạy tốt hơn 20dB so với phát hiện trực tiếp, mở rộng phạm vi từ 10km lên 120km mà không cần khuếch đại.
Triển khai tiêu chuẩn 400ZR: Thông số kỹ thuật OIF 400ZR định nghĩa các giao diện coherent 400Gbps có thể tương tác được tối ưu hóa cho kết nối trung tâm dữ liệu.⁵ Điều chế 16-QAM mã hóa 4 bit mỗi symbol trên phân cực kép. Sửa lỗi chuyển tiếp nối tiếp đạt tỷ lệ lỗi bit 10^-15. Form factor QSFP-DD duy trì khả năng tương thích ngược với cơ sở hạ tầng hiện có. Tiêu thụ điện năng dưới 15 watt cho phép triển khai mật độ cao.
Tích hợp Silicon Photonics: Bộ thu phát silicon photonics của Intel tích hợp laser, bộ điều chế và bộ phát hiện trên chip đơn.⁶ Quy trình sản xuất CMOS giảm chi phí 90% so với các thành phần rời rạc. Ống dẫn sóng khắc trong silicon định tuyến tín hiệu quang với tổn hao 0,1dB/cm. Bộ cộng hưởng micro-ring cho phép ghép kênh phân chia bước sóng trên chip. Tích hợp nguyên khối loại bỏ 80% kết nối quang gây ra vấn đề độ tin cậy.
Ưu điểm của quang học coherent cho khối lượng công việc AI: - Băng thông gấp 8 lần mỗi sợi so với phát hiện trực tiếp - Phạm vi 100km không cần trạm khuếch đại - Bù kỹ thuật số cho các suy giảm quang học - Điều chế linh hoạt thích ứng với yêu cầu khoảng cách - Khả năng điều chỉnh bước sóng cho phép định tuyến động - Sửa lỗi chuyển tiếp đảm bảo tính toàn vẹn dữ liệu
Mô hình kiến trúc mạng
Mạng quang cho AI tuân theo các mô hình kiến trúc riêng biệt tối ưu hóa cho băng thông và tính linh hoạt:
Fabric quang Spine-Leaf: Kiến trúc spine-leaf toàn quang loại bỏ chuyển mạch điện tử trong đường dữ liệu. Bộ chuyển mạch Leaf kết nối với máy chủ GPU sử dụng bộ thu phát 400ZR. Lớp Spine sử dụng bộ chuyển mạch chọn bước sóng định tuyến các lambda cụ thể. Mỗi liên kết spine-leaf mang 32 bước sóng ở 400Gbps tổng cộng 12,8Tbps. Bộ khuếch đại quang tăng cường tín hiệu mà không cần chuyển đổi quang-điện-quang. Lưu lượng đông-tây giữa các GPU bỏ qua hoàn toàn chuyển mạch điện tử.
Chuyển mạch mạch quang: Mạng Jupiter của Google sử dụng bộ chuyển mạch mạch quang cho truyền dữ liệu số lượng lớn.⁷ Bộ điều khiển SDN tập trung lập trình các đường quang dựa trên nhu cầu lưu lượng. Thiết lập mạch mất 10 nano giây so với 500 nano giây cho chuyển mạch gói. Các đường quang chuyên dụng loại bỏ hàng đợi và tắc nghẽn. Các công việc huấn luyện đặt trước băng thông đảm bảo hiệu suất nhất quán. Tái cấu hình động thích ứng với các mô hình lưu lượng thay đổi.
Mạng quang phân tách: Tách truyền tải quang khỏi các chức năng xử lý gói. Truyền tải quang cung cấp các bước sóng điểm-điểm. Xử lý gói chỉ xảy ra ở các biên mạng. Loại bỏ 60% thiết bị mạng khỏi đường dữ liệu. Giảm độ trễ từ 5 micro giây xuống 200 nano giây. Đơn giản hóa vận hành thông qua mở rộng độc lập các lớp quang và gói.
Mạng Clos photonic: Các fabric chuyển mạch quang đa tầng lấy cảm hứng từ mạng Clos. Bộ chuyển mạch photonic silicon cung cấp kết nối không chặn. Lưới ống dẫn sóng mảng định tuyến bước sóng mà không tiêu thụ điện. Mở rộng đến 100.000 cổng với kiến trúc ba tầng. Chuyển mạch dưới nano giây cho phép kỹ thuật lưu lượng chi tiết. Khả năng chịu lỗi thông qua nhiều đường quang.
Thực hành triển khai tốt nhất
Các triển khai mạng quang thành công tuân theo các thực hành đã được thiết lập:
Lập kế hoạch cơ sở hạ tầng sợi quang: Sợi đơn mode hỗ trợ khoảng cách lên đến 120km với quang học coherent. Thông số sợi cấp OS2 đảm bảo suy hao <0,4dB/km. Bán kính uốn cong tối thiểu 15mm ngăn ngừa tổn hao uốn cong vi mô. Hệ thống mã màu và ghi nhãn ngăn ngừa kết nối sai. Đặc tính hóa sợi sử dụng OTDR xác định suy giảm trước khi triển khai. Duy trì 20% công suất sợi dự phòng cho mở rộng tương lai.
Quản lý công suất quang: Công suất phát giữa -10dBm và +5dBm ngăn ngừa các hiệu ứng phi tuyến. Bộ khuếch đại quang duy trì công suất nhất quán trên phổ bước sóng. Bộ suy hao quang biến đổi cân bằng công suất trên các đường song song. Bộ giám sát công suất tại mỗi điểm kết nối cho phép khắc phục sự cố. Điều khiển công suất tự động bù cho sự lão hóa thành phần. Các giao thức an toàn ngăn ngừa tổn thương mắt từ ánh sáng hồng ngoại vô hình.
Lập kế hoạch và quản lý bước sóng: Lưới ITU-T định nghĩa các kênh bước sóng tiêu chuẩn tránh nhiễu. Hệ thống DWDM hỗ trợ 96 kênh trong băng C (1530-1565nm). Thuật toán phân bổ bước sóng ngăn ngừa tranh chấp. Dải bảo vệ giữa các kênh giảm xuyên nhiễu. Bộ khóa bước sóng duy trì độ ổn định tần số trong phạm vi 2,5GHz. Chuyển đổi bước sóng cho phép định tuyến linh hoạt.
Kiểm tra và xác nhận: Bộ kiểm tra tỷ lệ lỗi bit xác minh hiệu suất liên kết trước khi đưa vào sản xuất. Bộ phân tích phổ quang đo chất lượng tín hiệu và OSNR. Kiểm tra tán sắc mode phân cực đảm bảo độ ổn định dài hạn. Phân tích biểu đồ mắt xác nhận tính toàn vẹn tín hiệu. Kiểm tra loopback cô lập vấn đề đến các phân đoạn cụ thể. Giám sát liên tục phát hiện suy giảm trước khi xảy ra lỗi.
Introl thiết kế và triển khai các giải pháp mạng quang cho cơ sở hạ tầng AI trên khu vực phủ sóng toàn cầu của chúng tôi, với chuyên môn về quang học coherent và silicon photonics cho kết nối GPU.⁸ Các đội ngũ kỹ sư quang của chúng tôi đã triển khai hơn 200 cụm AI băng thông cao sử dụng các công nghệ photonic tiên tiến.
Cuộc cách mạng silicon photonics
Silicon photonics đưa các thành phần quang lên cùng chip với bộ xử lý:
Quang học đóng gói chung: NVLink của NVIDIA sử dụng cáp đồng giới hạn phạm vi 2 mét. Quang học đóng gói chung đặt bộ thu phát cách die GPU vài milimét. Loại bỏ serializer/deserializer tiêu thụ 10 watt trên 100Gbps. Giảm độ trễ từ 100 nano giây xuống 10 nano giây. Cho phép 1,6Tbps mỗi cạnh gói GPU. OCP 2.0 của Intel trình diễn quang học đóng gói chung ở 51,2Tbps.⁹
Bộ chuyển mạch toàn quang: Bộ chuyển mạch photonic định tuyến tín hiệu quang mà không cần chuyển đổi. Gương MEMS chuyển hướng chùm sáng trong 10 micro giây. Bộ chuyển mạch photonic silicon đạt tái cấu hình nano giây. Không tiêu thụ điện ở trạng thái ổn định. Mở rộng đến 1000x1000 cổng trong chip đơn. Loại bỏ 95% công suất so với bộ chuyển mạch điện tử.
Kết nối tính toán quang: Thay thế PCIe bằng liên kết quang giữa GPU và CPU. CXL qua quang mở rộng miền coherence bộ nhớ đến quy mô rack. Các fabric quang cache-coherent cho phép cụm 10.000 GPU. Kết nối bộ nhớ quang cung cấp băng thông 10TB/s. Gắn kết quang trực tiếp với các ngăn xếp bộ nhớ HBM. Passage của Lightmatter trình diễn băng thông chip-to-chip 100Tbps.¹⁰
Laser chấm lượng tử: Laser chấm lượng tử tích hợp trên silicon cung cấp nguồn sáng. Hoạt động không nhạy cảm với nhiệt độ loại bỏ yêu cầu làm mát. Tuổi thọ 100.000 giờ vượt quá độ tin cậy của thành phần điện tử. Mảng laser cho phép song song hóa lớn. Hiệu suất năng lượng 0,1 picojoule mỗi bit. Sản xuất hàng loạt sử dụng quy trình bán dẫn tiêu chuẩn.
Triển khai quang thực tế
AI Research SuperCluster của Meta: - Quy mô: 16.000 GPU A100 với liên kết quang 200Gbps - Băng thông: 13 petabit/giây băng thông fabric tổng hợp - Kiến trúc: Clos ba tầng với lớp spine quang - Công nghệ: Quang học coherent 400ZR cho liên kết giữa các tòa nhà - Độ trễ: 1,5 micro giây trên khuôn viên 2.000 foot - Kết quả: Huấn luyện mô hình nhanh hơn 3 lần so với cơ sở hạ tầng trước đó
Project Sirius của Microsoft Azure: - Đổi mới: Chuyển mạch toàn quang cho khối lượng công việc AI - Hiệu suất: 12,8Tbps mỗi bộ chuyển mạch quang - Hiệu quả: Giảm 85% công suất so với chuyển mạch điện tử - Quy mô: Kết nối 100.000 GPU bằng quang - Chuyển mạch: Thiết lập mạch quang dưới micro giây - Tác động: Giảm 40% chi phí huấn luyện
Trung tâm dữ liệu quang của Alibaba Cloud: - Triển khai: Quang học coherent 400G trong toàn bộ cơ sở - Phạm vi: Kết nối khuôn viên 40km không cần khuếch đại - Mật độ: 38,4Tbps mỗi rack sử dụng chuyển mạch quang - Công suất: 3 watt trên 100Gbps liên kết quang - Linh hoạt: Định tuyến bước sóng động dựa trên khối lượng công việc - Tiết kiệm: Giảm 15 triệu USD chi phí điện hàng năm
Frontier của Phòng thí nghiệm Quốc gia Oak Ridge: - Tính toán: 37.000 GPU AMD MI250X - Kết nối: Fabric Slingshot với liên kết quang - Băng thông: Băng thông injection 100GB/s mỗi nút - Topology: Dragonfly+ với kết nối nhóm quang - Khoảng cách: Liên kết quang trải dài cơ sở 300 mét - Thành tựu: Hệ thống exascale đầu tiên trên thế giới
Phân tích hiệu suất năng lượng
Mạng quang giảm đáng kể tiêu thụ điện năng trung tâm dữ liệu:
So sánh công suất liên kết (mỗi 100Gbps): - DAC đồng (3m): 35 watt - Cáp quang chủ động (100m): 12 watt - Silicon photonics (2km): 5 watt - Quang học coherent (40km): 3,5 watt - Photonics tương lai: <1 watt dự kiến
Tiết kiệm cấp hệ thống: Lớp tổng hợp fabric của Facebook sử dụng 90% kết nối quang. Hiệu quả sử dụng điện năng cải thiện từ 1,4 xuống 1,15 với chuyển mạch quang. Công suất thiết bị mạng giảm từ 15% xuống 5% tổng