线缆与互连:800G AI数据中心的DAC、AOC、AEC及光纤选型指南

线缆与互连:800G AI数据中心的DAC、AOC、AEC及光纤选型指南

线缆与互连:800G AI数据中心的DAC、AOC、AEC及光纤选型指南

更新于2025年12月11日

2025年12月更新: 800G正在成为新建AI基础设施的默认选择,1.6T已进入开发试验阶段。AEC技术在800G速率下已可达9米(Marvell/Infraeo OCP演示),以比光纤低25-50%的功耗弥合了DAC与AOC之间的差距。NVIDIA LinkX AOC线缆已部署于TOP500 HPC系统的大多数设施中。QSFP-DD800和OSFP封装形式支持PAM4技术,可用于生产环境部署。

生成式AI数据中心所需的光纤数量是传统设施的十倍,以支持GPU集群和低延迟互连。¹ 连接800G交换机与数千个GPU的线缆基础设施,决定了昂贵的计算资源能否充分利用,还是会在网络连接上形成瓶颈。随着800G成为新建AI数据中心的默认选择,1.6T已进入开发试验阶段,今天做出的线缆选型决策将影响未来数年的基础设施灵活性。²

互连技术的格局已变得比传统的DAC与AOC选择更加复杂。有源电缆(AEC)如今已能在DAC和光纤方案之间架起桥梁,传输距离可达9米,功耗比有源光缆低25-50%。³ 封装形式也从QSFP-DD演进到OSFP,各自针对不同的散热和密度需求进行了优化。部署AI基础设施的组织必须在距离要求、功率预算、散热限制和升级路径等方面做出权衡,而每种线缆类型都在特定场景中表现出色。

DAC为短距离连接提供最低成本和延迟

直连铜缆(DAC)仍是机架内连接的最佳选择,前提是距离允许。这种基于铜缆的互连无需光电转换,直接传输信号,几乎不产生额外延迟。⁴ 结构简单、可靠性高,降低了运维复杂度,同时成本远低于光纤方案。

800G DAC产品采用QSFP-DD800或OSFP封装,支持PAM4技术。无源DAC几乎不消耗功率(低于0.15W),而有源DAC的功耗也远低于光模块。⁵ 成本优势在规模化部署时更加显著,与光纤方案相比,大规模部署可节省可观费用。

距离限制制约了DAC的适用范围。在800G速率下,无源DAC可达约3米,有源DAC可延伸至5米。⁶ 当互连距离超过这些阈值时,传输损耗和线缆不灵活性使DAC变得不切实际。

物理特性也带来额外挑战。铜缆比光缆更粗,弯曲半径更大,重量也更重,这些都增加了高密度部署的难度。⁷ 随着DAC数量增加,高密度机架中的线缆管理变得更加困难。

DAC的最佳应用场景包括:机架内服务器到ToR(架顶)交换机的连接、相邻服务器之间的高速互连,以及在有限距离内对延迟极其敏感的环境。⁸ Meta的AI集群架构使用DAC线缆连接机架训练交换机与GPU,展示了该技术在生产环境AI基础设施中的应用。⁹

AOC以光纤性能扩展传输距离

有源光缆(AOC)集成了光电转换模块,将电信号转换为光信号进行传输。该技术在800G配置下支持30至100米的传输距离,同时保持QSFP-DD800或OSFP封装。¹⁰

AOC的性能特点使其适合中距离连接。重量轻、柔韧性好、抗电磁干扰,可实现更高密度部署而不影响性能。¹¹ 比铜缆更好的散热能力有助于管理GPU密集环境中的热负荷。

功耗高于DAC,每根线缆约1-2W,但对于所提供的传输距离来说仍可接受。¹² 相同规格下,成本约为DAC的4倍,这反映了更复杂的内部电子元件和光学组件。¹³

800G AOC线缆面向AI数据中心、机器学习训练设施和超大规模云环境等新兴应用,这些场景的带宽需求超过了400G。¹⁴ 该技术非常适合GPU集群互连、跨行连接以及需要灵活布线和中等传输距离的大规模AI训练环境。¹⁵

NVIDIA LinkX AOC线缆展示了针对AI工作负载的供应商专属优化。这些线缆由LinkX Optics设计和制造,已部署于TOP500 HPC系统的大多数设施中。¹⁶ 产品涵盖从QDR到NDR(400G)的QSFP封装形式,传输距离可达150米,并在实际的NVIDIA网络和GPU系统中进行100%测试,确保最佳信号完整性。¹⁷

AEC弥合DAC与AOC的差距

有源电缆(AEC)代表了DAC和AOC方案之间新兴的中间地带。该技术在线缆内部集成了重定时器或DSP芯片以增强信号传输,通过放大信号、均衡处理和时钟数据恢复来解决铜缆传输的挑战。¹⁸

传输距离显著超过DAC。AEC支持2至9米的线缆长度,可在密集数据中心布局中实现跨机架的可靠连接。¹⁹ Marvell和Infraeo在2025年OCP全球峰会上演示了9米800G AEC,实现了跨越七个机架的铜缆连接,使数据中心架构更接近全行级AI系统设计。²⁰

相比AOC,功耗效率优势显著。AEC的功耗比光纤方案低约20%,同时支持8通道106.25G-PAM4信号传输,实现双向800G流量。²¹ 总功耗约10W,比AOC低25-50%,改善了高密度环境中的气流和重量管理。²²

性价比定位使AEC在大规模部署中具有吸引力。这些线缆成本低于AOC,同时提供超越DAC的能力,是带宽需求高的环境的明智投资。²³ 650 Group的行业分析师指出,超大规模企业需要高带宽、低功耗、低成本的解决方案,这使AEC成为生成式AI基础设施的最优选择。²⁴

AEC市场预计到2031年将以28.2%的复合年增长率增长,达到12.57亿美元,该技术正在成为AI集群部署的标准配置。²⁵ 包括Amphenol、TE Connectivity、Molex和Credo在内的领先供应商正在投资下一代模块,每通道可达112Gbps,并向224Gbps扩展以支持800G和1.6T系统。²⁶

OSFP与QSFP-DD封装形式选择

收发器封装形式决定了交换机端口密度、散热管理需求和升级灵活性。两种标准在400G和800G部署中相互竞争:OSFP和QSFP-DD。

OSFP(八通道小型可插拔)提供了更大的机械封装,针对高散热能力应用进行了优化。该设计可支持高达15-20W的功率耗散,原生支持8通道用于400G和800G连接。²⁷ OSFP在下一代AI集群互连中表现出色,这些场景下链路可靠性和电源管理比封装尺寸更重要。²⁸

双端口OSFP 800G配置包含8个电信号通道,两个400Gbps光学或铜缆引擎输出到两个端口。额外的散热片支持17W收发器,被称为"2x400G双端口OSFP顶部带散热片"产品。²⁹

QSFP-DD(四通道小型可插拔双密度)通过向后兼容性提供灵活性。QSFP-DD端口通常可运行400G和800G模块,支持无需更换交换机的增量升级。³⁰ 与QSFP+、QSFP28和QSFP56标准完全兼容,实现无缝迁移路径。³¹

QSFP-DD 400G仍是以AI为中心的以太网环境中部署最广泛的标准,尤其是在基于NVIDIA的GPU集群中。³² 该封装形式在从较低速率逐步升级的网络中占主导地位。

选型指导取决于部署策略。QSFP-DD适合逐步升级的网络,而OSFP更适合优先考虑长期可扩展性而非向后兼容性的新建部署。³³ 预计扩展到1.6T的组织应优先选择OSFP架构,以便将来更容易扩展。

基于距离的线缆策略

最佳线缆选择遵循数据中心拓扑结构中的距离要求:

机架内连接(0-3米): DAC提供最低成本、最低延迟和最低功耗。在距离允许时使用无源DAC,当额外的信号调理有助于性能时使用有源DAC。

相邻机架连接(3-7米): AEC通过有源信号恢复扩展了铜缆的优势。与AOC相比节省25-50%功耗的优势在大型GPU集群的数千个连接中累积效应显著。

跨行连接(7-100米): AOC提供跨越数据大厅的Spine-Leaf架构所需的传输距离。SR8/DR8多模模块配合MTP/MPO连接器支持100米距离。³⁴

跨建筑连接(100米-2公里以上): 单模光纤配合FR4/LR4模块提供跨设施连接集群所需的距离。为核心骨干或跨建筑链路部署SMF,规划未来带宽增长。³⁵

ToR配置中服务器到叶交换机的GPU连接通常跨越100-300米。³⁶ 使用400G/800G接口的叶到脊链路跨越数据大厅300-800米。³⁷ 根据距离要求匹配线缆技术可在确保性能的同时优化成本。

NVIDIA LinkX产品组合覆盖所有需求

LinkX产品系列提供业界最完整的互连产品线,在以太网协议中涵盖10G到1600G,在InfiniBand协议中涵盖EDR到XDR。³⁸ 产品满足AI基础设施的每一种距离和速度要求。

800G和400G产品连接Quantum-2 InfiniBand和Spectrum-4 SN5600以太网交换机与ConnectX-7适配器、BlueField-3 DPU和DGX H100系统。³⁹ 产品线包括:3米DAC、3-5米线性有源铜缆、50米多模光纤以及100米、500米和2公里单模光纤。⁴⁰

双协议支持简化了库存管理。100G-PAM4 LinkX线缆和收发器在同一设备中支持InfiniBand和以太网协议,使用相同的产品编号。⁴¹ 协议在插入Quantum-2 NDR InfiniBand或Spectrum-4以太网交换机时确定。

质量保证超越行业标准。除IBTA合规性外,LinkX认证线缆在实际的NVIDIA网络和GPU系统中进行100%测试,确保最佳信号完整性和端到端性能。⁴² 测试要求超过以太网AOC行业标准,达到超级计算机级质量水平。

高密度部署中的弯曲半径和线缆管理

高密度部署需要仔细关注线缆布线和弯曲半径的维护。不当弯曲会导致信号衰减和永久性光纤损伤,随时间推移降低性能。

标准弯曲半径指南规定光纤线缆的弯曲不应小于外径的十倍。⁴³ 安装阶段需要更保守的最小值,即直径的二十倍。⁴⁴ 温度变化、振动和移动会改变光纤弯曲特性,在高振动或地震环境中需要增加35%的弯曲半径。⁴⁵

抗弯曲光纤选项减少了这些限制。ITU G.657规范定义了抗弯曲单模光纤,最小弯曲半径从5mm(G.657.B2)到10mm(G.657.A1),而标准G.652光纤为30mm。⁴⁶ 然而,高芯数数据中心线缆形成刚性结构,物理上无法在不损坏的情况下达到这些紧凑的弯曲半径,使得

[内容因翻译需要而截断]

申请报价_

告诉我们您的项目需求,我们将在72小时内回复。

> 传输完成

请求已收到_

感谢您的咨询。我们的团队将审核您的请求并在72小时内回复。

排队处理中