高速互连标准与规范

前言

最近看到很多关于 IEEE、OIF-CEI、802.3dj、800GAUI、CEI-224G 之类的名词,突然想起了以前看计算机网络的痛苦经历。各种标准名词看起来都很熟,但真的放在一起,又很难说清楚它们到底是什么关系。

之所以想整理这部分内容,是因为高速互连标准体系确实太杂了。偶尔去参加个技术论坛,或者听个厂商技术报告,里面全是 IEEE 802.3、OIF-CEI、224G SerDes、XSR、USR、VSR、KR、CR、DR、LR 这些词。内行人都要愣一下,外行就更听不懂了。

我写这篇文章的目的,就是希望把这一块的逻辑关系尽量理顺。以后即便我忘了,回头翻翻这篇文章,也能迅速想起来:OIF 是干什么的,CEI 是什么,IEEE 802.3 又是什么,Reach 等级和 800GBASE-DR4 这些命名到底是什么关系。

简单来说,高速互连标准不是一套孤立的标准,而是一整套从芯片电接口、封装、PCB、连接器、光模块,到以太网系统的分层规范体系。


高速互连体系结构

整个高速互连标准体系,可以先粗略理解成三层:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
应用/协议层
├── Ethernet
├── InfiniBand
├── PCIe
├── CXL
└───────────────

电接口与物理信道层
├── SerDes
├── OIF / CEI
├── Package
├── PCB
└── Connector

光电转换与长距离传输层
├── Optical Module
├── CPO / LPO / NPO
└── Fiber

当然,严格从 OSI 模型或者 IEEE 802.3 分层来看,里面还会分 MAC、PCS、PMA、PMD、MDI 等很多子层。但如果从工程理解角度出发,先按照这三层来理解会更直观。

应用/协议层:定义"跑什么业务协议"

这里说的"应用"不是指网页、微信这种软件应用,也不是严格意义上的 OSI 第七层应用层,而是指系统级或者网络级的数据交换协议。

例如:

  • Ethernet / InfiniBand:主要解决服务器与服务器之间,大规模网络怎么组网、怎么交换数据、怎么避免丢包、怎么保证吞吐量。
  • PCIe / CXL:主要解决服务器内部,CPU、GPU、内存、SSD、加速卡之间怎么高速通信,怎么实现低延迟访问,甚至怎么做内存共享。

这些协议关心的是:

数据如何组织,如何编码,如何寻址,如何纠错,如何在系统层面完成通信。

但这些协议最终要落到真实硬件上,还是要变成电信号或者光信号。也就是说,不管上层叫 Ethernet、PCIe 还是 CXL,最后都需要一套高速物理接口把比特真正送出去。

电接口与物理信道层:定义"信号在芯片和板卡上怎么走"

当上层协议准备把数据发出去时,首先会进入 PHY,也就是物理层。

在高速互连里,PHY 的核心就是 SerDes:

Serializer / Deserializer\text{Serializer / Deserializer}

它的作用是把芯片内部较宽、较低速的并行数据,转换成少数几条超高速串行数据流。例如现在经常说的 112G SerDes、224G SerDes,本质上就是指单通道能够承载 112Gb/s 或 224Gb/s 级别数据速率的高速串行收发器。

但是问题来了:

不同厂商都能做自己的 SerDes,那怎么保证它们之间可以互联?

这就需要标准。OIF / CEI 主要坐在这个位置。

OIF(Optical Internetworking Forum)提出的 CEI(Common Electrical Interface),本质上就是为了定义高速电接口的互操作要求。它不关心你内部用了什么架构,也不关心你用了几级 FFE、几级 DFE、多少 tap 的均衡器,它关心的是接口边界上的信号是否满足要求。

除了 SerDes 本身,电信号还要经过:

  • Package
  • Bump
  • Interposer
  • PCB Trace
  • Via
  • Connector
  • Cable

这些东西共同构成了高速链路里的物理信道。

因此现代高速互连已经不是简单的"芯片对芯片"问题,而是:

1
2
3
4
5
Tx SerDes

Package / PCB / Connector / Cable

Rx SerDes

也就是一个完整的 Tx——Channel——Rx 系统问题。

光模块:定义"如何跨越长距离"

电信号在铜线里传输,随着频率升高,损耗会迅速增加。到了 112G PAM4、224G PAM4 这个速率,PCB 上几十厘米的走线就已经是很严肃的问题了。如果再想跨机柜、跨机房甚至跨数据中心,用纯电互连就很困难。

这时就需要光模块。

光模块的作用很直接:

把高速电信号转换成光信号,通过光纤传输,再在对端转换回电信号。

也就是:

1
Electrical → Optical → Electrical

传统可插拔光模块、LPO、NPO、CPO,本质上都在讨论这件事:

电信号到底走多远?光电转换到底应该放在交换芯片附近、板边,还是封装内部?

所以从整体上看,高速互连标准体系其实是在回答三个问题:

  1. 上层数据怎么组织?
  2. 电信号怎么从芯片出来?
  3. 信号如何在 PCB、连接器、光模块和光纤中可靠传输?

上面的三层结构,与计算机网络中的 OSI 模型大致可以这样对应:

传统 OSI 层级 对应位置 实际工程载体
第 2 层及以上 Ethernet、InfiniBand、PCIe、CXL 等协议 MAC、协议栈、控制器、网卡、交换芯片
第 1 层:物理层逻辑部分 PCS / FEC / PMA SerDes 数字逻辑、编码、扰码、FEC、Lane 对齐
第 1 层:物理层电气部分 OIF / CEI、电接口、AUI、KR、CR SerDes 模拟前端、Tx/Rx、均衡器、参考接收机
第 1 层:物理信道与介质 Package / PCB / Connector / Cable / Fiber 封装、板材、过孔、连接器、铜缆、光模块、光纤

这里要注意,表格只是为了方便理解,并不是严格的一一映射。现实标准体系里,各个组织之间会互相引用、互相协同,并不是完全孤立的分层。


标准规范的由来

低速时代:接口规范就够了

在高速互连出现之前,数字系统的速率普遍不高。典型接口包括:

  • TTL
  • CMOS
  • RS232
  • LVDS

那个时候工程师主要关注的是逻辑电平:

  • 高电平是多少
  • 低电平是多少
  • 输入阈值是多少
  • 输出驱动能力是多少

规范通常只要规定:

VOH,VOL,VIH,VILV_{OH}, V_{OL}, V_{IH}, V_{IL}

基本就能完成接口设计。

原因也很简单:当时信号频率较低,PCB 尺寸相对于电磁波波长来说很小,很多导线可以近似看成理想连接。此时工程师真正关心的是器件接口,而不是传输信道。

换句话说:

接口电平规范定下来,设备大体上就能够互连。

Gbps 时代:信道开始变得不可忽略

随着互联网、数据中心和高速串行通信的发展,串行速率开始进入 Gbps 时代。此时一个新问题出现了:

同样的芯片,放在不同板卡上,表现完全不同。

比如一条最简单的链路:

1
Chip → PCB → Connector → PCB → Chip

不同厂商的 PCB 长度不同,过孔数量不同,连接器结构不同,板材损耗不同,最终导致信号衰减、反射、串扰完全不同。

这时工程师才真正意识到:

决定通信性能的不只是接口,还有接口之间的信道。

因此,高速互连规范开始从单纯的"接口规范",逐渐发展成"接口 + 信道 + 均衡 + 链路预算"的综合体系。


OIF 与 CEI 的诞生

1998 年,OIF(Optical Internetworking Forum)成立。它是由运营商、交换机厂商、芯片厂商、光模块厂商共同组成的产业联盟。成员里有很多熟悉的公司,例如 Broadcom、Cisco、Intel、NVIDIA、Marvell 等。

OIF 成立的目的并不是自己去设计芯片,而是解决一个更现实的问题:

如何让不同厂商生产的高速设备能够互联互通?

例如 Cisco 可以做交换机,Broadcom 可以做交换芯片,Marvell 可以做 SerDes,光模块厂商可以做模块。大家内部实现都不一样,但只要边界接口满足统一规范,就能够插在一起工作。

因此 OIF 提出了著名的:

CEI (Common Electrical Interface)\text{CEI (Common Electrical Interface)}

需要注意的是,CEI 的核心身份是电接口规范,而不是某一条具体链路的完整系统标准。它的核心思想是:

不规定实现方式,只规定接口边界和互操作要求。

也就是说,OIF 并不关心你的芯片内部到底用了什么架构。你可以用模拟均衡,也可以用 DSP;可以用 FFE,也可以用 DFE;可以用更复杂的 MLSE。只要你在规定的测试点上满足 CEI 要求,就可以和其他厂商设备互连。

不过也不能说 CEI 完全不管信道。随着速率越来越高,现代 CEI 规范里也会定义参考信道、测试点、参考接收机、均衡方法、合规测试方法等内容。更准确地说:

CEI 的核心是电接口规范,但为了保证互操作性,它必须同时约束接口所面对的典型信道环境。

随着数据速率不断提高,CEI 也不断演进:

CEI 版本 典型单通道速率
CEI-3G 3.125 Gb/s
CEI-6G 6 Gb/s
CEI-11G 11 Gb/s
CEI-28G 28 Gb/s
CEI-56G 56 Gb/s / PAM4
CEI-112G 112 Gb/s / PAM4
CEI-224G 224 Gb/s / PAM4

每一次速率翻倍,都意味着信道损耗、ISI、串扰、抖动和噪声问题更加严重。因此,仅仅定义一个"接口电平"已经远远不够,必须把信道和均衡一起考虑进去。


Reach 等级

在 CEI-11G、CEI-28G 之后,一个很重要的概念开始变得清晰:

Reach\text{Reach}

也就是互连距离等级。

同样是 28G、56G 或者 112G 电接口,它既可能用在几毫米的封装内部互连,也可能用在几十厘米的板级连接,还可能用在背板或者铜缆中。距离不同,信道损耗完全不同,对均衡器和测试方法的要求也完全不同。

因此 OIF 引入了不同的 Reach 分类:

  • XSR(Extra Short Reach / Extremely Short Reach)
  • USR(Ultra Short Reach)
  • VSR(Very Short Reach)
  • MR(Medium Reach)
  • LR(Long Reach)

这些 Reach 等级不要简单理解成"某个固定长度",也不要简单理解成"某个固定 dB 损耗"。因为不同代际标准的 Nyquist 频率不同,同样 16 dB 插损,在 14 GHz、28 GHz、53 GHz 下完全不是一回事。

所以 Reach 更准确的理解是:

某个电接口预期面对的信道环境分类。

可以大致整理成下面这样:

Reach 等级 全称 典型场景 典型实现
XSR Extra / Extremely Short Reach 封装内部、超短距离互连 Chiplet、CoWoS、EMIB、2.5D/3D 封装
USR Ultra Short Reach 封装到模块边缘、芯片到光引擎 ASIC ↔ 光引擎、CPO、LPO、NPO
VSR Very Short Reach 板级短距离互连 交换芯片 ↔ 光模块、网卡 ↔ 光模块
MR Medium Reach 中距离 PCB 或背板环境 机框内 PCB 走线、中等长度背板
LR Long Reach 更长距离电互连 长背板、铜缆、复杂连接器链路

也就是说,XSR、USR、VSR、MR、LR 本质上是在说:

这个接口准备工作在哪种信道环境里。

例如 CPO 里 ASIC 到光引擎的距离很短,更多对应 USR 或 XSR 思路;而传统交换芯片到可插拔光模块的板级走线,更多对应 VSR 或类似场景;背板和铜缆则会进入 MR、LR 或 IEEE 的 KR/CR 体系。

这里最容易混淆的一点是:

OIF 的 Reach 分类,和 IEEE 里的 DR、FR、LR 不是同一套东西。

OIF 的 XSR、USR、VSR、MR、LR 主要描述电接口信道环境;IEEE 里的 DR、FR、LR 通常描述以太网光链路的传输距离,例如 500 m、2 km、10 km。两者名字都有 LR,但含义并不一样。


从信道到均衡

在比较早的高速互连时代,人们主要关注:

S21S_{21}

也就是插入损耗。

工程师最朴素的想法是:只要信道损耗足够小,通信就能成功。这个思路在低速或者中低速时代是有用的,因为信道还没有复杂到完全闭眼。

但随着速率继续提高,事情开始变复杂。

同样一条信道,如果接收机均衡能力不同,最后表现可能完全不同。比如一个接收机只有简单 CTLE,另一个接收机有 CTLE + DFE,甚至还有 FFE 和 MLSE,那么它们对同一条信道的容忍能力完全不一样。

于是系统模型开始变成:

1
Tx → Channel → Rx EQ

也就是说,工程师关注的对象已经不再只是信道本身,而是:

Channel + Equalization

常见均衡器包括:

  • Tx FFE:在发送端预加重或去加重,用来提前补偿高频损耗。
  • CTLE:接收端连续时间线性均衡,用来提升高频成分。
  • Rx FFE:接收端前馈均衡,用来处理线性 ISI。
  • DFE:判决反馈均衡,用来消除已经判决符号对后续符号造成的 ISI。
  • MLSE / MLSD:在更严重的码间串扰下,通过序列检测寻找最可能的发送序列。

所以到了 56G、112G、224G 时代,单纯看一条 S 参数曲线已经远远不够。你必须同时问:

这条信道在什么参考发射机、什么参考接收机、什么参考均衡器下还能不能工作?

这就是现代链路规范的核心变化。


PAM4 与 COM 时代

进入 CEI-56G 和 CEI-112G 时代后,NRZ 逐渐被 PAM4 取代。

NRZ 一个符号只传 1 bit,而 PAM4 一个符号可以传 2 bit:

2 bit/symbol2\ \text{bit/symbol}

这意味着在相同波特率下,PAM4 可以把数据速率提高一倍。

但代价也很明显:

眼高变小,噪声裕量下降,链路更脆弱。

PAM4 有四个电平,三个眼图。相比 NRZ,它的每个眼高大约只有原来的一半,甚至更低。因此很多 112G、224G 链路在示波器上看起来已经接近闭眼,传统"看眼图开不开"的方法变得越来越不够用。

于是 IEEE 提出了 COM:

COM (Channel Operating Margin)\text{COM (Channel Operating Margin)}

COM 本质上是一种系统级链路预算方法。它不是单纯看插损,也不是单纯看眼图,而是把信道 S 参数、发射机模型、接收机模型、噪声、串扰和参考均衡器全部放进一个标准算法里,最后算出链路还剩多少工作裕量。

输入大致包括:

  • 信道 S 参数
  • 发射机模型
  • 接收机模型
  • 噪声模型
  • 串扰模型
  • 参考均衡器模型

输出是:

COM(dB)\text{COM(dB)}

通常对于 KR、CR 这类电链路,会要求 COM 大于某个门限,例如常见的 3 dB。

这里需要修正一个容易混淆的点:COM 不是 OIF 首先提出的,而是 IEEE 802.3 体系里非常核心的链路评估指标。OIF 和 IEEE 在很多地方会互相参考,但 COM 这个名字和方法主要来自 IEEE 802.3 的高速以太网链路规范。

COM 的出现标志着行业的关注点进一步变化:

从接口规范,到信道规范,再到完整链路规范。

也就是说,现在不再是简单地问"这条线损耗多少 dB",而是问:

在规定的 Tx、Channel、Rx、EQ、Noise 条件下,这条链路是否还有足够裕量满足目标 BER?

这就是 112G、224G 时代的核心逻辑。


以太网标准与 CEI 的关系

我们经常看到的 IEEE 802.3,也就是以太网标准。它和 OIF-CEI 的关系非常容易混淆。

简单来说:

OIF-CEI 更像是在定义高速电接口怎么互连;IEEE 802.3 则是在定义完整以太网系统怎么工作。

IEEE 802.3 不只是规定一根线怎么传电信号,它还要定义:

  • MAC
  • PCS
  • FEC
  • PMA
  • PMD
  • AUI
  • MDI
  • 光接口
  • 铜缆接口
  • 背板接口
  • 帧丢失率
  • 误码率
  • 多 Lane 对齐

也就是说,IEEE 关心的是完整的以太网系统。

举个比较形象的例子:

假设 Broadcom、Marvell、Intel 这些公司都在做 224G PAM4 SerDes。它们需要先在 OIF 这种产业联盟里讨论:单通道到底怎么定义,眼图怎么测,参考接收机怎么设,抖动、噪声、封装、连接器指标怎么定。最后形成类似 OIF CEI-224G 的电接口规范。

随后 IEEE 在制定 800G、1.6T 以太网标准时,会大量参考这些电接口能力。比如 1.6T 以太网可以用 8 条 200G 级别 Lane 拼出来,那么底层电接口就会和 224G PAM4 SerDes 的能力强相关。

但不能反过来简单理解成:

IEEE 只是把 OIF 拿过来用一下。

这也不准确。

IEEE 自己也会定义大量内容,例如:

  • 以太网帧格式
  • PCS 编码
  • FEC 方案
  • COM 方法
  • KR / CR / DR / FR / LR 等 PMD 类型
  • AUI 接口
  • 多通道对齐
  • 端到端 BER / FLR 要求

所以更准确的理解应该是:

OIF 和 IEEE 是协同关系。OIF 更聚焦高速电接口和互操作性,IEEE 则在此基础上构建完整以太网系统。

可以用一个不太严谨但好理解的比喻:

  • OIF 更像是在规定道路本身:车道宽度、路面质量、限速、接口边界。
  • IEEE 更像是在规定交通系统:车怎么编号,车队怎么组织,出错怎么纠正,终点怎么验收。

没有 OIF 这类电接口规范,底层 SerDes 很难互通;没有 IEEE 802.3,上层以太网系统也无法形成统一标准。

因此,从 CEI-6G、11G、28G、56G、112G 到 224G 的演进,本质上是在不断提升单通道 SerDes 能力;而从 10GE、100GE、400GE、800GE 到 1.6TbE 的演进,则是在利用这些 SerDes 能力构建更高容量的以太网系统。


OIF 命名体系与关注指标

命名规则

OIF 的命名通常可以粗略理解成:

[接口标准群][单通道速率][Reach / 场景][调制方式][\text{接口标准群}] - [\text{单通道速率}] - [\text{Reach / 场景}] - [\text{调制方式}]

例如:

1
OIF CEI-112G-VSR-PAM4

可以拆成:

  • CEI:Common Electrical Interface,通用电接口;
  • 112G:单通道 112 Gb/s 级别;
  • VSR:Very Short Reach,短距离板级场景;
  • PAM4:四电平脉冲幅度调制。

类似地,CEI-224G-VSR、CEI-224G-LR 这类名字,本质上就是在说:

这是一类 224G 级别的高速电接口,面向某种特定 Reach 的信道环境。

关注指标

如果打开一份 OIF CEI 官方标准文档,硬件工程师和 SI 工程师最关心的通常不是"协议怎么组包",而是下面这些东西。

链路拓扑和测试点

标准首先要定义这条链路长什么样。

例如:

1
Host ASIC → Host PCB → Connector → Module PCB → Module ASIC / DSP

同时还要定义测试点,例如 TP1、TP1a、TP4 等。测试点非常重要,因为不同测试点对应不同责任边界。Host 端要保证哪里合规,Module 端要保证哪里合规,必须讲清楚。

否则出了问题,大家就会互相甩锅:

是芯片不行?是板子不行?是连接器不行?还是模块不行?

标准测试点的作用就是把责任边界切开。

发射端和接收端指标

典型指标包括:

  • Signaling Rate
  • Output Amplitude
  • Eye Height
  • Eye Width
  • Jitter
  • SNDR
  • RLM
  • Transition Time
  • Return Loss

对于 PAM4 来说,还会特别关注线性度问题。例如四个电平是否均匀,三个眼是否平衡,发射端非线性失真是否过大。

以 112G-VSR 这类场景为例,大致会看到类似指标:

参数类别 典型参数 工程含义
信号速率 Signaling Rate 单通道波特率或比特率
插入损耗 Insertion Loss 信道在 Nyquist 频率附近的衰减
回波损耗 Return Loss 端口反射是否严重
眼高 / 眼宽 Eye Height / Eye Width 经过参考接收机后的开眼情况
SNDR Signal-to-Noise and Distortion Ratio 发射端噪声和非线性失真水平
Jitter 抖动 时间方向的裕量

这些指标背后的本质都是同一个问题:

发射端吐出来的信号,经过规定信道和参考接收机后,还能不能被可靠判决。

参考接收机与均衡器

到了 112G / 224G 之后,很多信号在直接示波器上看已经是闭眼的。如果不加参考均衡器,根本无法判断链路是否真的可用。

因此标准会规定参考接收机模型,例如:

  • CTLE 设置范围
  • DFE tap 数
  • 参考采样点
  • 噪声模型
  • 测试算法

这也是为什么现在做合规测试时,不能只把示波器接上去看原始眼图,而是要加载标准规定的参考接收机和均衡器模型。

从这个角度看,OIF-CEI 虽然叫电接口规范,但它已经明显不是低速时代那种简单的电平规范,而是一个把接口、信道和参考接收机都包含进来的高速互操作规范。


IEEE 命名体系与关注指标

命名规则

现代以太网接口的 IEEE 命名通常可以理解成:

[总速率]+[BASE / AUI]+[介质或场景]+[通道数][\text{总速率}] + [\text{BASE / AUI}] + [\text{介质或场景}] + [\text{通道数}]

例如:

1
2
3
4
800GBASE-DR4
1.6TBASE-CR8
800GAUI-4
1.6TAUI-8

这里面有几个关键部分。

速率前缀

例如:

  • 100G
  • 200G
  • 400G
  • 800G
  • 1.6T

表示整个以太网接口的总速率。

这里的总速率通常是多条 Lane 聚合出来的。例如 800G 可以由 8 条 100G Lane,也可以由 4 条 200G Lane 构成,具体取决于标准代际和实现方案。

BASE 与 AUI

BASE 表示基带以太网物理层,例如:

  • 400GBASE-DR4
  • 800GBASE-CR8
  • 1.6TBASE-LR8

AUI 是 Attachment Unit Interface,更多表示设备内部或芯片到模块之间的以太网电接口,例如:

  • 800GAUI-4
  • 1.6TAUI-8

AUI 又经常分成:

  • C2C:Chip to Chip
  • C2M:Chip to Module

这就是为什么在 800G / 1.6T 体系里,经常会看到 AUI、C2C、C2M 这些词。它们讨论的是以太网设备内部的电接口,而不是光纤跑 500 m 还是 10 km。

介质和场景后缀

常见后缀包括:

后缀 含义 典型场景
CR Copper Cable 直连铜缆 DAC
KR Backplane 背板互连
DR Data Center Reach 单模光纤短距离,典型 500 m
FR 以太网中距离光纤 典型 2 km
LR Long Reach 典型 10 km
ER Extended Reach 典型 40 km
ZR 更长距离相干光互连 典型 80 km 级别

这里也要注意,IEEE 的 LR 和 OIF 的 LR 不是一回事。IEEE 的 LR 常常是光纤 10 km 级别的 Long Reach;OIF 的 LR 通常是电接口里的 Long Reach 信道环境。

通道数后缀

例如:

  • DR4:4 条光通道;
  • CR8:8 条铜缆通道;
  • AUI-4:4 条电 Lane;
  • AUI-8:8 条电 Lane。

所以:

1
800GBASE-DR4

可以理解为:

800G 总速率,BASE 以太网物理层,Data Center Reach 光纤场景,4 条通道。

而:

1
1.6TBASE-CR8

可以理解为:

1.6T 总速率,铜缆场景,8 条通道。


IEEE 关注的核心指标

如果说 OIF 更关心电接口能不能互通,那么 IEEE 更关心完整以太网链路最终能不能满足系统要求。

BER 与 FLR

IEEE 不只是关心某一个采样点有没有判错,而是关心最终网络数据帧是否会丢失。

因此会涉及:

  • Pre-FEC BER
  • Post-FEC BER
  • FLR(Frame Loss Ratio)

Pre-FEC BER 指的是 FEC 纠错之前的原始误码率。到了 100G/lane、200G/lane 时代,链路的 Pre-FEC BER 可能并不低,但只要 FEC 足够强,最终 Post-FEC BER 和 FLR 仍然可以满足系统要求。

这也是为什么现代高速以太网离不开 FEC。

FEC

FEC 是 Forward Error Correction,也就是前向纠错。

在高速以太网里,FEC 已经不是可有可无的附加功能,而是系统能不能工作的关键部分。

典型 FEC 包括:

  • RS-FEC
  • KP4 FEC
  • 更复杂的级联 FEC
  • 802.3dj 中讨论的 Inner Code / Outer Code 思路

FEC 的问题在于,它一方面可以显著提高链路容错能力,另一方面也会带来:

  • 延迟
  • 功耗
  • 面积
  • 实现复杂度

所以 IEEE 在制定标准时,不只是看"能不能纠错",还要看纠错带来的系统代价。

COM

COM 是 IEEE 体系里非常核心的系统级链路评估指标。

它的思路是:

不只看信道插损,而是把信道、发射机、接收机、噪声、串扰、均衡器放在一起,计算这条链路还剩多少工作裕量。

对于 KR、CR 这类电链路,COM 是否达标往往是判断链路是否合规的重要依据。

所以可以这样理解:

  • 插损告诉你这条路"有多烂";
  • 眼图告诉你信号"看起来怎么样";
  • COM 告诉你在标准参考系统下"还能不能跑"。

多 Lane 对齐

现代以太网通常不是一条 Lane 跑完整速率,而是多条 Lane 并行。

例如:

1
2
800G = 4 × 200G
1.6T = 8 × 200G

多 Lane 并行就会带来 skew,也就是不同通道之间的延迟差。

由于 PCB 走线长度、光纤长度、模块内部路径都可能不同,不同 Lane 到达接收端的时间并不完全一致。因此 IEEE 必须定义 Alignment Marker、Lane Deskew 等机制,让接收端重新把多条 Lane 拼回完整数据流。

这部分就已经明显超出了 OIF 电接口规范的范围,属于完整以太网系统必须处理的问题。


OIF 与 IEEE 的指标互补

可以把 OIF 和 IEEE 的关注点整理成下面这张表:

维度 OIF / CEI IEEE 802.3
主要身份 高速电接口规范 以太网系统标准
关注对象 Tx、Rx、电接口、参考信道、互操作性 MAC、PCS、FEC、PMA、PMD、BER、FLR
典型指标 眼高、眼宽、SNDR、抖动、插损、回波损耗 COM、Pre/Post-FEC BER、FLR、FEC、Lane Alignment
工程视角 这条电接口能不能互连 这个以太网链路能不能作为系统工作
典型名称 CEI-112G-VSR、CEI-224G-LR 800GBASE-DR4、1.6TBASE-CR8、800GAUI-4

所以,它们不是谁取代谁的关系,而是互补关系。

OIF 更偏底层电接口,IEEE 更偏完整以太网系统。一个负责把"比特以电信号形式送过去",另一个负责把"这些比特组织成可靠的网络链路"。


Reach 与 Ethernet 命名的关系

最后再单独强调一下最容易混淆的地方:

OIF Reach 和 IEEE 后缀不是同一套命名体系。

可以这样理解:

1
2
3
4
5
6
7
8
9
10
11
12
OIF / CEI
--------------------------------
XSR / USR / VSR / MR / LR

主要描述:电接口面对的信道环境


IEEE 802.3
--------------------------------
AUI / KR / CR / DR / FR / LR / ER

主要描述:以太网接口类型、介质类型和传输距离

例如:

  • CEI-224G-VSR:描述 224G 级别短距离电接口;
  • 800GAUI-4:描述 800G 以太网内部 4 Lane 电接口;
  • 800GBASE-KR4:描述 800G 背板电互连;
  • 800GBASE-CR4:描述 800G 铜缆互连;
  • 800GBASE-DR4:描述 800G、4 通道、500 m 级别单模光纤互连;
  • 800GBASE-FR4:描述 800G、4 通道、2 km 级别光纤互连;
  • 800GBASE-LR4:描述 800G、4 通道、10 km 级别光纤互连。

因此,看到标准名词时,可以先问两个问题:

  1. 这是 OIF 的电接口规范,还是 IEEE 的以太网系统规范?
  2. 它描述的是芯片到芯片、芯片到模块、背板、铜缆,还是光纤?

这两个问题问清楚,大多数命名就不会乱了。


总结

高速互连标准体系之所以看起来复杂,是因为它不是单一标准,而是多层标准叠加的结果。

从底层看,SerDes 速率不断提升:

1
CEI-6G → CEI-11G → CEI-28G → CEI-56G → CEI-112G → CEI-224G

这条线代表的是单通道电接口能力的演进。

从系统看,以太网容量不断提升:

1
10GE → 100GE → 400GE → 800GE → 1.6TbE

这条线代表的是网络系统总吞吐能力的演进。

OIF-CEI 解决的是:

高速电信号如何在不同厂商芯片和模块之间互联。

IEEE 802.3 解决的是:

如何利用这些高速电接口,构建完整、可靠、可互操作的以太网系统。

而 Reach、COM、FEC、AUI、KR、CR、DR、FR、LR 这些概念,其实都是在这两条主线之间不断演化出来的工程工具。

所以如果用一句话总结这篇文章,我觉得可以这样说:

从 CEI 到 802.3,本质上是从"比特能不能作为电信号传过去",进一步发展到"数据帧能不能作为可靠网络业务传过去"。

这也是高速互连标准从接口规范、信道规范,最终走向完整链路规范的根本逻辑。