一场有关硅光子的有趣对话

2022-03-11 14:00:28 来源: 半导体行业观察

来源:内容由半导体行业观察(ID:icbank) 编译自next platform ,谢谢。


本周在圣地亚哥举行的 OFC2022 会议上有很多关于光通信的讨论。The Next Platform也与 Andy Bechtolsheim 就数据中心相关领域正在发生的,与硅光子相关的事情进行了交谈。


这有点像你去问莎士比亚,《哈姆雷特》的真正意思是什么?然后为此写一篇论文。

Bechtolsheim 是硅谷传奇的系统和网络企业家,四十年前他是 Sun Microsystems 的联合创始人之一,自 Arista Networks 成立以来,他担任了公司一系列的职位,最后成为了该公司的董事长和首席开发官。2004 年,Bechtolsheim 的工作是综合来自超大规模、云和现在的大型企业客户的所有网络需求,所有进入系统的交换机和网络接口 ASIC,以及所有关于电气和光信号的研究,以及尝试为 Arista Networks 的产品打造路线图。

接下来是关于硅光子学的有趣对话,特别是共同封装光学器件的发展,它试图解决一些令人讨厌的工程问题,但如果 Bechtolsheim 是正确的,这些问题可能会被其他技术打败。

Timothy Prickett Morgan: 我知道在硅光子学和共同封装光学器件方面存在不同的阵营。有些人想要在芯片上使用激光,有些人想要在芯片外使用激光,然后有些人想要共同封装光学器件,有些人认为可插拔光学模块,就像我们多年来一直在使用的那样,我们仍然在寻找将网络与服务器和存储结合在一起的最佳方式。那么,这些阵营有什么,他们面临的困难是什么?

Andy Bechtolsheim: 我认为考虑这一点的最佳方式是以降低功率为目的。换句话说,如果没有降低功耗,没有人会谈论共同封装的光学器件。显然,联合封装确实是一种封装技术——它不是一种新的光学器件,它不是一种新的 lambda,它不是一种新的光学接口。它实际上是在实施现有的 IEEE 光学行业标准,并且可能正在以某种方式推动更低的功率。这就是目标。如果它不提供更低的功率,没有人会提到它。

与传统的可插拔器件相比,人们预测或想象使用共同封装光学器件的功耗降低了 20%。

现在,在我们深入研究功耗后,可以看到它们主要来自四个方面:一个是开关芯片和光学器件之间的电气接口,当然,如果你把它做得更短,你需要更少的功率,这很好;第二个是 DSP 芯片,它并没有真正改变,因为它是由光学要求驱动的;然后是激光功率和光调制器,所有这些加起来就是总功率。

共同封装减少了电气通道长度,如果您有所谓的 XSR 通道,它是一个超低功率通道,与 VSR 通道相比,其范围只有几厘米,它能够驱动信号通过十英寸,这确实省电。但从来没有人制造过具有 XSR 通道的交换芯片,因为它没有市场。这是一个非常昂贵的tape out,除非他们能够获得投资回报,否则人们不会这样做。因此,到今天为止,还没有具有 XSR 通道的开关芯片,只有当有为该接口定制的芯片时,XSR 才会相关。


在光学方面,除 Intel 之外的大多数方法都有外部激光源。并且外部光源是连接的,这意味着它有一个黑色引脚连接器,连接到芯片上的共封装,然后从共封装芯片到前面板还有另一个连接器。因此,与可插拔光学器件相比,链路中有四个额外的连接器。此外,外部光源有分路器将其分成通道,然后是偏振光纤的整体问题,它从来都不是很完美,导致一些额外的损耗。

有了外部光源,其光学效率差异为 3 分贝——因此您需要多 3 dB 的激光才能在 IEEE 规范要求的接口上实现相同的 0 dB 输出。激光上的 3 dB 使激光功率翻倍。你实际上燃烧了更多的能量,而这种激光在高温下的效率只有 10%。因此,您需要消耗大量额外的能量来驱动外部光源,从而产生与可插拔模块相同的光输出。因此,由于需要额外的激光功率,今天的联合封装实际上比可插拔器件具有更高的功耗。


事实上,激光的影响是相当显着的。而且因为在最坏的情况下,开关处于高温状态,人们在谈论 500 毫瓦激光器,这些激光器运行得非常热,它们的电输入将超过 10 瓦。因此,它是一种非常重型的激光器,存在潜在的安全问题,以及如果收集器被任何可能熔化光纤玻璃尖端的灰尘颗粒污染。

TPM: 这听起来不像是降低功耗,这至少意味着它不会给希望移动每比特功率和每移动比特成本每一代都下降的超大规模厂商和云构建者产生吸引力。那么,随着交换机带宽的增加,这种功率将如何下降呢?

Andy Bechtolsheim: 如果我们看看如何降低功率,与硅光子学相比,有非常有前途的新光学调制技术。

联合封装的历史与硅光子学密切相关并与之相结合,因为您需要一种高效的制造技术将 16 个通道或 32 个通道放在单个芯片上。在传统世界中,当人们在晶圆厂制造这些东西时,他们不会屈服。但可以说,有了好的硅光子学,就像英特尔和其他公司已经证明的那样,你可以做到。

然而,硅光子有一个大问题,那就是它是一种高插入损耗调制器。您需要大量的激光功率来弥补在激光和出路之间您将损失大约 15 dB 的事实。所以要降低功耗,最好的技术其实不是硅光子,而是较新的技术,包括 薄膜铌酸锂 钛酸钡 ,还有人做有机调制器甚至石墨烯调制器。

因此,即将出现四种使用不同光学效果来实现调制的高质量且非常有前途的技术。他们在低得多的电压水平下能做到这一点,因此驱动器电流更少;它们的电容要小得多,因此您需要的能量更少,并且带宽更高。基本上,所有这些即将出现的新产品都比英特尔和其他公司大量出货的优质、旧的 Mach-Zehnder 调制器 要好。这些 Mach-Zehnder 调制器采用具有成本效益、高度可制造的技术制造。但是,它们的功率并不低。人们真的很想解决电源问题,所以你必须使用新技术。


在 Arista,我们实际上已经与一些主要供应商合作,以 800 Gb/秒的速度构建铌酸锂薄膜可插拔模块,使用 8 通道 112G/λ,我们使用 7 纳米 DSP 完成了这项工作。


如今,与之竞争的硅光子产品在 16 瓦范围内,而具有相同 DSP 的铌酸锂为 12.8 瓦。节省 3 瓦。使用 5 纳米 DSP,我们预计常规硅光子器件的功率将降至 13.3 瓦,节省 2.7 瓦,但铌酸锂将达到 10 瓦。这是一个令人难以置信的功率降低,实际上它现在处于人们想要通过固定调制器插入损耗来实现的共同封装光学器件的功率水平。

不幸的是,这种改进在联合封装中要困难得多,因为铌酸锂调制器并不小。它比传统的环形或 Mach-Zehnder 调制器大很多。因此,它不太适合联合封装切片。这不是模块的问题——那里有很多区域——但是将其中的 32 个通道放入带有 DSP 的 OAF 定义的外形尺寸中,这将非常具有挑战性。此外,它不是硅光子学,因此可能还有其他需要解决的良率问题。

现在,还有其他有希望的事情即将出现。我上面提到的 BTO 调制器将具有更低的插入损耗,并且在将电能转换为所需的调制光学效果方面具有更高的效率。所以也许他们可以达到更低的功率水平。他们在实验室中有一些很有前途的早期演示,但还没有完整的模块可以让我们对其进行测量;我们将在今年晚些时候或明年初拥有它。人们声称有机模块效率更高,功耗更低,但同样,这仍处于实验室阶段。铌酸锂调制器仍是原型,可能需要 18 个月或其他时间才能量产。

可以预见,我认为人们会对这些新的调制技术产生浓厚的兴趣,因为它是降低功率的最简单方法。这是调制路径上的物理变化,然后有助于降低激光功率,顺便说一下,这也使激光器更可靠,因为使激光器更可靠的最简单方法是降低功率,从而减少热量,这减少了热问题。这就是为什么我们认为目前业界最有希望的行动就是专注于低功率调制。

但与可插拔收发器相比,这是共同封装光学面临的真正问题。在可插拔世界中,光学技术的选择与开关芯片并不是紧密耦合的。它们是分散的,您可以向市场提供可插拔模块,并插入一个平台,只要它准备好就可以大批量运输。

但在联合封装的世界中,您几乎必须提前两年选择要押注的技术。开发这 32 个通道切片需要很长时间,这给了它们迭代的机会,并且需要您在第一天进行规范。因此,如果您想在今天为 2024 年推出的 102.4 Tb/sec 开关芯片进行联合封装,您必须立即开始,承诺精确设计,即联合封装光学切片。而使用可插拔光学器件,您可以完全解耦,如果我们需要一年或更长时间才能准备好,没问题,我们可以在 2025 年发货。

TPM: 总是很难与分立的组件打赌。在系统的所有级别中,我们都需要解耦特定的技术,这样一个延迟就不会停止所有事情,并且具有深度和开放的互连,因此我们可以将任何东西附加到socket、节点内或跨网络的任何东西上。

Andy Bechtolsheim: 从业务层面来看,你拥有当前供应链中的所有竞争。制造这些可插拔光学模块的公司有很多,您还可以在新技术领域进行竞争,因为押注钛酸钡调制器的公司不会押注铌酸锂。一个会比另一个成功,但现在说还为时过早。我不能告诉你。如果你和这些初创公司交谈,他们会非常乐观,他们得到了自切片奶酪以来最好的东西。

TPM: 还有人会说他们有自切片白面包以来最好的东西,我们可以做小三明治。. . .

Andy Bechtolsheim: 对。在实验室的基础上,它们都有有效点。但它们都没有投入生产,这意味着有数百万台的差距。最后,如果你不能把它变成数百万,它就不是市场的解决方案,因为他们无法提升它。

TPM: 我知道降低功率和降低每比特移动的成本是超大规模和云构建者的驱动力,但有时他们会接受网络设备(交换机、光学器件或网络接口卡)的更高功率 ,以换取较低的资本成本?

Andy Bechtolsheim: 有些客户只关心成本。事实是,它今天正在发生。今天,在光学功率方面,差异就像在光学组件级别或模块级别节省 20% 到 25%,但在数据中心级别,这是 1% 或更低。在包括服务器、存储和交换机在内的总功率中,光学器件并没有那么大的驱动力。

但是,对于每个机架或每个数据中心设施房间,每个房间和每个机架的电源容量有限,客户没有选择也不能更改数据中心,因为它们需要五年或更多时间去建成的他们可能已经配置过的设备。例如,每个机架 2 千瓦。所以他们总是不得不保持低功率,因为他们被限制了。所以对功率存在物理限制,这与绿色能源或拯救气候无关,而改变光学系统可以在那里做出贡献,有些人可能愿意支付额外费用,因为降低功耗的新技术最初可能会花费更多。

就网络的高级目标而言,较低的功率是可取的。成本是一个单独的问题,但人们想要低成本、低功率和高可靠性,但正如我所说,低功率与高可靠性齐头并进,因为较低的激光功率已被证明是提高激光功率可靠性的最佳方式。忽略灰尘污染,90% 到 95% 的光学故障是由激光造成的,而这些数据是针对 100 Gb/秒的收发器的,而在 400 Gb/秒时情况会变得更糟,因为激光更热。激光是这里的罪魁祸首。但是,如果您制造的激光器使用 1/10 的功率,它的可靠性就会提高许多数量级。

我认为整个论点的症结在于人们想要高可用性,他们想要低功耗,他们想要高带宽,但最难的是可靠性。并且专注于可靠性,还有一个可维护性方面。使用可插拔模块,这很容易:您可以在交换机运行时将其拉出并在现场更换。使用联合封装,如果出现开关级故障,这是一个非常昂贵的替代品,尽管外部激光源 (ELS) 是可插拔的,这解决了部分问题。但仍有 5% 的光学故障与 ELS 无关,而这只是其中之一。如果您的系统中有 64 或 128 个,它们可能会主导字段事件的数量。这不是一件令人高兴的事情,因为我们不想因为光学器件发生故障而恢复开关。

TPM: 超大规模制造商和云建设者在网络中的光收发器和共同封装的光学器件方面有何赌注?他们是不同的选择,还是他们都关注?

Andy Bechtolsheim: 它们并没有什么不同,这意味着每个人都想要这种高可靠性和低成本。

哦,顺便说一句,在我们达到这里的目标之前,我们需要讨论一个问题。那就是网络成本与数量高度相关。这意味着所有这些东西都需要大量的前期工程费用、产品成本、设备成本来投入生产。没有体积,联合封装永远不会比可插拔更具成本效益。在可插拔领域,该行业每年生产 1000 万个光模块,而联合封装是从零开始,需要很长时间才能向上移动。

然后你就会知道混合和匹配问题,并且联合封装实际上只适用于交换机上所有端口的相同光学标准接口。您不能像使用可插拔的那样混合和匹配收发器。

所以问题是:联合封装的光学器件是否会量产,因为只有最终证明可靠、可制造且具有成本效益,才能实现量产。如果它更便宜,人们会注意的,对吧?但是今天,它并不便宜。需要大量数量才能变得更便宜。

TPM: 那里有经典的鸡和蛋问题。如果没有出现工程技巧——你知道,四年前,包括你在内的很多人 都说,以 112 Gb/秒的本地信号传输电信号会耗尽力气, 现在我们有一些材料科学进步,看起来该行业将能够推动高达 224 Gb/秒的本机信号。

Andy Bechtolsheim: 虽然四年前我确实预计超过 100Gb/秒的 SerDes 电速度将非常具有挑战性,但现在很明显这不仅是可行的,而且会在 2025 年的时间范围内发生,并且是不是导致采用共同封装光学器件的拐点。

但这里还有第二个问题,因为它与外部激光器有关,特别是与 Ayar Labs 的环形调制器技术有关 ,该技术在较慢的速度下是最佳的,即使用 NRZ 编码的 32 Gb/秒和 64 Gb/秒。它可能达到112G-PAM4,但我的理解是它无法轻松支持224G-PAM4,这意味着Ayar的技术本身无法解决高速I/O问题。当然,使用反向齿轮箱总是有可能从 224 Gb/秒下降到 112 Gb/秒,但反向齿轮箱的功率或成本效率不高,而且无论如何不会增加多少 I/O可以下车。

Broadcom 声称共同封装的光学器件可节省 50%,这是基于消除光学器件 DSP 并使用开关 SerDes 直接驱动光学器件。确实如此,但是您也可以使用可插拔模块和合适的开关 SerDes 来做到这一点。

我们的坚定结论是,224 Gb/秒信号不需要共同封装的光学器件。因此,在这一点上,除了认为它会降低功率之外,没有什么可以推动共同封装的光学器件。但是你可以通过改变调制技术更容易地降低功率。


★ 点击文末 【阅读原文】 ,可查看本文原文链接!


*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。


今天是《半导体行业观察》为您分享的第2976内容,欢迎关注。

推荐阅读


Fabless的革命

苹果发布1140亿晶体管M1 Ultra:12年自研34颗处理器

模拟芯片巨头的殊途同归


半导体行业观察

半导体第一垂直媒体

实时 专业 原创 深度


识别二维码 ,回复下方关键词,阅读更多

晶圆|集成电路|设备 |汽车芯片|存储|台积电|AI|封装

回复 投稿 ,看《如何成为“半导体行业观察”的一员 》

回复 搜索 ,还能轻松找到其他你感兴趣的文章!


点击阅读原文,可查看本文
原文链接!


责任编辑:Sophie

相关文章

半导体行业观察
摩尔芯闻

热门评论