Photonics West关于CPO需求的讨论:可插拔还是CPO?

光纤在线编辑部  2023-02-15 12:20:38  文章来源:翻译整理  版权所有,未经许可严禁转载.

导读:光通信行业正处在十字路口,我们可以坚持可插拔逐步改善,人工智能可能因此放慢发展速度,采用受限于带宽的优化算法。或者我们采用其他办法,冒险来采用CPO技术来实现根本性改变。这将根本改变光模块工业的面貌。这一路径激动人心,但是充满挑战。无论如何,错过这个机会都是一个错误。

2/15/2023,光纤在线讯,ChatGPT引发的算力增长热潮直接引发国内CPO相关技术研发厂商的股价大涨。虽然以光纤在线多站在国内光模块厂商的角度看问题,CPO会是对国内光模块公司擅长的可插拔技术的颠覆性技术,会颠覆中国光模块供应商的竞争优势。而且可插拔技术其实一直也在进步。所以,或许我们不应该对CPO那么感冒。

刚刚结束的Photonic West上也有一场关于CPO技术的Panel讨论。市场研究公司Lightcounting最新的研报对此进行了报道。这场讨论之所以有趣,首先在于提出了一个很好的问题,既然网络产生的功耗只占当前数据中心总体功耗的2-3%,那么我们为什么还要对这个问题这么看重呢?由此引发的就是,真的需要CPO吗?

来自相干公司的Vipul Bhat引用两年前科学杂志一篇文章的数据指出人们对于数据中心功耗的担心有点过了(就像时下人们担心全球变暖一样?)。这篇文章比较了2010年和2018年的数据中心功耗,发现只增长了8%,将这一数据外插到2022-2023年度,增速只有2-3%。而导致这一低增速的背后是数据中心效率的提升,包括第一,负载从企业数据中心向云数据中心的迁移;第二,占功耗90%的服务器和存储器效率的稳步提升。而直接部署光通信产品的网络部分导致的功耗占比在2012年是1%,到2018年是2%,2022年大约是3%。那么问题来了?致力于降低数据中心光传输功耗的CPO技术还值得这么重视吗?

对此问题,LightCounting给出了自己的分析。如下图可看,纵坐标的对数的每年数据中心功耗(不是累计的),横坐标是年份。这种对数坐标下的直线增长意味着指数级的增长。所以,LC的结论是,对质疑者来说,当年发现功耗开始变大时,可能已经太晚了。2018年到2022年期间,数据中心部署的光模块的总功耗是330MW(秦山核电站总装机容量的20分之一),或者1.2TWh(12亿度电),只占到同期云数据中心总功耗的1%,但问题是到2028年,这一比例将达到8%以上,这还考虑到可插拔模块自身功耗效率的提升,从100G模块的35pJ每比特到800G模块的20pJ每比特。8%将是一个不可忽视的比例。因为对于一直受到供电限制的数据中心运营商来说,光模块增加的功耗,必须要从减少服务器和存储的部署来找补。

一个更显著的问题是AI服务器如今受到光连接的功耗和成本的严重限制。Nvidia说,如果没有光连接的限制,他们本可以部署的光模块会是现在的32倍。人工智能的计算需要大量的GPU和带宽支持,光连接会是最好的解决方案,如果光连接的功耗和成本能够降低的化。

来自Ayar Labs,博通,IBM和Ranovus等公司的下一代CPO设计预计在能量效率上可以达到2-3pJ每比特。Ayar Labs共同创办人Rajeev Ram教授指出,采用现在的技术,在200G每通道下,有望实现0.1pJ每比特。他在MIT的团队正在通过低电压调制器以及更好的探测器等手段争取实现0.001pJ每比特的连接功耗。现在MIT和Ayar Labs的方案实现低连接功耗都是基于较低的速率,比如Ayar Labs是64G NRZ来实现2pJ,每比特,是否能在112G每通道以上实现1pJ每比特的能量效率还要观察。

LightCounting认为:“光通信行业正处在十字路口,我们可以坚持可插拔逐步改善,人工智能可能因此放慢发展速度,采用受限于带宽的优化算法。或者我们采用其他办法,冒险来采用CPO技术来实现根本性改变。这将根本改变光模块工业的面貌。这一路径激动人心,但是充满挑战。无论如何,错过这个机会都是一个错误。”
光纤在线

光纤在线公众号

更多猛料!欢迎扫描左方二维码关注光纤在线官方微信

相关产品

微信扫描二维码
使用“扫一扫”即可将网页分享至朋友圈。