英特尔数据中心处理器将走向何方?

2022-01-22 14:00:33 来源: 半导体行业观察

来源:内容由半导体行业观察(ID:icbank) 编译自the next platform ,谢谢。


系统业务中有句老话是这么说的,客户购买的不是处理器,而是路线图。

作为一家服务器供应商,无论是CPU、GPU还是任何其他类型的设备,其诀窍都是披露足够的产品线路线图,这样既不会涉及泄密,又可以让人们信任你的产品。以英特尔为例,随着其计算引擎产品组合的扩大,竞争对手的数量也在不断增加,越来越多的企业开始加入其竞争对手的行列。

考虑到英特尔在数据中心领域所处的地位,最近其XEON SP业务受到AMD的EPYC x86服务器芯片和亚马逊云科技(Amazon Web Services)以及Ampere Computing旗下的ARM(ARM Collective)的冲击,尤其在大型超大规模企业和云计算企业中,你可能会认为英特尔需要公布一份路线图,对其未来的创新和时间表进行描述。

在计算机引擎可靠性方面,英特尔是失败者,这可能很难让人相信,但却是事实。英特尔的芯片制造技术不仅无法与代工巨头台积电竞争,而且工艺技术的持续延迟也给CPU的推出造成了严重的破坏。此外,当AMD在2017年首次推出Epyc处理器,并不断完善随后两代的x86兼容服务器芯片时,英特尔却在芯片架构方面拖后腿。当前,AMD已在设定技术规划,并且有一个代工合作伙伴帮助它在CPU、GPU和FPGA方面实现这一目标,一旦Xilinx的收购完成,这个目标也会很快实现。

鉴于英特尔首席执行官Pat Gelsinger掌舵已经一年多了,你可能会认为英特尔会像甲骨文(Oracle)联合创始人Larry Ellison在2010年1月收购太阳微系统公司(Sun Microsystems)后所做的那样:制定一份五年路线图,然后坚持执行。AMD在2017年凭借EPYCS重返服务器领域时也做了同样的事情,并且现在仍在这样做,只是程度较轻。

我们认为,问题在于即使Pat Gelsinger回到公司并掌舵一年后,但英特尔依旧对自己的未来充满不确定,如果在2009年9月的大衰退中Pat Gelsinger没有被排除在外,英特尔在数据中心的霸权可能已经完成,因为Pat Gelsinger会阻止之前发生的那些混乱。回来六个月后,Pat Gelsinger重组了公司,创建了新的业务团队,并授权了新的高管,但别搞错了:Pat Gelsinger负责整个Intelchilada,并与Queso一起订购芯片。

有传言称,下一代“Sapphire Rapids”处理器将在第三季度推出,我们询问英特尔时,他们否认了这一传言。于是我们开始调查有关XEON处理器路线图的传言,发现大部分内容都由一位名为Tom(姓氏未知)的博主在“Moore s Law Is Dead”博客和“Broken Silicon”播客上发布的视频中提出。如果你在网上浏览,你会发现各种各样的网站都指向MLID上的这篇文章,从去年夏天开始,关于英特尔2023年及以后的芯片路线图将如何发展已有各式各样的言论。虽然这些都很有趣,但我们想知道的是Xeon服务器的未来到底会是什么样,以及会如何影响未来的应用程序和市场。世界上的大多数应用程序仍然是在CPU上进行计算,所以服务器CPU的未来对大多数应用程序来说十分重要。

因此,为了解英特尔推出Xeon系列的潜在原因及其可能产生的影响,我们制作了一系列表格,显示了从“Sandy Bridge” Xeon E5到用于双插槽机器的“Cascade Lake” Xeon SP的发展情况,并且分别预测了从去年的“Ice Lake” Xeon SP到“Diamond Rapids” Xeon SP(如果英特尔仍打算这样命名)的发展情况,预计将在2025年或2026年实现,具体取决于进展情况。

这与组织我们的思想一样重要。

表中以红色粗斜体显示的项目是在缺乏数据的情况下对这些功能的估计,并且它是基于各种功能信号和时钟速率的预期改进,以及基于晶体管密度、能耗和chiplet架构的合理预期容量增加。公平地说,在许多情况下,英特尔还不知道这些未来的Xeon SP会是什么样子,因为要将PCI-Express 6.0外围设备控制器或DDR6内存控制器推向市场,还有许多工程工作要做,而且CPU必须与外围设备和内存的可用性交叉才能插入这些控制器。

我们的表格忽略了单插槽、4插座和8插座平台,以及创建这些平台所需的对Xeon CPU的调整。这些系统可能占据了20%到25%的市场份额,所赚的钱也差不多,并且为它们创建芯片和芯片组的调整也是相当温和的。在芯片和芯片组中需要激活不同数量的内核和不同数量的QPI或UPI链路,但是相对于服务器节点的每个规模,底层架构或多或少地保持同步变化。

让我们先来看看传统的Xeon E5和Xeon SP平台,全面了解英特尔在2012年至2020年期间拥有先进的CPU计算、内存和互连功能时所使用的手段:


在每种情况下,我们都在观察每代Xeon E5和Xeon SP中的顶级部分,这在芯片行业中通常被称为顶级BIN部分。每代变体拥有最多的内核,并将该代系统的热限制推到最高。

正如你所看到的,从2016年到2021年,英特尔已经采取了多种手段,但制造工艺一直停留在14纳米,这显然让Xeon 芯片更大的同时制造成本也提高了,还导致英特尔阻碍核心数,实际上减少了高速缓存。时钟速度也在一段时间内大幅下降,以帮助支付热室的费用,来增加核心计数,而不是转移到英特尔拖延已久的10纳米制造工艺。时钟指令(IPC)的改进(针对恒定时钟速率和单内核进行标准化)通常也不会给人留下深刻印象。“Cascade Lake”Xeon实际上是“Skylake”Xeon,只有几个不同的指令,随着2020年初Cascade Lake-R的更新,AMD凭借“Rome”EPYC 7002处理器大获关注,英特尔重新调整了双插座Xeon SP-6200系列黄金版本,并在AMD的EPYC爬坡之前从Skylake生产线中获得巨额利润,然后大幅削减价格。(早在2017年9月的《the Huge Premium Intel Is Charging For Skylake xeon》,我们就讨论过Skylake xeon的相对价格与之前Xeon相比有多高,这表明它显然是盈利的。)

在英特尔服务器芯片的历史上,这已经不是第一次了。2014年的“Haswell”Xeon芯片在原始吞吐量性能方面比“Ivy Bridge”Xeon E5稍差(至少对于顶级芯片而言),Ice Lake Xeon SPS的成本也略高于Cascade Lake-R Xeon SPS,但比2019年的Cascade Lake Xeon SPS低得多。但Skylake芯片创下了英特尔再也回不去的高水平。从标价上看,英特尔对Skylake CPU的报价只有之前的“Broadwell”CPU的一半,这就是当你没有竞争对手时会发生的事情。公平地说,机器之间的吞吐量增加了58.5%,这是值得的。(相对性能与IPC变化、核心数量和时钟速度有关,并与2009年3月推出的四核“Nehalem”E5500处理器进行比较,这是自七年前推出the Next Platform以来一直采用的计算方法。)

为了使Skylake和Cascade Lake处理器对数据中心更有价值,AVX-512矢量引擎和第二代Fusion Multiply Add(FMA)单元被添加到Xeon核心中,PCI-Express控制器获得了更多通道(即使它们没有变得更快),内存速度也在几代之间缓慢提升,QuickPath Interconnect(QPI)链路也是如此;更多的链接被添加到与两个、四个或八个处理器连接得更紧密的NUMA节点上。设备的瓦数也在攀升,因为当运行速度需要加快时,它会加速升温。

在CPU设计中平衡所有的这些压力是一项严峻的挑战,英特尔的芯片设计师们的一只手被绑在背后,另一只手戴着厚厚的太空手套,因为英特尔的代工厂无法及时生产出10纳米、7纳米和5纳米芯片,并用于他们的架构。

坦率地说,对于始终需要最大限度地提高每美元每瓦性能的数据中心客户来说,这是一件令人痛苦的事情,也是非常令人沮丧的事情。

随着去年“Ice Lake” Xeon  SPS的推出,我们看到了本可以在2017年或2018年用10纳米工艺实现的产品。Ice Lake芯片为一年一度(或多或少)的路线图奠定了基础,服务器平台跨越两代Xeon  SPS,并有望实现令人印象深刻的计算、内存、和互连,以及新一代IPC改进的健康剂量,以扩展chiplet架构在服务器CPU插槽中实现的核心数量。

在去年夏天的架构日上,英特尔提供了今年即将推出的“Sapphire Rapids” Xeon  SPS的一些突出功能,这些功能将插入“Eagle Stream”服务器平台。据我们所知,Xeon SP平台的“高级平台”不会像2019年的“Cascade Lake-AP”那样,将两个完整的处理器塞进一个插槽中。但有传言称,一个名为“Birch Stream”的AP平台将于2024年和2025年分别推出“Granite Rapids”和“Diamond Rapids”处理器。

据报道,Granite Rapids双核处理器被称为“Sierra Forrest”,类似于AMD的Genoa Epyc 7004处理器的“Bergamo” ,针对那些希望在一个插槽中拥有最大数量内核的超scaler和云客户。关键是,即使我们预计有大量的核心数量,英特尔似乎也会在一个封装中将其增倍。IBM今年在Power10上也做了同样的事情。这并不是一个新的想法,很早之前就有了,甚至可以追溯到互联网热潮时期,当时IBM、惠普和英特尔都将其服务器芯片的DCM投入该领域,以增加计算密度。

为了比较未来发布的Xeon SP处理器,我们忽略了这些AP以及那些将使用HBM内存来提高处理器内存带宽的处理器,虽然这些都很重要,但主题的其他因素也很重要,例如包含各种加速器的封装,而其他封装则不包含。计算领域将会出现大规模定制,正如我们之前所指出的,这将意味着,相对于过去更加精简的产品,任何特定的变化都会导致产量下降。Nehalem Xeon只有一个CPU,某些功能可能已经激活或未激活。在chiplet架构中,任何变化都是可能的。我们还认为英特尔最终将在服务器中混合使用大核和小核,即所谓的P核和E核(Performance and Efficient的缩写),我们忽略了这一点,并考虑在未来的Xeon中只使用P核的芯片。

因此,与当前的Ice Lake Xeon SPS相比,我们对未来四代Xeon SPS的最佳猜测如下:


正如我们所说,任何加粗的红色斜体都是我们的猜测。这是一个模板,我们将判断英特尔实际做什么,预测可能做什么。

我们认为“Emerald Rapids” Xeon SP将在一年后推出,并对Eagle Stream平台进行升级,它将是Sapphire Rapids的一个完整版本,所有的核心都被激活(或核心复杂的新芯片),并拥有更快的DDR5内存。鉴于核心数、时钟速度和IPC的改进,我们预计Top Bin 56核Sapphire Rapids芯片的吞吐量将比Top Bin 40核Ice Lake芯片高出约67%,并进一步认为英特尔将把芯片的价格提高到10,000美元左右,并提供约26%的性价比。

这也引出了一个很好的观点。在所有可以拉动的杠杆中,价格是最大的杠杆,也是最容易用力拉动的杠杆。如果AMD或ARM在性能或价格方面又或者两方面都变得咄咄逼人,那么英特尔也不得不效仿。我们希望每个企业都能在芯片上赚更多的钱,并为芯片注入更多的性能,以证明更高的价格是合理的。这些芯片的制造成本会更高,所以为什么不呢?

我们预计高端的Xeon处理器会变得更贵,因为与过去10年的Xeon产品线相比,每一代提供的增量计算都将非常惊人。

Granite Rapids 和Diamond Rapids就是一个很好的例子。在去年的英特尔加速活动上,芯片制造商推出了Granite Rapids的模具模型,我们在本文的顶部展示了这张特写图片,在此重复一下:


这个模型显示了两个核心块,每个有60个核,被HBM和高速缓存或PCI Express和内存控制器包围。(我们认为是后者,而不是前者。)为了与AMD的Epyc芯片竞争,Granite Rapids必须拥有120个左右的内核,所以也许英特尔只是为了好玩才在演示中放了个复活节彩蛋。

有传言称,Diamond Rapids Xeon SP芯片中使用的“Lion Cove”核心的IPC将是Sapphire Rapids CPU中使用的“Golden Cove”核心的两倍。

下面的图表展示了IPC与Dothan核心架构的改进,Dothan核心架构在Opteron一代中保存了英特尔的cookie:


Golden Cove和Lion Cove内核之间的2X IPC似乎很难实现,但上表显示了这两个处理器的性能和价格/性能。预计Emerald Rapids Xeon SPS中的“Raptor Cove”内核中的IPC将比Sapphire Rapids Xeon SPS使用的Golden Cove内核中的IPC提高5%到10%,而我们只显示了大约8%的中间值。为了实现2倍的飞跃,Granite Rapids和Diamond Rapids Xeon SPS中分别使用的Redwood Cove和Lion Cove内核,需要实现英特尔历史上最大的IPC改进。

如果英特尔能做到这一点,并以合适的工艺刻蚀(自己或台积电的)核心,尽可能将多的核心装入一个封装中,那么2024年和2025年的主流Xeon SP芯片将会令人印象深刻。如果一切如我们所料,一个顶级的Diamond Rapids处理器的价格将是顶级Sandy Bridge Xeon E5的6.3倍,但它拥有更多的18X核,提供65.6倍的吞吐量性能,并将单位性能成本降低了90.4%。

这些变化将彻底改变数据中心中CPU计算的性质。即使英特尔不这样做,AMD和ARM也很有可能会这样做。我们强烈怀疑,英特尔可能还需要一到两代人的时间才能实现其看似崇高的目标,让我们拭目以待。

★ 点击文末 【阅读原文】 ,可查看本文原文链接!


*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。


今天是《半导体行业观察》为您分享的第2928内容,欢迎关注。

推荐阅读


功率半导体材料分析

新一轮EUV光刻机争夺战开打

围攻SiC衬底龙头


半导体行业观察

半导体第一垂直媒体

实时 专业 原创 深度


识别二维码 ,回复下方关键词,阅读更多

晶圆|集成电路|设备 |汽车芯片|存储|台积电|AI|封装

回复 投稿 ,看《如何成为“半导体行业观察”的一员 》

回复 搜索 ,还能轻松找到其他你感兴趣的文章!


点击阅读原文,可查看本文
原文链接!


责任编辑:Sophie
半导体行业观察
摩尔芯闻

热门评论