英特尔也要推CPU+GPU的全新架构

2022-02-19 14:00:48 来源: 半导体行业观察

来源:内容 半导体行业观察(ID:icbank) 编译自HPCWIRE ,谢谢。


英特尔昨天举行了 2022 年投资者会议,涵盖了从即将推出的 Sapphire Rapids CPU 到备受期待(和延迟)的 Ponte Vecchio GPU 的所有内容。

但在会议摘要中有些埋没的是一个新的名称:“Falcon Shores”,这是一个被描述为“一种将 x86 和 Xe GPU 整合到一个插槽中的新架构”。

该消息很简短,由 Raja Koduri(英特尔加速计算系统和图形 [AXG] 集团高级副总裁兼总经理)在虚拟分组会议结束前的几分钟内发布。

Falcon Shores


“我们正在开发一个代号为 Falcon Shores 的全新架构,”Koduri 说。“Falcon Shores 将 x86 和 Xe GPU 加速整合到 Xeon 插槽中,利用下一代封装、内存和 I/O 技术,为计算大型数据集和训练巨大 AI 模型的系统提供巨大的性能和效率提升。”

“我们预计 Falcon Shores 将提供超过 5 倍的每瓦性能、超过 5 倍的计算密度增加以及超过 5 倍的内存容量和带宽提升 [相对于当前平台],所有这些都在一个具有巨大简化的 GPU 编程模型,”他继续说道。

“Falcon Shores 建立在一系列令人印象深刻的技术之上……包括 Angstrom 时代的工艺技术、下一代封装、英特尔正在开发的新型超带宽共享内存,以及行业领先的 I/O。我们对这种架构感到非常兴奋,因为它为比当前离散解决方案更广泛的工作负载带来了加速。”

根据路线图,Falcon Shores计划于 2024 年建成。

致命一击?


人们可能会将英特尔的 Falcon Shores 的概念与 Nvidia 即将推出的 Grace CPU 进行比较——它的第一个基于 Arm 的处理器,以及一个设计(如 Falcon Shores)与其内部 GPU 紧密结合的处理器。就 Nvidia 而言,Grace 将使用下一代 Nvidia NVLink 和下一代 Arm Neoverse 内核以一对一的 CPU-GPU 比率与 GPU 耦合。Grace 是在差不多一年前(2021 年 4 月)宣布的,而 Nvidia 将其定于 2023 年,比 Falcon Shores 提前一年。

Sapphire Rapids


然而,这些都还有一段路要走——Koduri 还花时间突出了比 Falcon Shores 更接近地平线的项目。例如,Sapphire Rapids——英特尔的下一代 Xeon——将于下个月开始向部分客户发货。

英特尔执行副总裁兼数据中心和人工智能事业部总经理 Sandra Rivera 在活动期间表示:“Sapphire 提高了工作负载优化性能的标准并为行业树立了新标准。“Sapphire Rapids 还将在重要的内存和互连标准方面引领行业。例如,PCIe [和] DDR5,以及新的高速缓存一致性互连 CXL,这是英特尔在业界领先的标准。”

Sapphire Rapids 也将采用高带宽内存 (HBM) ,英特尔在整个活动中都强调了这一点。“我们的战略是在此基础上 [与 Xeon 一起],并将其扩展到更高的计算和内存带宽,”Koduri 说。

“首先,我们将高带宽内存(或 HBM)与 Xeon CPU 集成到封装中,为 CPU 工作负载提供类似 GPU 的内存带宽。” Koduri 表示,配备 HBM 的 Sapphire Rappids 预计将于 2022 年下半年发货。

Ponte Vecchio


比 Sapphire Rapids 稍远的是 Ponte Vecchio,这是英特尔的离散 Xe GPU,预计将成为美国 Aurora exascale 超级计算机的核心。

Aurora——最初计划于 2021 年推出——现在(表面上)计划于 2022 年底推出,这与英特尔的工艺节点挑战以及由此导致的 Ponte Vecchio 延迟同步。Ponte Vecchio 的主要计算模块最初打算使用英特尔的 7nm 工艺(现在称为“Intel 4”),现在正在使用台积电的 N5 工艺制造。

“我们有望在今年晚些时候为 [the] Aurora 超级计算机程序交付这款 GPU,”Koduri 向听众保证。“我们在这款产品上取得了稳步进展,我们很高兴能在这款 GPU 上展示一些早期的领先性能结果。” 为此,他在金融服务工作负载基准上与未识别的竞争对手产品进行了性能比较,称预生产的 Ponte Vecchio 装置显示出“与当今市场上的最佳解决方案相比有显着的性能改进”。

oneAPI


英特尔近期战略之一是其 oneAPI 编程模型。

“从硬件的角度来看,将 Ponte Vecchio 与 Xeon HBM 相结合非常棒,”Koduri 说,“但同样重要的是,通过现有的 Xeon HPC 和 AI 软件基础,可以无缝、透明地利用硬件技术。这就是我们的 OneAPI 开放生态系统发挥作用的地方。我们构建了 OneAPI 以无缝利用 Xeon 软件生态系统,允许软件开发人员使用单个代码库跨一系列 CPU 和加速器工作。

通过使 OneAPI 成为一个开放的生态系统,我们消除了当前 GPU 加速器在 HPC 和 AI 中使用的封闭专有编程环境的障碍。”

Koduri 补充说,英特尔预计“随着 Xeon HBM 和 [Ponte Vecchio] 变得更容易为所有人所用,今年开发人员采用我们的开放方法的势头将非常强劲。”

我们将在 2023 年推出 Xeon HBM 和 PVC 的后续产品,”他说。其中包括:Emerald Rapids,英特尔在英特尔 7 处理节点上的下一代至强处理器。

然后,2024 年将我们带回Falcon Shores。2024 年还将带来另一款下一代至强产品 Granite Rapids,这是一款之前计划用于Intel 4 工艺的 P 核处理器,但现在升级到了Intel 3 工艺。Granite Rapids 将与 Sierra Forest 一起推出,这是一款同样采用 Intel 3 工艺的 E 核 Xeon 处理器。


原文链接:

https://www.hpcwire.com/2022/02/18/intel-announces-falcon-shores-cpu-gpu-combo-architecture-for-2024/


*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。


今天是《半导体行业观察》为您分享的第2956内容,欢迎关注。

推荐阅读


碳化硅,究竟贵在哪里?

一线工程师眼中的国产光刻胶

从ASML年报看半导体产业的未来


半导体行业观察

半导体第一垂直媒体

实时 专业 原创 深度


识别二维码 ,回复下方关键词,阅读更多

晶圆|集成电路|设备 |汽车芯片|存储|台积电|AI|封装

回复 投稿 ,看《如何成为“半导体行业观察”的一员 》

回复 搜索 ,还能轻松找到其他你感兴趣的文章!

责任编辑:Sophie
半导体行业观察
摩尔芯闻

热门评论