30年,2250 亿颗芯片,Arm祭出新“核”武器

2022-07-06 18:12:57 来源: 互联网
据Arm 首席执行官 Rene Haas在日前的一场发布会上所说,在过去的30 年来,基于 Arm 架构的芯片出货量已超过 2,250 亿颗。对于这家IP巨头来说,这无异是一个值得庆贺的标榜战绩。
 
“我们已经大量地投入于基础设施、网络、汽车、物联网、元宇宙和游戏等方面。游戏的核心在于极为丰富的视觉体验,我们现在的投入将切实影响到未来的视觉体验。”Rene Haas补充说。
 
从演讲中我们可以得知,全面计算解决方案(Total Compute Solutions)会是Arm计算未来的一个好帮手。这是一个植根于开发者可及性、安全性和计算性能的战略,旨在为所有消费级设备市场提供优异的性能表现。通过优化的系统设计和实施,能助力合作伙伴不断突破极限。
 
近日,Arm更是带来新一代的全面计算解决方案。
 
 
搭上了“光追”的GPU
 
Arm 高级副总裁兼终端事业部总经理Paul Williamson首先指出,如今,移动端是世上最大的游戏平台。移动设备的创新也正在推动这一市场的增长。随着相关性能与需求的增长,持续的性能表现成为游戏的关键指标。“因为能够在 CPU、系统 IP 和 GPU 上提供全面的优化,所以Arm 才促成了手机芯片游戏性能的提升。”Paul Williamson表示。Arm Mali系列的 GPU 出货量已超过 80 亿颗, 助力其成为移动游戏的基石,但这还不够。
 
因为在Arm看来,在移动游戏行业,除了性能以外,光线追踪又成为了展现其实力的又一个指标。这就驱动Arm推出了全新系列的GPU Immortalis。据介绍,Immortalis 的不同之处的在于卓超的性能与功能。且具备了基于硬件的光线追踪功能,并将以无可匹敌的性能表现强力增援安卓游戏生态系统。“它传承于 Mali,但以终极的移动 3D 体验进行调试和强化设计。这就是 Immortalis,基于 Arm 技术的视觉体验新时代。 ”Paul Williamson说。
 
 
从相关资料可以看到,这颗名为Immortalis-G715的GPU是Arm第一款专为移动设备设计可支持基于硬件的光线追踪的GPU。值得一提的是,Arm在去年发布的Arm Mali-G710 就已经支持基于软件的光线追踪。而联发科也已经在其旗舰产品Dimensity 9000 芯片组中利用了这一功能,并将其已用于 OPPO 的 Find X5 Pro Dimensity 版本等旗舰智能手机。
 
在Arm看来,Immortalis-G715 中光线追踪的硬件加速将提升游戏性能,并为未来的旗舰智能手机带来更逼真和身临其境的体验。
 
所谓光线追踪,是一种计算机图形技术,它通过对单个光线在场景周围的路径进行建模来生成逼真的光照和阴影。从本质上讲,这提供了更逼真的游戏体验。将这个功能加在芯片上,挑战在于会给芯片带来功率、功耗和面积。然而,Immortalis-G715 上的光线追踪仅使用了 4% 的着色器核心区域,同时通过硬件加速实现了 300% 以上的性能提升。
 
Paul Williamson表示,基于硬件的光线追踪能帮助我们实现更高的性能,同时,也能够让游戏开发者在其游戏内容中应用更多的特效。他同时指出,Arm的光线追踪实现是基于标准的 Vulkan API ,这对所有开发者的可及性非常高。因此,这使新的特效更适用于移动游戏,也为光追特效应用于未来的VR和AR中带来了可能性。
 
在问到关于这个光线追踪性能相关的问题时,Arm的GPU技术专家表示,评估光线追踪的性能是很复杂的,关键是要了解已知的应用场景,否则光谈论性能会容易产生误导。例如,在没有反射的黑色房间里的单一光源与在有许多反射的复杂场景中的多个光源是完全不同的。
 
Arm 强调,光线追踪代表了移动游戏内容的范式转变。而他们现在已经加以支持,且其合作伙伴已经准备好,硬件已经准备好,就连开发者生态系统也已经准备就绪。
 
 
除了Immortalis-G715以外,Arm同时推出面向高端移动平台的 Mali-G715 和 Mali-G615。 在Mali-G715上,Arm提供了所有新款 GPU 均具备的可变速率着色 (Variable Rate Shading) 图形功能,能够显著降低能耗,并进一步提升游戏性能。
 
Arm进一步表示,2021 年推出的 Mali-G610 为高端设备提供持续的游戏性能,从而广受市场青睐。此次推出的 Arm Mali-G615 将为更广大的开发者和消费者更快地带来高端的移动应用场景、功能和特性。
 
与前一代产品相比,最新的 Arm GPU 性能提升了 15%,是迄今为止 Arm 性能最强的 GPU。这展现了 Arm 专注于确保最新旗舰级和高端智能手机能够提供终端用户所需的 AAA 游戏体验。新的 GPU 同样基于高效的 Arm Mali-G710 GPU 构建,且其能效优化了 15%,让用户能够乐享更长的游戏时间。
 
CPU的循序渐进
 
“对于全面计算,我们需要用一个性能高效的 CPU 集群来平衡 GPU。2021 年是 Armv9 CPU 落地的第一年,当时我们推出了一款兼顾性能和效率的 CPU。现在,我很高兴地介绍我们最新的 CPU 集群—— 2 个全新的 CPU 和 2 款现有 IP 的更新。”Paul Williamson在发布会上说。
 

 
据介绍,Cortex-X3 是Arm Cortex-X 定制 CPU 项目的新产品。Cortex-X 是Arm与合作伙伴密切合作的产品,以开发支持一流、最优化的工作负载的 CPU 为目标。通过不断优化,该系列在推出的 3 年间,每年都达到 2 位数的性能增长。而在今年推出的Cortex-X3上,Arm将其优化工作聚焦于更多的基准和工作负载上,并基于微架构进行创新,进一步推动峰值性能。
 
“Arm此款 CPU 能为目前的安卓旗舰手机带来 25% 的性能提升,为现在的主流笔记本电脑带来 34% 的性能提升。Cortex-X3 是我们迄今为止性能最强的 Cortex CPU,我们将继续打造强大的产品线。”Paul Williamson告诉记者。
 
 
Arm Cortex-A715 则专注于高效性能,与 Cortex-A710 相比,其能效提升了 20%,且性能提升了 5%,达到了可媲美 Cortex-X1 性能的重要里程碑。

 
相关介绍指出,Arm对 Cortex-A715 设计进行了一系列有针对性的改进,包括分支预测精度和数据预取。这也是Arm在其上能为客户提供性能和功耗完美平衡的原因。与 A710 相比,新的A715另一个更值得注意的变化是其新内核仅为 64 位。由于没有了 AArch32 指令的限制,Arm 的指令解码器的大小与其前身相比大幅度缩小,所有这些解码器现在都可以处理 NEON、SVE2 和其他指令。与此同时,Arm还优化了改设计的前端和后端。正是这样使其在面积、功率和执行方面的效率更高。
 
Arm表示,鉴于高效性能的重要性,Cortex-A715 的 CPU 集群采用了基于大小核 (big.LITTLE™) 的配置,这也是目前全球消费级设备最常用的异构处理架构。
 
在更新大核心的同时,Arm还更新了在去年推出的,基于 Armv9 架构的“小核心” Arm Cortex-A510,这是 Arm 四年来推出的首款高效小核。今年的更新版本在保持性能不变的同时,将功耗降低了 5%。同时,与去年的上一代产品相比,更新版的 DSU-110 所支持的 CPU 集群内核数增加了 50%,实现了不同等级消费级设备的可扩展性。
 
 
从相关报道可以看到,改进后的 A510 可将功耗降低多达 5%,同时改进时序,从而优化频率。进而能帮助明年推出的智能手机在低功耗任务中显得更高效。有趣的是,改进后的 A510 可以配置 AArch32 支持——原来只有 AArch64——这将该核心带入传统移动、物联网和其他市场。因此,就 Arm 的合作伙伴如何使用核心而言,它更加灵活一些。
 
至于Arm 更新的动态共享单元 (DSU) ,也在在单个集群中的支持性能获得了提升,例如其DSU 在 Cortex-X3 上支持多达 12 个内核和 16M L3 缓存,可实现跨笔记本电脑和台式设备、移动设备、DTV 等设备的可扩展性。报道指出,与上一代相比,更新后的 DSU-110 支持的内核数量增加了 50%,同时支持最新的 ISA 功能。这些变化提高了Arm合作伙伴的灵活性,并提供了资源来充分发挥其 CPU 的潜力,从而改善用户体验。据了解,Arm的合作伙伴现在可以针对具有新配置(例如 8 个 Cortex-X3 CPU 内核和 4 个 Cortex-A715 CPU 内核)的高端笔记本电脑设备,解锁新一代消费设备。
 

 
“伴随着我们最新的 CPU 与 GPU IP,配置了的工具、软件生态系统以及实体 IP 和通用标准。Arm打造出了灵活且扩展性高的解决方案,能满足从台式机到轻量级 AR/VR 设备之间广泛的价格区间。作为核心基础平台的延伸,全面计算解决方案支持这些市场的专用计算能力。只有通过系统层级的优化,我们才能提供如此出色的体验,能为用户带来了全然不同的世界。”Paul Williamson说。
 
据他透露,展望未来,Arm将引入全新的核心和架构,并在多个方面升级,进一步提升开发者和终端用户的体验。他们未来将会助力打造怎样的一个处理世界,这值得我们期待。
 
 
 
 
 
 
 
 
 
 
 
责任编辑:sophie
半导体行业观察
摩尔芯闻

热门评论