移动AI浪潮席卷而来:Arm终端CSS引领下一轮计算创新

2024-06-11 09:41:17 来源: 杜芹

当今,我们正处于一个AI加速计算时代,所有芯片厂商的步伐都明显加快了不少。继3月推出汽车计算子系统(CSS)之后,Arm又于近日推出了面向终端设备的Arm终端计算子系统(Arm CSS for Client)。该子系统是业界首个为Arm CPU和GPU提供3nm物理实现的解决方案,旨在简化基于Arm架构的解决方案的构建和部署,并显著提升性能和计算能力,助力终端产品更快上市。
 
正值移动AI爆发前夜,Arm将掀起新一轮的移动终端计算创新。
 
AI移动时代开启,Arm是基石
 
过去一年,人工智能 (AI) 技术给移动设备带来了令人瞩目的变革。从CES到MWC,越来越多的AI正转向在设备端,而不是在云端运行。
 
在vivo X100和 X100 Pro 发布会上,vivo推出自研的设备端大语言模型——蓝心大模型 BlueLM,支持写作与绘画方面的生成式 AI 内容创作,还能总结书本内容。设备端AI 再次重新定义了智能手机的“智能性”。
 
不仅是智能手机,AI 技术的影响还延伸至笔记本电脑、可穿戴设备和数字电视等多种设备。在Arm终端CSS的媒体沟通会上,Arm终端事业部产品管理副总裁 James McNiven指出,从微软近期的发布中可以看到,今年 Windows on Arm (WoA) 生态系统所取得的进展令人赞叹,它为消费者提供了更多选择。不论外观,笔记本电脑和智能手机都是我们随身携带的移动设备,它们需要具备超长的电池续航时间和强大的计算能力。AI再次为消费电子增添了新的活力。
 
 
Arm终端事业部产品管理副总裁 James McNiven
 
作为全球领先的IP供应商,Arm是这一切的基础,基于 Arm 架构的智能手机一直是 AI 体验的先行者,因此,Arm将是满足下一波计算性能需求的关键
 
Arm为全球最大的计算生态系统提供了通用的应用和对开发者友好的指令集。虽然提到AI,我们往往联想到更高的算力以及更高的能耗,但是无论如何,能效始终是 Arm 的核心优势。Arm架构的强大实力及其领先的实现能力,无疑为当今的计算平台带来了最高效的性能。
 
3纳米、Arm v9架构,Arm终端计算子系统带来极致性能提升
 
Arm终端CSS将物理实现与 Armv9 的 AI 优势结合在一起。作为面向未来十年计算的基础,Arm在2021年推出了专为性能和AI而设计的 Armv9 架构。Armv9在过去几年中得到了显著提升,其中包括:提高在矢量加速、机器学习 (ML) 等领域的计算能力;增强系统的安全性和稳健性;更重要的是,增加了面向 AI 的功能。
 
在去年 Armv9.2 取得成功的基础上,现在Arm正通过全新的 Arm Cortex-X CPU 和卓越的全新 Immortalis GPU 来提供全球领先的高性能。Arm终端CSS的性能优势主要体现在以下几个方面:
 
l 强大的CPU性能:Arm Cortex-X925 CPU是Arm迄今为止IPC提升幅度最大的CPU,在Geekbench中实现了36%的单线程性能增长,AI性能更是大幅提升,吞吐量(Token)首次响应时间提高了41%。这得益于微架构的显著演进,包括最宽的解码和矢量设计,带来了50% TOPS数的增长,以及更大的私有L2缓存大小。
 
l 卓越的GPU性能:Arm Immortalis-G925 GPU是Arm第三代、也是性能最强、效率最高的GPU,它在图形应用方面性能提升了37%,AI/ML网络性能提升了34%。此外,还大幅提升了光线追踪技术在复杂物体场景下的表现,性能提升高达52%。
 
在CSS的效率方面,用户可以选择不同的CPU微架构来实现最大性能和最长使用时间。通过Immortalis和Arm Mali提供的GPU可扩展性,用户可以灵活调整性能和效率。与Cortex-A720相比,Cortex-A725的能效提高了35%,这是由于微架构的改进以及工艺和物理IP的优化。同样,Cortex-A520“小核”CPU也通过工艺和物理实现得到了改进。
 
在图形效率方面,《堡垒之夜》等手游在提供去年相同游戏性能的情况下,功耗降低了30%。在可扩展性方面,合作伙伴可以利用一系列不同的CPU和GPU选项(包括CPU类型、核心数量和缓存大小等配置),为大屏幕计算、智能手机、数字电视和可穿戴设备等设计解决方案。
 
Arm终端CSS不仅提供了强大的性能,还进行了优秀的能效优化,助力终端设备延长续航时间。例如:
 
Ø 浏览器性能提升:通过优化网页浏览器,性能提升了23%,降低功耗。
 
Ø 动态性能框架优化:与Google合作,优化安卓动态性能框架,高端内容每帧能耗降低25%,帧速率提高35%。
 
Ø 工作负载平衡:调整安卓工作负载在不同CPU核心之间的平衡方式,为YouTube节省高达10%的功耗。
 
Ø 视频编解码器优化:对Google的AV1视频编解码器进行软件优化,视频性能最多可提高40%。
 
安全也是Arm毫无吝啬重点发力的一环,Arm 的内存标记扩展 (Memory Tagging Extension, MTE) 可帮助开发者在无需侵入式检测的情况下查找和修复代码中的错误,也可在实际操作环境下,用来减少安全漏洞被利用。vivo X100 和 X100 Pro 以及 Google Pixel 8 旗舰设备现在都允许用户启用 MTE。
 
Arm Kleidi:为开发者释放更多性能的钥匙
 
为了让开发者能够充分利用Arm终端CSS的性能优势,Arm推出了Arm Kleidi,这是一款能够嵌入任何软件平台以释放 CSS 计算性能的工具。目前Arm主要推出了面向 AI的KleidiAI,以及面向计算机视觉的KleidiCV。​
 
James也热情的介绍了Kleidi一词的背后含义,Kleidi来源于希腊语,意为“钥匙”,Arm希望能够借助Kleidi为开发者释放更多性能的钥匙。
 
从通用框架(如TensorFlow和PyTorch),到特定任务的解决方案(如 MediaPipe 和 Llama 3),Arm已将KleidiAI集成到各种框架中。Kleidi 确保开发者能够充分利用 Arm 终端 CSS 中最新的 Armv9 功能,例如可伸缩矢量扩展 (Scalable Vector Extensions, SVE)。它不仅能在现有的 CPU 核心上出色运行,还为未来的 CPU 创新做好了准备,如可伸缩矩阵扩展 (Scalable Matrix Extensions, SME)。例如,当运行在 Cortex-X925上时,Kleidi技术运行最新的 Llama 3 和 Phi-3 LLM 的速度比参考实现快 2.9 倍,且只需不到24小时就能实现。
 
从根本上说,计算机视觉与 AI紧密相连,但这些摄像头不仅仅运行神经网络,还包含许多传统的计算机视觉算法,其性能对摄像头或社交媒体应用的顺畅运行至关重要。这正是Arm构建 KleidiCV 的原因。据James的介绍,当我们将 KleidiCV 融入常用的 OpenCV 库时,性能显著提高。今年,Arm还与 OpenCV.ai 合作,使安卓开发者能够更轻松地将 OpenCV 集成到他们的项目中,并从 KleidiCV 带来的改进中受益。
 
以 Arm为计算基础构建的软件平台是世界上最为普适且重要的软件平台。有70%的第三方安卓ML工作负载都在CPU上运行。Kleidi的发布将为开发者提供实现Arm CPU最佳性能的路径,使其能够专注于下一个重大创新。
 
“我们希望Arm终端CSS是最易于访问AI体验的平台。它结合了软件以及世界上最大的移动设备生态系统之一,将成为新一代产品和服务的基石。Arm 终端 CSS 具备提供一个 AI 优化的计算平台所需的计算性能和效率。
 
Arm生态系统蓬勃发展
 
对于Windows on Arm (WoA) 生态系统来说,今年也是Arm成果丰硕的一年。除了 Microsoft Office、Dropbox、Zoom、Adobe 套件等,越来越多的应用成为 Arm 原生应用,尤其是百度、哔哩哔哩、Chrome 浏览器、爱奇艺、搜狗、腾讯 QQ 音乐等。
 
此外,还有许多针对创作者的开源工具,例如最近新增的 Audacity、Blender 和 OBS Studio(用于流媒体),这些应用整合了大量的开源库和开发者工具。James表示,我们很荣幸能与微软合作,通过资助开源和发布我们面向 Windows 的 Arm Performance Libraries(Arm 性能库)来发展这个生态系统。对于现在的大多数用户来说,他们绝大部分时间都在运行原生应用。
 
vivo作为终端手机厂商,一直非常关注用户体验,以“用户导向”为主。传统的性能衡量方式主要依靠基准测试(benchmark),但vivo发现实际应用程序对缓存有较高要求,缓存未命中率比基准测试高很多,这对用户体验的流畅性和续航至关重要。令人欣喜的是,Arm在前端访存能力方面进行了大量投资,提升了包括指令预取、分支预测和更大缓存能力在内的性能,从而显著提升了实际应用程序的表现。vivo与MediaTek合作,通过全大核架构,充分发挥了Arm处理器的优势,使手机流畅性达到了新的高度。
 
在生成式AI方面,vivo推出了蓝心大模型,为用户提供自然语言处理、摘要、翻译和图片生成等功能。生成式AI极大地提高了信息处理效率,成为用户的刚需,而其背后的硬件基础依赖于Arm CSS的强大处理能力。vivo很高兴看到Arm在AI技术上的持续布局,期待未来Arm CSS能集成更多AI能力,并为开发者提供更广泛的开发环境,支持端侧生成式AI应用的开发。
 
vivo与Arm的密切合作源于对用户需求和产品性能的深刻理解。通过反馈用户的需求和产品功耗瓶颈分析,vivo希望促进整个产业链的良性循环,提升手机产品的用户体验。未来,vivo将继续与Arm合作,带来更多创新成果,为消费者提供更优质的使用体验。
 
结语
 
Arm终端CSS的推出,是Arm敏锐洞察AI在移动终端发展大势的重大战略举措。它为终端厂商提供了强大的性能、灵活的选择以及优秀的能效和安全保障,助力其打造更具竞争力的移动产品,引领移动AI创新浪潮。
 
 
 
责任编辑:sophie

相关文章

半导体行业观察
摩尔芯闻

热门评论