NVIDIA和Ampere联合发布一款Arm架构云服务器

2022-08-29 18:48:42 来源: 半导体行业观察 杜芹
NVIDIA和Ampere Computing于近日宣布推出一款用于云游戏的Arm架构云原生服务器平台AICAN。AICAN将如何满足云游戏的需求,CPU和GPU在其中所起的作用各是什么?除此之外,还有一大利器是什么?
 
云原生游戏的两大支柱:CPU和GPU
 
从玩家与游戏的交互方式来看,云游戏是将云端经过渲染的数字内容以视频流的方式下发至玩家的终端设备。这个终端设备可包括手机、平板、PC应用、浏览器等。所以云游戏能够让玩家可以“即点即玩,按需畅玩”的最大灵活性、便利性,实现设备自由,游戏品质不受限。 
 
鉴于云游戏的优良特点,整个云游戏市场发展迅速,无论从玩家参与方式、内容品质、商业模式和规模,都在快速发展。根据中国信通院今年发布的《全球云游戏产业深度观察及趋势研判研究报告》的数据,在3年后,中国云游的市场规模将是今年的4倍,用户数量也是今天的2倍以上。 
 
而与此同时,为了支撑云游戏的基础设施,对云游戏服务器提出了新的要求。过去很多的云游戏服务器并不是传统意义上的服务器,其内部集成了多个终端SoC,形成一个服务器的形态,这种服务器的优势是游戏部署简单、成熟,但局限性也很明显,那就是无法满足现代数据中心规模化和自动化部署的标准,限制真正云化的发展和游戏内容品质。所以,现在就开始采用标准服务器来解决算力瓶颈等问题,使云游戏逐步完成从云化到云原生的本质性转变。
  
云游戏对算力需求主要体现在三个方面:Android系统的容器化能力游戏的渲染视频流编码的算力。对应的性能驱动主要是CPU和GPU,CPU可以很大程度上决定一台服务器同时并发可以运行多少个Android云游戏的实例;每一帧游戏画面的渲染需要GPU的支持。所以服务器配置和选择时,这三个核心算力要根据所需承载的游戏的密度、视频流、质量等方面进行平衡。 
 
在CPU的采用上,目前云游戏服务器方案主要有两种:一是采用X86服务器,另外一种是Arm的方案。在这两种方案中,如果在传统的X86服务器上运行Android游戏,会产生指令集兼容性的问题。在指令集翻译的过程中,无可避免地会产生效率的损耗,原来的算力优势也会大打折扣;而Arm云原生云游服务器可以覆盖最大范围的应用市场,来自终端,天然的云端和边端同构的属性带来很多优势,比如性能效率的无损、软件开发环境和工具链的一致性、跨设备可迁移性等等。 
 
所以Arm可以说是云游戏服务器的最佳方案。现在移动游戏可以说是最大且增长最快的游戏市场,目前已有数千部游戏针对 Arm 指令集进行了优化。
 
NVIDIA和Ampere强强联合打造出AICAN服务器
 
在这样的背景下,NVIDIA与Ampere Computing携手共同打造一个专用于云游戏的ARM架构的云原生服务器平台,称为AICAN平台。AICAN平台将为云游戏基础设施带来原生的兼容性和领先的高性能。
 
AICAN平台集两大CPU和GPU厂商大成,采用Ampere® Altra® 系列处理器和NVIDIA的T4和A16两种GPU,它们可以不需要修改或者模拟,就能原生地运行,兼容ARM的移动游戏。该平台内置双插槽 Ampere Altra Max CPU,提供行业领先的 256 个内核,并可配置多达 4 个 NVIDIA A16或6个 NVIDIA T4 GPU,每台服务器最多可支持160个并发用户(CCUs)。
 
  图1:AICAN 平台架构
 
首先从CPU的角度来看,据Ampere Computing中国区产品市场总监孙开本的介绍,Ampere Altra系列处理器的内核最高主频可以达到3.0 Ghz以上,每个内核的L1和L2的缓存是独享的,相对终端SoC内核而言,其性能大幅领先。同时,Altra系列处理器的内核采用单线程设计,功耗设计非常出色,所有内核都能够同时以最大的主频运行,每个内核的性能非常稳定,可以进行线性扩展,如此一来可以保证所有的游戏实例表现稳定,不会因为某一个单个CPU上运行的游戏数量或者游戏负载轻重的变化而出现波动,这对于保持用户服务的一致性,达到指定的SLA很重要。 
 
同时,凭借 Ampere Altra Max领先的核密度,单机架 AICAN 服务器可以同时向大约 2,500 多个移动用户传输串流。而且Ampere Altra处理器具有丰富的PCIe接口,所有搭载的GPU都是PCIe直联到CPU内核互联网络的,可以组成高密的、高效互联的GPU云平台。 这不仅使得广大消费者更容易从云端流式传输优质移动游戏,也同时首次为服务提供商提供极具竞争力的基础设施成本。
 
Ampere Altra处理器另外一个独特的优势是,它是目前市场上唯一能同时支持32位和64位应用的处理器,无论对以前开发的游戏,还是现在将来的64位的游戏,都可以实现原生支持。 
 
其次在GPU方面,NVIDIA已经在单T4上可以达到32路的游戏的并发,在下一代服务器中,NVIDIA引入了一个更高密度GPU“A16”,A16是一款定位于数据中心的GPU产品。A16将渲染能力、编码能力、解码能力均移植到Android内,在Androi云化过程中可以有效地保证应用程序的兼容性。 
 
而且,A16的渲染能力和编码能力均比T4有几倍的增强。 据NVIDIA中国区高级云游戏解决方案架构师张洁的介绍,在A16的GPU上,如果以H.264的编码方式可以编出720P 30帧的画面,在A16上可以达到182路。如果有游戏用户追求更高的画质体验或者更顺滑的体验,帧率提得更高,比如在1080P 60帧的场景下,针对重度游戏我们也可以做到45路。大显存也成为A16的一个非常重要的优势,A16可以提供64GB的显存容量。
 
所以在“Ampere CPU+NVIDIA GPU”的加持下,目前单台服务器上可以到160路超高密度并发的云游的能力。
 
除此之外,在游戏的积累和生态方面,NVIDIA A16 GPU可以支持人工智能以及光线追踪的专门的硬件单元,去支撑一些游戏场景。
 
除了GPU和CPU,软件的重要性凸显
 
张洁还指出AICAN很重要的一部分在于,NVIDIA在该硬件平台上搭建了一个Android的Cloud Gaming Software Stack,让用户可以达到开箱即用的能力,大大减少用户在整个云游戏平台构建过程中遇到的问题和大量工程化的实践,让用户可以快速地来部署云游戏能力。
 
软硬件结合一直是NVIDIA发展长青的一大致胜策略,在云游戏层面,NVIDIA在3年前就开始做软件层面的工作,从上图的AICAN平台架构图中也可以看出,在上层的Software Stack上:有专门针对云游戏设计的Cloud Gaming Driver,再往上NVIDIA构建了Android Container,就是将Android进行了容器化,然后游戏渲染出来的画面可以通过NVIDIA Android Cloud SDK,此SDK又包括一系列的部分,如Capture SDK、Stream SDK等等。Software Stack支持的模式是多种多样的,包括裸金属化、虚拟机直通,或者是VGPU的部署,部署到数据中心以后跑上Android Container,然后运行游戏,最终串流到用户端。 
 
为了保证性能,让Android的游戏可以原生的调用GPU,NVIDIA在Software上做了特殊支持,所以Android游戏可以直接调用物理的GPU,不需要通过中转的方式。
 
在兼容性方面,Software平台上已经验证了业内主流的超过200款以上的游戏。NVIDIA在后端有很大的Android的团队去支持这个兼容性问题的解决以及优化。
 
服务器厂商和云游戏玩家迎来狂欢
 
AICAN平台能够将位于云数据中心的移动游戏流式直接传输至终端用户,使用户无需下载。目前,浪潮和华勤等多家领先的OEM服务器制造商都在构建AICAN服务器平台。其中,浪潮与Ampere和NVIDIA共同设计打造了Aoqin AICAN服务器,它内置两个Ampere Altra Max CPU和多达四个NVIDIA A16 GPU以及两块 NVIDIA SmartNIC,机箱尺寸只有2U大小。
 
 图2:浪潮 AICAN 服务器
 
华勤的AICAN服务器在2U空间内兼容Ampere Altra和 Altra Max 两代 CPU,并联合NVIDIA 率先适配 T4 GPU,提高客户收益。
 
 
图 3:华勤 AICAN 服务器
 
全球对移动游戏流式传输的关注日益增加。腾讯先锋云游戏提供的服务正在为腾讯吸引越来越多的游戏玩家。腾讯先锋云游戏负责人方亮表示:“在 Ampere Computing 和 NVIDIA 的支持下,腾讯先锋云游戏将达到新的高度。现在通过在 Ampere Computing 和 NVIDIA 的 Arm 服务器平台上运行云游戏,我们将多款腾讯精品游戏由 3-10G,压缩储存空间到 20M 左右,用户即便使用存储空间有限的手机也能畅玩精品游戏,这让我们能够接触和覆盖到更广泛的用户,并且提升了增量收入。”
 
责任编辑:sophie

相关文章

半导体行业观察
摩尔芯闻

热门评论