瞄准AI、AV和元宇宙的未来,NVIDIA GPU多领域全面开花

2022-09-23 11:05:23 来源: 杜芹

NVIDIA 在9月22日的秋季 GTC上发布了一系列新技术。包括H100 GPU全面投产,发布了IGX边缘AI计算平台、最新Jetson Orin Nano、Isaac SIM上云、数字孪生方案等等。虽然Nvidia仍然是PC显卡的顶级玩家,但视频游戏早已不仅仅是其芯片的主要目标市场。接下来,NVIDIA瞄准了AI、AV和元宇宙的未来,将其GPU产品广泛用于从医学研究到金融服务到工业控制到云计算,到汽车领域。


 
NVIDIA H100 GPU全面投产
 
NVIDIA H100于2022年4月发布,由800亿个晶体管组成,并采用了众多开创性的技术,除了Hopper的架构和Transformer引擎之外,第二代多实例GPU、机密计算、第四代NVIDIA NVLink和DPX 指令等若干关键性创新也让H100 GPU如虎添翼,实现了NVIDIA加速计算数据中心平台的又一次飞跃。
 
NVIDIA于22的GTC大会上宣布NVIDIA H100 Tensor Core GPU全面投产,NVIDIA全球技术合作伙伴计划于10月推出首批基于开创性NVIDIA Hopper™架构的产品和服务。据悉,H100使企业能够削减AI的部署成本,相较于上一代,在提供相同AI性能的情况下,可将能效提高3.5倍,总体拥有成本减少至1/3,所使用的服务器节点数也减少至1/5。
 
在客户应用方面,全球领先的计算机制造商、高等教育和研究机构、以及云端客户等都是H100的忠实拥护者。其中在计算机制造商方面,已在构建系统的合作伙伴包括源讯(Atos)、思科、戴尔科技、富士通、技嘉科技、慧与、联想和超微。预计到今年年底将有超过50款服务器型号面市,2023年上半年还将有数十款型号面市;巴塞罗那超级计算中心、洛斯阿拉莫斯国家实验室、瑞士国家超级计算中心(CSCS)、德州高级计算中心和筑波大学等也将采用H100;AWS、谷歌云、Microsoft Azure、Oracle Cloud Infrastructure等云厂商将从明年开始率先在云端部署基于H100的实例。
 
除此之外,NVIDIA DGX™ H100系统现在也已开始接受客户预定。该系统包含8个H100 GPU,FP8精度的峰值性能达到32 PFlops。每个DGX系统都包含NVIDIA Base Command™和NVIDIA AI Enterprise软件,可实现从单一节点到NVIDIA DGX SuperPOD™的集群部署,为大型语言模型和其他大规模工作负载的高级AI开发工作提供支持。
 
NVIDIA创始人兼首席执行官黄仁勋表示:“Hopper是AI工厂的全新引擎。它能够处理和挖掘海量数据,训练具有数万亿参数的模型,这些模型将推动基于语言的AI、机器人、医疗和生命科学领域的进步。Hopper的Transformer引擎将性能提升了一个数量级,使大规模AI和HPC能够为企业和研究人员所用。”
 
下一代汽车级芯片Thor
 
此前,在2021 年春季的 Nvidia GPU 技术大会 (GTC) 上,CEO Jensen Huang 演讲的亮点之一是宣布了用于自动驾驶汽车的下一代片上系统 (SoC),称为 Atlan。Atlan 计划于 2025 年用于量产车应用。不过在本周的 2022 年秋季 GTC 上,黄仁勋宣布 Atlan 已被取消,取而代之的是一种名为 Thor 的新设计,该设计将提供两倍的性能和数据吞吐量,但仍将在 2025 年推出。
 
Atlan 承诺提供迄今为止所有汽车 SoC 的最高性能,具有高达每秒 1,000 万亿次运算 (TOPS) 的整数计算能力。这大约是今年在量产车辆中推出的 Orin SoC 性能的四倍,包括 Nio ET7、Xpeng G9 以及即将发布的 Polestar 3 和沃尔沃 XC90 替代品。
 
NVIDIA的DRIVE Thor,它结合了 Hopper 的变压器引擎、Ada 的 GPU 和 Grace 的惊人 CPU。新的 Thor 超级芯片提供 2,000 teraflops 的性能,取代了 DRIVE 路线图上的 Atlan,并提供了从 DRIVE Orin 的无缝过渡,后者具有 254 TOPS 的性能,目前正在生产车辆中。
 
除了新的 CPU 和 GPU 内核以及下一代 GPU 内核之外,Thor 还集成了最初为数据中心应用开发的 NVLINK 连接,以加快板上芯片之间的数据传输。新的 SoC 是第一个具有集成推理变压器引擎的自动车辆计算平台。从本质上讲,这通过运行许多并行操作来提高深度神经网络处理传感器数据的能力,以便系统了解任何时间点发生的情况。新车现在包括超过 30 个传感器,包括 10 个或更多摄像头、多个雷达、激光雷达和超声波传感器,这种能力对于软件感知系统的工作至关重要。

NVIDIA Jetson家族再添一员大将:Jetson Orin Nano
 
在近日的NVIDIA GTC大会上,NVIDIA宣布推出全新Jetson Orin Nano系统级模组,扩充了NVIDIA Jetson™产品阵容。全新Jetson Orin Nano的性能比上一代产品提高了80倍,这将为边缘AI和机器人技术更容易获得。
 
NVIDIA Jetson系列首次涵盖了六个基于Orin的生产模组,可支持各种边缘AI和机器人应用。其中包括在最小的Jetson外形尺寸下提供每秒40万亿次(TOPS)AI性能的Orin Nano,以及为高级自主机器提供每秒275万亿次(TOPS)AI性能的AGX Orin。
 
Orin Nano 模组在外形和引脚上与之前发布的 Orin NX 模组完全兼容。凭借完整的仿真支持,客户从今天起就可以使用AGX Orin开发者套件开发适合Orin Nano系列的应用,能够灵活地设计一个系统来支持多个 Jetson 模组并轻松扩展其应用。
 
Orin Nano模组将分为两个版本:Orin Nano 8GB提供最高40 TOPS性能,功率为7W至15W;4GB版本提供最高20 TOPS性能,功率仅为5W至10W。
 
Orin Nano得到了NVIDIA JetPack™ SDK的支持并由NVIDIA CUDA-X™加速计算堆栈驱动。该计算堆栈也被用于创造工业物联网、制造业、智慧城市等领域的开创性AI产品。Jetson Orin Nano模组将于明年1月上市。
 
NVIDIA GPU为生物学带来革命
 
生命科学领域正处于一场数据革命之中,研究人员迫切需要一种将机器学习引入生物医学的新方法。在这方面,NVIDIA将大型语言模型扩展到生物学领域。
 
在GTC大会上,NVIDIA宣布,与博德研究所合作,为Terra云平台提供快速分析海量医疗数据所需的AI和加速工具。这将惠及该平台的25000多名用户,这些用户包括来自学术界、初创企业和大型制药公司的生物医学研究人员。
 
在Terra平台上提供NVIDIA Clara™ Parabricks®:Parabricks是一款用于测序数据二级分析的GPU加速软件套件,现可用于六个新的Terra工作流程。在博德研究所的GATK最佳实践——生殖细胞突变检测分析流程中,Parabricks在GPU上进行分析的速度提高了24倍,而成本减半。用户现在可以使用Clara Parabricks,在一个多小时内完成全基因组的分析,而在基于CPU的环境中这项工作需要24个小时才能完成。
 
此外,NVIDIA正致力于为10多万名研究人员所使用的行业标准工具——博德研究所的GATK工具包打造新的深度学习模型,帮助研究人员识别与疾病相关的基因变异。这将助力新药研发人员研究新的疗法。
 
NVIDIA BioNeMo是NVIDIA Clara Discovery药物研发框架、应用和AI模型集的一部分。NVIDIA的BioNeMo框架包含蛋白质和化学领域的预训练LLM模型,可简化训练、推理和扩展。BioNeMo是NVIDIA NeMo Megatron框架针对化学、蛋白质和DNA/RNA序列领域的扩展。通过BioNeMo,开发者能够有效地训练和部署具有数十亿参数的生物学LLM模型。
 
正如AI通过LLM来学习如何理解人类语言,该框架也在学习生物学和化学语言。NVIDIA BioNeMo使基于生物分子数据的大规模神经网络训练更为轻松,助力研究人员发现生物序列中的新模式并获得新洞察。研究人员可将这些洞察与生物特性或功能乃至人类健康状况联系起来。
 
NVIDIA初创加速计划成员、生物技术初创企业Peptone的机器学习负责人Istvan Redl表示:“随着大型语言模型在蛋白质领域的应用日益广泛,高效训练LLM并快速调整模型架构的能力变得非常重要。我们相信BioNeMo框架将满足可扩展性和快速实验这两大工程方面的需求。”
 
NVIDIA IGX为医疗行业带来了先进、主动的安全性能
 
在近日的GTC大会上,NVIDIA宣布推出一款用于高精度边缘AI的NVIDIA IGX平台,该平台将为这些行业带来了先进、主动的安全性能。NVIDIA IGX将帮助企业建立下一代软件定义的工业和医疗设备,这些设备可以在与人类相同的环境中安全运行。
 
NVIDIA IGX平台是一套强大的硬件和软件组合。在硬件方面,其中就包括NVIDIA IGX Orin这一强大、紧凑、节能的AI超级计算机,用于自主工业机器和医疗设备。该平台强大的软件堆栈具有可针对不同用例进行编程和配置的关键安全功能。凭借这些功能,企业能够提高仓库车间、手术室等人机协作环境的主动安全性。
 
对于医疗行业的边缘AI用例,IGX提供安全、低延迟的AI推理,以满足临床对医疗程序中的一系列仪器和传感器获得即时洞察的需求,例如机器人辅助手术、患者监测系统等。
 
在医疗领域,IGX平台可支持用于医疗设备的实时AI计算平台——NVIDIA Clara Holoscan,实现了新设备的快速开发和部署,将AI应用直接送入手术室,全球每年有超过3亿例手术在这里进行。
 
超过70家医疗器械公司、初创企业和医疗中心已经在使用Holoscan推动AI应用在临床环境中的部署并将医疗设备发展成软件即服务业务模式。比如Activ Surgical、Moon Surgical和Proximie等正在构建新一代手术系统。Moon Surgical表示,通过Clara Holoscan和IGX,新一代Maestro手术机器人助手的影像管道、管理系统和硬件设计工程周期缩短了至少6个月。
 
对于制造业和物流业,IGX为高度监管的实体工厂和仓库提供了额外的安全层。在工业边缘领域,西门子是首批在边缘使用IGX的公司之一。这家工业自动化与数字化领域的技术领导者正在与NVIDIA合作开发未来的自动工厂。西门子正在与NVIDIA一起扩展其在整个工业计算领域的工作,包括数字孪生和工业元宇宙。
 
结语
 
Nvidia所做的不仅仅是设计芯片,在Nvidia公司总共25,000名员工中,有80%是工程师,而且一半以上是从事软件工作。软硬结合之下的NVIDIA,正在将其芯片迈向各个领域,用AI赋能各行各业。
 
责任编辑:sophie

相关文章

半导体行业观察
摩尔芯闻

热门评论