[原创] 国产GPU如何实现长期制胜?

2022-08-13 14:00:02 来源: 半导体行业观察

近年来,受需求以及政策、资本的推动,作为图形渲染和智能计算的航母平台的GPU成为市场宠儿,一众GPU厂商站上时代潮头。


据Verified Market Research数据统计,2027年全球GPU市场规模有望达到1853.1亿美元,年平均增速高达32.82%,千亿级赛道风口已至。


全球GPU市场规模走势预测


其中,中国GPU市场规模和增长潜力巨大。据赛迪数据显示,2021年中国大陆GPU市场规模约为70亿美元。在当前地缘政治、大国博弈的背景下,相较于有一定积累的国产CPU,GPU的破局更具紧迫性和必要性。国产GPU不仅孕育着千亿量级的市场空间,还承担着国产替代和打破巨头垄断的重任。


随着国内GPU赛道上一个又一个有力的“新跑手”交出真刀真枪的产品,国产GPU正迅速走过“从无到有”,进入“从可用到好用”的迭代阶段。


在此趋势和背景下,芯动科技“风华2号”GPU新品隆重面市。


“风华2号”的创新与突破


据介绍,“风华2号”是一款集超低功耗、强渲染、4K高清三屏显示、4K视频解码及智能AI计算于一体的桌面和笔记本GPU,实现了多个自研技术的创新突破。


在新品发布现场,“风华2号”GPU通过基准测试跑分、办公软件、工程制图、GIS到游戏娱乐等多种重度典型应用的现场实时演示,向业界全方位展示了其领跑国产桌面、笔记本电脑和工控机赛道的能效,表现震撼全场。



芯动科技CEO敖海展示了采用“风华2号”GPU芯片的无风扇板卡


超低功耗是“风华2号”桌面级GPU的主打亮点。发布现场,“风华2号”实测能效比领先,在统信4K桌面环境,芯动工程师现场演示了金山WPS、视频网站、中望CAD、glmark等各种典型桌面渲染应用,操作流畅。桌面应用典型功耗4-15W,实测结果显示,风华2号运行在低功耗模式下时,即使同时开启多种应用,工作功耗仅在4瓦左右,其能效比远优于市场同等算力产品。而其低散热要求也使得系统可靠性大大增加,可以支持无风扇设计,支持笔记本和MXM一体机。


强渲染能力是“风华2号”的另一突出优势,也是此前国内GPU的布局痛点和技术难点。


风华2号支持三屏高清显示(演示场景为CAD制图、高清视频、曼哈顿)


近年,国产GPU市场异常火热,本土GPU厂商融资和产品开发进展频频,不仅受到了资本的青睐支持,也取得了技术层面的实际突破。其中大多数厂商专注于通用GPU(GPGPU)研发,这种GPU主要处理原本由CPU负责的通用计算任务,实现相对简单的AI运算,并不具备图形渲染能力,而具备图像渲染能力的自主GPU国内鲜见。


去年底,芯动发布的数据中心服务器GPU“风华1号”,首次突破了国内GPU渲染能力瓶颈,像素填充率达到160GPixel/秒,FP32浮点算力达到5T FLOPS。在云应用和数据中心领域首次实现多用户1080P和多路硬件虚拟化、各种高清编解码/转码功能,支持数据中心服务器高密度图形渲染,大幅提升了国产GPU的渲染能力,在5G数据中心渲染性能上能够对标国外主流显卡。


风华1号可同时支持16路1080P云游戏


如今“风华2号”的问世,再次不负所望,在多操作系统下的能效比和功能性都不输国际水准,使得我们的桌面级GPU技术拥有了“门面担当”。


“风华2号”GPU像素填充率48GPixel/秒,FP32浮点算力1.5TFLOPS,基准跑分成绩领先。工程师现场展示了在麒麟操作系统下风华2号GLmark2基准测试实测评分超过6500。通过Unigine Heaven重度基准测试,充分展现了OpenGL4.3的能力,并在演示过程中突出了曲面细分(Tessellation)的渲染效果,形象立体。


风华2号在Unigine Heaven下的OpenGL4.3水平


同时,“风华2号”还支持4K级三屏高清显示,无论是办公上网视频,还是多媒体娱乐以及苍穹GIS应用上均有优秀表现。现场工程师还即兴试玩了Linux下最新的重量级赛车游戏,画面流畅逼真,渲染能力游刃有余,必将成为游戏玩家和极客们的福音。


风华2号演示Linux下重度赛车游戏


风华2号GPU比肩国际的功能和能效还表现在卓越的AI计算能力上。风华2号支持科学/边缘计算,AI性能超过12.5TOPS,支持人脸识别、目标识别、语义分割、图像超分辨率等多种场景实时应用,超过传统低功耗桌面显卡的AI计算水平。


除了性能表现,GPU的使用同样离不开其通用性和适配性,“风华2号”还实现了多平台兼容,已与统信和麒麟等操作系统完成互认证, 并全面支持飞腾、龙芯、申威、海光、兆芯、鲲鹏等主流国产CPU平台,在国产系统上进行苍穹GIS空间地图实时渲染游刃有余。


“风华2号”在Windows10系统上的渲染展示


值得关注的是,“风华2号”已经流畅支持微软Win10 DirectX图形框架。据悉,Windows DirectX 11严格要求支持包括曲面细分在内的各种高级渲染技术,开发难度极大,至今全球只有少数几家公司的GPU支持了Windows DirectX 11。发布现场,芯动工程师演示了Win10操作系统下的QQ通讯、办公上网和娱乐游戏等各种应用,风华2号完美实现了多种复杂场景的流畅渲染和曲面细分的细节呈现,3D渲染性能完全能够满足日常工作娱乐所需。


对于“风华2号”的优势,芯动科技CEO敖海总结出 自研率领先、能效比领先、渲染力领先、

AI计算领先、兼容性领先、高安全高可靠、高带宽领先、3屏4K显示 等八大亮点。



“风华2号”诸多优势背后,凝聚着芯动科技16年来匠心打磨的众多全球顶尖高性能计算IP,正如风华1号采用了全球首款GDDR6/6X Combo高性能IP,使得其显存带宽领先。“风华2号”再现芯动黑科技,自研了全球首款速度最高LPDDR5X显存技术,在桌面级低功耗水平下达到10Gbps带宽新高。


“风华2号”GPU自研率非常突出,诸如PCIe3.0、LPDDR5/4、HDMI2.0/DP/eDP1.4/VGA、中国专利的物理不可克隆PUF安全技术,都是芯动长期对外授权的自研优势技术。也是由于芯动接口技术的优势,其产品的普适性非常强,板卡支持长鑫、长存等内存、显存、电源管理芯片,成为从IP到板卡的国产化自研率突出的显卡产品,产品性能优越,实现了里程碑式的突破。


芯动科技针对高性能计算的全栈底层核心技术和一站式服务


GPU的自研率必然要看内核的自主演进程度。芯动和苹果公司一样,在最初架构授权的基础上不断优化GPU内核,凭借团队强大的IP自研能力和全栈底层核心技术的创新能力,现已完整独立掌握了GPU内核演进架构图,有了自己的GPU架构把控,并且有能力做到未来三年每年发布两款GPU。比如‘风华2号’能够支持到DX11/OpenGL4.2以上API,这些都是原来的GPU架构所不具备的。


国产GPU如何制胜


风华系列GPU芯片的成功研发还只是开始,更重要的问题是产品如何实现规模化商用,国产GPU又如何共建新生态和推动替代进程。对此,芯动科技副总裁毛鸣明表示,芯动科技的优势在于可以更贴近客户、贴近需求,在软硬件设计和配套方案方面做出差异化、定制化。


芯动科技GPU项目总监何颖(左)、芯动科技副总裁毛鸣明(右)接受媒体采访


毛鸣明强调,“芯片产品的成功需要大量流片验证和量产出货,而可持续的落地场景是长期规模化发展的关键驱动力。”进入新领域时,芯动科技不在存量市场上跟行业巨头进行正面竞争,而以“风华1号”先立足于国产数据中心服务器市场,“风华2号”则在低功耗桌面级GPU开辟一条新出路。“先把当前市场做好,通过快速的技术升级和产品迭代站稳脚跟,进而紧跟云渲染指数级增长的态势向前发展,积累到一定程度或许会逐渐进入更多增量市场。”


芯片国产化的趋势也给本土厂商带来了新机遇,就国产GPU生态如何制胜这一话题,现场参加圆桌论坛的专家们认为,行业上下游伙伴、学术机构、科研院所等需要通力合作、共建生态才能实现长期共赢。而国产GPU从能用到好用是一个漫长的过程,需要时间推广、布局、优化、提升,更需要用户的支持、包容与纠错。精准定位客户需求,发挥本土企业功能定制化和响应及时性、产品通用性优势,是风华系列GPU独辟蹊径的核心,也是国产GPU当下的出路之一。目前,风华系列GPU正在与国内外软硬件厂商积极适配,不断完善国产GPU生态,赋能国产GPU生态链建设。


风华的未来之路


从需求端考虑,GPU的优势在于并行计算。展望未来,GPU将聚焦两大应用发展方向,即更逼真的图形显现和更高算力的科学计算。


一方面,图形显现是GPU芯片最初的功能,随着视觉科技和虚拟现实技术的发展,更加真实的图形显现效果会对GPU的并行计算能力提出更高的要求。另一方面,高性能计算又分为通用计算和人工智能计算,通用计算是来处理一些原本CPU可以处理、但是更适合拥有强大浮点计算能力的GPU处理的运算,比如人脸识别等;不同于传统基于流处理器的GPU,用于AI计算的GPU大多数情况下浮点计算精度要求较低,但对计算吞吐量要求较高。


芯动科技首席GPU科学家杨喜乐博士表示,风华将针对办公桌面、车载智能座舱、云游戏、云计算等市场及相关衍生需求,持续推出GPU新产品,设计演进先进的GPU架构,实现顶尖的渲染性能,同时兼顾低功耗、高度扩展性设计,满足客户的不同需求。未来几款风华GPU也会支持光线追踪等最先进的图形处理生态,进一步支持Direct X12、OpenGL4.6、Vulkan等框架;不仅如此,未来芯动还会开发高性能GPGPU,以满足AI训练推理、图像处理、通用计算、科学及工程计算等广泛应用领域。


敖海也表示,“风华2号”是芯动赋能桌面生态链的开始,将拉开风华系列GPU走向大众市场的序幕。目前“风华3号”已基本完成研发,将为国内用户提供超大算力光追等酷炫性能;GPGPU和座舱产品也正与客户定义中,未来更多定制计算产品线将接踵而至。


可以看到,强悍迭代能力是芯动的固有优势,靠自有IP和定制能力以及代工厂合作伙伴的支持,不断演进先进技术,确保性能持续领先、供应链安全和优势性价比,芯动科技正在对标国际前沿的道路上愈走愈远,一马当先,开拓国产GPU的新未来。


写在最后


发布会现场,赛迪顾问集成电路产业研究中心一级咨询专家池宪念表示,过去20多年里,GPU的需求来源于视频加速、2D/3D游戏,后来利用自身并行处理和通用计算的优势,逐步开拓出服务器、汽车、人工智能、物联网、边缘计算等新领域的衍生需求。


“云化”加速时代,GPU与CPU组成了异构计算的运算体系,从底层由系统软件和驱动层支持着上层的各种应用,GPU也逐渐成为了专用计算时代的刚需。


面对国际巨头的激烈竞争,国产GPU何去何从,池宪念给出了三点建议:其一,目前国内GPU产品被国外垄断严重,需要从低端产品到高端产品逐渐布局,利用政策和成本优势逐渐占领市场。其二,调研和跟踪国际龙头发展路径与研发动态,建立产品研发和应用生态,建立软硬件结合的一体化循环产品,增加客户粘性。最后,呼吁投资者对GPU企业给予更多关注,让国内企业有开发产品、发展市场的资金支持和前进动力。


综合来看,国产GPU行业的发展,需要产业各界给予耐心与支持。芯动科技频频发力,风华GPU正成为加速国产GPU产业发展与突围的“利器”。



*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。


今天是《半导体行业观察》为您分享的第3129期内容,欢迎关注。

推荐阅读


国产桌面级GPU芯片“风华2号”惊艳亮相,超低功耗支持无风扇设计

国产GPU奋起直追,芯动科技一马当先

国产GPU初露曙光


半导体行业观察

半导体第一垂直媒体

实时 专业 原创 深度


识别二维码 ,回复下方关键词,阅读更多

晶圆|集成电路|设备|汽车芯片|存储|台积电|AI|封装

回复 投稿 ,看《如何成为“半导体行业观察”的一员 》

回复 搜索 ,还能轻松找到其他你感兴趣的文章!

责任编辑:Sophie
半导体行业观察
摩尔芯闻

热门评论