刚刚,平头哥发布了一款芯片

2023-11-01 18:03:07 来源: 互联网
在今天举办的云栖大会上,阿里巴巴平头哥发布了旗下首颗SSD主控芯片镇岳510。
 
众所周知,在过去几年里,云计算市场正在发生翻天覆地的变化,这就驱使服务器里面的算力构成产生了新的变革,催生了算力、网力和存力三大“力”。其中,“算力”除了有传统的CPU在继续发生作用,新崛起的GPU和NPU等加速器正在算力市场发挥重要作用;“网力”则是在网络的变化下,驱动传统的网卡走向了Smart NiC和DPU。
 
此外,当前的云计算还给“存力”提出了新的需求,这正是平头哥定义了镇岳510的原因。
 
一颗自研的芯片
 
据介绍,作为平头哥旗下第一颗SSD主控芯片,镇岳510内置玄铁910 RISC-V多核CPU,采用平头哥自研紧耦合芯片架构,对SSD任务进行高度抽象,可固化任务硬化为加速算子以提升性能,FTL关键任务则运行于玄铁910 CPU以保持灵活性。这让其拥有足够的能力去支持先进的PCIe 5.0接口和DDR5.0技术。而通过自研LDPC纠错算法与介质电压预测算法,镇岳510获得了更高的可靠性,误码率比业内标杆领先1个数量级。


 
从算力上看,镇岳510也不遑多让。数据显示,平头哥的这颗SSD控制器芯片每秒可处理高达340万笔IO,这意味着一枚镇岳510的性能,相当于1万块高性能HDD的性能总和。
 
得益于领先的设计,镇岳510还拥有极高的能效比,每瓦功耗可提供42万笔IO访问,这样带来的功耗节省是巨大的。
 
平头哥方面举例说,以一个部署了10万块SSD的数据中心为例,相比目前主流的PCIe 4.0SSD,镇岳510在相同的性能下,仅主控芯片即每年节省260万度电,按照一度电排放0.785千克二氧化碳计算,每年可减少二氧化碳排放2千吨。
 

 
此外,该芯片还针对云计算场景进行了深度优化,让镇岳510与云存储软件系统紧密融合协作,有效降低数据读写的延时,为系统带来了更高的性能。例如,镇岳510在支持NVMe的队列级调度机制的同时,额外实现了更精细、更灵活的IO级调度机制,结合云存储系统,能更好地满足延迟敏感型IO场景的需求。
 

 
据平头哥方面介绍,镇岳510不仅具备更强存力、更高可靠等特点,通过为云定制,该芯片还带来了更多优秀的存储体验。
 
例如,通过完美实现ZNS协议,镇岳510消减了“SSD接口税”,并通过灵活的硬件表项加速保持了高IO性能,而Zone分区状态则交由玄铁910CPU维护,保留了对新协议的灵活性。此外,镇岳510定制了Last Sector 随机写功能,实现了小报文的多次反复下盘,简化了ZNS的应用难度;同时,镇岳510在支持NVMe标准的SQ调度机制的同时,还额外定制了基于IO粒度的优先级调度机制,允许系统按IO打标,优先级种类多达8级,结合云存储系统,能够更好的保障延迟敏感型业务的服务质量;最后,镇岳510还以IO为粒度,遵循上层存储语义进行校验,补齐了整个存储系统的数据链路校验的最后一环。
 
不仅如此,镇岳510还支持以存储语义对内部数据进行后台巡检,而无需再读出至服务器,节省了宝贵的PCIe带宽、服务器内存带宽与CPU算力。
 
定制化势在必行
 
从上面的介绍可以看到,阿里巴巴平头哥这颗芯片不仅是一颗自研的芯片,而且在很多方面是做了定制的。在平头哥看来,这是发展的一条必经道路。如大众所熟知,云计算符合冯诺依曼架构——数据从存储设备中取出,通过网络传送到计算单元,运算结果通过网络传输至存储设备中保存。 不错,随着“算力”的指数级增长,“网力”的快速演进,“存力”也面临新的挑战,这首先就体现在SSD层面。
 
首先,作为计算数据的来源与结果数据的目的地,SSD读写吞吐速率的高低,将制约整个计算系统的性能;
 
其次,云上为了提高并发能力,业务请求通常会被拆分为多笔子请求分散到众多SSD并发执行。任何一块SSD的时延发生抖动,都会造成整个业务请求的延迟。这就使得稳定的延迟变得更加重要;
 
第三,绿色、减碳是云数据中心的一贯追求。如何提升能效,以更低的功耗,提供更高的性能,是SSD的重要挑战,这就促使厂商在其上追求更好的TCO; 

最后,提高数据中心资源利用率是云的核心诉求。这就促使行业去提高SSD的存储密度,在单块SSD内提供更大的存储容量,以有效减少所需部署的服务器数量、交换机/路由器数量。
 
在上述多种因素的影响下,云开始与底层芯片全方位融合联合设计,提供更好的用户体验。其主要聚焦的方向就包括了消除SSD接口税(通过存储软件与NAND特性完美契合,达到数据排布的最优化,后台操作的最小化)、全链路QoS优化(延迟敏感型与带宽敏感型IO实现了精细化区分处理,提升延迟敏感型IO的SLA)和智能卸载(可靠性计算卸载至SSD,实现全路径存储语义校验,同时也减轻了服务器主机算力开销)。
 
这也正是平头哥在设计镇岳510的时候所专注的目标。
 
过去5年,平头哥已推出多款算力芯片,其云原生处理器芯片倚天710已在阿里云数据中心规模化部署,算力性价比提升超30%,已服务100多家电商、短视频、在线教育等领域客户。此次镇岳510的问世,意味着平头哥的芯片产品家族从算力扩展到了存力领域,进一步为云计算行业提供高性价比的技术底座。

责任编辑:sophie

相关文章

半导体行业观察
摩尔芯闻

热门评论