传奇芯片设计师Jim Keller投身自研RISC-V

2022-06-29 14:00:27 来源: 半导体行业观察

来源:内容来自 导体行业观察(ID:icbank)综合 ,谢谢。

在半导体行业观察之前发布的一个由传奇芯片设计师Jim Keller发表的题为《Future of Compute》 (点击文末 阅读原文 即可查看本视频) 的视频里披露了一个细节,那就是Jim Keller所在的公司tenstorrent正在开发一款名为Ascalon 的RISC-V处理器。



这一方面透露,这个传奇芯片设计师对这个新兴架构重视程度很高。另一方面,也表明他们已经从之前授权转向了自研。


在去年四月,有报道指出,Tenstorrent已获得 SiFive 基于 RISC-V 架构开发的通用 CPU 设计的许可。报道强调,该许可通用内核和 IP 将加快 Tenstorrent 产品的上市时间。


资料显示,Tenstorrent 基于其针对机器学习 (ML) 优化的 Tensix 处理器内核开发高性能 AI 训练和推理片上系统架构。为了运行传统工作负载,Tenstorrent 的 SoC 将使用 SiFive 新的通用智能 X280 基于 64 位 RISC-V 的内核以及完全集成的 512 位宽 RISC-V 矢量扩展 (RVV)。


除了 SiFive 的 Intelligence X280 IP,Tenstorrent 还将获得 RISC-V 软件堆栈,这将进一步加快 AI SoC 公司的上市时间。


Jim Keller谈RISC-V


在之前接受anandtech采访的时候,Jim keller曾经就risc-v发表了观点。


当时的采访者问Jim keller: “您过去曾谈到 CPU 指令集,而我在这次采访中收到的最大请求之一是请您谈一下对 CPU 指令集的看法。具体问题是关于我们应该如何处理对它们的基本限制,我们如何转向更好的限制,以及在 ARM、x86 和 RISC V 方面,你都是什么观点。”


Jim keller回应道: [争论指令集]是一个非常悲伤的故事。它甚至不是几十个 [操作码] ,而是80% 的核心执行只有 6 条指令 ,加载((load)、存储(store)、加(add)、减(subtract)、比较(compare)和分支(branch)。有了这些,你几乎已经涵盖了它。如果您使用 Perl 或其他语言编写代码,则调用和返回可能比比较和分支更重要。但是指令集只有一点点重要——你可能会因为缺少指令而损失 10% 或 20% [性能]。


有一段时间我们认为可变长度指令(variable-length)真的很难解码。但我们一直在想办法做到这一点。您基本上可以预测所有指令在表格中的位置,一旦有了好的预测器,您就可以很好地预测这些内容。因此,当您构建小型计算机时,固定长度的指令似乎非常好,但是如果您正在构建一台真正的大型计算机,要预测或找出所有指令的位置,它并不能支配模具。所以没有那么重要。


RISC 刚出现时,x86 是半微码。所以如果你看看芯片,一半的芯片是 ROM,或者可能是三分之一或其他东西。RISC 人员可以说 RISC 芯片上没有 ROM,因此我们获得了更高的性能。但是现在ROM这么小,你找不到它。其实加法器这么小,你怎么都找不到?今天限制计算机性能的是可预测性,其中两大因素是指令/分支可预测性和数据局部性。


现在,新的预测器非常擅长这一点。它们很大 -,两个预测器比加法器大得多。这就是您进入 CPU 与 GPU(或 AI 引擎)辩论的地方。GPU 人员会说“看,没有分支预测器,因为我们并行执行所有操作”。所以芯片有更多的加法器和减法器,如果这就是你的问题,那就对了。但是他们在运行 C 程序方面很糟糕。


GPU 是为在像素上运行着色器程序而构建的,因此如果给定 800 万像素,而大型 GPU 现在有 6000 个线程,则您可以覆盖所有像素,每个像素每帧运行 1000 个程序。但这有点像一群携带沙粒的蚂蚁,而大型人工智能计算机,它们具有非常大的矩阵乘法器。他们喜欢数量少得多的线程来做更多的数学运算,因为问题本身就很大。而着色器的问题是问题本质上很小,因为像素太多。


真正存在三种不同类型的计算机:CPU、GPU 和 AI。英伟达正在做一些“中间人”的事情,他们使用 GPU 来运行人工智能,并试图增强它。其中一些显然工作得很好,而其中一些显然相当复杂。有趣的是,这种情况经常发生,通用 CPU 在看到 GPU 的矢量性能时,添加了矢量单元。有时这很好,因为你只有一点点矢量计算要做,但如果你有很多,GPU 可能是更好的解决方案。


提问者进一步提到: “那么回到 ISA 问题——很多人都在问你对 Arm 与 x86 的看法如何?你是怎么看。”


Jim keller接着说: 我有点在意。这就是发生的事情 。当 x86 首次出现时,它非常简单和干净,对吧?当时,有多种 8 位架构:x86、6800、6502。当时我可能对所有这些架构都进行了编程。然后奇怪的是,x86 是开放版本。他们将其授权给七家不同的公司。这给了人们机会,但英特尔出人意料地授权了它。然后他们去了 16 位和 32 位,然后他们添加了虚拟内存、虚拟化、安全性,然后是 64 位和更多功能。因此,当您添加内容时,架构会发生什么,您保留旧内容以使其兼容。


所以当 Arm 刚出来的时候,它也是一台干净的 32 位计算机。与 x86 相比,它看起来更简单,更容易构建。然后他们添加了一个 16 位模式和 IT(如果有的话)指令,这很糟糕。然后 [他们添加] 一个奇怪的浮点向量扩展集,在寄存器文件中带有覆盖,然后是 64 位,部分清理了它。有一些特殊的东西用于安全和启动,所以它变得更加复杂。


现在 RISC-V 出现了,它是闪亮的新表亲,对吧?因为没有历史遗留问题。它实际上是一个开放的指令集架构,人们在大学里构建它,他们没有时间或兴趣添加太多垃圾,就像某些架构那样。所以相对而言,仅仅因为它的血统和年龄,它处于复杂性生命周期的早期。这是一个非常好的指令集,他们做得很好。因此,如果我只是想说我今天是否想要真正快速地构建一台计算机,并且我希望它运行得更快,那么 RISC-V 是最容易选择的。这是最简单的一个,它拥有所有正确的功能,它拥有您实际需要优化的正确的前八条指令,而且它没有太多的垃圾。


★ 点击文末 【阅读原文】 ,可查看视频 《Future of Compute》 ~

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。


今天是《半导体行业观察》为您分享的第3085内容,欢迎关注。

推荐阅读


台积电先进封装,最新进展

EUV光刻机最新路线图

车用SiC,迎来800V风口


半导体行业观察

半导体第一垂直媒体

实时 专业 原创 深度


识别二维码 ,回复下方关键词,阅读更多

晶圆|集成电路|设备 |汽车芯片|存储|台积电|AI|封装

回复 投稿 ,看《如何成为“半导体行业观察”的一员 》

回复 搜索 ,还能轻松找到其他你感兴趣的文章!

责任编辑:Sophie

相关文章

半导体行业观察
摩尔芯闻

热门评论