微软将未来押在这个FPGA芯片上

2016-10-23 23:22:00 来源: 互联网

china0513-624x468

本文来自连线,由半导体行业观察根据原文翻译

将时钟回拨到2012年12月,Doug Burger站在当时的微软首席执行官 Steve Ballmer面前,与他畅谈未来。

以脾气暴躁闻名的SteveBallmer坐在Building 99演讲室的地板上,与四年前加入公司的计算机芯片研究员Doug Burger探讨一些芯片技术,这就是Burger口中的Project Catapult。

china0513-624x468

DougBurger.

Burger表示,技术世界正在跨进一个新的阶段。在未来,一些大型的互联网公司会运营一些跟以往不同的复杂互联网业务,而这些公司就需要打造一些全新的架构去运行这些业务,而这并不是通过软件去升级就可以实现的,当中还需要硬件去配合,当中就包括了服务器和网络设备。而Project Catapult就能解决微软的服务器问题,因为他们都会搭载微软特别定制的芯片,去完成这些特殊任务。

在Burger想向Ballmer介绍其最新的想法的时候,后者吃了一惊,因为他最初招聘Burger来微软,只是希望他能够升级研发中心,而不是来做策略介绍的,但Burger的表现出乎Ballmer的意料。Burger表示,再过去40年里,微软只是聚焦在打造Windows, Word和Excel这类的计算机软件,并不需要更多的硬件。而正是因为这样,微软避开了费事、昂贵且bug众多的硬件产业。而微软做硬件芯片就和可口可乐做鱼翅汤一样怪异。

china0513-624x468ProjectCatapult

在演讲室里,Burger娓娓道来,他对Ballmer说,谷歌和亚马逊这样的公司已经开始做出转变,且现在的硬件制造商并不能提供满足微软在线服务所需的硬件服务。如果微软不再做硬件的话,未来一定会落后于其他竞争者,但Ballmer并不认同他的观点。然而一会之后,Bing的运营主管Qi Lu加入了讨论。他表示,他们的团队已经开始了相关的研究。

现在,这个由Berger和Lu打造的FPGA芯片,将会改变这个世界。其实FPGA已经被应用在Bing搜索的支持上,在接下来的数周内,微软将会基于神经网络(模仿人脑结构的人工智能)推动新的搜索算法。借助这个芯片,其执行速度比传统的芯片会快上很多倍,只需要24毫秒就可以实现,规避了以往长达四秒搜索空白的尴尬。

这个全新FPGA同样能够支持微软的云计算服务Azure。在接下来的数年里,微软全球的数百万部的服务器将会装上这个FPGA。“这个给我们带来了很大的灵活性和容量,并带来很大的经济收益”,Burger说。

“这将成为微软的标准,全球的架构”,Breger强调。

china0513-624x468

Catapult团队成员:Adrian Caulfield,Eric Chung, Doug Burger,和Andrew Putnam

这个项目并不是为了帮助Bing追赶Google,这是对未来全球系统转变的一个信号。由于硅芯片的发展不能满足人工智能的需求,从美国的亚马逊到中国的百度,这些互联网都在其服务器上使用其相关标准的芯片。

从目前的情况看来,为了维持其网上业务运转,微软每年需要在硬件上投入50到60亿美元,因此关于这些芯片的追求要投入到实操阶段,2014年接任微软CEO的SatyaNadella对记者说。我们要将其提到优先位置,纳德拉强调。

一种全新的传统计算机芯片

2010 年圣诞节前的某一天,微软的研究员AndrewPutnam 正在度假,突然就接到他Boss Burger 的电话。Burger 告诉Putnam ,节后他会和Bing 的老大会面,因此他需要一个可以在FPGA 上执行Bing 的机器学习算法的硬件。

Putnam 就立刻驱车前往最近的星巴克,打开电脑开始谋划这个项目。

47 岁的Burger 和39 岁的Putnam 之前都是学者,Burger 之前曾在德克萨斯大学奥斯汀分校担任了九年的计算机学教授,在那里,他专门研究微处理器,并设计了一款叫做EDGE 的芯片;而Putnam 则在华盛顿大学担任了五年的研究员,那五年里他一直和FPGA 打交道。虽然FPGA 存在了很长一段时间,但一直以来业内都是用它来做原型验证。2009 年,Burger 把Putnam 招进微软,他们开始探索一个想法——这类FPGA 芯片实际上可以加速在线服务。

这一想法,最初连他们的老板都不认同。Burger 小组的主管、微软的研究所VP Peter Lee 说,每隔两年,FPGA 的时代将要到来的论断,都会被炒热一次。但这次不一样了,Burger 和他的研究小组坚信,FPGA 大显身手的时代已经到来,而Bing 则是最好的测试对象。

china0513-624x468

Project Catapult 的第一个版本,Burger 和他的团队在西雅图园区数据中心测试过了这个硬件

微软的搜索引擎Bing 是一个运行在数千台机器上的在线服务,每台机器都是靠CPU 驱动的。虽然Intel 公司一直在推动硬件升级,但是这些硬件跟不上软件的进步是不争的事实。

尤其是在人工智能潮流兴起以后,Intel 处理器的缺点被进一步放大。

而类似Bing 这类的服务的需求已经超过了摩尔定律,大家发现,单纯靠增加CPU 的数量已经不能解决问题了。

但另一方面,如果为每个新难题打造定制化专用芯片又太过昂贵,FPGA 正好填补了其中的鸿沟。他们让工程师打造比流水线型通用CPU 速度更快(因为FPGA 是真并行)、功耗更低的芯片。可定制化让它能够从容面对瞬息万变的技术和商业模式。

在节后会议上,Burger 主张Bing 在FPGA 上的执行能实现低功耗提速,但并不是很明朗。因此在接下来的几个月中,他们就根据Putnam 的草图去做了一个原型,通过这个原型可以验证,新FPGA 可以将Bing 的机器学习算法提速100 倍。正是这个数据吸引了微软对这个项目的兴趣,这也让Burger 的团队进入了艰难的开发阶段。

原型机是一个内有6 个FPGA 的专用盒,由满满一架子服务器共享。当盒子过热到滋滋作响,或者机器学习算法的复杂度增加到需要多于六个FPGA ,整个系统就会奔溃。这让Bing 的工程师无比抓狂。

因此Burger 的团队又花了好几个月去改进,推出了第二个版本的原型,这是一个能被接入每台服务器的电路板,每个电路板只含有一个FPGA ,但每个FPGA 板都可以连接到其余所有服务器。这样就打造了一大批可以让任何Bing 机器接入的可编程芯片组。

正是这个原型,让Bing 的老大Qi Lu 大感兴趣。他给了Burger 一大笔钱,让他可以用FPGA 建立一个拥有1600 台服务器的测试环境。在台湾和中国大陆制造商的帮助下,Burger 的团队还是花了六个月才打造好这个测试环境。他们最初是在微软园区的数据中心进行了相关测试,但碰上了事故,经过了三天的抢修,一切又回到了正常轨迹。

在2013 和2014 年的好几个月里,测试表明Bing 的“决策树”机器学习算法速度在新芯片的支持下有了四十倍的提升。在2014 年夏天,微软声称会将这个项目移植到Bing 的数据中心中,但稍后他们暂停了这一计划。

除Bing 之外,搜索更多应用

在早些年,Bing 承载了微软的在线野心,但到了2015 年。微软又多了两个大型的在线业务,一个是商务应用Office 365 ;另一个是云计算服务Azure 。和他的所有竞争者一样,微软的掌门人意识到,要让其在线帝国高效的运行,那就需要打造一个统一的稳固基础。如果Project Catapult 将会对改变Bing ,那它也应该进入Azure 和Office 365 的“内芯”。

问题是Azure 高管并不在意如何加速机器学习,他们需要的帮助在于网络连接。而Azure 的数据中心在面对大流量时,也逐渐显得力不从心,因为传统的CPU 已经跟不上他们的步伐了。

终于,Azure 的首席架构师Mark Russinovich 将目光头投向了Project Catapult ,因为他们的服务器同样需要FPGA 芯片,只不过这次需要在服务器和网络之间布置FPGA

china0513-624x468

第一个FPGA 架构原型是一个被所有服务器共享的的盒子(版本0 );之后就每个服务器有一个FPGA (版本1 );之后就是在服务器和整体网络之间布置FPGA

FPGA 团队需要再次重构硬件。因为在第三个版本的原型中,FPGA 是放置在每个服务器的“边缘”,能够直接和网络连接,FPGA 组依然能让任意机器直接接入,这就让它可以为Office 365 助力。

Project Catapult 终于能够活下去了。

据介绍,这个芯片的重构过程是非常痛苦的,不仅仅是因为要建新的硬件,而且每次都需要重新对FPGA 编程。相对于软件编程来说,这简直就是一个噩梦。不但写程序艰难,正确的写程序更是难上加难。

这是一个极度繁琐的工作,就像在芯片上改一个微小的逻辑门那么繁琐。

既然芯片已经有了,那么对于微软来说,他们每次需要面对的挑战就是重新编程这些芯片。去了解这个世界是很艰难的。Project Catapult 比传统的架构节省了30% 的花费和10% 的功耗,而速度则提高了两倍,这些优点让企业离不开它了。

微软Project Catapult 的首次展示的阵仗非常大,Azure 用它去传送数据,而在占有全球20% 桌面搜索和10% 移动搜索的Bing 上,Project Catapult 能够推动其AI 神经网络更进一步。而Office 365 则表示,使用了新的架构,能够大大提高了其压缩和加密的机器学习能力。Burger 表示,这些芯片将会逐渐走进微软的服务器。

不过,这真的奏效吗?

微软Next 研究所的负责人Peter Lee 表示,Project Catapult 还是让他有些困惑。

在纳德拉担任CEO 以后,他一直推进Next 的创新。他希望可以从中看到未来十年或者二十年的趋势。他希望从现在开始,能够改变微软的轨迹。Project Catapult 是当中的一个先行者,展望未来,他们希望在业内缔造一个更庞大的转变,而这一切来源于一个不需要CPU 的技术。

china0513-624x468

Peter Lee

包括微软在内的互联网巨头现在是用GPU 去弥补CPU 的不足,在这些巨头的人脸识别等神经网络应用中,GPU 担任很重要的工作。同样,微软这些巨头也使用硅的替代品去执行神经网络操作。甚至是昂贵的定制芯片,他们也会去尝试。

现在看来,谷歌在自制神经网络芯片上面,走得比较远。那就是早前推出的让Intel 闻风丧胆的TPU

在TPU 上面,谷歌为了速度牺牲了其长期的灵活性,他这样做是为了消灭手机上发起命令的延迟。问题是一旦谷歌的神经网络模式转变,谷歌就需要重新做一个新芯片。

而微软的FPGA 则具有更高的灵活性,从长远来看,是更具备价值的。虽然这个FPGA 并没有谷歌的定制化芯片那么快。但微软可以随着需求的改变重新定义芯片,以满足全新人工智能模式的需求。

china0513-624x468

新版本的硬件,版本2 ,能够直接接入微软的服务器和网络。

微软的服务项目是如此庞大,因此对FPGA 的需求也是海量的,一旦成熟的话,就将会改变芯片市场。

去年Intel 耗费巨资收购了FPGA 老二Altera ,英特尔的执行副总裁Diane Bryant 表示,这笔收购的出发点就是Intel 认为到2020 年,三分之一的服务器将由FPGA 提供计算能力。

在技术领域,GPU 、CPU 、TPU 和FPGA 都是一些不同的而定义。在云计算时代,微软、谷歌和亚马逊这些企业推动技术的大踏步发展,它们所推出的那些替代芯片也会让APP 和在线服务的应用范围更广。Peter Lee 认为,到2030 年,微软还能扩大其超级计算机的全球影响力,而在那之后,将会是量子计算的时代。

在最后,纳德拉谈到了微软的量子计算计划,虽然这看起来有点像空中楼阁,但多年前的Project Catapult 又何尝不是这样?

摩尔精英

china0513-624x468

【关于转载】:转载仅限全文转载并完整保留文章标题及内容,不得删改、添加内容绕开原创保护,且文章开头必须注明:转自“ 半导体行业观察icbank”微信公众号。谢谢合作!

【关于投稿】:欢迎半导体精英投稿,一经录用将署名刊登,红包重谢!来稿邮件请在标题标明“投稿”,并在稿件中注明姓名、电话、单位和职务。欢迎添加我的个人微信号MooreRen001或发邮件到 jyzhang@moore.ren

china0513-624x468

点击阅读原文,查看更多半导体高薪职位

责任编辑:mooreelite
半导体行业观察
摩尔芯闻

热门评论