传奇芯片大师 Jim Keller:RISC-V、英伟达与 AI 的未来

栏目:行业报道作者:阿法兔来源:阿法兔研究笔记发布:2023-07-06浏览:89058

ARM 开始推动服务器的发展,之后 RISC-V 出现了,混沌时代来临。

 

撰文: 阿法兔

 

在诸如数据中心和高性能计算领域,初创 AI 芯片公司如何与英伟达竞争?

 

  • 关于 AI 时代的混乱与秩序
  • 关于 X86 和 RISC-V
  • 关于人类与 AI 的关系

 

Jim Keller 是一位传奇 CPU 设计师,以其出色的技术才能和对计算机架构的深刻理解而闻名,半导体行业有着广泛的经验和卓越的成就(阿法兔是他的粉丝)

 

先简单介绍一下,他的经历为什么传奇:

 

1990 年,Jim Keller 开始在 AMD 工作,参设计开发了 AMD K7(Athlon) 处理器的开发,这款芯片,也是 AMD 第一款直接能跟 Intel 正面竞争的处理器。

 

1999 年到 2004 之间,Jim Keller 再次回到 AMD,担任首席架构师的,他也是 AMD64 指令集架构的主要设计师之一,并且,他的设计理念,对 AMD 的 Hammer 项目 ( 包括 Opteron 和 Athlon 64 处理器 ) 产生了深远的影响。2004 年到 2008 年,Jim Keller 在 P.A. Semi 工作时,协助开发了低功耗 PowerPC 处理器。

 

2008 年到 2012 年,也正是 Jim Keller 在苹果工作的期间,主导开发了 Apple A4 和 A5 芯片,这些芯片被用于 iPhone 和其他 Apple 产品,这些芯片的设计和架构,不仅对苹果的未来,也对整个移动处理器发展格局产生了深远的影响。

 

2012 年,他再次回到 AMD,主导开发了 Zen 架构,对 AMD 的再次复兴起到了关键作用。2015 年到 2017,Jim Keller 加入特斯拉负责开发自动驾驶硬件,之后去了 Intel 担任高级副总裁。2021 年,Jim Keller 开始参与创业,担任 Tenstorrent 的创始人之一。

 

除了在这些知名公司工作外,Keller 还是 RISC-V 开源指令集架构的积极支持者。他相信 RISC-V 具有巨大的潜力,并预测在未来的 5 到 10 年里,RISC-V 将在数据中心和科学计算领域取得主导地位。他对 RISC-V 的支持在业界引起了广泛关注。近年来,Keller 担任了 AI 芯片公司 Tenstorrent 的首席技术官(CTO),并在 2023 年初接任该公司的首席执行官(CEO)。他在 Tenstorrent 的领导下致力于推动开源硬件和软件的发展,希望将 Tenstorrent 的 AI 软件堆栈开源,让用户能够自由地定制和编程。

 

改天我们有详细讲讲硅仙人的故事,今天这篇,主要是来自 Jim Keller 近日接受 EE Times 的采访的几个核心观点,针对目前火热的 AI 市场,Jim Keller 提出了自己的观点,并且解释了几个关键问题。

 

问题:在诸如数据中心和高性能计算领域,初创 AI 芯片公司如何与英伟达竞争?

 

Jim:历史上经常会上演类似的剧本,当一家公司变成巨头,就会获得很多关注,市场也会关注利润率、盈利、市场,但是,当世界处于变革期的时候,情况又会如何?接下来的几年里,会看到很有趣的事情,因为 AI 一直都是非常开放的领域。很多重要研究都是开源的,有人发布新东西,有人 Fork,有人继续改进迭代。

 

但是,如此开放的 AI 堆栈,目前却被少数几个大玩家主导。另一方面,建立最厉害最牛的模型的成本非常高。也许有的人对此感到高兴,因为他们认为这属于所谓的「壁垒」,还有的人则担心,如果地球上只有三家公司能够花得起构建人工智能的钱,那这个世界又会怎么样?

 

这种情况,为小公司创造了机会,因为每个人都想构建属于自己的、AI 时代的计算机,而这就是我们的机会。举个例子,英特尔最早属于开放架构,有 7 个许可 证,而 8086 之所以能击败 Z80、6502 和 68000,是因为有多个参与者,正是因为英特尔拥有 AMD 这样的竞争对手,才在一定程度上让他们保持谦虚谨慎。

 

我认为开源非常重要,目前,我们已经在慢慢见证这种变化,因为曾经以前有很多计算机公司变得成功时,就开始忽视市场的声音,这类变革已经在历史上发生了很多次,并且会继续发生。

 

关于 X86 和 RISC-V

 

我相信在未来 5 到 10 年内,RISC-V 将遍布所有数据中心,特别是和超级计算机相关的部分。我们与多个超级计算机制造方交流,这些人都是向量化、编译器、向量浮点性能领域世界级专家,他们有专有需求,但目前大厂商没法满足。

 

超级计算机的需求和进展,包括定制化需求,结合 RISC-V 的软件生态系统发展的速度,未来会有一些不一样。这里有以下几个原因:

 

首先,很多以前基于英特尔的数据中心用的是 Linux(开源),但也存在不少专有系统管理软件(Intel 在计算机的计算机硬件和操作系统之间的那层)。比如说,当 AMD 发布了一个不错的产品时,由于没有获得英特尔的专有系统管理代码,AMD 的产品就无法正常工作,很多代码必须以开源的方式编写。

 

其次,应该关注的不是底层是 x86 还是 ARM,而是软件是是不是开源。

 

ARM 也在发展成为服务器平台,我们的创业公司,正在与印度的一家公司合作制造服务器产品,6 个月内,我们在 RISC-V 模拟器上启动了服务器软件堆栈(本来认为这个进程需要一年多)。Google 也将 Android 移植到 RISC-V 上。RISC-V 的变革将加速,而且所有这些软件都是开源的,这些会卷进来更多的协同贡献。(这里硅仙人指的是需要从 x86,也就是 riscv 的竞品的生态伙伴中,争取出一些人和业务来,支持 risc-v)

 

关于混乱与秩序:The role of chaos in innovation, and whether AI can innovate

 

Jim Keller: 乔布斯相信,并且清晰地知道如何构造最佳的技术,他总想要自己亲自动手。类似于 Google、Microsoft 等公司拥有海量的数据,当人们销售产品时,肯定会更倾向于销售自己想要销售的东西。

 

亚马逊云科技发布自研云计算 Graviton 是一个很好的例子,针对自己的工作负 载进行优化,也许会节省一些成本,但有趣的地方在于,当有 20~40 的人在同时构造自己的服务器时,会发生什么?(成本太高了,硅仙人认为应该让亚马逊找专业的人做专业的事情,自研成本太高了)

 

在单一的世界里,你按部就班,关注一些客户,忽略其他信号。但是投入的人越多,乱和随机性的机也会大大增加。每当有转折点时,会看到更多的人参与其中。

 

所以,ARM 开始推动服务器的发展,之后 RISC-V 出现了,它更倾向于让混乱(混沌)来临。(意思就是,ARM 本来有意要抢占 X86 市场的,X86 原来只有 RM 一个竞争对手,现在 RISC-V 进来,开始一起竞争,混沌就来临了)

 

Andy Grove(英特尔前 CEO)曾说过:让混乱来临,然后再把混乱控制住。他懂得如何从混乱的世界走向秩序的世界,管理者往往难以理解 Andy 的话,因为他们外部视角看 Intel,感觉这个企业非常有纪律。但是其实,在设计方面,英特尔是自由奔放的,但把伟大的设计理念转化为高度精炼的产品,是非常艰难的智力过程创新的增长是必须的,人们通过创新来达到目标,问题是,我们能否在成功的同时保持创新。这是一项智力挑战,许多公司曾经都试图这样做过,然后世界就发生变化了,然后很多过去的公司就因为没有创新而直接死掉了。

 

对于成功的公司来说,他们有成本去进行更多的投入,并且引进技术、优化成本。混乱会继续,更多实验也会继续,但是有没有机会,咱搞点新玩意?人们通常会关注成熟的技术,比如说,那些在二战中制造喷气发动机引擎的人,但历史的发展告诉我们,20 年后,所有的引擎都变成了电动马达。

 

市面上有一种说法:只要业务比 Nvidia 更加细分,就能更好地与 Nvidia 竞争,你怎么看这种观点?

 

Jim:  我感觉这种做法不会成功。重点在于,模型在不断变化,要考虑生成模型、训练、稳定扩散模型(Stable Diffusion Models)是关于语言,还是图像,所有等等这些都是计算平台。你不会仅通过专注某个细分场景,就能轻易打败败那些投入数十亿美元进行研究并积累深厚经验的现有公司。

 

Nvidia 已经非常专注,想要竞争,就必须做些不同的事情,或者找一个不同的商业模式或市场,大公司的问题在于,它们业务版图很大,但对于个人而言,如果你有一个伟大的创意,但一开始可能只能赚十万美元,对大公司来说,就很难执行,这属于正常的商业逻辑。

 

伟大的公司在于,它们能提前看到转机。例如,Jensen Huang(黄仁勋)早在 AI 成为现实之前就预见到了 AI 的重要性,这考验的是前瞻性。

 

重新思考人类和 AI 的关系:过去的几个月里, AI 在公众眼中的形象因为 ChatGPT 出现发生了很大的转变,你怎么看?

 

Jim:我有朋友说,过去大家认为, 想要赢国际象棋比赛,必须制作一个非常智能的系统,然后当有人制作了一个在国际象棋比赛中获胜的电脑,人们又会说,哦,那不是真正的智能,要赢围棋才是算真正的智能。我们人类一直在谈论什么是智能,但是没有真正审视我们人类自己,我们到底做什么?

 

我认为如何定义智能,是关键问题所在,我们以目标为导向, 我们是问题解决者,能够设想未来,能够处理各种场景,我们可以制定计划,可以做出判断,可以识别事物,将这些组合在一个有趣的循环中,头脑中有一个关于我们是谁,为什么这样做的陈述。

 

叙述在人类做决策之后才形成,那么,人类在思考世界时是否有自由意志?因为思想通常落后于我们的行为半秒。

 

不过,我认为这次 AI 泡沫周期,是挺不可思议的。它既存在积极的一面,也存在消极的的一面,我们很激动,但也会感到恐惧。互联网、移动革命、PC 革命,它们开辟了新的大门,使新科技和新世界成为可能。

 

举个例子:我的一部手机,凝结了超过一万亿美元的技术,但屏幕有了个裂缝。如果乔布斯还活着,他肯定会对此不满,为什么要制造一个一掉在地上就会裂开的手机?

 

我并没有修理我的手机,因为手机上的裂缝,时刻提醒我人类是不完美的。现在,AI 让我们重新审视智能应用、软件工作的方式,也以极快的速度嵌入到各种事物中,5 年后,没有人会记得刚出来的时候是什么样子。创新很神奇,人类非常擅长通过随机化一些思维,然后创造东西。这种情况发生在比你意识到的更低、更高或更深的抽象层次上。那种灵光一现的时刻并不是来自宇宙的信息,而是来自你没有意识到的抽象层的信息。

 

关于监管:Sam Altman 在美国参议院谈论 AI 应该如何受到监管, 您对 AI 的监管持什么立场?

 

Jim Keller:我不知道他们要如何监管计算机程序?程序及其修改比人们想象的要简单,但是,你可以监管那些拥有 10000 个 GPU 的大公司吗?可以数数有多少人拥有这些,然后去监管他们,但是当有一亿台计算机可以运行 AI 程序时,会发生什么?

 

要在每个人的手机上放置监管软件吗?这个解决方案产生的问题比问题本身要严重得多,成本也会比较不值。我赞同 Elon Musk 的看法——也就是,AI 将非常快速地发展。我们需要小心的是,要尽可能地使其保持诚实。一个开放的社会,有发生很多独立的实验,事物以合理的方式进行检查和平衡,无论是成功还是不成功,我更倾向于认为世界应该是开放的,我们应该做好应对准备,对未来拭目以待。

如果你有其他解读,或者是对本文有什么意见建议,欢迎在后台交流。如果是开发者,特别是对《计算复杂性》有所涉猎,欢迎加我 Alphatue。

 

参考资料
1.Jim Keller on AI, RISC-V, Tenstorrent’s Move to Edge IP - EE Times
2.Jim Keller (engineer) - Wikipedia
  • 本文感谢 Dakai 和 ChaosAI

 

 

免责声明:本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况,及遵守所在国家和地区的相关法律法规。同时本网站部分推送的文章内容未及时与原作者联系,在已知出处的情况下均已注明来源,版权归原作者所有,内容为原作者个人观点,并不代表本网站赞同其观点和对其真实性负责,若涉及版权问题,敬请原作者联系我们删除,感谢每一位作者的辛苦创作与付出!

 

广告位不存在!
确认删除?
VIP会员服务
限时9折优惠