在德克萨斯州奥斯汀的南部,半导体制造商Advanced Micro Devices的工程师们设计了一款名为MI300的人工智能芯片,该芯片于一年前发布,预计在发布的第一年将产生超过50亿美元(78亿美元)的销售额。
不远处,在奥斯汀北部的一栋高层建筑里,亚马逊的设计师们开发了一种新的、速度更快的人工智能芯片,名为Trainium。然后,他们在手掌大小的电路板和两台冰箱大小的复杂电脑上测试了这种芯片。
德州首府的这两项努力反映了快速发展的人工智能芯片市场的转变,人工智能芯片可能是目前最热门、最令人垂涎的技术。该行业长期以来一直由英伟达(Nvidia)主导,该公司利用其人工智能芯片成为了一个价值3万亿美元的庞然大物。多年来,其他公司试图与该公司的芯片相匹敌,这些芯片为人工智能任务提供了巨大的计算能力,但进展甚微。
现在,AMD和亚马逊开发的芯片,以及消费者对其技术的反应,都进一步表明,英伟达的可靠替代品终于出现了。
Futurum Group的分析师丹尼尔·纽曼(Daniel Newman)表示,在一些关键的人工智能任务上,英伟达的竞争对手正在证明,他们可以提供更快的速度和更低的价格。“所有人都知道这是可能的,现在我们开始看到它成为现实,”他说。
推动这种转变的是一系列科技公司——从亚马逊(Amazon)和AMD等大型竞争对手,到规模较小的初创公司——它们已开始为人工智能开发的特定阶段定制芯片,这一阶段正变得越来越重要。这一过程被称为“推理”,发生在公司使用芯片训练人工智能模型之后。它允许他们执行任务,例如与人工智能聊天机器人提供答案。
移动芯片制造商高通(Qualcomm)首席执行官克里斯蒂亚诺?阿蒙(Cristiano Amon)表示:“真正的商业价值来自推理,而推理正开始扩大规模。”高通计划将亚马逊的新芯片用于人工智能任务。“我们开始看到变化的开始。”
英伟达的竞争对手也开始以另一种方式向该公司学习。他们已经开始模仿英伟达的策略,即制造完整的计算机,而不仅仅是芯片,这样客户就可以为人工智能目的从芯片中榨取最大的功率和性能。
周二,亚马逊宣布推出基于其新型Trainium 2人工智能芯片的计算服务,并获得了包括苹果在内的潜在用户的好评,这表明竞争加剧。该公司还推出了包含16个或64个芯片的计算机,这些计算机具有超快的网络连接,可以特别加快推理性能。
亚马逊网络服务公司(Amazon Web Services)首席执行官马特·加曼(Matt Garman)表示,亚马逊甚至正在为自己投资的初创公司Anthropic建造一座大型人工智能工厂。这家初创公司的创始人兼首席计算官汤姆·布朗(Tom Brown)说,这个计算“集群”将拥有数十万个新的Trainium芯片,其能力将是Anthropic曾经使用过的任何芯片的五倍。这家公司运营着克劳德聊天机器人,总部位于旧金山。
布朗说:“这意味着客户将以更低的价格和更快的速度获得更多的智能。”
根据市场研究公司Omdia的数据,预计今年数据中心运营商在没有英伟达芯片的计算机上的总支出将增长49%,达到1260亿美元。数据中心运营商为人工智能任务提供所需的计算能力。
即便如此,竞争加剧并不意味着英伟达有失去领先地位的危险。该公司的一位发言人提到了英伟达首席执行官黄仁勋(Jensen Huang)的言论。黄仁勋曾表示,英伟达在人工智能软件和推理能力方面具有重大优势。黄补充说,对该公司新推出的Blackwell人工智能芯片的需求非常旺盛,他说,尽管运行所需的功率增加了,但每瓦特能量可以执行更多的计算。
“我们的总拥有成本是如此之高,以至于即使竞争对手的芯片是免费的,它也不够便宜,”黄在今年斯坦福大学的一次演讲中说。
不断变化的人工智能芯片市场在一定程度上受到SambaNova Systems、Groq和Cerebras Systems等资金雄厚的初创公司的推动,这些公司最近宣称,它们在推理方面拥有巨大的速度优势,价格和功耗都更低。英伟达目前的芯片每个售价高达1.5万美元,而其Blackwell芯片预计每个售价数万美元。
这促使一些客户转向其他产品。研究中心德克萨斯高级计算中心(Texas Advanced Computing Centre)的执行董事丹?斯坦齐奥内(Dan Stanzione)表示,该组织计划明年购买一台位于布莱克韦尔的超级计算机,但由于功耗和价格都较低,很可能也会使用SambaNova的芯片来执行推理任务。
“那些东西太贵了,”他在谈到英伟达的芯片时说。
AMD表示,预计将在明年推出自己的新型人工智能芯片,瞄准英伟达的Blackwell芯片。在该公司的奥斯汀实验室里,该公司对人工智能芯片进行了详尽的测试,高管们表示,推断性能是一个主要卖点。其中一个客户是Facebook和Instagram的所有者meta,该公司表示,它已经训练了一个名为Llama 3.1 405B的新人工智能模型,该模型使用英伟达的芯片,但它使用AMD的mi300芯片为用户提供答案。
亚马逊(Amazon)、b谷歌、微软(Microsoft)和meta也在设计自己的人工智能芯片,以加速特定的计算任务并降低成本,同时仍在构建由英伟达芯片驱动的大型机器集群。本月,谷歌计划开始销售基于内部开发的第六代芯片的服务,该芯片名为Trillium,其速度几乎是上一代芯片的五倍。
亚马逊有时被视为人工智能领域的落后者,但它似乎特别决心迎头赶上。除其他资本支出外,该公司今年拨出750亿美元用于人工智能芯片和其他计算硬件。
在该公司的奥斯汀办公室——由2015年被亚马逊收购的初创公司Annapurna Labs运营——工程师们之前为亚马逊网络服务开发了网络芯片和通用微处理器。它早期的人工智能芯片,包括第一版的Trainium,并没有获得太多的市场吸引力。
亚马逊对新的Trainium 2芯片要乐观得多,它的速度是以前芯片的四倍。周二,该公司还宣布了另一款芯片Trainium 3的计划,这款芯片的功能将更加强大。
巴黎人工智能初创公司Poolside的首席技术官埃索?康德(Eiso Kant)估计,与基于英伟达的硬件相比,按每美元计算,Trainium 2的计算性能将提高40%。
康德补充说,亚马逊还计划在世界各地的数据中心提供基于培训的服务,这有助于推理任务。
“现实是,在我的行业里,我不在乎下面是什么硅,”他说。“我关心的是,我能得到最好的性价比,并把它卖给最终用户。”
本文最初发表于《纽约时报》。