近日,Quora CEO发布了一个推特,在推中他表示:人工智能热潮被低估的原因之一是 GPU/TPU 短缺。这种短缺导致产品推出和模型培训受到各种限制,但这些都是不可见的。相反,我们所看到的只是 Nvidia 的价格飙升。一旦供应满足需求,事情就会加速。
在这个推文下面,Elon Musk回应道:
“True. Also, many other NN accelerator chips are also under development.Nvidia will not have a monopoly on large-scale training & inference forever.”
也就是说,Elon Musk认为英伟达不会垄断这个AI训练市场。
在更早之前,Elon Musk曾经表示,连狗都在抢GPU,他同时还谈到,GPU现在比“drugs”还难抢,由此可见GPU在市场的受欢迎程度。
另一个行业大佬——OpenAI的CEO Sam Altman在早前的交流中也表示, OpenAI 缺乏足够的图形处理单元或 GPU(训练和运行 AI 软件所需的超强大芯片)来快速改进 ChatGPT。
据相关报道,OpenAI的客户抱怨是关于 API 的可靠性和速度。对此,Sam 承认他们的担忧,并解释说大部分问题是 GPU 短缺的结果,
OpenAI 只是受到全行业芯片短缺影响的众多公司之一。4 月,The Information 报道称,由于亚马逊、微软和谷歌等主要云提供商的服务器短缺,人工智能初创公司正面临重大困难。
对芯片的需求如此强劲,以至于美国领先的制造商 Nvidia 近首次达到 1 万亿美元的市值。自年初以来,该公司的股价上涨了 171%。
“主要的原因确实是 GPU 瓶颈,这是由供需之间的巨大差距造成的,必须尽快解决,”总部位于以色列的 Run:ai 的执行官兼联合创始人 Omri Geller 说。“这适用于 OpenAI,但它适用于整个生态系统。”
挣疯了的,不止AI芯片公司!
在圣何塞郊区的一栋灰色长方形建筑内,一排排闪烁着闪光的机器。五颜六色的电线连接着高端服务器、网络设备和数据存储系统。笨重的空调机组在头顶呼啸而过。噪音迫使游客大声喊叫。
该建筑属于 Equinix,一家租赁数据中心空间的公司。里面的设备属于从企业巨头到初创公司的公司,这些公司越来越多地使用它来运行他们的人工智能 ( AI ) 系统。AI淘金热受到“生成式”系统(如热门虚拟对话者Chat gpt )的惊人复杂性的刺激,有望为那些利用该技术潜力的人带来丰厚的利润。不过,就像任何淘金热的早期一样,它已经为必要的镐和铁锹的卖家创造了财富。
5 月 24 日,为许多AI服务器设计半导体的 Nvidia超过了分析师对截至 4 月的三个月的收入和利润预测。它预计本季度销售额为 110 亿美元,是华尔街预期的一倍。由于其股价在第二天飙升了 30%,该公司的市值徘徊在 1 万亿美元附近。英伟达执行官黄仁勋于 5 月 29 日宣布,世界正处于“新计算时代的转折点”。
其他芯片公司,从amd等芯片设计公司同行到台湾台积电等制造商,都被AI 的热情所吸引。其他计算基础设施的供应商也是如此——包括从那些五颜六色的电缆、嘈杂的空调设备和数据中心占地面积到帮助运行人工智能模型和整理数据的软件的一切。自 chatgpt于去年11 月推出以来,由 30 多家此类公司组成的等权重指数上涨了 40% ,而以科技股为主的纳斯达克指数上涨了 13%(见上图表)。“一个新的技术堆栈正在出现,”游说团体AI基础设施联盟的 Daniel Jeffries 总结道。
从表面上看,AI热潮似乎远不如 Chatgpt及其快速扩张的竞争对手背后的聪明“大型语言模型”令人兴奋。但是,随着依赖这些模型的模型构建者和应用程序制造者争夺未来AI蛋糕的一部分,他们都需要此时此地的计算能力——而且是大量的计算能力。
的AI系统,包括生成式系统,比旧系统的计算密集度要高得多,更不用说非AI应用程序了。互联网巨头云计算部门 google cloud platform人工智能基础架构负责人 Amin Vahdat观察到,在过去六年中,模型大小每年增长十倍。gpt -4 是为 chat gpt提供支持的版本,它使用大约 1trn 参数分析数据,是其前身的五倍多。随着模型复杂性的增加,训练它们的计算需求也相应增加。
经过训练后,AI需要较少的数字运算能力才能在称为推理的过程中使用。但考虑到所提供的应用范围,推理将累积起来也需要大量的处理能力。微软拥有超过 2,500 名客户的服务,该服务使用Chatgpt的创建者 open AI的技术,该软件巨头拥有近一半的客户。这是上一季度的十倍。谷歌的母公司 Alphabet 拥有六种产品,在全球范围内拥有 20 亿或更多用户,并计划通过生成AI来增强它们。
对计算能力的需求激增,明显的赢家是芯片制造商。台积电等制造商代表终端客户,特别是为大多数人工智能应用提供支持的大型云计算提供商,每次将他们的蓝图蚀刻到硅片上时, Nvidia 和amd等公司都会收取许可费。因此,人工智能对芯片设计师来说是一个福音,因为它受益于更强大的芯片(往往会产生更高的利润),而且更多。瑞银银行估计,在未来一两年内,人工智能将使对称为图形处理单元 ( gpu ) 的芯片的需求增加 100 亿至 150 亿美元。
因此,占其销售额 56% 的 Nvidia 年度数据中心收入可能会翻一番。amd将在今年晚些时候推出一款新的gpu 。bernstein 的 stacy rasgon 表示,虽然它在gpu设计游戏中的规模比 Nvidia 小得多,但AI繁荣的规模意味着该公司准备好从市场中获益,“即使它只是得到市场的一部分”,分析师说。专注于人工智能的芯片设计初创公司,如 Cerebras 和 Graphcore,正试图为自己赢得名声。数据提供商 PitchBook 统计了大约 300 家这样的公司。
当然,一些意外收获也将归于制造商。4 月,台积电的老板CC魏谨慎地谈到了“人工智能相关需求的增量上升”。投资者更加热情。英伟达公布财报后,该公司股价上涨 10%,市值增加约 200 亿美元。不太明显的受益者还包括允许将更多芯片封装到单个处理单元中的公司。Besi 是一家荷兰公司,生产有助于将芯片粘合在一起的工具。根据另一家分析师公司 New Street Research 的 Pierre Ferragu 的说法,这家荷兰公司控制着四分之三的高精度键合市场。今年以来,其股价已上涨了一倍以上。
瑞银估计,gpu约占专用AI服务器成本的一半,而标准服务器的成本仅为十分之一。但它们并不是必要的装备。要作为一台计算机工作,数据中心的gpu也需要相互通信。
这反过来又需要越来越先进的网络设备,例如交换机、路由器和专用芯片。据研究公司 650 Group 称,此类套件的市场预计在未来几年内将以每年 40% 的速度增长,到 2027 年将达到近 90 亿美元。Nvidia 也获得了此类套件的许可,占全球销售额的 78%。但加州公司 Arista Networks 等竞争对手也开始关注投资者:其股价在过去一年上涨了近 70%。销售有助于网络运营的芯片的 Broadcom 表示,其此类半导体的年销售额将在 2023 年翻两番,达到 8 亿美元。
这将使台湾的纬创资通和英业达等服务器制造商受益,它们主要为亚马逊网络服务 ( aws ) 和微软的 Azure 等大型云提供商生产定制服务器。较小的制造商也应该做得很好。另一家台湾服务器制造商Wiwynn的老板近表示,与AI相关的项目占其当前订单的一半以上。美国公司 Super Micro 表示,在截至 4 月的三个月中,人工智能产品占其销售额的 29%,高于此前 12 个月的平均 20%。
所有这些AI硬件都需要软件才能运行。其中一些程序来自硬件公司;例如,Nvidia 的软件平台,称为cuda,允许客户充分利用其gpu 。其他公司创建的应用程序可以让AI公司管理数据(Datagen、Pinecone、Scale AI)或托管大型语言模型(HuggingFace、Replicate)。PitchBook 统计了大约 80 家这样的初创公司。今年到目前为止,已有 20 多家公司筹集了新资金;投资方包括安德森霍洛维茨和老虎环球两大风投巨头。
与硬件一样,许多此类软件的主要客户是云巨头。亚马逊、Alphabet 和微软计划今年共同承担约 1200 亿美元的资本支出,高于 2022 年的 780 亿美元。其中大部分将用于扩大其云容量。即便如此,对人工智能计算的需求如此之高,以至于他们都在努力跟上。
这为挑战者创造了机会。在过去的几年里, ibm、Nvidia 和 Equinix 已经开始提供对gpu的“服务”访问。专注于人工智能的云初创公司也在激增。其中之一,Lambda,从投资者那里筹集了 4400 万美元,例如谷歌的风险投资部门之一的 Gradient Ventures 和 Open AI 的联合创始人 Greg brockman。该交易对该公司的估值约为 2 亿美元。一家类似的公司 CoreWeave 在 4 月份筹集了 2.21 亿美元,其中包括来自 Nvidia 的融资,估值为 20 亿美元。CoreWeave 的联合创始人 Brannin McBee 认为,专注于围绕AI设计的客户服务和基础设施有助于它与云巨头竞争。
一组人工智能基础设施的赢家接近提供实际的铲子:数据中心的房东。随着对云计算的需求激增,他们的财产正在被填满。2022 年下半年,数据中心空置率为 3%,创历史新低。Equinix 或其竞争对手 Digital Realty 等公司与大型资产管理公司的竞争日益激烈,后者热衷于将数据中心添加到其房地产投资组合中。2021 年,私募市场巨头黑石斥资 100 亿美元收购了美国的数据中心运营商之一qts realty trust。4 月,Blackstone 的加拿大竞争对手 Brookfield 收购了法国数据中心公司 Data4,该公司一直在大力投资数据中心。
人工智能基础设施堆栈的持续增长可能会遇到限制。一是能量。数据中心的一位大投资者指出,电力供应预计会减缓北弗吉尼亚和硅谷等枢纽地区新数据中心的发展,数据中心是其中的巨大用户。另一个潜在的障碍是从庞大的人工智能模型和基于云的推理转向需要较少计算能力来训练并可以在智能手机上运行推理的较小系统,就像谷歌近推出的缩小版 Pa LM 的情况一样模型。
的问号在于人工智能繁荣本身的持久性。尽管 Chat gpt及其同类产品很受欢迎,但该技术的盈利用例仍不明朗。在硅谷,炒作可以瞬间变成失望。Nvidia 的市值在 2021 年飙升,因为它的gpu被证明是挖掘比特币和其他加密货币的完美选择,然后随着加密货币繁荣走向萧条而崩溃。
如果这项技术确实达到了其变革性的收费标准,监管机构可能会采取严厉措施。世界各地的政策制定者担心生成式AI可能会消除工作岗位或传播错误信息,因此已经在考虑采取措施。事实上,5 月 11 日,欧盟立法者提出了一套限制聊天机器人的规则。
所有这些限制因素都可能会减缓AI的部署,从而削弱AI基础设施公司的前景。但可能只有一点点。即使生成式AI并没有像它的支持者声称的那样具有变革性,它几乎肯定会比加密更有用。还有很多其他的非生成式AI也需要大量的计算能力。除非即将在全球范围内禁止生成人工智能,否则淘金热可能会停止。只要每个人都在奔波,卖镐和铲子的小贩就会大赚一笔。
另一家研究公司idc的 Peter Rutten 指出,人工智能的繁荣对于组装进入数据中心的服务器的公司来说也是个好消息。另一家分析师公司 Dell'Oro Group 预测,全球数据中心将在五年内将专用于AI的服务器份额从目前的不到 10% 增加到约 20%,并且该套件在数据中心资本中的份额服务器支出将从目前的 20% 左右上升到 45%。
来源:yole