划重点

1、黄仁勋始终担心,英伟达的大客户是否足够快地安装了英伟达的芯片,并从中获得收入。

2、英伟达在决定如何在数据中心部署其下一代芯片的过程中,与微软产生了对立和争议。

3、英伟达在为其AI芯片设计专有机架,这可能会给服务器制造商戴尔、惠普等带来压力。



腾讯科技讯 据国外媒体报道,尽管英伟达借助人工智能热潮取得了前所未有的成功,但其CEO黄仁勋却仍保持着高度的警觉。

他忧虑的是,主要云服务提供商是否能迅速扩展其数据中心规模,以部署英伟达的人工智能芯片;他也担心英伟达与客户如微软在芯片部署策略上可能出现的潜在摩擦。

此外,随着英伟达进军软件与云服务领域,它直接与其最大客户展开了竞争,这无疑增加了市场的复杂性。

在应对这些挑战的同时,黄仁勋正全力以赴地维持英伟达的增长势头和市场领导地位,以避免重蹈诸如思科等硬件巨头因忽视市场变化而衰落的覆辙。

强推服务器租赁业务,挑战微软、亚马逊等云巨头

作为人工智能热潮的领军人物,黄仁勋成功推动了英伟达的迅猛增长和利润飙升,使其市值达到与微软和苹果比肩的3万亿美元水平,并在6月19日一举成为全球市值第一。然而,在这辉煌的成就背后,黄仁勋及其团队仍保持着高度的警觉,他们正面对着一个行业内的新威胁——英伟达芯片的需求可能会遭遇瓶颈。

为了预防这一风险,英伟达开始积极向人工智能开发商销售软件,并在一年前成立了自有服务器租赁业务DGX Cloud,直接挑战其最大客户微软、亚马逊等云服务巨头。令人惊讶的是,DGX Cloud的运行基于从这些云提供商那里租用的英伟达服务器集群。英伟达进而将这些服务器以更高的价格转租给自己的客户,并承诺提供卓越的计算性能。



这一策略在行业内引发了紧张局势。全球最大云服务提供商亚马逊最初拒绝了英伟达在其数据中心内开展竞争业务的提议。然而,随着规模较小的竞争对手纷纷接受英伟达的条件,亚马逊最终也不得不妥协,宣布将为DGX Cloud提供其他云提供商尚未拥有的最新英伟达人工智能芯片。亚马逊可能还担心,在芯片供应紧张的情况下,得罪这位关键的供应商将带来不利后果。

去年秋天,英伟达甚至考虑过为DGX Cloud租赁自己的数据中心。这样的举措将彻底切断与传统云提供商的联系。最近,英伟达还聘请了Meta资深高管亚历克西斯·布莱克·比约林(Alexis Black Bjorlin)来管理其云业务。目前尚不清楚英伟达是否将继续为DGX Cloud建设自己的数据中心。

与此同时,英伟达的销售团队也在不遗余力地深入了解客户如何使用其芯片。他们最近向云服务提供商询问的问题包括:他们的客户是谁,以及他们签订了什么样的合同来租用这些服务器。这些问题的答案不仅有助于英伟达提前制定销售策略,还能帮助它识别云服务器租赁业务的潜在目标客户。

尽管微软、Meta以及xAI等公司正在利用英伟达芯片来训练创新的人工智能模型,但这些模型在短期内可能不会带来显著的收入。可以预见,这可能会促使部分公司重新评估其芯片采购计划。同时,他们可能也无法承担仅为容纳英伟达芯片而大规模扩展数据中心的费用。为此,黄仁勋谨慎地管理着英伟达的芯片分配策略,避免任何一家公司囤积过多的芯片。

强制客户遵循英伟达机架设计,与微软角力


为了进一步扩大硬件业务的收入,英伟达正加强对最大客户购买和安装其GPU方式的控制力度。通常,大型云提供商会自行设计客户服务器机架,以适应其全球数据中心内各种芯片的需求。然而,当英伟达推广其下一代旗舰芯片GB200时,它试图说服客户采纳与该公司设计完全匹配的机架方案。



微软与英伟达今年就这一问题进行了数周的激烈讨论。据谈判参与者透露,英伟达要求微软购买一种与其现有数据中心机架尺寸不兼容的特定服务器机架设计。这种改变将限制微软在不同人工智能芯片之间轻松切换的灵活性。尽管同意采纳英伟达机架设计的客户将优先获得新芯片,但微软高管对此表示了坚决反对。

微软高管还感受到了来自英伟达网线的购买压力,因为他们认为英伟达会优先考虑这类捆绑采购,而非仅涉及GPU的订单。英伟达的网络芯片和电缆在微软对英伟达产品的总支出中占据了相当比重。截至2023年初,这一比例约为三分之一。

据悉,这场关于服务器机架设计的争议最终上升到了微软 CTO凯文·斯科特(Kevin Scott)和 CEO萨蒂亚·纳德拉(Satya Nadella)的层面。经过多轮谈判,英伟达最终做出了让步,允许微软为GB200芯片设计定制机架。此后,谷歌和亚马逊也获得了类似的特权。

不过,英伟达可能会从小客户对GB200机架的购买中获益更多。据悉,与往年不同,英伟达今年计划先行设计并采购用于存储GB200芯片的服务器和机架材料,随后再将这些硬件交给制造商进行最终生产和销售。这一策略转变将对传统服务器制造商如戴尔、惠普和超微造成冲击,这些公司过去主要负责此类硬件的设计和生产。

不再是单纯GPU公司,正打造AI操作系统



然而,对于英伟达而言,未来若缺乏稳定的新利润增长点,前景堪忧。正如众多评论家所指出的,思科在2000年互联网泡沫顶峰时期,因销售路由器而短暂成为世界上市值最高的公司。

当时,电信公司纷纷建立新的数据中心,但基于互联网的收入未能如科技高管和投资者所期望的那样实现,导致这些数据中心被闲置。随着思科的硬件逐渐沦为普通商品,其销售额始终未能从下滑中恢复。黄仁勋私下向同事强调,英伟达必须确保不会重蹈思科的覆辙,避免迅速崛起后最终走向衰落。

在最近几个月里,英伟达推出了一系列软件产品,旨在将其业务从硬件扩展到更多元化的领域。在今年2月的财报电话会议上,黄仁勋将这项名为Nvidia AI Enterprise的业务描述为“人工智能操作系统”,客户可以利用它来训练和运行人工智能应用。英伟达对每个GPU每年收取4500美元的软件使用费,随着时间的推移,这有望成为一项至关重要的业务。

风险投资家帕德瓦尔指出:“英伟达出售的不仅仅是芯片——他们提供的是GPU、软件以及用于现代数据中心的完整系统。人们往往认为它只是一家GPU公司,但实际上它远不止于此。”

存储公司Box的首席执行官亚伦·列维(Aaron Levie)也表示:“如果你是英伟达,你的目标无疑是构建一个强大的飞轮,通过提供卓越的软件服务来确保客户持续选择你的产品。我认为黄仁勋在这方面做得非常出色。”

马斯克和扎克伯格助黄仁勋登顶 有钱难买英伟达高端芯片



6月19日凌晨1点01分,英伟达市值盘中达3.33万亿美元,超越微软成为全球市值最高的公司。截至美股收盘,英伟达总市值33353亿美元,比微软33173亿美元总市值高出180亿美元。

英伟达市值增速看似“疯狂”,确是人工智能风起云涌、头部科技公司大幅抢购英伟达高端芯片的资本映射。据富国银行的统计,英伟达目前在全球数据中心AI加速市场拥有98%的份额,处于绝对的统治地位。

“英伟达高端芯片处于供不应求的状态,美国很多科技巨头都排队买H100、B200 等高端AI芯片。在高端芯片领域,英伟达市占率超过80%。”天使投资人、人工智能专家郭涛对《AI光年》透露。

全世界科技公司都想在这一轮人工智能时代博得头筹,购买AI芯片建立算力壁垒是门槛。“目前,大模型发展有Scaling Laws的存在,现在还处于算力野蛮生长的阶段。用1万张卡和100张卡训练的时间和机会成本肯定不同。”联想创投合伙人王光熙对《AI光年》表示。

从上市到市值1万亿美元,英伟达用了24年;从市值1万亿美元到2万亿美元,英伟达用了10个月;从2万亿美元到3万亿美元,英伟达耗时仅3个月。英伟达市值狂飙突进,美国科技巨头亲自把他们的竞争对手推上了全球市值第一的位置。   

有钱难买英伟达高端芯片

美国时间5月26日,特斯拉CEO埃隆·马斯克旗下人工智能初创企业xAI宣布获得60亿美元B轮融资。一周后,马斯克就表态公司至少斥资90亿美元购买30万块英伟达B200 AI芯片。

“考虑到技术进步的速度,将1千兆瓦的电力投入H100并不值得。xAl 10万H100液冷训练集群将在几个月后上线。下一个重要的步骤或是明年夏天部署约30万台B200设备,并配备CX8网络。”马斯克6月3日在X上透露。

据悉:英伟达高端AI计算芯片包括A100、H100及今年晚些时候要上市的B200芯片等。据公开信息显示,B200芯片浮点运算能力是H100的5倍,或于今年下半年才上市。在等待B200芯片的间隙,Meta等科技公司也不忘抢购H100。

2024年年初,Meta创始人扎克伯格在Instagramg上表示,“为训练下一代模型 Llama 3,到 2024 年底,公司将购买超过 35 万块英伟达 H100 GPU。再算上英伟达 A100 和其他人工智能芯片,年底Meta总体上将有近60万个H100 的GPU 算力。”

Raymond James分析师曾估计,英伟达的H100售价在2.5万至3万美元之间,而在 eBay 上的售价可以超过4万美元。按照3万美元的单价,Meta购买的35万块H100将为英伟达带来约百亿美元的收入。

从财报角度看,微软、Meta等购买AI芯片的投入主要反应在“购买不动产和设备的支出”(Purchases of property and equipment)这一项。    

最新财报数据显示,微软2023年Q2—2024年Q1(自然年)的资本支出共395.47亿美元,合约2862亿元人民币;Meta于2023年Q2—2024年Q1的资本支出共268.24亿美元,合约1946亿人民币。



可以这么说,在英伟达冲击全球市值第一的路上,每年花上千亿抢购英伟达芯片的微软、Meta等科技公司功不可没。

“除AI芯片外,英伟达在AIPC、机器人、空间计算领域都有新产品和生态推出。新产品给了资本市场高预期,短期内推动英伟达市值创新高也在情理之中。”郭涛对《AI光年》分析。

“英伟达未来三年没有对手”

英伟达在全球市值第一的位置上能维持多久?英伟达在高端AI芯片一家独大的局面何时能被打破?事实上,随着大模型和生成式AI热潮持续升温,越来越多厂商也开始在AI芯片领域发力,AI芯片竞争趋于白热化。

在AIPC赛道,英特尔发布新架构Lunar Lake,综合AI算力提升至120TOPS;为和英伟达同台竞技,黄仁勋的远方亲戚、AMD董事长兼CEO苏姿丰也拿出“一年一更新”的姿态,公开和英伟达抢市场。   

“AMD今年将会推出Instinct MI325X,2025年推出MI350,2026年推出MI400。”苏姿丰在Computex2024展会上透露。

此外,为节省购买高端AI计算芯片成本,谷歌、亚马逊等科技巨头也在自研异构芯片,比如谷歌自研的TPU、亚马逊自研的Trainium、微软自研的Maia。

在国内,华为是英伟达无法忽视的竞争对手。黄仁勋曾在接受采访时表态:“尽管英伟达在人工智能芯片市场上占据主导地位,但竞争对手的追赶速度很快。华为是其中一家非常强大的竞争对手。”

华为Ascend与鲲鹏部门首席运营官汪涛也曾表示,华为Ascend 910B AI芯片在训练性能上已成功超越英伟达A100 AI GPU达20%。

不过,英伟达和其他厂商的差距并不局限于算力本身,英伟达整个系统里还包括生态、网络、通信等完善的系统。比如,有了CUDA,开发者能够利用GPU的强大并行处理能力来加速计算密集型任务;Nvlink&NVSwitch可以解决多芯片间的集群协同和数据传输问题;InfiniBand可以解决数据中心内部服务器之间的数据传输问题等。

有云厂商人士曾对《AI光年》透露,“由于英伟达成熟和广泛的生态系统,对于已经布局英伟达高端芯片的数据中心来说,替换芯片不仅要考虑生态系统的兼容性,还要考虑重新培训成本、软件重构、性能下滑等风险。”

在郭涛看来,英伟达在AI计算领域建立的技术和生态壁垒,其他厂商短期内难以打破,建立生态需要时间,没法一蹴而就。“在高端芯片领域,英伟达未来三年没有对手。”郭涛对《AI光年》预测。   

在国内市场,英伟达于5月底下调“阉割版”芯片H20,价格比华为昇腾910B便宜10%以上。

H20等芯片价格下调是否会影响英伟达股价?对此,有行业人士对《AI光年》透露,“国内AI大厂已经提前囤积了英伟达高端芯片,H20对国内科技巨头训练大模型意义不大。现在购买H20以中小企业为主,以平衡算力资源,所以H20降价对英伟达股价基本没有影响。”