近期的一些消息显露出AI芯片初创公司的前景,似乎不太妙。Wave Computing破产关闭的还历历在目,现在AI芯片领域的初创公司似乎正遭遇前所未有的挑战。在英伟达的“阴影”下,一些潜在的投资者对初创公司望而却步。面对全球经济的不稳定性不断增强,投资者因而变得愈发审慎,他们对风险的忍受度显著降低,这进一步增加了AI芯片制造商在筹资时的困难。根据PitchBook的数据,对专注于人工智能的芯片制造商的风险投资,从2021年的90亿美元降至40亿美元。


虽然像Cerebras Systems、Graphcore和SambaNova这样的企业成功筹集了大量资金,并在自己的技术领域取得了一定的成就,但要撼动英伟达这样的行业巨擘仍非易事。尤其是在像ChatGPT这类大型模型应用兴起之际,英伟达的地位愈发稳固,其GPU芯片在众多AI应用中都扮演着不可或缺的角色,这使得任何试图挑战英伟达的初创公司都面临着巨大的压力。这些AI芯片初创企业需要不懈努力,以证明他们的技术不仅能与英伟达媲美,甚至具有超越的潜力和价值。


资金流动性的减少、创新步伐的放缓,以及消费者信心的衰退,都在很大程度上制约了这些初创公司的成长。在这种大环境下,AI芯片初创公司不仅要与技术巨头竞争,还要在经济大潮的冲击下稳住阵脚,这无疑对它们的生存和发展提出了更高的要求。


几近破产、融资困难、裁员,艰难的AI芯片公司


Mythic是模拟AI芯片的一家明星公司,但是据科技网站The Register报道,这家专注于模拟内存计算(CIM)的AI芯片初创公司总共筹集了约1.6亿美元资金,去年现金耗尽,几乎被迫停止运营。好在2023年3月,它成功筹集到了1300万美元投资。Mythic首席执行官Dave Rick表示,英伟达“间接”加剧了整体AI芯片公司的融资困境,因为投资者希望投资巨额、回报丰厚的全垒打型投资。


在资金筹集方面,Graphcore堪称欧洲半导体初创企业中的佼佼者。这家公司由Nigel Toon和Simon Knowles在2016年创立,此前他们将自己的硬件公司卖给了英伟达。Graphcore致力于开发IPU(智能处理单元),这一点与目前主流的针对人工智能应用的GPU(图形处理单元)截然不同。Graphcore称,其IPU在满足人工智能的特定需求方面,比GPU更具有优势。据PitchBook的数据显示,截至目前,Graphcore已经成功筹集了超过6亿美元的投资。然而,相比所筹集的资金,Graphcore的收入却相对微薄。


故事在2020年出现了重大转变,当时微软决定在其云计算中心停用Graphcore的芯片,这一举措使得Graphcore失去了一个主要客户,从而面临了更加严峻的挑战。根据金融时报的报道,到2022年,Graphcore的收入骤降了46%,仅为270万美元,同时税前亏损增加了11%,高达2.046亿美元,年终现金余额为1.57亿美元。


Graphcore表示,到明年5月份需要进一步融资才能实现收支平衡。公司将这一不利局面归咎于“宏观经济环境的逆境”和“关键战略客户”的硬件采购推迟,尤其是来自“中国的主要客户”。据路透社的消息,Graphcore关闭了在挪威、日本和韩国的业务,并缩减了在其他国家的业务。目前,Graphcore也开始重新调整业务方向,将其IPU芯片从数据中心转向部署在云计算环境中。


Rivos,一家服务器芯片制造商,正面临苹果公司的诉讼,被指控非法挖角其工程师并窃取商业机密。今年八月,Rivos裁减了大约二十名员工,约占公司员工总数的6%,在此过程中,管理层向留下的员工透露,公司获取新资金的可能性正在减少。联合创始人还向部分员工透露,苹果针对该公司及其几位前苹果员工的诉讼,严重阻碍了他们的筹资活动。


芯片公司烧钱是常态,巨额的研发投入、激烈的市场竞争以及对顶尖人才的争夺,都使得这些公司在成长的道路上不得不投入大量的资金。如今,人工智能领域初创公司给予初级工程师的薪酬往往十分可观,这一方面反映了人才市场的供不应求,另一方面也凸显了这些初创公司对技术人才的极度渴求。


然而,这种高薪策略是否可持续,却是一个值得深思的问题。对于AI芯片初创公司而言,成功融资是其发展的关键一步,但资金的有效利用同样至关重要——这不仅关乎公司的现阶段运营,更影响到其长远的战略目标和市场地位。


英伟达的一些劲敌?


Cerebras是一家“一鸣惊人”的公司,该公司因为芯片大,而捕获了行业的眼球。英伟达的A100 GPU已经相当大了,差不多826平方毫米。但Cerebras的新型芯片WSE-2芯片,面积为45225平方毫米,几乎覆盖了8英寸硅晶圆的整个表面。自2016年成立以来它已筹集了7.3亿美元。


根据CB Insights全球独角兽俱乐部的数据,该公司目前估值为40亿美元。目前,Cerebras已经与阿布扎比G42合作建造了九台人工智能超级计算机中的第一台,这台超级计算机的造价超过1亿美元。Cerebras也正在朝着生成式AI领域奋进,虽然它已经证明了其CS-2在GPT模型中训练的速度,但是其仍没有获得大型厂商的采用。




Cerebras研究人员首次在Andromeda AI超级计算机上训练了一系列七个GPT模型,参数分别为 111M、256M、590M、1.3B、2.7B、6.7B 和 13B


Tenstorrent也是业界很看好的一家初创公司,由顶级芯片设计师Jim Keller于2016年所创立。截至目前,该公司已经融资了近3.35亿美元,最近的一次投资者中包括三星和现代,目前估值约为10亿美元。Tenstorrent将利用RISC-V和Chiplet技术打造AI CPU,以此来挑战英伟达的AI主导地位。最近,Tenstorrent刚与三星达成生产合作的协议,计划使用三星的4nm工艺来生产芯片。


该公司拥有全面的路线图(如下图所示),其中包括基于RISC-V的高性能CPU小芯片以及先进的AI 加速器小芯片,有望为机器学习提供强大的解决方案。目前,Tenstorrent有两款产品:一种名为Grayskull的机器学习处理器,可提供约315 INT8 TOPS的性能,可插入PCIe Gen4插槽;另一种是联网Wormhole ML处理器,可提供约350 INT8 TOPS的性能并使用GDDR6内存子系统,一个PCIe Gen4 x16接口,并具有与其他机器连接的400GbE。


今年他们将推出其Black Hole独立ML计算机芯片。该公司的重头戏Grendel将于2024年推出,这是一种高配置、高性能的ML芯片设计,将CPU芯片与专用的ML/AI芯片相结合,与英伟达的GH200和 Grace/Hopper超级芯片的实现方式类似。


Tenstorrent的AI芯片路线图(图片来源:Tenstorrent)


成立于2017年的SambaNova,已成为AI芯片创业领域中资金最雄厚的公司之一。截至目前,该公司已成功筹集了高达10亿美元的融资,投资方包括如软银和英特尔等知名机构。这使SambaNova不仅成为融资额最高的AI芯片初创公司,也被视为英伟达最有力的新兴竞争者之一,公司估值达到了50亿美元。


SambaNova最近推出了其最新的第四代SN40L处理器。这款处理器拥有超过1020亿个晶体管,采用了台积电的5nm工艺,其计算速度高达638 teraflops。独特的三层内存系统(包括片上内存、高带宽内存和高容量内存)旨在处理与AI工作负载相关的庞大数据流。SambaNova宣称,一个只有8个此类芯片组成的节点就能够支持多达50万亿参数的模型,这几乎是OpenAI的GPT-4 LLM报告规模的三倍。


该公司的首席执行官Rodrigo Liang表示,使用标准的GPU来执行相同任务将需要数百个芯片,这意味着总成本只有使用标准方法的1/25。然而,SambaNova并不直接将芯片销售给其他公司。相反,它提供对其定制技术栈的访问权限,其中包含了为运行最大型AI模型而专门设计的专有硬件和软件。


避免与之正面竞争,会否是AI芯片初创公司的新出路?


尽管英伟达在人工智能计算领域占据主导地位,但该公司并没有牢牢锁定该领域,市场机会仍然有很多。如果按照英伟达的冯·诺依曼架构+HBM+先进工艺+互联这样的路线,可能将无人能敌英伟达,而且GPU价格和功耗一直在上涨,这对于人工智能行业本身来说是不可持续的。所以一些AI芯片公司选择不与英伟达正面竞争,另辟蹊径,走出一些差异化的路线,试图在市场中分一杯羹。


d-Matrix:存内计算芯片


d-Matrix公司也是一家AI芯片初创公司,该公司认为,随着生成式人工智能的爆发,当前的基础设施无法维持成本和需求,生成式人工智能需要变革性的计算范式。所以d-Matrix设计的芯片具有数字“内存计算”功能,使人工智能计算机代码能够更有效地运行。d-Matrix宣称可以将TCO降低十倍,并在性能和延迟方面具有二十倍的优势。


据The Register的报道,这家初创公司的最新芯片名为Jayhawk II,将采用通过高速结构连接的八个小芯片,总共2GB的 SRAM,而且只需要350瓦就能提供大约2000 TFLOPs的FP8性能和多达9600 TOPs的Int4或块浮点数学性能。


d-Matrix 路线图(来源:d-Matrix)


该芯片可帮助ChatGPT等生成型AI应用提供支持。不过该公司所针对的仅是人工智能的推理部分,训练部分则不涉猎,也就是说他们不与英伟达正面竞争,而是发力在300-600亿参数模型领域。对于这种尺寸的模型,在人工智能推理方面,英伟达的H100不一定是最经济的选择。运行这些模型的大部分成本都归结于快速高带宽内存的使用。相比之下,d-Matrix加速器中使用的SRAM更快、更便宜,但容量也有限。


d-Matrix已经在微软的支持下融资1.1亿美元,微软已承诺在明年推出该芯片时对其自用进行评估。d-Matrix预计两年内年收入为7000万至7500万美元,并实现收支平衡。


Ceremorphic:模拟计算AI芯片


Ceremorphic正在设计一款采用台积电5nm工艺的超低功耗超级计算芯片,利用其自己的专利技术和多线程处理架构ThreadArch®。该公司的创始人兼首席执行官Venkat Mattela,此前他所创立的Redpine Signals于2020年3月以3.14亿美元的价格出售给了Silicon Labs。Ceremorphic所研发的芯片的核心在于数字电路之下的模拟电路,在芯片功能的层次结构的最低层进行模拟计算,更高层次上则不做模拟计算。该公司的创始人兼首席执行官Venkat Mattela认为,模拟乘法将比数字乘法更有效地利用电压,更好地实现低功耗。


该公司的主要技术包括可靠、低能耗和安全的机器学习、图形神经处理器、抗量子和硅高效安全处理器、高性能模拟电路、可靠的时序电路和系统级互连,使产品能够针对不同的细分市场进行扩展。右图描绘了 Ceremorphic的技术组合,涵盖当前和未来的计算需求。


Ceremorphic的技术组合


结语


目前的事实证明,在英伟达所主导的GPU生态中,初创芯片公司想要活下来并不容易,“替代英伟达”很难。强如AMD和英特尔都很难撬动这块大蛋糕。对于这些AI芯片公司而言,机会窗口很窄,英伟达已经发布了其最新的路线图。而且,大型的云厂商几乎都已经躬身自研芯片了,亚马逊拥有Inferentia芯片,谷歌最近展示了其第五代张量处理单元,微软即将发布其自研芯片,这进一步挤压了希望通过云提供商进入市场的初创企业的机会。


芯片初创企业所承担的风险甚至超越了传统软件初创公司,因为它们不仅需要巨额资金来支持复杂的半导体设计和软件开发,还要承担实物产品的制造成本。随着时间的推移,我们可能会目睹一些此类企业的破产倒闭、被收购,但它们中的每一个都怀揣着成为下一个英伟达的梦想。


本文来自微信公众号:半导体行业观察 (ID:icbank),作者:杜芹DQ