一个春节的功夫,美国的科技巨头和独角兽们就将AI前沿推向了更远处。在美国AI科技公司的引领下,标普指数超过了5000点,创出了历史新高。英伟达市值超过谷歌,仅次于微软和苹果。



尤其是OpenAI和谷歌DeepMind的巅峰对决,正在把大模型推向新一代,在国内再度引发一轮危言:我们和他们的差距是不是拉大了?


8日,奥特曼7万亿美元融资计划曝光;9日,谷歌发布Gemini Ultra1;10日,英伟达成立新部门,为客户定制AI芯片;13日,英伟达发布可以安装到PC上的Chat with RTX;14日,AI大神卡帕西(Andrej Karpathy)再次从OpenAI离职;15日,谷歌发布Gemini 1.5,OpenAI发布Sora。


原本谷歌应该吸引足够的目光。谷歌赶着中国龙年的除夕,发布了号称唯一胜过人类专家水平的大模型Gemini Ultra1,同时抹去了Bard的番号,将旗下产品统一纳入Gemini。几天后,谷歌再次发布Gemini 1.5,这个基于Transformer和MoE架构的模型,最大的特点是拥有超大的上下文窗口,能够稳定处理百万token,相当于一次塞给大模型一部电影,400多页的文档,或数万行代码。谷歌还在测试将它的能力扩展到千万token级别。



更大的上下文窗口,意味着大模型能够读懂更真实、更连贯的世界。用我们在“展望”里的话说,下一代闭源大模型推出,出现了胜任人类水平的AGI“火花”。


几个小时后,OpenAI发布了Sora,声称自己构建了一个“物理世界的通用模拟器”,相信它将成为实现通用人工智能(AGI)的重要里程碑。这个带有Transformer骨架的扩散模型,证明扩展法则与智能涌现依然成立。


Sora并不完美。英伟达高级科学家Jim Fan认为,它还无法取代游戏引擎,后者长期致力于为玩家提供物理碰撞或光线追踪等逼近真实世界规则的游戏体验。但Jim Fan认为,Sora已经是视频生成的GPT-3时刻,不必纠结于它的缺陷,多想想未来的“GPT-4时刻”。


能与谷歌与OpenAI比拼谁最接近AGI的,还有Meta。在Sora发布当天,Meta发布了V-JEPA(视频联合嵌入预测架构)。这个基于Yann LeCun的世界模型和自主智能体设计的无监督“视频预测模型”,号称能以“人类的理解方式”看待这个世界。它不是生成模型,完成预训练后也可以免去复杂的精调,当需要学习新技能时,只需要在其上添加小型的、专门的层。


难怪奥特曼施展起了融资魔法,计划筹集5万亿美元到7万亿美元的资金,加速扩展法则,抢先抵达通用人工智能,卡住其他竞争对手的脖子。如今的Sora,让Pika与Runway这样的初创企业非常难受。


7万亿美元是一个庞大的数字,大到即使类比,都会让人缺乏实际感受。它相当于去年全球芯片销售总额的13倍。软银集团也在为AI芯片筹集资金,但只有“区区”1000亿美元,孙正义将这个项目命名为伊邪那岐(Izanagi),是日本神话里开天辟地的神祇。


因此,奥特曼的融资计划,听起来更像是一个AI经济的投资构想,而不是一个单纯的芯片制造投资计划。OpenAI在向上游推进垂直一体化,从算力集群、芯片制造、一直到能源。


奥特曼试图控制所有有关大模型与人工智能的议程设置。在他的眼里,未来的AI世界,是一个由能源、数据、芯片等基础设施支撑起来的超级智能。OpenAI代表了超级智能。现在,让我们换一种说法,奥特曼希望同时开启206个曼哈顿计划(经通货膨胀调整后)


这刺激到了英伟达。黄仁勋认为,芯片技术仍在进步,成本将继续不断下降;同时,构建人工智能系统的新方法,也将会被发明出来。人工智能系统正在发生的最大的变化之一,就是加速在端侧与边缘侧落地。


随着未来对于推理需求的激增,智能驾驶、AI PC以及正在兴起的空间计算,以及面向企业的边缘AI场景,都将提升高性能、低成本、低能耗的定制芯片的需求。英伟达已经开始灵活适应,正在成立新的业务部门,为云计算厂商和人工智能企业提供定制的芯片。许多新的边缘服务,都是由客户需求驱动的。


该公司也推出了Chat with RTX,完全运行在PC本地,不需要把数据传输到云端。在靠近数据诞生的地方,利用本地储存的个人专属的知识,安全地回答个人最关切的问题,拥有巨大的潜力。


个人AI设备与个人AI体验将成为2024年巨头的必争之地。谷歌曾在去年底发布适用于终端设备的Gemini Nano;OpenAI的Sora能够直接以不同设备的原生宽高比创建内容,甚至只有30亿规模参数,可以塞进手机,这足以让所有的终端设备厂商难以入眠。


这里蕴藏着巨大的机会。前OpenAI高级研究人员卡帕西(Andrej Karpathy),一直在琢磨AI驱动的操作系统,想做出个人助理,可以实现个人AI设备复杂任务的自动化。他师从著名AI学者李飞飞,是OpenAI的创始成员,也曾是特斯拉Autopilot负责人。在硅谷,他还需要一次创业。


卡帕西离开OpenAI的时候,宣布“没有发生什么特别的事情”,但他欢迎更多的阴谋论。围绕OpenAI的猜测,总是很有趣。在拱卫奥特曼的地位后,OpenAI终于完成了800亿美元估值的交易,仅次于字节跳动与SpaceX,让员工兑现他们的股份。媒体还扒出,于2021年底推出的OpenAI Startup Fund,不归OpenAI所有,也不归非营利性基金会,而是由奥特曼拥有。


中国错过了大模型的原创创新,但仍拥有最庞大的应用场景,并且正在加速实现。在春节前,阿里巴巴发布了通义千问大模型Qwen-1.5,6个版本中的5个,适合塞进不同的个人AI设备里,覆盖了从5亿、数十亿到140亿参数规模。阿里巴巴曾透露将与联想合作,让大模型率先在PC上“跑起来”。节后第一天,传统智能手机厂商OPPO与魅族同时宣布,资源将向AI手机加速集中。



还记得2023年的春节刚过,刚刚度过群体免疫,人们开始呐喊“拼经济”的时候,才意识到推出了两个月的ChatGPT,已经改变了世界。


今年如何?从各省的新春第一会,到各大公司的开工;从AI到股市,龙年开始了。


本文来自微信公众号:未尽研究 (ID:Weijin_Research),作者:未尽研究