2021年下半年,英诺天使基金合伙人王晟开始认真研究大模型,想找一个大模型项目投点钱。


当时美国硅谷出现了一批大模型相关的项目,发展很迅猛。比如年初成立的Jasper,在市场上非常火爆,它只需一个简单提示,就能生成各种风格的营销文案,当年就赚了3000万美元。而Jasper的底层系统,来自于OpenAI在一年前推出的大语言模型GPT-3。


王晟留意到了GPT-3,觉得这个方向或许隐藏着大机会。虽然当时生成式AI的质量还不太理想,但他觉得对于投资而言,或许到了一个合适的时点。


但当时国内做大模型的创业团队不多。2021年底,英诺天使基金在清华大学设立了一个奖学金项目,支持计算机系的学生做研究,2017级博士岂凡超申请了这个项目。王晟意外发现,岂凡超正在做的大模型项目,正好就是他想投的方向。


2022年4月,临近毕业,岂凡超对王晟透露了想创业的想法,王晟果断决定投资,深言科技成立了。


天使轮之后,岂凡超开始为下一轮融资做准备,三个月内谈了四五十家VC,没有一家愿意投资。“大家都看不懂,不知道什么是大模型。”王晟对我回忆。


9月下旬的一个周五,王晟拉着岂凡超跟红杉资本的一个合伙人吃了顿饭,三天后就收到了详谈的邀约,岂凡超聊完拿到了红杉的TS(投资意向)


行业看起来一切如常,但一些嗅觉敏锐的投资人,已经提前感受到了大模型行业即将到来的波涛汹涌。


2个月后的11月底,OpenAI正式推出ChatGPT,因为效果惊艳,整个科技圈大为震撼。一时间,AI大模型爆火,科技公司纷纷跟进,整个投资圈一蜂窝冲上去看大模型项目。


2023年的“百模大战”中,VC对着20来家创业公司猛投,项目估值一时被拉到很高,很多投资机构陷入迷茫。按照王晟的话说,“大家第一看不懂,第二不敢投,第三投不到。对于绝大多数早期投资机构而言,已经没法玩了。”


如今,大模型热潮还在继续。前不久,我跟王晟进行了一次深聊,他对我讲了投资大模型的历程、经验和感受,也分享了他对大模型创业投资的一些观察和见解。以下是正文:


一、大模型估值有泡沫,比的是“市梦率”


问:英诺什么时候将AIGC确定为一个重要的投资方向?


王晟:我们其实投AI不算晚,之前就在AI赛道花了很多时间。国内第一波AI浪潮差不多从2013年开始,诞生了AI四小龙(商汤、旷视、依图、云从),我们从2016年开始投资,投中了文远知行、智行者、中科原动力等项目,后来投了一些图像视频类的AI公司,再就是这一波大模型。


问:大模型项目估值很高,动辄几十亿人民币,这是不是对关注早期投资的基金不太友好?


王晟:早期基金就得投的早。2022年11月底OpenAI推出ChatGPT之后,很多VC才去学习,提升认知,开始找项目。实际上你今天看到的项目,绝大多数都是在那之后出现的,而我们在那之前就开始布局了。


问:在ChatGPT出现之后,还有哪些项目是适合早期投资的?


王晟:几乎没有。


问:为什么?


王晟:我觉得市场跟大家看到的情况不一样。2023年整个AI投资是两端收敛,资金端20多家VC投资很活跃,资产端就几十个项目融了很多钱,两边都没有泛化,这个市场还不够繁荣。


中基协统计全市场VC有1.2万家,实际出手的可能连200家都不到,活跃的也就20来家,剩下的都是在看热闹,跟着摇旗呐喊。因为大家第一看不懂,第二不敢投,第三投不到。一堆创业者各种鼓吹项目多厉害,其实根本没人投。


问:为什么会呈现两端收敛的格局?


王晟:创新有周期,当多个方面的基础科学研究达到一个阈值,就会出现天才企业家把科研成果转化成技术创新,带动一个新的技术范式。


一个新的技术范式出现之后,首先要做infra(基础设施),就像建一个商场,先得通水通电有电梯,但做infra不会泛化,因为需要大笔投资,能玩得起的玩家不多。如果infra本身还不完善,去做应用毫无意义,会被基础设施的升级碾压掉。


另外,今天能做的所有创新都是受限的,涌现出优秀的创业者和产品经理还需要时间。2007年iPhone出现,移动互联网浪潮开启,但很多重要的应用隔了好几年才出现,拼多多是2015年,抖音是2016年,而ChatGPT从推出到现在也就一年时间,没人知道它的能力边界在哪里。


问:所以要在恰当的时间段内做恰当的事。


王晟:是的。过去两年行业在大力构建infra,还没到大量做创新项目的时间点,今年会有一些能够迅速提升生产力的应用涌现出来,目前一个共识是,2023年是大模型元年,2024年是Agent元年,但还不是AI应用的元年。所有投资人都是在这种规律周期里做符合周期的事情。


问:你说的拿到投资的几十家创业公司,是以大模型为主吗?


王晟:大模型可能占了接近一半,另外有一些是infra,比如芯片算力、无损网络、光模块。我们也投了端侧的算力芯片,但我们不太相信在数据中心这种通用的GPU上,能跑出来一个初创公司,因为硬件特别不适合VC投很多钱。


问:所以投大模型的主要还是资金实力雄厚的大机构和巨头公司?


王晟:目前看来是这样,除非你投的早,因为对天使投资来讲投的早很重要。


问:现在市场上号称有200多个大模型,你认为有水分吗?


王晟:我认为能属于头部的也就十几家。


问:头部的几个项目估值飞涨,有的高达百亿人民币,你觉得是否存在高估?


王晟:肯定是高估了。商汤现在是300多亿港币,而曾经有3000亿。现在大模型的估值拉到这么高,都是市梦率,可能未来会拉到更高,但最终还是要看如何落地,能不能避免上一波AI在落地上无法找到特别有效的商业场景的情况。


问:现在行业里怎么估值?


王晟:大家会基于未来的收入,给十几倍二十倍的PS(市销率),现在实际给到的都是大几十倍甚至上百倍的PS。没收入的就拍脑袋给个数。


问:作为早期投资人,面对这种局面会不会焦虑?


王晟:没什么可焦虑的,这些大模型公司我们想投都能投得进去,只不过有些我们选择没出手。


问:为什么不出手?


王晟:我们的单笔投资跟项目的估值匹配度不好,这不是说我们投不进去。其实对于绝大多数早期投资机构而言,已经没法玩了,大量的VC首先不知道该往哪个方向投,其次大家一窝蜂都上的时候,他也不知道谁厉害,然后他也找不到这些人,即便找到了人家可能没兴趣让他投,他也投不进去。我们没有这些问题。


问:王小川的百川智能之前很火,你们有接触吗?


王晟:2022年4月初,我跟王小川一起吃过一顿饭,他欢迎我们投资,但确实太贵了。当时是亲友轮,估值5亿美金,英诺的典型投资一般是1000万人民币,这在5亿美金的盘子里确实不太匹配。


所以我觉得早期投资机构需要认知早,做判断早,不能在VC一哄而上的时候才反应过来,那就已经不是早期投资人能参与的了。在市场达成共识之前出手,价格就会可控,共识达成后价格会上涨很快。


二、投资大模型,最核心还是看人


问:你们怎么判断哪个项目能跑出来?


王晟:核心看团队做大模型的能力。中国跟美国有一个很大的差异,投资人往往会迫切要求项目落地到具体的应用场景,拿到订单获得收益,只讲商业模式是不被认可的,但另一方面中国的用户和企业都不愿意付费,很少能像OpenAI那样获得很高的年收入。但是投资人可以认可一个团队做好大模型的能力,我们相信大模型跟某些行业深度结合之后,可能会创造出巨大价值。


问:所以投资人看的不是现在的商业模式,而是一种能力和可能性。


王晟:对,你可以理解2022年投的大模型项目都没有商业模式,大家也说不清楚怎么赚钱。


问:哪些方面的能力对一个大模型团队至关重要?


王晟:最核心的还是人,所有公司都是如此。你有了最好的人才,就能够吸引投资,有钱了就能买算力,再去吸引更好的人才,飞轮就能滚动起来。


问:什么背景或者类型的人才是最被看好的?


王晟:我觉得这是动态的。一开始学术水平高的团队更有优势,大家比的是科研能力,LLaMA开源之后,大家对大模型的认知迅速被拉齐,这个时候拥有更强工程能力、融资能力的团队更容易赢。


问:中国创业者从LLaMA开源学到了什么?


王晟:如果自己从零到一练大模型,过去累积的经验、科研能力、方法是非常重要的,或许某些方面在技术上不难,但它是一个综合的、涉及到很多技巧和方法的事情,一旦有个点被卡住了,靠自己可能需要花一两年时间才能解决。Meta过去这些年积累的大模型技术,本来都是不传之秘,结果一开源,迅速把很多认知拉平了,这意味着很多坑不用再踩,那些在大厂做过巨大系统工程的人,优势就体现出来了。


问:接下来可能会怎么演变?


王晟:我认为LLaMA接下来应该也是开源的,可能是多模态,仍然保持很高的水准。当再过几年,开源大模型能力封顶的时候,更大的挑战就来自于做产品的能力。那时对一个团队最大的挑战不是科研,也不是工程,而是整个系统的运营能力,那可能就是王慧文的时代。


问:这么说的话,王慧文入场太早了?


王晟:我觉得王慧文有一点做错了,他角色错了。他下场的阶段是拼技术、科研、工程,他的优势在后期的市场和运营,未来对他更友好。


问:有些大模型企业是在开源模型上做创新,还有一些是套壳,你认为这两种有没有机会?


王晟:有这么三类企业:第一类是真正有能力做大模型的企业,第二类是基于开源大模型做微调、部署,第三类是调用外部大模型的API接口。后两种属于大模型应用公司,要特别专注于应用场景,侧重于发现需求,做好产品,因为它的价值在于把模型用好,把需求满足好,我觉得机会也不小。


Infra完善之后,就会出现很多应用。但受限于我们的想象力,这些应用都是基于过去的,现在用新技术来做迁移,把新的技术范式当成做创新转变的手段,所以几百个大模型,很多都是大公司甚至上市公司在做,他们实际上是试图用大模型赋能原有业务,优化业务链、工具链、工作流。


问:但有些公司似乎只吆喝不行动。


王晟:有些上市公司口号喊得响,可能是为了拉股价。实打实做大模型的企业,在二级市场很少。技术范式迁移的过程中,其实没有创业公司太多机会,因为大厂占据了场景、客户、数据,创业公司只能等创新,需要时间去涌现。


问:之前大家都说要做中国的OpenAI,你觉得现在有公司能配得上这个称号吗?


王晟:我觉得目前还没有。


问:差距有多大?


王晟:现在国内头部的大模型差不多都在GPT-3.5的水平,最顶尖的距离GPT-4和Gemini可能还有两年的差距。一方面在语言能力,另外在多模态方面差距挺远。差距能否缩小,就要看这一次大模型技术范式的天花板有多高,包括多模态能不能也变成生成式,我觉得未来会变成生成式多模态大语言模型。假如LLaMA不开源,我们今天的水平可能比现在还要差,会被国外的大模型公司大幅甩下。


问:现在很多大模型会说自己在某个指标上超越了GPT,在一些排行榜夺冠,这能代表模型的真实水平吗?


王晟:现在的榜单多而杂,基本原理是给AI出题,但我们发现有些榜单的题目和答案都是错的,所以打分越高,可能意味着模型能力越差。对于投资机构而言,刷榜的得分不重要,什么样的团队能做什么事,其实大家都知道,重点还是看人。


三、大厂做大模型没有优势,机会属于创新者


问:行业里一种观点,认为基础大模型交给大厂做就好了,没必要重复造轮子,你怎么看?


王晟:这是屁股决定脑袋。我认为大力度的颠覆式创新,应该由初创企业来做,而不是由某些业务上的垄断者来做,因为作为既得利益者,第一它做不好,第二不利于整个创新的生态。


问:表面看起来,大厂有很多优势。


王晟:我觉得没有什么优势。


问:他们会讲,有云计算、人才、资源。


王晟:熊彼特讲创新,其实不是颠覆式创新,而是创造性破坏。创新会对旧势力造成沉重打击,所有不创新的企业都会被破坏掉,而大厂就代表旧势力、旧的生产力、旧的范式,创新本身就是要颠覆他们的。大厂愿意做的都是当一个东西看起来成熟时,跳出来抢夺胜利果实。渐进式创新、无法形成特定壁垒的项目,很容易被大厂打击,爆发式创新、具有飞轮效应的项目,只要飞轮转动起来,大厂就很难将它干掉。


问:你觉得这一波AI跟上一轮最大的区别是什么?


王晟:大模型。过去的小模型不会带来泛化的智能,只能在特定场景表现不错,现在我们已经看到了大模型的涌现,而且过去的语言任务是理解式,现在是生成式,它能做的事情会更多。


问:差异怎么体现?


王晟:我们经常开玩笑,人类能感知,动物也能,而且不比我们差,但动物能做的事就很少。只有是生成式,才会像人类产生巨大的、更复杂、更多元化的经济活动。


问:垂直模型是伪命题吗?有人认为数据太少就不会有智能涌现。


王晟:其实大语言模型已经有很多数据了,再给它很少的数据也能涌现,就像一个受过非常多教育的人能触类旁通,因为底座太强大。更重要的其实是,大模型应该深入到工作流中去,让AI变成工作的人,而不只是一个聊天机器人。只有AI进入工作流,它才在行业里有价值,这就是Agent要做的事。


问:大模型的竞争,是不是已经不再可能会有新的团队出现并挤进头部阵营?


王晟:目前看不太可能。


问:现有的玩家你更看好谁?


王晟:现有的几家各有特色,而他们其实代表了不同的探索方向,现在赢就变成了一个更复杂的事儿,长期还是要看谁真正挖到了需求。


问:黄仁勋和马斯克都提到,会在2029年之前看到AGI(通用人工智能)。你的预测偏乐观还是偏保守?


王晟:我觉得没戏。从大的范式上来看,有人相信基于transformer就能实现AGI,但transformer存在一个悖论,它做复杂的事情容易,做简单的事情有时候很困难。我觉得有一些其他范式也有机会,比如基于强化学习的具身智能,以及全脑计算。


问:接下来你觉得哪些领域可能会出现爆款应用?


王晟:多模态大模型、生成式视频、Agent。


问:现在这一波AI创业,创业者如果不懂技术,是不是就没什么机会?


王晟:那就等几年。现在这个新旧范式转移的阶段是属于技术高手的,等底层的创新都做完了,创新做成平台化,会需要产品高手和运营高手,那才是新一波大众可以参与的时候。


问:作为投资人你是怎么学习的?如何获取信息?


王晟:除了常规的信息渠道,我觉得还是得跟厉害的人交流,这样能提升认知。另外投资是一个非常复杂的综合性的系统,不是说我投AI就只学AI,它还涉及到很多交叉学科的知识,比如我会看脑科学、行为学的东西,一个广泛的知识体系还是挺重要的。


本文来自微信公众号:树龙谈(ID:shulongtalk),作者:贺树龙,编辑: 黎明,对话嘉宾:王晟