什么才是正确的AI创业创新姿势?

答案好像不是做大模型的。吃过见过,和王兴一起创立了万亿美团帝国的王慧文,大模型创业弄了一半,抑郁了,早早就退出了人工智能内卷,他或许提前看到了什么终局?

王慧文的退出,并没有像他高调宣布进军大模型一样,引起什么产业波澜和反思。大家只是感叹有钱人看来只是表面快乐。

无论是大厂还是中小创业公司,大部分继续一股脑继续“造轮子”,做大模型开发。

对于人工智能产业,目前催生三个可见的赛道:

万亿级的是芯片公司,这是属于英伟达、AMD等超级公司的赛道,不属于任何中国企业。

千亿级潜力是开发大模型“造轮子”,OpenAI提供了大模型的思路,许多公司在OpenAI开源的基础上去模仿OpenAI开发自己的大模型。但是随着今年4月份OpenAI宣布不再开源,模仿者大部失去了方向,技术水平停留在ChatGPT 2.0左右阶段。

还有就是百亿级左右的赛道,各种搭建在大模型上的应用,把大模型作为底层技术,应用在各个领域,例如做各个产业的垂直模型,现在有在尝试医疗、法律、娱乐、绘画、数字人等等领域,目前大部分都处于试水阶段。

目前在中国,AI这条赛道上大家都喜欢抢着造轮子。根据中新财经统计,目前已有超90家中国科技公司发布AI大模型,而这个数字在今年4月份还仅为50多家,人工智能产业正在“百模大战”。

然而,造轮子这条赛道,在昨天大概率将被扎克伯格的Meta发布的Llama 2给终结掉。

一、Meta放大招Llama 2,让“造轮子”大模型创业者们心头一凉

昨天,Meta宣布Llama 2激起整个人工智能产业震荡。Llama 2即扎克伯格创建的Meta(Facebook)旗下专门推出的商用开源大模型。据Meta官方介绍,Llama 2大语言模型系列是经过预训练和微调的生成式文本模型,其参数数量从70亿到700亿不等。

Llama 2其参数和实际测试已经达到ChatGPT-3.5左右水平,先不说中小创业公司,国内就算许多大厂,如文心一言、通义千问、360智脑都不能达到这个水平。

作为人工智能领域权威之一的机器学习科学家内森·兰伯特( Nathan Lambert )直言,Llama 2 性能是超过GPT-3的,对许多闭门造大模型的公司是个巨大的打击,这个模型(Llama 2)将满足大多数公司对更低成本和个性化的需求

Llama 2对于人工智能应用,就像手机APP开发之于安卓操作系统一样,其目的就是让应用层开发者们不用重复造轮子,直接用最低成本获得大模型的基础设施使用。

几个月前,Google曾公开表示,因为有开源社区,我们(Google和OpenAI)没有护城河。或许是美国巨头们已经想明白,大模型本身并不具备护城河,而是某个开源大模型上面形成的应用生态将是最大护城河。

这个生态看起来是美国巨头们蓄谋已久。作为Meta宣布的首批合作伙伴之一,亚马逊云科技宣布,客户可通过Amazon SageMaker JumpStart使用由Meta开发的Llama 2基础模型。

而OpenAI 的密切合作伙伴微软,这一次成了 Llama 2 的首要合作伙伴。在未来,任何个人开发者或者中小公司,都可以最低成本调用Llama 2。

猎豹CEO傅盛在第一时间转发了Llama 2的文章,并配文“这一下不知道多少公司笑醒在深夜,多少公司哭晕在厕所”。



朋友圈下面,前搜狗CEO、百川智能创始人王小川留言:哈哈哈。表示赞同。

而此前就说公开说“大模型本身没有价值”的金沙江创投合伙人朱啸虎则留言说:“都是笑醒吧,又可以take free ride”,意思是大家都可以用免费的“轮子”了——OpenAI已经不再开源,而Llama 2的出现拯救了大家。

傅盛随后在其视频里公开表示,Llama 2将会让大模型白菜价、平民化,像自己这样做人工智能应用落地的才是正确的方向。

《量子连线》采访了一些在看人工智能项目的投资人,他们都表示目前已经不会再投“国产大模型”。业内许多人已经达成共识,大模型就是一堆代码,如果没有落地产业生态,意义不大。

目前看来,大模型需要生态,以及大规模资金投入,这也不是一般中小创业公司和投资机构能长期承担的,美国方面有科技媒体透露Llama 2目前保守估计训练成本高达2500万美金。而整合亚马逊云,微软等生态更是不可想象的资源。

百度高管吴甜曾在几天前表示,真正从底层做起来的大模型成本非常高,国内大模型终局将只有几家能活下来。

只是想不到终局来得如此只快速。

二、搞基础设施是浪费资源,硅谷创业者反而比较清醒

王小川曾在4月份说中国大模型比美国技术落后了3年,而百度方面则认为没有那么大差距,为此双发还打了嘴仗。

但不管差距多久,商业竞争先发优势是非常重要的。安卓系统如果晚两年发布,将不具备今天的生态;微信如果晚米聊两年出现,张小龙必然不会有今天的成就...正如《从0到1》所描述的,互联网是个能把先发规模优势发挥到极致的领域。

也许是监管和中美环境,让中国大厂们,甚至创业者心存侥幸,觉得还可以有几年的发展空间,还能在基础设施上努努力。但是随着监管规则的落地,以及硅谷大模型基础设施的逐渐成型,再做轮子已经没有任何意义。

其实在硅谷,大部分中小创业公司并没有在重复造轮子,他们早已经开始研究人工智能应用方向。例如最近兴起的AI Agent概念——AI工具能够自主工作和反馈,感知所处工作环境并作出反应,通过自主决策和行动完成某些任务,还能通过学习、反思进行迭代。整个过程几乎不依赖人类的指令和监督。

例如Inflection AI是一个人工智能旅行私人助理公司,在6月底筹集了13亿美元资金。该公司正在开发一款私人助理,可以担任顾问角色,处理诸如在旅行延误后获得航班积分和酒店等任务,解决了人们繁琐的旅行事务。

另外一家初创公司Adept,筹集了4.15亿美元资金。Adept研发的模型Action Transformer(ACT-1),仅需一句提示语,便可以自行进入公司Salesforce客户关系数据库,完成一项据说需要人类点击10次或更多点击的任务。

而人工智能角色生成聊天软件Character.ai以10亿美金估值获得了1.5亿美元的投资,Character.AI 允许用户以各种人物(例如明星、历史人物)等人物为模型创建人工智能聊天机器人,还可以帮助用户去和自己的男女朋友聊天,以增进感情。

大模型,在未来更多将是像云一样的基础设施,需要的企业或者用户直接进行采购和调用。

一些接受采访的软件开发者对《量子连线》表示,调用大模型非常简单并且成本不高,一些开发者在今天已经开始测试调用 Llama 2。



甚至一些把自己的微信聊天接入了。之前他们需要使用一些类ChatGPT的开源软件,现在直接使用 Llama 2,有了 Llama 2 这样的开源大模型,自研的意义更小了。

傅盛预言,未来几个月,大模型开发者将面临大规模裁员。

而对于阿里云,百度这些All in大模型的大厂来说,Llama 2也将给他们造成巨大的压力,如果相同的价格,为什么开发者不去用价格更便宜,性能更好的大模型呢?