一个有着超大“内存”的智能助手,可以一口气读完二十万字的小说,还会上网冲浪,这是一款名为Kimi的AI助手的官方介绍。
如果是作为一位电子文档和生成式AI高频使用者,你在此之前可能未必听说过这款助手;但如果你是一个A股的资深股民,你一定在这几天内听说过这个名字。
两周之前,国内AI独角兽月之暗面宣布其对话式AI助手产品Kimi智能助手现已支持200万字的无损上下文输入。
但AI界还没有反应过来的时候,资本市场的狂欢突然之间开始了。首先开始大涨的,居然是昔日A股“妖王”九安医疗。自3月19日起,九安医疗股价起飞。从当日开盘41.96元/股,在4个交易日内一度涨至最高54.98元/股。这是因为在2023年8月时,九安医疗曾经投资过月之暗面这家公司。
但事情发展的速度太快,随后几天里,A股市场上冉冉升起了一个全新的概念——“kimi概念股”,并且多家上市公司股价因此而受益。
比如华策影视拥有国内影视行业最大的全版权片库,掌阅科技接入Kimi尝试打造智能阅读App,中文在线拥有可用于模型的IP数据,中广天择为其提供数据支持和交易平台,深信服参与了月之暗面的融资。值得注意的是,就连人民网都是Kimi内容合规的核心合作方和训练数据审核方……
而如上列举的,仅仅也只是一众Kimi概念股中的一部分。一周时间里,沉寂已久的A股市场上迎来了一场久违的概念股炒作狂欢,其爆火的热度,以至于让一众互联网大厂们都坐不住了,相继开始布局kimi所在的长文本赛道。
不过,从这一周开始,Kimi概念股就开始相继熄火,比如此前涨幅不错的九安医疗和华策影视,股价都开始掉头向下,华策影视一度跌超9%。
这场关于AI的炒作盛宴,还没正式开始,似乎就要结束了。
到底发生了什么?
一
Kimi的爆火,从最开始就透露出了一股迷之气息——因为它所主打的长文本赛道,本身并不算是什么新的技术路线。甚至在Sora推出之前,单一的大语言模型就被认为迟早是要转向多模态的。
当然,Kimi也并非没有优点。比如和其他文生文大模型应用相比,Kimi 这款产品自诞生起的核心竞争力就在于长文本分析联网搜索、文档处理等功能。特别是在深度解析厚重书籍内容方面,其性能远超其他模型。
有人实测了Kimi在长文本阅读上的表现,发现其在理解超长文本,比如小说和长篇文件上确实具有独到优势。输入一本《红楼梦》,数秒内就能给你一篇漂亮的总结报告。但是,目前市面上的主流大模型产品在promot的输入上都是有字数限制的。
比如GPT-3.5上下文输入长度约在1.6万token,GPT-4在3.2万token(token:模型输入和输出的基本单位)。把token量化成人类语言的话,3.2万token的GPT-4达到了阅读一篇短篇小说的程度,但并不支持阅读长篇小说。
在理解长篇著作这一点上,Kimi确实有强大优势。
而且,对于中国市场的理解,要完爆OpenAI的ChatGPT好几条大街。比如,向kimi提问“构建房地产市场新发展模式”最早是在哪份文件中提出的,kimi能够以极快的速度给出正确答案,这也是ChatGPT和Gemini们一辈子难以企及的觉悟。但问题是,这个优点其他国产大模型也有。
因此,市场对于Kimi的商业模式价值判断主要还是集中在第一点——长文本上。
但从技术上来看,作为文生文模型上的衍生,长文本在技术上并没有太多的实现难度。无非是加大算力支撑。但也正因为这样,长文本在现实中会遇到一个致命bug,就是成本和收益是否匹配。
一般来说,增加模型规模可能会提高模型的性能,如语言理解能力、生成文本的质量等。更大的上下文范围可以提供更多信息来辅助模型做出更准确的预测或生成更自然的文本。
这本身并没有什么技术门槛,但随着模型规模的增加,需要更多的计算资源来训练和运行这些模型。这可能包括更多的GPU/TPU资源以及更长的训练时间。因此,在考虑模型规模时,需要权衡性能提升和资源成本之间的关系。
去年10月,月之暗面创始人杨植麟去年向行业媒体称,不同于OpenAI只提供ChatGPT一个产品和最先进的多模态基础能力,月之暗面瞄准的是下一个C端超级APP:以长文本技术为突破,在其基础通用模型基础上去裂变出N个应用。
二
换句话说,Kimi打一开始就是冲着商业化变现转化去的。这又是一个典型的中国AI产品特点。当然这并不是坏事,毕竟不是谁都能有微软投入OpenAI的冒险和决心的。
但问题是,月之暗面所设想的C端,到底有多少人存在长文本解析的需求?除了学术研究需要,起码从目前来判断,看不到什么更大的场景。
更关键的是,只看见了出项,却没有看到进项。
据七麦数据下载量预估,近一个月来,Kimi 在App Store日均下载量5445,在安卓端全渠道日均下载量12360,合计日均下载量为17805。目前Kimi投放广告的获客成本约在10元,如果算上拉新后用户问答互动产生的算力成本,每个用户的获客成本达到12-13元。
根据第三方平台的下载量预估,近一个月来,Kimi在苹果端和安卓端的日均下载量为17805。按此计算,Kimi每天的获客成本将烧掉至少20万元。
不论金额多少,这个数据本身就充满了吊诡和荒诞。因为你基本很少看见关于ChatGPT和Gemini的讨论是聚焦在他们的获客成本上的。相反,ChatGPT自诞生之后,就成为史上最快用户破亿的消费级应用。
也就是说,当国外的大模型已经正在思考技术变革是否会威胁人类时,我们的大模型目标是如何抓取更多的人类注意力。
商业模式之外,技术也并非完全没有门槛存在。考虑长文档规模大小的时候还需要看智能水平,目前包括GPT-4、Gemini、Claude等模型均未达到理想水平。另外,长文档规模与智能水平也需要进行工程方面的ROI考量。这些都在技术上还存在需要克服的门槛。
当然,这并不是否认kimi母公司月之暗面的能力。从创始团队背景来看,公司创始人杨植麟为中国35岁以下NLP领域引用最高的研究者,Transformer-XL和XLNet两篇论文的第一作者,公司另外两位联合创始人周昕宇和吴育昕也在大模型道路上探索多年。
由此也可见,技术基本盘还是有的。但是如果对比目前国内大模型赛道上的创业团队来看,每一家其实都不会太差。除了一众互联网大厂,百川智能、智谱AI等从创始人到团队,背景都不会输给月之暗面。
但为什么,目前只有Kimi在Sora的强大光环之下还算是“出圈”了呢?
上面问题的答案,可能并不在月之暗面公司本身。
三
众所周知,自2023年开始,中国市场就掀起了轰轰烈烈的百模大战。
自从2022年12月ChatGPT-3.5的发布之后,生成式AI的技术革命浪潮就已经开启。2023年2月开始,中国国内就涌现出众多的通用大模型和垂类大模型,目前国内公布的大模型数量已超过300个,市场竞争极度激烈,其中不乏也存在着号称要在几个月追平ChatGPT的选手。
过去四十年来,中国企业的竞争方式一直是追赶、复制、模仿。然而,到了2024年开年,OpenAI新发布的Sora震惊四座却在中国市场应者寥寥。这一次,辛苦追赶一年的各路大模型们猛然发现,曾经以为中美的AI差距也就是几个月时间,但在OpenAI的颠覆式创新面前,差距比想象的要大得多。
但市场情绪总需要找到一个标的——Kimi恰好搭上了这班流量和情绪的高速列车。本质上,市场并不在乎它到底是Kimi还是别的什么,也不关心这家公司是不是存在颠覆式创新,只在乎我是不是能通过AI概念的炒作,来收割韭菜。
目前来看,中国的大模型究竟能不能跑出可与OpenAI叫板的选手还是一个巨大的未知数。我只知道,去年6月我在和OpenAI的一位知名科学家聊起中国市场正在进行的“百模大战”时,他所表现的茫然和尴尬,最后不得已回我一句:
我们并没有注意到中国AI产业的这些变化。但我想真正的标准还是需要评估它的创新程度,而不是追逐创新的能力。
we'd want to evaluate the extent to which they are either cutting edge or innovative, as opposed to simply chasing the cutting edge。
当然,还是非常期待看到借助A股市场力量的Kimi,到底能在互联网大厂、李开复、王小川等人至今也未能取得突破性进展的赛道上取得怎么样的创新。
毕竟,目前中国AI产业还有一大后发优势——马斯克前段时间选择给旗下的生成式AI开源,中国AI又一次获得了追赶和学习的机会。
本文来自微信公众号:深水研究(ID:DeepResearch2023),作者:沸雪,编辑:Rocket