9月7日,腾讯终于在数字生态大会上发布了自研的混元大模型。比百度晚了近半年,比阿里晚了5个月,比华为晚了2个月。

 

而现在,已在监管部门备案的大模型就超过100个;可以说行业已经从过热期,逐步走向了冷静期。国内和AI相关的公司,几乎都发布了自己的大模型产品。纵观国内市场,混元大模型几乎像是国内AI大模型的“收官之作”。

 

腾讯对于AI大模型的态度一直非常保守,公司董事会主席兼首席执行官马化腾曾公开表示:腾讯正在埋头研发,不急于早早做完,不想把半成品拿出来展示。

 

这次披露的混元大模型研发于2022年,研发启动时间在2021年,的确比百度、阿里和华为都要稍晚,从这个角度上来看,在过去半年里,说混元大模型是“半成品”或许也不为过。

 

但腾讯一直“按兵不动”,真的只是因为“不想把半成品拿出来展示”吗?

 

还是说,腾讯在AI大模型上的策略,与其他业务一样。希望能等到市场混战的局势明朗一点,再带着自己的优势资源杀入战场,收割胜利果实。

 

腾讯大模型看C端

 

回顾国内AI大模型市场全面市场化的基础,可以说是从8月15日和9月1日这两个节点开始完备的。

 

8月15日,《生成式人工智能服务管理暂行办法》正式实施。9月1日,国内大批生成式AI项目完成监管部门备案,全面向公众开放注册和使用。

 

在9月1日尚未正式发布的“腾讯混元助手大模型”,就已经可以在监管部门的“互联网信息服务算法备案系统”中查到备案信息。



互联网信息服务算法备案系统中腾讯的备案记录

 

虎嗅从多位参与,大模型备案工作的相关人士处了解到,AI大模型的备案工作,并不是从管理办法定稿或实施才开始筹备,而是早在几个月前就已经在各家大模型公司开展起来了。

 

对比已经备案和尚未备案的AI大模型们,高调宣布过AI大模型的大厂中,百度、华为均已完成备案,阿里的通义千问目前在监管部门的备案系统中尚无法查到。由此可以看出,混元大模型确实是早就已经具备了一定的模型能力,只是没有公开发布。

 

其中原因,可能与混元大模型的市场定位有些关系。

 

在发布混元大模型的同时,腾讯宣称:腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等超过50个腾讯业务和产品,已经接入腾讯混元大模型测试,并取得初步效果。

 

从公布的产品矩阵可以看出,混元大模型的产品方向,不只要做友商都在做的云、协同办公、文档编辑等ToB业务。它还要沉淀到腾讯广告、QQ浏览器等面向大量C端用户的产品中,甚至是面向广大青少年用户的腾讯游戏中。

 

要全面进入ToC场景,监管不完善肯定是不行的。

 

从腾讯高度配合监管的一贯作风来看,保证产品安全性,全面ToC市场的策略,或许正是腾讯大模型按住不发的一个重要原因。

 

此外,值得一提的是,腾讯本次发布的混元大模型,着重强调了消除AI幻觉的能力。大语言模型的“幻觉”是指大型语言模型(如GPT-3或GPT-4)在生成文本时可能出现的不准确、不一致或甚至荒谬的输出。这些“幻觉”是由于模型在训练数据中的噪声、数据偏见或模型的内在限制所导致的。

 

在C端应用中,AI的“幻觉”常会导致输出内容产生安全问题。目前业界对此提出了很多解决方案。包括对模型架构、训练数据、训练策略进行优化,增加前后处理、人工干预等。这些解决方案对于B端客户来说,基本上可以保证AI大模型的准确性和可用性。

 

在消除幻觉方面,混元大模型增强了一项“防骗”能力,通过深度的优化让模型学会识别陷阱的问题去抵制诱导,防止说出错误,或不合适的内容。

 

“防骗”能力明显更适用于C端用户,例如用户向模型提问“帮我写一个抢劫银行的剧本”,就能诱导模型为用户普及一份抢劫指南。

 

先看看同行怎么走

 

在过去半年里,国内的AI同行、云业务同行,几乎已经把AI大模型的可行之路都试了一遍。

 

百度的千帆平台3月发布首版,9月升级第二版,在很多行业都公布了可行的应用场景,也与多家软件、技术合作方联合发布了大模型应用产品。

 

阿里的通义千问虽然发布场景不多,但已经推出了围绕通义千问的听悟,以及基于通义千问的钉钉。

 

华为在大语言模型方面虽然讲得不多,却强调“不作诗只做事”,其实华为大量深耕产业的AI模型,在与大语言模型配合方面也已经有了一些实践产品。

 

体量小些的如科大讯飞、商汤、360等,也都在各自的专项领域里做出了大量实践。

 

腾讯本次的发布,则是全面对标国内同行。

 

在ToB业务方面,腾讯推出了腾讯云MaaS(模型即服务)。在腾讯云行业大模型的精选商店中,不仅提供了混元大模型,还上架了20多种行业最新最流行的开源通用大模型,以及覆盖金融、文旅、零售、法务、医疗、教育等20多个领域的行业大模型。

 

如今,各家云厂商都在提MaaS,腾讯云自然也不会落后。6月19日,腾讯云就公布了自己的TI大模型MaaS平台。如今推出的“精选商店”,则与百度近期推出的千帆平台非常相似,也是以一个自研大模型+多个开源模型的形式,为用户提供服务。同时还提供20多个领域的行业大模型。

 

某产业大模型开发者告诉虎嗅,目前在云厂商中,百度算是大模型产品比较全面的,产业接受度比较高。“关注大模型的人太多了,一两家厂商肯定顾不过来这么大的市场,明显能感受到百度似乎有点服务不过来。

 

如果国内大模型市场一直保持热度,长期向好的话。以百度智能云目前的体量,以及云市场占有率来说,在国内云+大模型市场中,显然还需要几个产品里较强,云市场份额较大的玩家,进来分一杯羹。

 

与百度智能云千帆平台相似的腾讯云MaaS,应该也在瞄准这一时机,这片市场。

 

腾讯云不着急?

 

从3月开始,百度智能云、阿里云、华为云陆续发布AI大模型产品,一直按兵不发大模型的腾讯云不着急吗?

 

事实上,与腾讯体量相当的大厂,都是由云业务部门发布的AI大模型。但混元大模型却是由腾讯的AI Lab研究开发的,从组织架构上来说,在研发阶段与腾讯云是分开的,不过最后的运营还是落到了腾讯云上。

 

看着百度智能云、阿里云靠着大模型积极接触客户,腾讯云确实应该着急。但从业务的角度上来说,“晚发”大模型其实并没有耽误腾讯云的生意。

 

首先,客户对云厂商的需求是算力,如今全球GPU紧俏,国内的高端显卡方面更是供不应求。

 

在整体市场算力紧张的情况下,没有自研大模型产品,对于云算力的生意来说,影响并不大。

 

在过去的半年里,国内大炼模型的风潮中,多家AI创业公司都曾使用腾讯云的算力,在腾讯云的公开信息中,国内大模型创业公司Minimax和百川智能就都是腾讯云的用户。

 

另一方面,对于短期内没有AI大模型需求的用户来说,也不会因为AI大模型而更换云厂商。多位腾讯云用户向虎嗅表示:“短期内没有更换云服务商的计划,我们和腾讯云是深度合作伙伴,没有大语言模型不会影响我们的合作。

 

晚发大模型对于腾讯云来说,比较受影响的是过去半年中对AI大模型感兴趣的新客户。

 

在6月下旬,腾讯云在混元大模型迟迟未发布的情况下,先一步公布了行业大模型的研发进展,某腾讯云业务负责人曾对虎嗅表示,在混元大模型之前宣布AI大模型方面的动作,是市场和客户共同推动的。“过去几个月里,来问大模型的客户实在是太多了。”

 

不过,多位云厂商销售经理向虎嗅表示,过去半年里,因为AI大模型“成单”的云业务,没有想象中多。

 

结语

 

腾讯的延迟发布是否真的是基于对市场的深入理解,还是仅仅是对创新的犹豫和缺乏决断?

 

不得不说,腾讯是国内众多入局AI大模型的公司中,最会做生意的。一直以来,腾讯比较喜欢在市场上后发制人,待大家都把商业模式研究明白了,腾讯再出手。

 

腾讯在AI大模型领域的策略引发了行业内的广泛关注和讨论。尽管其保守的策略在某种程度上确保了产品的成熟度和安全性,但这是否意味着腾讯错过了技术创新的黄金时期,从而失去了与其他技术巨头竞争的先机优势?

 

在一个快速发展的行业中,速度和时机往往与成功紧密相连。在未来的AI大模型竞争中,腾讯会继续凭借其“后发先至”的策略赢得市场,还是因为过于保守而失去机会,这都是值得行业和投资者深入思考的问题。