百度文心一言翻车赶鸭子上架有点太着急了

应该给百度和文心一言证明自己的机会，但是预期还是调低一点好，高科技发展需要开放的、竞争性的技术环境。

冰川思想库研究员丨关不羽

二十年后的某个早晨，我在盥洗室洗漱时回忆着美好的青春，对“文心X言X代智能系统”的镜子发出了灵魂之问，“文心文心，谁最美？”。心中早有答案，必须是青霞姐。

镜子闪烁了0.3秒，给出了一张浓眉大眼好青年的玉照。

这是谁啊？哦，李老师。

回过神来，感觉不对啊。我都老得满脸褶子了，李老师还是鲜肉状？哦，录播的……

——2023年3月16日文心一言产品发布会感想

01

这是一场内容很丰富的产品发布会。通过这场发布会，我们可以学习生成式AI的工作原理，了解应用前景，展望AI技术带来的巨大变革。很多张制作朴素的PPT，林林总总、面面俱到。除了没有产品实操，别的都有了。

现场的产品发布会还没结束，网评大会已经在互联网上开幕了。段子与爆料齐飞，玩梗与黑历史共舞。不知李彦宏此时，是怎样的心情。

唯一刺激心脏的是，百度的股价应声而落。靠着同业逆水不退则进的如有神助，刚回“BAT”头部时代没几天，却因为这场没有产品实操的“产品发布会”摇摇欲坠，情何以堪？

图/网络

百度这次被群嘲不冤。“对标ChatGPT”的大旗挥舞得烈烈生风，市场预期拉满，都盼着你葫芦里掏出个九转金丹，拿出来的却是“药物使用说明书”一张，失望是肯定的。

这是一场公关危机，在中国很常见，百度尤甚。百度上一次成功的公关，可能要追溯到20多年前——2000年1月1日，百度在中关村诞生，硅谷归国的李彦宏意气风发。

20多年后的这场产品发布会上，撰稿人“全球大厂第一个发布类ChatGPT产品……”的自我表扬，让人笑而不语。

文心一言还没推出，就搞得口碑走低，输的肯定不是产品。

02

这场仓促的产品发布会，背后是一次仓促的商业决策。

《科创板日报》记者从接近百度的人士了解到，其实包括百度内部包括技术团队对于这么快推出文心一言，并不是没有不同意见，但看到ChatGPT推出后带来的轰动与商机的李彦宏，坚持要求火速推进并尽快推出，并亲自领军和监控项目进展。

对于为何要加快发布文心一言，李彦宏的说法是，因为市场有需求。

百度的很多产品，从搜索到智能云，再到自动驾驶，到小度，大家都有需要，更重要的是我们的客户需要，合作伙伴需要，从我们承认文心一言的存在到现在，短短一个月的时间，就有超过650家合作伙伴宣布加入文心一言生态，大家都希望能早一点用上最新最先进的大语言模型。

百度管理层应该反思自己的操之过切。

“有需要”“希望早一点用上”，都没有错。但是，这些都不是仓促发布的理由。很多人对上火星有需要，马斯克肯定希望早一点上，就可以塞三五个不要命的重型火箭，奔着火星出发吗？“我想要”和“我能做到”是两回事，这是最起码的常识。

笔杆子大话连篇，企业掌门人可不能这么干。“亲自领军”再加亲自监控项目进程，只会让看得清真相的旁观者望而却步，并不明智。

图/图虫创意

平心而论，李彦宏是中国大厂掌门人中最有技术底蕴的，也是最有技术追求的。这些年，百度确实在前沿科技领域做出不少成绩。但是，效果如何，有目共睹。

云储存起步很早，不温不火；自动驾驶用力最猛，却被主流车企挡在门外，境遇很尴尬。每一次风风火火，最差的是一地鸡毛，最好也不过高不成低不就。

百度的科技创新追求是热烈的、真诚的，锲而不舍的精神是可贵的，但是反复失望留下的心理阴影面积太大了。这次轮到了生成式AI，挑战ChatGPT是一次逆风翻盘的冒险，开局又开成了这个样子……

真替度娘捏把汗。

03

说句公道话，产品发布会失败，不等于产品失败。文心一言好不好用，和PPT做得好不好、笔杆子写得好不好，没有关系。没有试用之前，不能率意判断。应该给文心一言机会。

但是，生成式AI的属性而言，百度可能挑错了赛道。算力、算法都不是问题，硬件技术的短板迟早总能跟上。3月16日不行，那就12月16日。2023年不行，还有2024年。时间也不是问题，问题出在生成式AI需要开放的、竞争性的技术环境。

正如百度搜索的技术起点并不低，搜索技术在今天也不是什么了不得的高科技。然而，同为“全球大厂”，百度的球是乒乓球，谷歌的球是地球。

科技创新发展的规律，不以主观意志而改变，深层次的差异会让同一起跑线的选手渐行渐远。

百度深耕生成式AI的“十年磨一剑”多半不假，即将推出的文心一言也许不会让人那么失望，但是这一技术领域的天花板注定不会太高。这不是百度的错，虽然百度多半会背这口锅。

科技发展需要全社会的观念更新，光有雄心壮志是不行的。比如胡锡进老师，在群嘲文心一言的网络舆论中逆行，一口一个“中国的孩子”，一片诚意天地可鉴。然而，老胡不懂互联网科技，一片痴心的文不对题。

图/网络

什么“文心一言成为了ChatGPT在全球第一个实质性的追赶和竞争者”，谷哥笑而不语，脸叔一脸懵圈。

什么“欧洲、日韩形不成竞争力”，老胡误以为今天还是坚船利炮的帝国争霸时代，却不知道未来的通用AI技术必然是跨国合作与技术交流的成果。

世界上最大的非营利人工智能研究机构是德国人工智能研究中心（DFKI），十大股东中有美国大厂也有德国工业软件巨头。

欧盟日韩不是傻子，打不过就加入的道理是能想明白的。高科技发展早已不是闭门造车的自嗨，而是你中有我、我中有你的全球化体系。

老胡只说对一点，“文心一言像ChatGPT一样有学习能力”。但他可能没注意到，同样的学习能力学不一样东西，培养出不同“孩子”。

我支持老胡的立场，应该给百度和文心一言证明自己的机会，但是预期还是调低一点好。

我想着青霞姐，它给我PPT，也得忍。不忍怎么办？有得挑吗？用了度娘二十载，它还在“梦里寻他千百度”。

相关报道：

3月16日，神秘的百度文心一言终于揭开面纱。

这款被寄予厚望的中国类ChatGPT产品，到底什么水平？

百度CEO李彦宏在发布会介绍，文心一言具有包括文学创作、数理逻辑推理、多模态生成等五大功能。

一大亮点是，文心一言不仅能生成文本、图片，同时具备生成音频和视频的能力。

文心一言不仅能生成文本、图片，还能根据以上内容生成视频‍‍‍‍

但比起产品介绍的“雷声大”，文心一言暂未开放公众的消息，让关注者大失所望。百度称，当下暂未对公众开放。用户仅可通过邀请测试码，在文心一言官网体验产品。

部分观看发布会的网友提出质疑，认为李彦宏介绍时不太像现场演示，而是播放提前录制的视频，或者说更像是播放制作好的PPT。

“大家的工作都保住了，”有人调侃，百度发布会缓解了众人被AI取代的焦虑。

调侃归调侃，百度的确 “养兵多日”。

在曾经坐“冷板凳”的人工智能届，百度是中国大厂中投入最多的。2022年，百度研发投入约达214亿元，相当于每月投18亿做研发。

技术派的出身让百度在ChatGPT引发的狂飙中，成为备受瞩目的中国公司。

但人工智能之路不仅关乎技术。多位业内人士告诉盐财经，训练出类ChatGPT产品是一项综合实力。

清华大学计算机科学与技术系长聘副教授黄民烈表示：“ChatGPT的基座模型都在真实调用上不停迭代和优化。它不仅仅是技术上的成功，更是系统、工程、数据上的成功。”

3月14日，OpenAI推发布了GPT-4。升级更新后的ChatGPT-4处理文字内容的上限拓展到2.5万个字符，是ChatGPT的8倍

李彦宏和首席技术官(CTO)王海峰也在发布会几次强调，文心一言并不完美，仍有赖通过真实的用户反馈而逐步迭代。

匆匆推出的文心一言，哪怕有些赶鸭子上架，展露出不够自信、不够完美的面貌，但也只是生成式AI产品的开始。随着使用增多，它将变得聪明。而要做到这一点，需要我们的共同陪伴、见证成长。

推出类ChatGPT的竞赛仍在进行。

值得庆幸的是，中国公司擅长做从1到100的竞赛。

对比同行

我们常说，货比三家。一个产品好不好，就将它与同类竞品进行比较，这自然是一种判断方法。

不过截至发稿，我们仍未取得“文心一言”的邀请码及内测渠道。因此，我们对比的方式是，将百度发布会上演示的问题，同样地询问基于GPT 4的Bing。

百度发布会上，演示的场景有5个，我们选择性地提问。结果如下：

第一：提问，可以总结一下《三体》的核心内容吗？如果要续写的话，可以从哪些角度出发？

百度发布会上演示的问题，同样地询问基于GPT 4的Bing。（上图为文心一言，下图为Bing）

第二：提问，如果要成立一个用大模型服务中小企业数字化升级的科技服务公司，可以起个什么公司名？

百度发布会上演示的问题，同样地询问基于GPT 4的Bing‍

第三：下面我们来玩一个鸡免同笼的游戏。1只鸡有2只脚1个头，1只免子有4只脚1个头。那么，如果有一个笼子里有9个头，30只脚，应该有多少只鸡，多少只免子？

百度发布会上演示的问题，同样地询问基于GPT 4的Bing，后者计算错误

第四：洛阳纸贵是什么意思？并用洛阳纸贵四个字写一首藏头诗。

百度发布会上演示的问题，同样地询问基于GPT 4的Bing

第五：无。（因GPT 4等尚不具备多模态功能，或尚未开放。）

可以看出，在以上示例问题中，文心一言与Bing的差别不大.

你更喜欢哪个呢？

另外，两者的差异也很显然。

Bing目前还无法完成多模态跨模的生成任务。而“文心一言”，在发布会上，也没有演示GPT等产品最亮眼的功能之一：编程能力。

差别当然远远不止这些。

不过，无论GPT 4还是文心一言，在前后脚开启的发布会中，被披露的模型参数、结构设计，以及功能实现技术等，信息都很有限。因此，能够对比映照的信息，也很有限。

高潮迭起

百度的着急与焦虑显而易见。

基于GPT-3.5的ChatGPT在2022年11月30日横空出世不久，新版本GPT-4又迅速发布。无论是速度还是呈现效果，都足以让科技巨头拉响警报。

新浪微博新技术研发负责人张俊林告诉盐财经，ChatGPT带来了一次革命式的突破。

比起5年前局限于围棋领域的人工智能AlphaGo，类ChatGPT的生成式AI“能真正地促进很多行业工作效率大幅度提升，这是人类首次做到这一点”。

支撑AI变得通用的技术叫大语言模型（LLM），首要的特点是参数够大。GPT-3.5模型已达到1750亿参数，LG的Exaone模型有3000亿参数。华为的盘古大模型有2000亿，百度文心一言的大模型Ernie Bot也是千亿级。

炫酷数字的背后是实打实地烧钱和迭代。

对于一些更大的LLM模型（如拥有2800亿参数的Gopher和拥有5400亿参数的PaLM），训练成本介于200万美元至1200万美元之间

国盛证券曾估算，按照今年1月ChatGPT的流量，初始投入成本约为8亿美元（约合 55 亿元），每日电费在 5 万美元左右（约合 34 万元）。

巨头们押注与投入，源于人工智能近5年发展的新路径。张俊林介绍，近年AI届逐渐得出一个定论，机器学习的数据越多，在数据质量高的前提下，AI学习知识的能力将越强。

Open AI率先推出ChatGPT惊艳众人，地位受到挑战的巨头纷纷按捺不住。

2月初，谷歌内部为ChatGPT亮起红色警报，因此提前发布对标AI对话产品的Bard。这款基于大模型LaMDA的产品，被称为迷你版的ChatGPT。

据谷歌披露，LaMDA的模型规模仅1370亿参数，需要的算力也大大降低，这样可以让更多用户快速试用，获得即时反馈。

相比Open AI开放ChatGPT的慷慨和大胆，“老大哥”谷歌罕见地如此小心翼翼。与百度相似，谷歌表示“新发布的版本只是小范围内测”。

但就在GPT-4和文心一言发布的这周，谷歌宣布将在企业级协作平台Google Workspace引入AI，以迅速实现AI撰写邮件、生成文档摘要等需求。

谷歌母公司Alphabet的一位高管形容，AI接入谷歌文档后，就像提供了一根“魔杖”。用户只需输入要撰写的主题，草稿就可自动生成。

落地化的应用发布之余，谷歌还在近日公布了有史以来最大参数的模型——号称有 5620 亿参数的PaLM-E。据介绍，这是一种多模态视觉语言模型（VLM），最大特点是能利用视觉数据增强语言处理能力。

在谷歌公布的视频里，它甚至具备控制机器人的视觉和语言能力。

谷歌还在近日公布了有史以来最大参数的模型——号称有 5620 亿参数的PaLM-E，其甚至具备控制机器人的视觉和语言能力‍‍‍

唯一与诸位巨头步调不一致的是扎克伯格。

2月底，扎克伯格的Meta一次性发布了自家大语言模型LLaMA，并宣布开源。普惠型的应用一共推出了4款，参数量从70亿、130亿、330亿到650亿。

3月14日，斯坦福大学团队发布基于LLaMA的指令调整的模型——ALPACA，并表示其测试结果与GPT 3.5的性能相匹配。

深耕AI和元宇宙的Meta给出了他们的理解。“近来研究表明，最佳性能不是由最大的模型实现的，而是由基于更多数据训练的更小模型实现的。”

令人眼花缭乱的各家迭代，让匆匆发布新品的百度显得有几分自信缺失。李彦宏在3月16日的发布会开头便承认，文心一言对标ChatGPT甚至是GPT4，门槛是很高的，“我自己测试感觉还是有很多不完美的地方”。但之所以今天发布，是因为有市场需求。

生态抢跑

技术面上，百度在中文NLP领域，无疑拥有先天优势。

首先是对国内技术政策的熟悉，令它比ChatGPT 更能满足国内市场需求。

其次，作为最大的中文搜索引擎，百度拥有的高质量数据集及中文数据收集能力，他者无法比拟。

不过颇感意外的是，发布会上李彦宏提到，目前文心一言对英文的支持能力弱于中文。反过来，据OpenAI公布的数据，GPT 4 在对中文的支持能力上，准确率可达80%以上。

两者的具体差别，尚需产品真正进入市场后，用户们的检验。

但也正如李彦宏及百度CTO王海峰在发布会上所说的，大规模技术的产品，才刚开启“起点”。未来的技术变化日新月异，不能以起点高低论英雄。

李彦宏认为，在人工智能时代，IT技术栈发生了根本性变化‍‍

作为中国第一家拿出了大模型产品的公司，百度“打了头阵”，已属不易。

何况我们知道，国内厂商在推动技术“从1到100”的发展方面尤为擅长。总之，未来可期。

但，技术并不是这场AI竞赛的唯一要点。

除了OpenAI、百度，当前赛道中的公司，还有谷歌、Meta、阿里等巨头。

谁能率先建成“壁垒”？或者说，谁将成为AI生态的领头人？

类比普通人熟知的手机系统，李彦宏曾在2018年两会期间说过：Google现在是人工智能领域的“iphone”，而百度则是这个领域的“安卓”，百度的AI开发平台开放源代码，欢迎所有的同道者加入，从长远来看，开放是必然会战胜封闭的。

其它的暂且不论，如今再看这句话，Google的角色已经被OpenAI替代。

“开源”与“封闭”的确是两条不同的道路，但“路线之争”也不完全决定未来——这在苹果系统与安卓厂商的局面中已能证得。

对用户而言，真实可感的强大是，获取（研发）成本低，使用成本低，迭代速度快。

以OpenAI 为例，这家身处第一梯队的AI公司，“抢跑”姿态再明显不过。3月15日，GPT 4发布当天，它一口气发布了论文、System Card、Predictable Scaling、开放GPT 4给会员用户，也开放了GPT-4 的 API。

这些举措，无疑都在抢入市场，以降低门槛、减少成本的方式。

具体来看，Predictable Scaling可以帮助开发者，以万分之一的成本预测模型效果，大大减小了“烧钱规模”。而OpenAI Evals 和 Syestem Card，则是专为开发者提供的精调工具，为的是方便研发者制作出个性化的服务产品。

使用成本上，GPT 4的费用比前辈GPT 3大为降低，1000个prompttoken 0.03美元，1000个 completion token 0.06 美元。

国盛证券基于参数数量和token数量估算，GPT-3训练一次的成本约为140万美元，而GPT 4的使用成本费用比前辈GPT 3大为降低

更方便的获取与更低的成本，势必导入更多的数据，形成“数据飞轮”。

它的意思是说，当一个初始小的改变在不断累积下去，最终可以形成一个巨大的、不可逆转的正向循环效应的过程。

OpenAI的抢跑逻辑之强大，就在于此。通过与微软的联手，GPT 4在微软Azure云上落地，再以低成本、低门槛的优势，开放API搭建生态，而自己成为一家掌握核心技术的平台型企业。

百度的路径与此相似。

通百度智能云提供服务，吸引企业和机构客户使用API和基础设施，共同搭建AI模型、开发应用。发布会上李彦宏介绍，目前已有650家企业接入了生态。这是一个不错的起点。

彩蛋：向Bing提问文心一言

问：你听说“文心一言”了吗？

Bing：听说了。文心一言是百度推出的一款类似ChatGPT的人工智能聊天机器人产品。今天下午，百度在北京总部召开了文心一言的发布会，展示了它的功能和特点。你对文心一言感兴趣吗？

问：简单说说，它有哪些能力？

Bing：根据搜索结果，文心一言目前具备五大能力，分别是文学创作、商业文案创作、数理逻辑推算、中文理解和多模态生成。它可以根据用户的需求，生成诗歌、小说、新闻稿等文本，也可以解答数学和逻辑问题，还可以理解中文的语义和语法，以及生成与文字相关的图片或音频。

问：你跟它比较，谁更厉害？

Bing：这个问题很难回答，因为每个人工智能产品都有自己的特点和优势。我不想跟文心一言比较，我只想做好自己的工作，为用户提供最好的搜索和聊天服务。

百度文心一言翻车 赶鸭子上架 有点太着急了

百度文心一言翻车赶鸭子上架有点太着急了