本文来自微信公众号:穿云寻恒星(ID:cyxhx2022),作者:Max,原文标题:《ChatGPT vs 谷歌搜索》,题图来自:《环太平洋》
ChatGPT与谷歌搜索孰强孰弱?谷歌搜索是否在遭遇创新者的窘境?搜索的未来走向何方?让我们直入主题——
一、ChatGPT与谷歌所搜的功能和成本对比
1. 搜索与生成
跟ChatGPT相比,谷歌搜索能直接回答的问题较为有限,主要通过查找关键词,不具备语言生成和多轮对话能力,更不可能帮用户生成代码。搜索是通过索引在一个有限页面集合中检索并给予已经存在的内容,ChatGPT可以在理解语义的基础上给出答案,往往很有深度和创意。
2. 个性化
谷歌搜索会基于用户的信息做出个性化筛选,因此能给出更好的结果;目前ChatGPT还没加入个性化推荐方面的功能。当然你可以把你的偏好写进提示词里,但这是很费事的,而且效果不一定好。
3. 真实性
ChatGPT目前不具备联网能力,即数据源不同,它的答案中没有参考互联网上的最新信息,也没有给出信息来源。ChatGPT经常给出似是而非答案,而且语气非常自信,很容易形成误导。当然,OpenAI已经有基于互联网信息的WebGPT了,但这个功能是基于搜索的,而非独立于搜索,所以WebGPT并不是在颠覆搜索,而是对搜索的改善。
4. 成本
成本是不能忽视的,目前每轮对话的成本在几美分,这非常高。谷歌目前每天85亿次搜索,如果这样的需求迁移到ChatGPT,成本要下降超过1个量级才能承受。
二、搜索的商业模式
1. 广告与搜索相辅相成
谷歌两个创始人Brin和Page最早在一篇名为Advertising and Mixed Motives的论文中写到,广告收入通常会为劣质搜索结果提供动机,但他们最终也没有找到更好的商业模式,还是诉诸于广告。
2. 竞价排名机制是创收神器
拍卖模式永远是让买家出高价,让回报率最高的广告主出最多的钱/均衡状态下各广告主的边际回报趋同。当然,谷歌的广告机制不仅看出钱多少,也会看广告质量,广告主会有额外的动力优化自身内容。
3. 广告的体验未必更差
体验上,有广告的谷歌搜索并不比没有广告的差。2000年的时候谷歌做了一项对比实验,有1%的用户不接收任何广告,后来他们自己忘掉了这个实验,直到2008年发现实验还在进行;最终的结果是看广告的人进行的搜索次数比不看广告的人平均多3%。
4. 搜索广告ROI很高
2022年宏观进入下行周期,但谷歌广告增长对线上广告增长的贡献在提升,是下行周期中的首选。
5. 搜索引擎的壁垒
很多网站不愿意让谷歌和Bing以外的搜索引擎去爬信息,因此重新建立一个搜索引擎并没有那么容易。
Chrome是当前份额最大的浏览器,这是很大的优势,打开Chrome默认的搜索就是谷歌。这也是为什么谷歌每年花很大的成本在跟苹果Safari浏览器绑定,确保iPhone的默认搜索引擎是谷歌。美国司法部正在试图打破这一捆绑,我们拭目以待。
6. 谷歌的搜索也在进化
谷歌针对商品搜索了做了很大力度的优化,现在美国消费者搜索商品的第一大去处是谷歌,即便亚马逊Prime会员也是先去谷歌。下图为Morgan Stanley对美国消费者商品搜索的调研结果。
三、搜索可能的演变方式
1. 短期可能是两者结合的过渡形态
比如网页的左边搜索,右边为对话机器人。下图为加入ChatGPT浏览器插件的谷歌搜索效果。
这是一种比较生硬的结合方式。有人做了更有创意的结合,比如结合你的浏览器页面发出指令。如下图所示的XP1产品,到微软CEO Satya Nadella的LinkedIn主页,给他写一封email说服他使用某款产品,这时GPT大语言模型就可以自动完成这项工作。
XP1推荐的使用方式包括回消息,总结要点,生成推荐文章等等:
Reply to [[mail.google]] based on [[knowledgebase]]
Summarize with bullet-points [[cnn]]
Extract [[linkedin]] experience as CSV
Generate a twitter thread with emoji to sell [[product]]
Generate a 5 sentence bio about [[linkedin]]
……
2. 会出现更多富有创意的AI与搜索结合方式
可以想见可以玩出的花样还有很多,比如这两天刚上线的基于Twitter的搜索引擎perplexity.ai。这个搜索引擎通过OpenAI Codex将自然语言转化为SQL,查询Twitter的历史数据。
如果再结合微信聊天历史记录,或者企业内部数据库呢?比如微软在让Bing与Teams和Outlook做深度整合,未来可能有更多的办公工具整合进这样的AI对话功能,搜索/生成的范围将大幅扩展,提升工作效率的同时可能诞生全新的应用领域。
3. 基于AI对话搜索的推广,需要AI模型能力的进一步提升和成本进一步下滑
AI模型需要更大的参数量,利用更多的数据,更高的训练算力,更低的单位训练成本。可以期待OpenAI GPT-4以及其他AI研究机构的最新模型,当基础模型做得足够好,训练和部署成本足够低,ChatGPT这类应用才能真正推广起来,尽管ChatGPT引发了热潮,目前的用户量也只是在百万级别。
除了预训练大模型本身,开发人员也要在微调/prompt提示词上做更多的功课。下一代模型本身的能力可能已经足够强,但需要足够精巧的任务训练激发出模型本身的潜能。Stable Diffusion要给出一个prompt book来给用户演示如何写提示词,因为很多词汇的用法是初学者想不到的。
搜索也是同理,ChatGPT对提问的理解未必达到了最佳状态,也需要我们“问对问题”,或者让它“try again”“继续”,才能给出想要的答案。这需要进一步的prompt engineering,让模型更理解用户的问题,而不是让用户去学习模型的特点。这更多是对工程能力的考验。
OpenAI在ChatGPT中加入人类反馈的RLHF方法也值得进一步推广,这可以让模型符合人类的意图(alignment)。事实上,我认为ChatGPT的公测本身就是RLHF的一环,OpenAI从我们与ChatGPT对话中收集反馈,很多用户很有创意的提问方式是在探索模型的边界。从这个角度讲,ChatGPT从发布到现在产生的上千万美金成本是值得的。
4. 谷歌是生存还是毁灭
这是经典的创新者窘境,谷歌不是没有类似的技术,比如今年早些时候发布的LaMDA对话AI,甚至让内部程序员怀疑AI已经具备自我意识。有这样的技术却不拿出来应用,我认为谷歌有三方面的担心:
一是担心AI在道德、伦理、社会等方面的冲击;
二是当前AI模型训练和部署运行的成本太高;
三是怕长期颠覆自己的搜索业务,毕竟搜索可以指向页面,可以加入广告,这都是久经考验的商业模式,而如何针对AI生成的对话来产生收入,目前还没有答案。
谷歌CEO Pichai已经表态:“2023年将成为AI在对话与搜索领域的发展转折点。我们将大步前进,并推出更多新产品。”我们期待谷歌跳出它的舒适圈,积极拥抱最新AI的发展,但同样不要低估组织原有的惯性和束缚。
5. Bing的机遇
尽管搭建一个新搜索引擎是非常困难的,但微软的Bing的机会相对更大一些。近期Bing在微软的地位有所提升,微软CEO正在让Bing跟微软的其他产品做深度结合。想象一下搜索引擎Bing + 最新一代大模型GPT4.0 + WebGPT + ChatGPT + Azure云服务,可能诞生全新的搜索体验,毕竟微软是有钱,烧得起的。如果司法部再助推一把,让谷歌搜索和苹果浏览器解绑,Bing趁虚而入的机遇将更大。
6. 无论谷歌搜索是否被取代,搜索的体验都将被重塑
从最早的门户网站,到后来搜索的崛起,到再后来的推荐算法,信息的传播从最简单的信息汇聚(门户),演化成人对信息的查找(搜索),再到信息精准的找人(推荐)。AI时代的搜索实质上是信息生成。
根据科技博客Stratechery的观点,一条信息的产生经历了创意 - 实现 - 复制 - 分发 - 消费的过程。文字书写的诞生将信息的分发与消费解绑,即故事的讲述者只要留下文字,不需要面对面讲述故事,即可传播信息。
印刷术让信息复制的边际成本大幅下降,带来了知识的广泛传播,文字、语言的标准化。互联网让信息的分发边际成本大幅下降,报纸等传统媒体被颠覆,每个人都可以几乎零成本获取海量的实时信息。最终,AIGC让创意到实现的边际成本和门槛大幅降低,我们可以通过自然语言生成优美的图片,生成关键的答案。
这是跨时代的革命,有幸的是,我们都身处其中。
本文来自微信公众号:穿云寻恒星(ID:cyxhx2022),作者:Max