本文来自微信公众号:阑夕(ID:techread),作者:阑夕,题图来自:《终结者:黑暗命运》


Google在宣布推出对话式AI服务Bard——很显然是为了对标ChatGPT——的演示视频里出现了一个显而易见的错误回答,然后导致Google的市值暴跌了1000亿美元,如果这都不算地狱笑话,那什么才算?


“我知道你很急,但你先别急。”——微软的内心活动,大抵如是。


作为OpenAI的最大投资者,微软已经摆出了要把ChatGPT薅得一干二净的姿态,从Bing到Office,从后端支持到前端展现,所有的产品资源都在向“整合ChatGPT”让步。


最新的消息是,微软正在通过邮箱发放新版Bing的测试资格,可以直接输入自然语言向ChatGPT提出搜索询问,一时间洛阳纸贵,人们纷纷拿出积满灰尘的Outlook邮箱排队求码。


给微软的产品排队,这是什么概念呢,上一次可能还是它发售Windows 95的时候,各家经销商人满为患⋯⋯


图源:视觉中国
图源:视觉中国


微软的CEO萨堤亚·纳德拉放出狠话:“从此刻开始,搜索的毛利率将永远、不可逆的进入下降轨道。”


这话是说给他的印度老乡、Google的CEO桑达尔·皮查伊听的,老乡见老乡,未必总是两眼泪汪汪




在Web时代,搜索引擎曾被视为完美的商业模式,它既是用户上网冲浪的入口,通过搜索框可以抵达一切地方,输入关键词的行为本身又会主动暴露用户所需,无限利好广告匹配的准确度。


过去几十年里,搜索引擎成功打造出了一套共生系统,网站生产内容,搜索分配流量,大家再一起吃广告预算,就像牙签鸟和鳄鱼的关系,绝对的公平谈不上,但共同利益是稳固的。


App时代的互联网画地为牢,对搜索引擎有着釜底抽薪的影响,信息被圈在一座座孤岛里,不再对搜索爬虫予取予求,做站的ROI也远远比不上做号。


最直接的表现是,在即时性越来越高的世界,搜索体验的滞后性越来越明显了,对于静态的、结构化的需求——比如月球和地球的距离有多远——搜索引擎依然是管用的,但是如果用户想要了解环球影城今天有多少人入园,它就难以告知答案了。


搜索的解决方案通常是做一个API,然后需要环球影城接进来提供数据,它再去搜索结果端予以呈现,但是当代互联网用户更加熟练的做法是,去社交媒体里搜索,然后就会看到专门更新数据的运营账号。


新鲜的内容不再入库了,这是最早产生的裂缝。


Google的续命手段相当关键,总结下来最为奏效的有三个:


1. 依靠Android垄断了智能手机的底层系统,这不止是移动互联网的门票,而且是VIP包厢级的;


2. 提前收购了较为主流的内容平台,比如BlogSpot和YouTube,尤其是后者,这让Google不至于断水绝粮;


3. Web在英文世界的衰落速度比中文世界慢太多,而Facebook等产品的封闭化程度也相当有限。


所以Google在资本市场依然可以继续讲述搜索的故事,尽管它不再性感,作为拉动公司发展的现金牛,不断地向创新业务输血,这是Google在过去十年里向股东们对话的主流口径。


直到ChatGPT的横空出世无情地打破了这套叙事,在能力最擅长、资源最丰富、供养最充足的AI领域,Google被一家区区几百亿美金的公司抢了风头。


这不是业务层的失误,而是战略层的空靶。



去年夏天,Google的一名工程师因为在和自家机器人聊天程序LaMDA沟通时认为对方已经具备人格而被公司施以强制休假的惩罚,一度成为科技行业的热门话题。


尽管当时外界普遍认为这是AI领域的又一次成功炒作,但Google事实上表现出来的,却是唯恐避之不及的态度,因为它非常害怕脱离技术范畴的讨论。


Google内部曾有一个饱经挫折的部门“AI道德委员会”,最新的动态停留在2019年,内容为宣布解散。


顾名思义,这本是被Google抱有崇高目所组建的,希望汇集一批“独立董事”式的人物,来为公司的AI产品划定有所为、有所不为的边界。


然而这个部门从雏形到散伙的过程里就从未消停过纷扰矛盾,不是有人质疑Google和军方共享AI技术有违伦理,就是抨击委员会里有谁反对气候变化德不配位,总而言之,一地鸡毛。


就像人类史上的大多数多边组织一样,共识从来少得可怜,分歧却总是有如泉涌。


自从解散“AI道德委员会”后,Google对于AI的态度就变得脆断犹疑,具体表现之一,就是极为抵触将AI产品开放出来,让用户体验Beta。


比如AI绘画产品Imagen,Google不知道发表了多少篇论文,证明它的“跑分”结果吊打包括OpenAI旗下在内的所有竞争对手,但是Imagen迄今为止都还在Google的口袋里,不给用户使用。


图源:Imagen
图源:Imagen


Google提供了充分的理由解释为何要如此藏着掖着——担心遭到恶意滥用......避免社会刻板印象......以及压迫性观点......语言理解有局限性——简而言之,怕出事儿。


无法承受风险,这是Google踏入万亿美金俱乐部之后最大的转变,就像Google Photo自动给用户照片加标签的功能曾经误给一张照片里的黑人打上了“猩猩”的标签,引起轩然大波之后,Google最后的处理方案你们根本猜不到。


它选择把所有和灵长类动物有关的词语,从词库里整个删掉了。



就在Google反复进行内心斗争的时候,OpenAI把它该揽的活儿全给包了,GPT和LaMDA从卧龙凤雏的关系分道扬镳,一个匣里龙吟惊天下,一个落破凤凰不如鸡。


更重要的是,ChatGPT这种服务能力,是足以重新定义搜索引擎的。


从微软正在测试的新版Bing来看,ChatGPT带来的最大改变,是搜索引擎史无前例地开始支持自然语言指令。


目前,所有的搜索产品,无论是Google还是百度,都只支持程序格式指令,比如你只想让它搜索某个固定网站的结果,就需要在输入框里打出“site:网址+关键词”的组合,你想让它不要显示分词结果,就要在关键词前后加上双引号,等等。


你无法用自然语言告诉一个搜索引擎,让它按照你的需求去行动,因为它不懂,开发它的工程师,只能预留一些程序格式,以及对应的搜索服务,用户必须遵照这些格式提出请求。


这是工程师的造物逻辑,用一段代码去触发另一段代码,当下很多人工智能总是沦为人工智障也是因为这个原因,用户没有按照它的格式对话,然后把机器搞懵了。


ChatGPT对于自然语言的理解,几乎可以把搜索引擎的传统定义给颠覆了,它不再只限于检索信息,而且还能计算信息。


有人用新版Bing搜索了这么一个问题:宜家的Klippan型号双人沙发能不能放到我的2019款本田奥德赛里,如果折叠座椅的话?


这就是基于自然语言的请求,千百年来人类相互交谈,就是这么进行的,在ChatGPT问世以前,没有任何搜索引擎可以消化如此一大段话。


然而,在Bing的对话专区里,ChatGPT已经算出了沙发的体积和奥德赛后排需要放倒几排座椅了。


要我说,Google的股价跌得还不够多。



我们都知道图形界面的发明史,为了获得低价购入苹果公司股票的机会,打印机巨头施乐邀请乔布斯拜访帕洛尔托研发中心,并在那里向他演示了施乐的计算机研发成果:一台不需要输入命令行、而是拥有可视化图形界面的电脑。


图源:wikipedia<br>
图源:wikipedia


震惊之余,乔布斯完整吸收了这套工业方案,并将图形界面的设计用在了日后大获成功Macintosh上,而比尔·盖茨因为要给Macintosh开发软件,也被这套图形界面彻底征服,不再关注Dos系统,转而开始研发Windows。


自此,个人电脑终于有了走进千家万户的推力。


图形界面之于命令行的革命性意义在于,它让电脑不再只是懂程序语言的人才会使用的昂贵机器,任何一个普通人,都能快速熟悉它的基本操作,用鼠标点击一个图标,就能打开一个程序窗口。


据说在Google内部,对于ChatGPT的评定等级为“红色警报”,这是这家公司成立二十多年以来,第一次出现的警报级别。


如果ChatGPT能把自然语言带给搜索引擎,那么搜索的本质都会变得不同,用户将拥有“提需求”的能力,一切复杂的、个性化、精细化的念头,都可以交给AI去跑,坐享其成。


与之相比,输入关键词然后在列表里寻找想要的结果这种体验,就和在Dos系统下一行行的写命令没什么区别了。


还是举例来说,我想看“马斯克在2019年6月到2021年3月之间发过的所有关于月亮且转发量高于5000的推文”,这就是一个需求,把它发给Google,Google是看不懂的。


但是能够处理自然语言的搜索引擎知道我要什么,它会按照我的要求——如果我自己来,也会这么操作,只不过要花好几个小时——把马斯克在那段时间发布的推文全部看一遍,然后筛选出我需要的推文,全过程用时不到一秒钟。


这还是搜索产品吗?好像也是,只不过更进一步的,它是把搜索的算力资源,私有化了。


ChatGPT现在已经出现了这样的迹象,每个用户都在部署一个专属于自己的智能助手,而调校得比较好的,和调校得比较差的之间,存在天壤之别。


当然了,千人一面带来舆论操纵的怀疑,千人千面又被担心信息茧房,在水多了加面和面多了加水这件事情上,永远不可能让所有人都满意。



直到今天,Google的桌面端首页都保留着一个“I'm Feeling Lucky”的按钮,就放在搜索按钮的右边。


图源:Google首页
图源:Google首页


无论对于怎样的用户来说,这都是一个令人困惑的设计,Google自己也曾做过调查,超过80%的用户不明白这个按钮是用来做什么的,也不知道点击之后会怎么样。


事实上,这又是Google母胎以来的某种工程师趣味,从文案到体验,都充满了彩蛋色彩,用户输入关键词后,点击“I'm Feeling Lucky”将直接跳转到搜索结果的第一个链接,把搜索行为变成了开盲盒。


李开复在离任后吐槽过这件事情,他说从内部数据来看,第一这个按钮没什么人点,第二就算点了,大多数情况也都是用户不小心点错了,不少员工都反馈过这种设计的鸡肋,但Google的创始人坚持己见,因为觉得这样很酷,很极客,“至少很适合印在T恤上”。


也许Google的确有着某种不算错的预感,也就是搜索引擎的使命理应把用户送到他想去的目的地,“I'm Feeling Lucky”就代表了它的初衷,但是终其几十年来,Google都只是停留在了这种形式上,任凭用户去尝试幸运,因为它的商业模式——在搜索结果页插入广告——锁死了一键直达的发展可能。


理解了Google的别扭,才能理解萨堤亚·纳德拉所称的“搜索的毛利将永远下降”,无论ChatGPT以后会怎么挣钱,它都从模式上抛弃了旧搜索的广告匹配机制,当Google的基本盘动摇了,搜索引擎躺着挣钱的利润空间,也就紧缩起来了。


这砸的是一个每年创收两千多亿美金的盘子,谈笑风月间,鲸落万物生。


更可怕的是,这看上去只是ChatGPT挥手砍下的第一刀,从OpenAI的创始人在那篇“万物摩尔定律”的构想里看,他对ChatGPT乃至AI行业的设想,绝不仅仅是做几个更加聪明的聊天机器人。


近乎无限的算力,自我学习的网络,前仆后继的资本,最后会重写一套人类史上绝无仅有的经济系统。


所以我在多场ChatGPT主题的会议里反复说过一个观点:对于ChatGPT现在能做的事情,怎么低估都不过分,它还很笨拙,绝大多数溢美之词都是因为评论者们见识太少,但在ChatGPT未来能做的事情上,怎么高估都不为过。


不要忘了,弗兰肯斯坦的怪物最早学会的语言,是“火”。



十多年前,我在深圳见过一家做山寨机的公司,手机配置很普通,却卖得特别贵,竟然能够做到每年好几亿的营业额。


这家公司的手机专门卖给做生意的小老板,说服他们买单的原因,是销售会在现场演示的一项功能——智能语音助手。


在那个时候,Siri大概还是新建文件夹,整个行业语音识别应用率和准确度都相当有限,但是这款山寨机的助手软件却能识别一些非常复杂的命令,比如几号几点给王总发一条生日祝福的短信,连短信文案都不需要准备,它直接就能自动生成准时发送。


更神奇的是,它连环境音都能识别,如果老板在鸣笛声此起彼伏的路况里录入语音,它会在反馈无法听清的同时还贴心地补上一句“请小心驾驶”。


后来山寨机做不下去了,这家公司改做外贸,也分享了这个让自己制霸过一个细分市场的秘密,非常朴实无华:在东莞组建了一支百余人的话务团队,三班倒工作制,接听机主语音后远程在客户的手机上执行指令,所有那些精确得超出时代的语音识别,都是这些廉价劳动力一条一条听出来的。


所谓的进步,大概是我们不必善待ChatGPT,那些古怪刁钻的提问并不会为难OpenAI在印度或是越南的外包团队,恰恰相反,来自用户的输入都是在供养AI,让它变得强大和深厚。


任何技术的发展路径都是如此,量变引起质变,从念念不忘,到必有回响。


硅谷的风险资本和华尔街的投行们,倒是一直在赌下一代计算平台到底会出现在哪里,VR、元宇宙、Web3,每个都上台遛过一圈,但是现在看来,下一代计算平台的形态,未必一定会是某种平台。


这话我们在互联网行业已经听到过太多次,取代一款产品的,往往不是另一款这样的产品。


ChatGPT以及整个AIGC产业很难称得上是一种计算平台,只不过它们的计算资源已经在指数级地爆炸,可以预见的是,由 AI生成的内容,将在某一天超过人类生产的内容,而这一天的到来,也会比很多人想象得要快。


阿瑟·克拉克在短篇小说《神的九十亿个名字》里,讲了一个关于人类终极任务的故事,僧侣和科学家们造出了一台计算机,通过穷举字母组合的方式,找到了那个不可言说的神的真名,并唤醒了神的降临。


于是最后,“苍穹之上,一片寂寥,群星慢慢地闭上了眼睛”。


本文来自微信公众号:阑夕(ID:techread),作者:阑夕