图片来源:Patrick Edell
在旧金山一个下雨的星期二,苹果公司的高管在一个拥挤的演讲台上揭开了第五代 iPhone 的面纱。这部手机的外观与前一版本相同,但有一个新功能让观众们议论纷纷——它就是虚拟助手 Siri。
当时,苹果软件部门负责人斯科特·福斯特尔(Scott Forstall)按下 iPhone 的一个按钮唤醒 Siri,并向其提问。应他的要求,Siri 先后查询了当时巴黎的时间(“晚上 8:16”,Siri 回答道)、解释了“有丝分裂”这个词(“细胞分裂过程中,细胞核分裂成含有相同数量染色体的细胞核”,它解释道),并且还列出了 14 家评分极高的希腊餐厅,其中 5 家位于加州湾区城市帕洛阿托(Palo Alto)。
“我已经接触人工智能很长时间了,但这仍然让我感到很惊叹。”福斯特尔说。
那已经是 12 年前的故事了。在那过后,对于 Siri 和其他由人工智能驱动的虚拟助手类竞争产品,比如亚马逊的语音助手 Alexa 和谷歌智能助手(Google Assistant),人们都没有觉得特别惊叹。这项技术基本上没有取得有效的进展,而语音助手则成了笑柄。2018 年,喜剧综艺节目《周六夜现场》(Saturday Night Live)还出现了一段老年人使用智能音箱的滑稽表演。
如今,科技界又对一种新的虚拟助手充满了热情,即聊天机器人。这些由人工智能驱动的机器人,比如旧金山人工智能研究公司 OpenAI 推出的 ChatGPT 以及 ChatGPT Plus,可以对输入到聊天框中的问题做出快速即兴回答。许多人现在都在用 ChatGPT 来处理复杂任务,比如编写软件、起草商业提案和创作小说。
使用人工智能来预测下文的 ChatGPT 每天都在迅速改进。几个月前,它还写不出来俳句(译者注:日本的一种古典短诗);现在,它可以轻轻松松地写出这些内容。前不久,OpenAI 又发布了为 ChatGPT 提供动力的下一代人工智能引擎 GPT-4。
围绕聊天机器人形成的热度可以表明,曾经也掀起类似热度的 Siri、Alexa 和其他语音助手,现在在人工智能竞赛中已经失去了领先地位。
在过去的十年里,这些产品都遇到了不少困难。据前苹果工程师、曾负责 Siri 项目的约翰·柏基(John Burkey),Siri 遇到了技术难题,包括代码写得很烂,即便是更新升级很基本的功能,也需要数周的时间。亚马逊和谷歌的前员工透露,这两家公司误判了语音助手的应用方式,导致它们的工作方向出现了偏差,最终也基本上没有得到回报。他们还称,当这些实验失败后,这些公司对这项技术的热情也随之消退。
微软公司首席执行官萨蒂亚·纳德拉(Satya Nadella)前不久在接受《金融时报》(The Financial Times)采访时表示,语音助手“蠢得像块石头”,新的人工智能将引领发展潮流。在这方面,微软已经与 OpenAI 达成了密切合作关系,并且向该初创公司投资了 130 亿美元,还将其技术整合到必应搜索引擎(Bing)以及其他产品中。
苹果公司拒绝对 Siri 发表评论。谷歌表示,其致力于推出一款优秀的虚拟助手产品,让用户在使用手机的情况下,以及在家中或者车中都能使用这款产品。同时,该公司也在单独测试一款名叫 Bard 的聊天机器人。亚马逊表示,在过去一年里,全球范围内与 Alexa 的用户互动增长了 30%,其对打造世界级人工智能产品的使命仍然充满信心。
2014年,亚马逊推出了加载 Alexa 语音助理的智能音箱 Echo。
图片来源:Grant Hindsley
语音助手和聊天机器人背后的人工智能类型并不相同。聊天机器人是由所谓的大型语言模型(LLM)所驱动的,这些模型系统经过大量网络数据集的训练,能够识别和生成基于数据集的文本。在此基础上,它们就可以生成完整的句子。
相比之下,Siri、Alexa 和谷歌助手基本上都属于所谓的命令和控制系统。这些系统只能理解有限的问题和请求,比如“纽约市的天气如何?”或者“打开卧室的灯。”如果用户要求虚拟助手执行其代码中没有的操作,那它就可能无法提供这样的帮助。
工程师柏基称,Siri 的设计也很繁琐,以至于增添新功能也会费时又费力。2014 年,苹果任命其专门针对 Siri 进行改进。Siri 的数据库包含一个庞大的单词列表,其中还包括音乐艺术家和餐厅等地点的名称。这些单词列表还有近 20 种语言版本。
柏基称,这使得它就像一个“一个巨大的雪球”。他还补充说,如果要在 Siri 的数据库中添加一个单词,“实际上就是在一大堆无序的数据库中再添加一些数据。”
因此,柏基表示,看似简单的更新,比如向数据集中添加一些新的词汇,也需要重建整个数据库,这一过程可能需要长达六周的时间。如果要添加更复杂的功能,如新的搜索工具,那可能就需要近一年的时间。这即意味着,Siri 不可能成为像 ChatGPT 这样的创意型助手。
亚马逊和谷歌的前员工透露,Alexa 和谷歌助手都采用了类似于 Siri 的技术,但他们却很难通过其产品实现真正意义的创收。(与之不同的是,苹果能够通过 Siri 成功地吸引了许多用户购买 iPhone。)
2014 年,亚马逊又推出了加载 Alexa 语音助理的智能音箱 Echo。该公司一位负责 Alexa 项目的前高管表示,该公司希望消费者能通过与 Alexa 对话的方式下订单,从而提高线上商店的销售额。然而,尽管人们喜欢利用 Alexa 获取天气信息和设置闹钟,但很少有人用这种方式来订购商品。
这位前高管还提到,亚马逊可能在制造新的硬件产品方面投入过多,比如现在已经停产的与 Alexa 配套的闹钟和微波炉,但这些产品的售价基本上等同于甚至低于其成本。
他还表示,该公司在创建让人们轻松扩展 Alexa 功能的生态系统方面投入不足,没有像苹果公司一样,围绕其 App Store 打造了一个具有活力的生态系统,不断激发用户对 iPhone 的兴趣。 尽管亚马逊也推出了一个类似的“技能”商店,让 Alexa 可以控制电灯开关等第三方配件,但用户却很难找到和设置扬声器的功能。这就与从应用商店下载移动应用的无障碍体验全然不同。
消费科技分析师、为亚马逊提供顾问服务的创意策略研究公司的卡罗琳·米兰内西(Carolina Milanesi)表示:“我们从未在语音助手领域拥有过像 App Store 那样的光辉时刻。”
去年底,亚马逊宣布将裁员逾 1.7 万人。其中,负责 Alexa 的部门就是主要的裁员对象。部分负责 Alexa 的高管已经离开了公司。
亚马逊发言人金利·皮索尔(Kinley Pearsall)表示,Alexa 不仅仅是一个语音助手,“我们仍然对其使命保持乐观态度。”
谷歌在智能蓝牙音箱 Google Home Mini 等产品中嵌入了“谷歌助手”功能。
图片来源:Smith Collection/Gado
一位曾在谷歌助手项目上工作的前负责人表示,亚马逊在 Alexa 上的失误可能也误导了谷歌。谷歌工程师在研发谷歌助手时一直在对标 Alexa,并为此花费了数年时间去模仿 Alexa,包括设计智能扬声器和语音控制的平板屏幕,以控制恒温器和电灯开关等家庭配件。后来,谷歌又将广告业务整合到了这些家居产品中,但遗憾的是,这并没有成为其主要的收入来源。
这位前负责人表示,随着时间的推移,谷歌意识到大多数人只会通过语音助手来执行有限的简单任务,比如启动定时器和播放音乐。2020 年,在谷歌高管帕巴卡尔·拉格万(Prabhakar Raghavan)接管谷歌助手项目后,他的团队就迅速做出了调整,把谷歌助手这项功能定位成 Android 智能手机上的一项重要功能。
今年 1 月,当谷歌母公司 Alphabet 宣布裁员 1.2 万人。其中,负责家居设备操作系统的团队有 16% 的工程师都丢掉了工作。
如今,许多大型科技公司现在都在争相推出类似于 ChatGPT 的产品。2 月,苹果在总部园区的乔布斯剧院举行了年度 AI 峰会。两名内部人士透露,这是一场内部活动,员工可以以此来进一步了解公司的大型语言模型和其他 AI 工具。他们还表示,包括 Siri 团队成员在内的许多工程师每周都在测试与语言生成有关的想法与工具。
3 月中旬,谷歌还表示,其将在很短的时间内推出生成型人工智能工具,以帮助企业、政府机构和软件开发人员打造具有嵌入式聊天机器人功能的应用程序,同时将底层技术整合到他们的系统中。
据人工智能专家,未来,聊天机器人和语音助手的技术将融合在一起。这即意味着,人们将可以通过语音来控制聊天机器人,使用苹果、亚马逊和谷歌等公司产品的用户就可以要求这些虚拟助手帮助他们完成相关复杂工作,这些工作就不仅仅局限于查询天气等简单任务了。
人工智能初创公司 Perplexity 联合创始人阿拉温德·斯里尼瓦斯(Aravind Srinivas)表示:“过去这些产品从未真正奏效,因为我们从未具备人类级别的对话能力。”Perplexity 是一款由聊天机器人驱动的搜索引擎。“但现在我们就具备了这种能力。”斯里尼瓦斯说。