本文来自微信公众号:极客公园 (ID:geekpark),作者:Jesse,题图来自:视觉中国
时隔两年,苹果复活了 HomePod。
这个做法令人困惑。毕竟两年前,苹果已经宣布停产、下架 HomePod,向外界传递出明确信息:这是一款失败的产品。
而这次发布的新 HomePod,从设计、功能、产品定位上,并没有大的改变。很难想象,它要如何逆转曾经失败的命运。
与此同时,外部的市场环境,已变得更加艰难。整个智能音箱市场,已经进入了发展的瓶颈期,处于市场领先地位的谷歌、亚马逊,都在裁撤自己的音箱产品团队。
这样的背景下,苹果依然选择复活 HomePod,坚持要在这个领域里占住一席之地,很难不令人好奇它背后的战略考量。
而 ChatGPT 等先进自然语言处理模型的爆火,也给智能音箱产品的未来,提供了更多想象空间。
HomePod,会是苹果第一个用上 ChatGPT 技术的产品吗?
HomePod 的失败与重试
2017 年夏天,苹果第一次发布了 HomePod。
这是苹果少有地以“追随者”的身份,发布一款全新产品。在 HomePod 之前,亚马逊通过 Echo,成功定义了“智能音箱”这个产品品类,也一定程度上迫使谷歌和苹果跟进,开发类似功能定位的产品。
作为消费计算硬件的引领者、颠覆者,苹果不会甘心于“跟随”。
在 HomePod 上,苹果首次搭载了“计算音频”技术。它让 HomePod 能够识别、适应环境,用户只需要将它随意摆放在一堵墙边、一个角落,它就能自动将声音填充进整个房间,提供优秀的声音体验。
为了提供先进、优秀的声音体验,苹果对 HomePod 的“堆料”可以说不计成本。它内部搭载了 7 个中高音发声单元,一个低音炮,6 个用于接收语音指令的麦克风,以及一颗 A8 芯片,用以处理音频信号。
这让 HomePod 成为苹果公司历史上毛利最低的产品。
发布初期,有市场机构估算,HomePod 光物料成本就高达 200 多美元,毛利只有 40% 不到,不仅远低于 iPhone、iPad 等苹果产品,也低于亚马逊、谷歌的同类竞品。
尽管成本居高,利润稀薄,HomePod 的售价依然远高于市场平均水平。上一代 HomePod 的定价为 2699 元人民币,349 美元。相比之下,亚马逊 Echo 的价格基线在 99 美元,碰到优惠,能低至 50 美元以内,甚至有时会随亚马逊 Prime 会员“白送”。这让 HomePod 在问世初期,很快落入了竞争的不利位置。
更大的问题在于,HomePod 虽然音质优秀,却不够“智能”。苹果把大部分筹码都压在了“音质”上,在至关重要的语音交互方面则相对落后。Siri 能力的深度和广度,明显落后于亚马逊的 Alexa 和谷歌的 Google Assistant。
技术上,HomePod 对苹果有着重要意义。“计算音频”后来成为了苹果极为重要的技术资产,被用在 Mac、iPad、iPhone、AirPods 等几乎全系列产品上,获得了消费者的认可。但在产品层面,HomePod 却遭遇了一场大败。
发布一两年后,HomePod 仅占美国智能音箱市场个位数的份额。为应对这一情况,2020 年秋季,苹果推出了 HomePod mini,售价仅为 749 元人民币,99 美元,将战线拉到了竞争对手的同一水平线上。
HomePod mini 发售后几个月,2021 年春天,苹果迅速对外宣布,停产、下架 HomePod,直接“废除”了这条产品线。下架的同时,苹果不忘强调,HomePod mini 销量喜人。
事实确实如此,根据市场研究机构 Strategy Analytics 的报告,HomePod mini 发售后,苹果在智能音箱市场的占有率几乎实现了翻倍,从 5% 上涨到 10%。
复盘 HomePod 的失败,不难发现,智能音箱用户的心理价位有着明显的天花板,用户愿意购买智能音箱,但并不愿为它付出高价。
除此之外,用户选购音箱时最最看重的依然是“智能语音功能”。在这方面相对领先的亚马逊、谷歌,成为了行业领头羊。
试图通过音频技术曲线救国的苹果,没能逆转 HomePod 的失败命运。
从这个角度去看,新 HomePod 愈发令人感到不解,因为它几乎没有做出什么改变。相比前代产品,它的设计、功能几乎毫无改进,只是新增了一个检测室内温湿度的小功能。苹果减少了新 HomePod 内部发声单元、麦克风的数量。这大概率是为了更好地控制成本。
虽然通过优化音频处理算法,新 HomePod 保持了与前代同样高水准的音质。但它的价格依然不低,2299 人民币、299 美元的价格,意味着它仍是市面上最贵的智能音箱之一。
就在新 HomePod 上市之时,外部的市场环境却在变得愈发风雨飘摇。
“不智能”的魔咒
通过 HomePod 的故事不难看到,智能音箱的崛起之路,必须要“硬啃”智能。它是绕不过去的一个槛。
而智能音箱“不够智能”的魔咒,不止萦绕在苹果一家公司头上,包括谷歌、亚马逊,都面临着类似的情况:智能音箱的销量、市场渗透率还在增长,但已经遇到了明显的瓶颈。
2022 年全球智能音箱的市场规模约为 103 亿美元。作为对比,同样是在 2014 年进入高速发展期的智能手表,市场规模则已达到 334 亿美元。另一个诞生更晚,与音箱同为音频设备的品类,真无线耳机,市场规模更是已达到 500 亿美元,且增速迅猛得多。
市场机构根据调研测算的“市场规模”,并不十分严谨。但从智能音箱、手表、耳机三者的差距上,依然能看出,智能音箱这个品类整体表现乏力。
问题依然要归结于“不智能”,也就是语音助手不够好用。
当年语音助手刚刚诞生、流行时,行业喊出了“voice-first”(语音交互优先)的口号,人们曾期待它能彻底颠覆交互,成为触控的关键辅助,甚至取代触控,成为主流。各家厂商都开始押注语音交互技术,扩张团队。
事实证明,语音交互缺乏深度、精度,常出现识别指令失败的情况,反馈和交互感不够好。比如不少用户会问智能音箱一些问题,但音箱不具备理解上下文的能力,并不能形成一个连贯对话;又比如,用户命令音箱播放音乐,一时间无法想出准确的歌曲名,给出一个模糊指令,音箱就无法判断用户要放的到底是什么歌,毕竟它没有“搜索”界面。
这些因素结合起来,导致音箱用户的使用率不高,发出的指令也往往停留在表面,主要是问问天气、设个倒计时这些简单交互,难以绑定需求,形成稳固的使用场景。大量音箱产品,都没能逃过“吃灰”的命运。
最终,各家厂商都不得不面对现实。
去年 12 月,亚马逊宣布裁员 10000 人,其中“设备与服务”,也就是负责开发 Echo 音箱和 Alexa 语音助手的部门,成为了裁员重灾区。
裁员公布后,亚马逊负责“设备与服务”的高级副总裁 David Limp 接受了彭博社的采访。他表示,裁撤的重点,是一些 Alexa 的试验性项目,包括远程健康服务、游戏。这些项目充满了天马行空的想象,但开发过程都面临巨大阻力,看不到突破的希望。
Limp 表示,Alexa 的活跃用户数一直在增长,但整个 Alexa 和 Echo 业务并未实现盈利。因为音箱的硬件利润本就不高,还经常打折、降价销售。此前有传闻称亚马逊在 Echo、Alexa 这门生意上亏掉了 50 亿美元,Limp 否认了这一数字,但也拒绝提供具体的准确数字。
类似的情况也发生在谷歌。
在今年 1 月启动的大裁员中,谷歌智能家居操作系统 Fuchsia 的开发团队,面对的形势最为惨烈,约 16% 的员工被裁。2018 年,Fuchsia 在谷歌内部刚刚启动时,曾有传闻称谷歌的智能音箱将会率先搭载 Fuchsia 系统。很显然,它也曾承载过谷歌对“语音交互”的想象,但没能实现突破。
现在,谷歌早已削减了在智能音箱产品上的投入,自 2021 年 3 月以来,谷歌已经两年没有更新过音箱产品。
等待下一次“爆发”
把视野放大一点,今天智能音箱所面对的困境,与其说是“衰退”,不如说是一次“沉淀”。
作为计算设备,智能音箱的未来依然有很大的想象空间,只不过今天的语音交互技术,还不足以实现那些想象。
从这个角度去看,谷歌亚马逊虽然削减了各自的音箱团队,但两家对语音交互、自然语言处理的探索并未停止。亚马逊目前依然有近万名员工,正在从事与 Alexa 相关的项目开发;谷歌则一直在探索基于 AI 技术的交互可能。
包括最近大热的 ChatGPT,也给行业带来了更多希望。这类大型自然语言处理模型,恰好能解决传统语音助手“无法理解上下文,不够准确”的问题,能为语音交互提供更好的准确性、扩展性、连贯性,让机器理解人类语音指令的能力,实现指数级飞跃。
当然,GPT 模型对巨大算力的依赖,意味着它无法在短期内植入进语音助手产品。但 ChatGPT 的成功,依然为一个“真正智能”的语音助手,提供了可行性依据。
采访中,亚马逊高级副总裁 Limp 也提到了 ChatGPT。他表示,自己试用了 ChatGPT,与它对话的体验非常好,而且未来还会有更多模型问世,这些模型将会在更多不同的使用场景下发挥作用。眼前最大的问题只有一个,就是训练模型的成本太高。
故事远没有结束。ChatGPT 惊艳世界之后,几乎每一家公司都开始将目光聚焦于 AI 领域。
谷歌内部拉响了“红色警戒”,CEO Sundar Pichai 召回了两位创始人,让他们也参与到未来的产品路线规划中,还调动多个团队,要求他们迅速参与到 AI 的项目开发中,加快进度。据报道,谷歌计划在今年发布 20 多个 AI 相关的产品和功能,为用户提供“对话式”的体验。
与此同时,苹果内部也正在举办一场 AI 峰会,虽然这场活动更类似于一场“团建”,并不意味着苹果会很快推出什么新产品、新功能。但它依然揭示了苹果对 AI 技术的关注与重视,这或许也是苹果“复活”HomePod 的一部分用意。
这很容易让人想到当年 Macintosh 的故事。
1984 年,乔布斯认定了“图形界面”就是个人电脑的未来,并将它放在了第一代 Macintosh 上。但他来得太早了,无论从技术还是成本考量,Macintosh 都没有赢得用户。
直到 10 年后,图形界面才真正开始成为主流。
现在,类似的事情或许也正发生在语音交互上,它在等待下一次“爆发”。
本文来自微信公众号:极客公园 (ID:geekpark),作者:Jesse