划重点

1、苹果在2011年率先推出了智能助手,但自那以后十多年来,Siri的功能改进却十分有限。

2、在人工智能技术加持下,Siri有望获得颠覆性改进,与谷歌、微软以及OpenAI等公司竞争。

3、在WWDC上,苹果可能会宣布与OpenAI合作的计划,将AI技术引入苹果产品和服务中。

4、与OpenAI的合作可能只是权宜之计,苹果最终将推出自己的人工智能功能。



据国外媒体报道,苹果在2011年推出了智能助手Siri,它是该公司联合创始人史蒂夫·乔布斯(Steve Jobs)生前倾注心血的杰作之一。在其十多年的发展历程中,苹果通过内部持续不断的改进,向世人展示了顶尖人工智能语音助手所拥有的无限潜力。

Siri可以在iPhone上运行,无需依赖网络连接,其速度、对话流畅度以及理解用户指令的精确度均令人叹为观止。据内部消息透露,这个内部代号“黑鸟计划”(Project Blackbird)的项目还规划了让第三方应用程序开发者为Siri增添更多功能的蓝图。

但在Siri发布十年后,其持续改进却没有取得太大成果。2021年发布的增强版Siri X,只进行了相对保守的升级,更多侧重于将Siri的核心软件从远程服务器转移至iPhone上,旨在提高语音助手的速度和隐私保护功能。

不过这种情况即将迎来改变。北京时间6月11日凌晨1点,在苹果2024年全球开发者大会(WWDC)上,该公司将投身一场定义科技未来的人工智能军备竞赛中。苹果正努力追赶微软、谷歌等竞争对手,这些巨头已经开始将生成式人工智能融入其核心产品中。



据知情人士透露,苹果一贯的谨慎和独特的保密文化,以及其在实现硬件和软件无缝集成升级时的审慎态度,曾一度限制了其在人工智能领域的早期进展。然而,面对当前的竞争格局,苹果意识到自身正处在一个必须勇于冒险、突破常规的新阶段。

据悉,苹果将在今年的WWDC上宣布对其软件产品(包括Siri在内)进行一系列生成式人工智能的升级。这些人工智能功能将涵盖信息撰写协助、照片编辑和文本总结等领域。

尽管苹果预计短期内难以超越领先的人工智能创新者,但该公司准备推出的这些人工智能功能将拥有令人印象深刻的能力,并且致力于最大限度地保护用户隐私。这将是释放人工智能助手全部潜力的核心要素。据知情人士称,与OpenAI、谷歌和Cohere的会谈后,预计苹果还将公布与一家或多家主要人工智能开发商的合作计划。

长久以来,苹果以其产品的卓越和完美为傲,但在新兴的人工智能模型领域,达到完美几乎是不可能的任务。虽然OpenAI等系统凭借其出色的文字、图像和视频处理能力吸引了超过1.8亿用户,但它们偶尔也会出错,这些错误通常被称为“幻觉”。苹果对此类问题的容忍度极低。

华盛顿大学计算机科学与工程荣誉退休教授佩德罗·多明戈斯(Pedro Domingos)指出:“人工智能无法做到100%准确,这是基本事实。而苹果并不接受这一现实。他们不会发布任何产品,除非它达到了完美的标准。”

集成人工智能功能

据一位知情人士透露,苹果正在权衡是否应让用户选择第三方人工智能服务以替代或增强Siri。目前,关于第三方人工智能提供商将如何为Siri提供支持、增强或替代的具体方式,以及苹果是否会推出类似服务的细节,都尚不明朗。多家媒体早前已报道苹果与OpenAI的合作传闻,这有可能为Siri带来颠覆性的变革。

与此同时,谷歌、微软和三星电子已经迅速将生成式人工智能整合至自家的设备与服务中。尽管苹果发现自己在这场科技行业的代际变革中稍显落后,但许多投资者和人工智能领域的专家都表示,苹果定能找到一种方式,将生成式人工智能带给公众。



Siri团队的前工程经理、现任《华盛顿邮报》首席技术官的维尼特·科斯拉(Vineet Khosla)表示:“苹果几乎可以做任何他们下定决心要做的事情。该公司始终以消费者为中心,他们的人工智能策略是确保它在极度注重隐私保护的前提下运行。”

多年来,苹果对Siri进行了持续优化,并在其全线产品中嵌入了多种小型人工智能功能。例如,在最新发布的Vision Pro头显中,人工智能技术被广泛用于追踪用户的眼睛和手部位置。

当苹果在2011年推出Siri时,该公司便在其他竞争对手之前,迈出了建立首个人工智能助手的步伐。早在2010年,苹果就在乔布斯的领导下收购了Siri的开发团队,从而推动了Siri的诞生。乔布斯鼓励团队保持Siri的风趣和幽默感,而Siri的提前发布也显示了苹果公司敢于冒险的精神。



“Siri是苹果在乔布斯时代最后推出的一个创新项目,”被苹果收购的Siri初创公司联合创始人达格·基特劳斯(Dag Kittlaus)回忆道,他在Siri发布后不久便离开了苹果。

与前谷歌员工关系紧张

在推动Siri发展的道路上,苹果聘请了谷歌的顶级工程高管约翰·詹南德里亚(John Giannandrea)来执行其人工智能战略。2018年,詹南德里亚晋升为高级副总裁,直接向苹果首席执行官蒂姆·库克(Tim Cook)报告工作。

在早期的团队会议上,詹南德里亚明确指出,改进Siri是他的核心任务之一。他还负责将苹果在人工智能领域的分散工作统一整合。据内部消息透露,他通过招募谷歌员工和收购初创公司来打造自己的人工智能团队,但这一团队在融入苹果其他部门时遭遇了不小的挑战。

新的人工智能团队运作方式与谷歌的某些部门颇为相似,这些部门在截止日期的管理上相对宽松。然而,苹果的所有团队都必须遵循严格的最后期限,以确保每年秋季的新品发布会能够如期举行。据知情人士透露,苹果产品开发的其他部门与人工智能团队在合作过程中时常出现分歧,主要是因为双方在截止日期上难以达成一致。

与此同时,苹果专注于软件开发的其他部门并未与人工智能团队展开深入合作,而是独立发展自己的人工智能功能。例如,由高级副总裁克雷格·费德里吉(Craig Federighi)领导的软件团队,继续致力于图像和视频识别功能背后的人工智能技术研发。

多位苹果前高管和工程师指出,詹南德里亚的人工智能团队还面临计算资源有限的挑战。据熟悉苹果内部基础设施的人士透露,与竞争对手相比,苹果近年来获得的图形处理单元(GPU)芯片较少,而GPU对于训练人工智能模型至关重要。

因此,大部分时候,苹果的人工智能团队不得不依赖外部云服务来训练他们的人工智能模型。此外,詹南德里亚团队中的许多前谷歌员工更倾向于使用谷歌的云服务。

ChatGPT效应

当OpenAI在2022年底惊艳发布ChatGPT聊天机器人时,业界格局为之一变。据知情人士透露,在那个圣诞假期,费德里吉开始尝试微软旗下的GitHub人工智能编码工具Copilot,这一体验让他对人工智能的看法有了转变。Copilot正是由OpenAI的技术所驱动。

自那时起,费德里吉领导的软件工程团队被赋予了新任务:探索将生成式人工智能融入苹果产品的创新方法,并获取必要的资源来推动这些项目的实施。在内部会议上,费德里吉明确表达了对生成式人工智能技术的认可,并计划将其整合至苹果软件的各个方面。

为加快生成人工智能的内部研发进程,苹果在今年2月决定暂停自动驾驶电动汽车的研发,将部分员工调配至这些前沿的人工智能项目中。

预计苹果今年将宣布的一系列新功能和更新将由其内部构建的生成式人工智能模型提供支持。同时,苹果也在积极寻求外部合作伙伴,以开发更为先进的人工智能技术。据悉,詹南德里亚和费德里吉已经与OpenAI的首席执行官山姆·奥特曼(Sam Altman)进行了会面。



对于双方而言,这一潜在的合作无疑是一笔双赢的交易。OpenAI将有机会接触到数十亿苹果用户,包括那些对ChatGPT持保留态度的用户。而对苹果来说,这次合作将使其获得人工智能时代最炙手可热的技术,并有机会将其与自己的服务完美结合。

随着人工智能技术的需求日益迫切,Siri的联合创始人基特劳斯表示,今年对Siri而言可能是至关重要的一年。该公司计划将人工智能功能全面整合至iPhone中,为用户带来全新的体验。他说:“Siri虽已历经坎坷,但我坚信它的复兴即将到来。

权宜之计?

不过,基特劳斯补充说,对于苹果而言,与OpenAI的合作很可能是一种“中短期关系”。他强调:“可以肯定,苹果会努力开发自己的技术。”

据知情人士透露,苹果选择OpenAI作为其首个重要的人工智能合作伙伴,原因有几点。首先,苹果获得了比与谷歌合作更优越的商业条款。其次,苹果深信OpenAI的技术在市场中处于领先地位。此外,若将谷歌的人工智能集成到iPhone中可能会给人一种印象,即苹果在人工智能这一关键领域被谷歌击败。

有鉴于此,苹果与OpenAI的合作或许只是权宜之计。该公司有着将外部技术逐步内部化的悠久历史,例如,他们曾用自己的芯片取代了英特尔的芯片。

同时,苹果也在寻求聊天机器人以外的技术突破。据知情人士透露,该公司计划利用大语言模型来驱动其正在秘密研发的一对机器人设备。这些设备包括一个配备大显示屏的桌面机械臂,以及一款能够跟随用户移动、协助处理家务的移动机器人。此外,苹果还计划为AirPods增添摄像头和人工智能功能。

对于Siri而言,基特劳斯认为其前景将更为光明。在乔布斯的愿景中,Siri被定位为智能个人助理。如今,基特劳斯表示:“实现乔布斯最初愿景已无任何技术障碍”。

OpenAI、谷歌、微软相继放AI大招,压力给到苹果,市场聚焦下周WWDC

虽然苹果多年来在谈论其产品时都避免使用“AI”这个缩写,但时过境迁,如今已没有再回避的可能。然而,在AI方面已然成为追赶者的苹果,面临各大科技公司的激烈竞争。

对手大招不断 苹果如何接招?


自2022年底OpenAI掀起的生成式人工智能热潮以来,AI一直是科技行业的最大话题,推动了芯片制造商英伟达的市值达到3万亿美元,并引发了微软、谷歌和亚马逊等公司的优先战略发生重大转变,这些公司都在竞相将AI纳入其核心服务。

生成式AI模型领头羊OpenAI自不必说,自该公司公布新一代具有语音对话功能的模型ChatGPT-4o以来,收入大增,该公司还表示新一代模型正在开发中。

而作为电子设备方面与苹果的直接竞争者,谷歌和微软已经在AI PC方面放出大招。

微软此前宣布,Windows 11 AI PC 6月18日起在微软和戴尔、联想等合作伙伴设备中陆续上市,比搭载M3的苹果MacBook Air快58%,运算次数40+TOPS/秒;新功能Recall帮助查找PC上看过内容,提供中文等40多种语言翻译的实时字幕。

谷歌宣布为其高端安卓笔记本电脑Chromebook Plus产品线添加新的人工智能功能,与微软和苹果在AI PC展开正面竞争。谷歌更是有自研的Gemini模型,虽然起初被ChatGPT压过一头,但随着不断迭代,与ChatGPT-4o的差距在不断缩小。

随着苹果2024年全球开发者大会(WWDC)下周即将举行,投资者和客户现在希望看到iPhone制造商会推出哪些AI功能,来应对AI方面激烈的挑战。

苹果公司CEO蒂姆·库克已暗示有“重大计划”,每个人都在关注苹果在AI方面会有何建树。目前,苹果有超过10亿部iPhone在使用,华尔街希望听到哪些AI功能会让iPhone在与Android竞争对手中更具竞争力,以及公司如何证明其在开发自有芯片方面的投资。

投资者对那些展示出明确AI战略和愿景的公司抱有更大兴趣。英伟达股价在过去一年中翻了三倍,微软积极将OpenAI纳入其产品,在过去一年中上涨了28%。相比之下,苹果仅上涨了9%,而且其市值已被以上两家公司超越。

分析师表示,这是库克和苹果十多年来最重要的事件,“AI战略是苹果增长拼图中缺失的一块,这次活动需要令人瞩目,而不是让人无动于衷。”

预计苹果软件主管Craig Federighi将谈到苹果AI的实际应用。有分析师预计,苹果将揭示其在整个个人设备多样化生态系统中实施生成式AI的长期愿景。“生成式AI对苹果业务的影响是整个科技领域中最深远的,苹果有一个清晰的机会将生成式AI功能带到数十亿的消费设备上。”

与OpenAI合作还是竞争?

上个月,OpenAI推出了其AI软件ChatGPT-4o的语音模式。而当ChatGPT-4o刚推出时,就有人指出,这应该是Siri更新的目标。

有分析称,苹果可能会在下周与OpenAI合作升级Siri。还有报道说,苹果还在讨论从其他公司(包括谷歌和Cohere)获取聊天机器人技术。但目前苹果拒绝就与OpenAI的合作发表评论。

但也有分析认为,一种可能性是,苹果的新Siri不会直接与功能齐全的聊天机器人竞争,但会改进其现有功能,并将只能由聊天机器人回答的问题转给合作伙伴。这与现在的Spotlight搜索和Siri的工作方式相似。苹果的系统会尝试回答问题,如果不能,它会转向谷歌。该协议每年为苹果带来180亿美元的收入。

而且,苹果也可能避免全力拥抱与OpenAI的合作或聊天机器人。其中一个原因是,聊天机器人故障可能会产生尴尬的头条新闻,并可能破坏公司对用户隐私和个人数据控制的重视。因为OpenAI的技术基于网络抓取,ChatGPT用户交互用于改进模型,这种技术可能违反苹果的隐私原则。

而且,像OpenAI这样的大型语言模型仍然存在不准确或“幻觉”的问题,同时仍有版权问题尚未解决,这些都是苹果高管们希望避免的。

还有科技界资深人士表示,即便苹果与OpenAI合作,也很可能只是权宜之计。苹果长期以来一直将外部技术引入内部,并致力于发展自己的能力,例如用自己的芯片取代英特尔公司的芯片。

该人士还透露,苹果的AI战略远比聊天机器人广泛,它计划使用大型语言模型来驱动正在秘密开发的机器人设备,包括一个带有类似 iPad 的大型显示屏的桌面机械臂,以及一款可以跟随用户并代表他们处理家务的移动机器人,此外苹果还希望为AirPods 配备摄像头和人工智能功能。

但与此同时,苹果与OpenAI之间可能的合作关系也引起了微软高层的担忧。

分析认为,微软希望利用OpenAI 的技术打入消费者市场,而不仅仅是企业市场,而OpenAI与苹果的交易可能会损害这些机会,苹果的AI能力将与微软直接竞争。

不过,从好的一方面来看,微软可能会从苹果和 OpenAI 的合作中赚到更多钱,微软将获得更多的云计算收入。

效率vs规模


在AI模型路线的侧重点上,苹果可能也与竞争对手有所区分。

库克此前强调,苹果自有芯片在运行AI模型方面具有优势。“我们相信AI的变革力量和愿景,并相信我们有一些优势可以在这个新时代中使我们与众不同,包括苹果独特的无缝硬件、软件和服务集成,开创性的Apple Silicon和我们的行业领先的神经引擎,以及我们对隐私的坚定关注。”

有分析师预计,苹果会在WWDC主题演讲中的演示将专注于功能和设备上的能力,以及在设备上运行的生成式AI模型。

今年4月,苹果发布了关于其称为“高效语言模型”的AI模型的研究,这些模型能够在手机上运行。微软也在研究同样的概念。苹果的一个“OpenELM”模型有11亿个参数或权重,比OpenAI的2020年GPT-3模型的1750亿参数要小得多,甚至比Meta的Llama的一种版本的700亿参数还要小。

在论文中,苹果的研究人员在运行苹果M2 Max芯片的MacBook Pro笔记本电脑上对模型进行了基准测试,表明这些高效模型不一定需要连接到云端。这可以提高响应速度,并提供一层隐私保护,因为敏感问题可以在设备本身上回答,而不必返回苹果服务器。

媒体报道,苹果软件中内置的一些功能可能包括为用户提供他们错过的短信摘要、生成新表情符号的图像、在公司的开发软件Xcode中完成代码,或撰写电子邮件回复。苹果还可以决定在其数据中心加载M2 Ultra芯片,以处理需要更多算力的AI查询。