今天凌晨,苹果官宣 WWDC 2024 将于 6 月 10 日至 14 日举行。


苹果全球营销高级副总裁 Greg Joswiak 在社交媒体上表示:“在您的日历标记上 WWDC24 吧。这场活动无疑会令人惊喜!”



有意思的是,Greg Joswiak 特意把“Absolutely Incredible”的首字母拼成大写,合起来就是 AI ,似乎在暗示今年 WWDC 的重点。


不过,彭博社记者 Mark Gurman 认为,苹果并不打算在 iOS 18 推出自研生成式 AI 聊天机器人,而是和 OpenAI、Google 和百度等公司合作,联合发布“协助用户日常生活”的全新 AI 功能。


比起早已搭载 AI 助手的国产品牌,苹果这回又不出意外地晚了大半年,慢人一步似乎一直都是苹果的标签,只是它们总能在稳步前行中带来一些惊喜。


然而,AI 大模型的进步速度正以周、甚至以天计数,苹果的迟到,究竟是再一次后发先至,还是在新时代掉队的开始?


一、略显妥协的方案,先上车才是重点


上个月的最后一天,苹果用 12 分钟的短会宣布:放弃造车,All in AI,汽车团队的众多成员将被调往 AI 部门。


蛰伏十年的泰坦计划,倒在了入局新能源汽车的最后一年,对于未来百家争鸣的汽车市场而言,会有些许遗憾,但从一家科技公司长远的发展来看,这莫过于一个长远且正确的选择。



AI 是基础性的应用,在所有大公司都主动或被动拥抱 AI 的当下,苹果的“断舍离”顺应着时代。


而如何拥抱 AI?怎样的人工智能才能在逐渐被瓜分的市场里占得一席之地?是它们最先要解决的难题。


针对国外市场,苹果正在与 Google 积极谈判,以便在 iOS 18 中加入 AI 大模型,实现其他品牌早就有的 AI 功能。


虽然目前“双方尚未决定人工智能协议的条款或品牌,也没有最终确定如何实施”,但在众多备选合作商(OpenAI 和 Anthropic)中,Google 和 Gemini,应该是最适合苹果和 iPhone 的那一个。


今年二月发售的三星 Galaxy S24 系列机型以 AI 功能出圈,通话翻译、创意写作等功能赶上了国内平均水平,即圈即搜缩短了搜索路径,也极有可能成为今后 AI 手机的主要发展路线。


海外版的 S24 系列,就是通过大模型 Gemini 支持,才得以完成上述功能。


从经验讲,Google 已在全球出货量最高的旗舰机型上,完成了初步尝试,相比于在 PC 或 Web 端大火的厂商,它们更知道手机大模型的操作习惯、使用场景、适配应用应该怎么做。


再者,Google 本身也更渴望得到苹果的项目。


根据国际数据公司 IDC 的统计,三星在 2023 年全球智能手机市场占有率达到了 19.4%,苹果则成功登顶达到了 20.1%。



若是拿下苹果,Gemini 在全球范围内手机终端的搭载率将达到 4 成,这对于一家面临激烈竞争的 AI 大模型公司,极为利好。


在梦里笑醒的除了 Google,还有苹果。


和其他强调“自研”的厂商不同,苹果在一开始就以合作来达成 AI 上机,也有其自身的考量。


首先,在本身起步晚进度慢的现状下,“拿来主义”是快速争夺市场的妙手,和 Google 的合作,在减小研发成本、收取高额坑位费的同时,还能缓解两家公司目前所面临的监管压力。


其次,AIGC 的技术很好,但在落地时却因道德、隐私等方面的缺陷被大量诟病,交给成熟的第三方,特别是已经在三星机型上试水成功的 Google,省力省心,且减小了舆论和责任风险。


这当中的另一道坎,是技术本地化。每个国家和地区对 AI 大模型的监管和相关法规都有着不同的要求,合法合规的落地才是争夺市场和发展技术的前提,因此才催生出了“国内+国际”双管齐下的路线。


按照三星与百度初见成效的合作,苹果才会选择这条已经被“验证为真”的路线。


国行版三星 S24 系列上的 AI 功能,实际上有多个厂家旗下的技术组成:即圈即搜功能由百度和京东提供;智能修图由美图秀秀的大模型 MiracleVision 完成;文章摘要、智能写作则采用了百度的文心一言大模型。


不过据中国日报报道,接近苹果公司的知情人士对该消息予以否认,表示双方尚未达成合作。


二位最终能否一拍即合,还要等待后续的消息,


最后,苹果要做的并非一个智能语音助手,而是整套 AI 终端。但根据 Macrumor 的爆料,以目前的自研进度和技术成果,苹果的大模型还远达不到 Google、OpenAI 等公司水准。


与其赶鸭子上架一个智能聊天机器人,不如先拿成熟的方案做过渡,为自研大模型争取更多的研究时间和进步空间。


而且苹果对 AI 策略的规划,有更长远的考量:


除了自家 AI 应用,它们(苹果)更希望为开发者和用户提供一个更大的平台,从而能够使其更好地从中获利。


华尔街咨询机构 Melius Research 主管 Ben Reitzes 在接受 CNBC 采访时表示,苹果可能会在 6 月份的 WWDC 上,推出一个全新的 AI 应用商店,预计当中将包括各大供应商提供的 AI 应用。


Reitzes 预测,苹果将在开发者大会上详细说明如何从 App Store 购买 AI 应用程序,并且,全新的 AI 应用商店也会拥有专属的 App、AI 助手以及升级版 Siri。


AI 应用商店实际上并不新鲜,OpenAI、百度等公司都在自家大模型产品发布后,推出了各家的 AI 商店。


准备进军 AI 领域的苹果,将如何通过应用商店,将 AI 融入 Apple 的生态,届时也会一同揭晓。


二、当下的市场很重要,但未来的核心技术才是根本


合作,是苹果 AI 全球化的第一步,而最终的目标,是为了拥有全路自研的 AI 大模型。


这是一项烧钱且耗神的工程,别说退步,稍微进步的慢一点,都有可能在下周被淘汰。一个有竞争力的大模型,往往代表着今后在市场上的主导权与议价权。


库克认为:


生成式 AI 方面开辟新天地,我们相信这项技术可以重新定义未来。


而苹果对于大模型的探索,其实一直都在日程表上。


本月 15 日,苹果工程师悄悄发布的一篇研究论文,当中详细介绍了一种名为 MM1 的新型生成式 AI 模型的开发过程。



MM1 是一个具有最高 30B(300 亿)参数的多模态 LLM 系列,这是苹果在多模态大模型的最新研究成果。


总的来说,苹果的自研模型在测试效果上,与 Gemini 和 GPT4V 还有一定的差距,也没有在生成结果上表现出如 Sora 一样惊人的效果,更没有探索出一条全新的技术路线。



但是,它能通过控制各种数据变量,在对比中找出影响模型生成效果最关键的那几个因素,简单来说,它天生不强大,不过善于观察、实践和总结,在一次次的尝试中,也能取得不错的成绩。


MM1 由密集模型和 MoE(混合专家)变体组成,当指令进入 MoE 后,究竟应该去“东市买骏马”还是“西市买鞍鞯”,都会被这个指令中心安排的明明白白的。


问题被细化和分类的同时,也提升了计算效率,节约了运行能耗。



这篇论文,代表苹果在 AI 领域探索的阶段性成果,虽然 MM1 没有颠覆行业更没有惊艳世界,但在晦涩难懂的专业术语里还是能看出它们的进步:


我们的工作模式一直是先做工作,然后再谈论工作,而不是在自己面前出言不逊 —— Tim Cook


没有透露过多技术细节的苹果,其实还在盘算着另一步棋:端侧大模型。



早在去年底,苹果在名为《闪存中的大型语言模型:在有限内存下高效的大型语言模型推理》的论文中,就提出了大模型落地 iPhone 等“内存有限”设备的方法。


研究人员称,他们通过最新的闪存技术,在 iPhone 和其他内存受限的设备上成功部署了 LLM(大语言模型)



这个项目被称为 Apple GPT,最大的作用是将 LLM 数据直接存储在闪存中,比如整合在 Siri 内部,相较于传统的运行方法,新技术使 CPU 和 GPU 的推理速度,最大提升了 5 倍和 25 倍。


研究人员称,开发的这些效率型方法使得 AI 模型能够在 iPhone 当前内存的两倍范围内运行。


也就是说,侧端搭载大模型有了可行性,通过减少闪存传输的数据量、提高每次传输的吞吐量,让 LLM 的数据直接储存在闪存中。


三、撇开技术,Siri 是我们和 AI 的桥梁


进度缓,消息少,布局大。这是苹果探索 AI 的概况。


每每看到苹果的某项技术落后于市场和竞争对手,都会给人一种“起步太晚”的错觉,实际上在翻看相关新闻和专利文件的时候,又会发现它往往是最早布局的那一批,甚至那一个。


截止到 2023 年,苹果总共收购了 32 家 AI 公司,位列科技巨头中收购榜第一。


收购 Siri,应该可以算作苹果入局 AI 的开端。



2010 年的乔布斯打给“Siri 之父”Dag Kittlaus 的一通电话,让 Siri 以超过 2 亿美元的身价,加入苹果,走上 iPhone。


Siri 最初的定位是一个快速准确获取信息的助手,或是处理复杂任务的助理。


在最原始的版本里,Siri 可以与 42 个网络服务相连接——从餐馆点评网站 Yelp、售票网站 StubHub,到电影点评网站 Rotten Tomatoes 和数学计算网站 Wolfram Alpha。


根据提示,Siri 会将各种信息整合,并回复用户。无需打开其他的应用软件,Siri 就可以帮助用户买票、订餐馆或叫出租车。


这些如今被 AI Pin 和其他智慧助手大力宣扬的“AI 功能”,似乎只是十多年前 Siri 的“基础操作”。


但 Siri 的实际体验,已经在 AI 大模型爆炸式发展的当下,被拉开了不小差距。



智能助手,是对人的被动模仿,有问必答,有求必应。


而 AI 终端,则是对人的主动接近。根据用户的个人习惯、喜爱偏好,总结以往、推理以后,在不同的时间地点给予你最合适的建议和答案,并且能够不断地学习优化,成为“私人专属”。


图片来自:x.com


从整体上看,苹果的迟到只是相对的晚,因为 AI 手机,还处于发展的早期阶段。


的确,大部分国产品牌已经在 AI 终端的阶段发力,功能大体相同,特长各有侧重。


但各家大模型的可用性只能算达到及格线,除了像 OPPO 相册的 AI 消除、三星通话的实时翻译、小爱同学的 AI 通话等细分功能,大部分的体验目前还是与独立的 AI 应用有些差距。


这当中,除了厂家的技术突破,也和 App 开放的接口有关,比如不支持微信语音通话摘要的模型,在日常生活中,就少了一大块的应用空间。


因此,大模型和系统、App 的整合,以及对全新交互方式的探索,还有很长的路要走。在此之前,AI 功能还没能达到影响消费者购机决策的程度。


在 AI 上机的元年,Siri 的目标是和其他 AI 助手抹平这半年多的差距;而作为苹果布局未来的重要部分,我们更期待 6 月份的 Siri,会带来怎样的“One more thing”。


本文来自微信公众号:APPSO (ID:appsolution),作者:肖凡博