作者|田思奇
有没有可能,让计算机理解我们,而不是我们去理解计算机?
在信息不断增加的世界里,计算机能否根据这些信息帮助我们更有效地推理、计划并采取行动?
当地时间5月21日(周二)上午举行的微软Build年度开发者大会上,微软首席执行官萨蒂亚·纳德拉 (Satya Nadella) 提出了上述两个问题。他说这是微软几十年来的两个梦想,而当下的人工智能浪潮为这两个梦想提供了答案。
大会前一日,微软首先发布了史上最强大的AI PC产品,其中包括多个令人惊艳的新功能。在媒体采访中,纳德拉毫不掩饰对苹果的“敌意”。他骄傲地宣布,诞生于上个世纪的微软PC与苹果Mac的大战,正重新回到聚光灯下:“我们现在想让真正的竞争重新回到 Windows 与 Mac 之间。”
和此前媒体透露的信息不同,微软并没有发布自研大模型与OpenAI抗衡。相反,上周OpenAI刚刚发布的GPT-4o模型得到了纳德拉的高度肯定。同时,OpenAI首席执行官萨姆·奥尔特曼(Sam Altman)也在OpenAI近期陷入一片争议声中的前提下,亲自来到西雅图为Build大会站台,巩固了微软与OpenAI的联系。
但从网友表态来看,让主流市场接受拥有了GPT-4o加持的Copilot,恐怕还需要一段时间。许多人看不到购买新电脑或者抛弃Mac的理由,还有人认为“电脑充分理解自己”是十分恐怖的事情。
不过微软的确在首次发布Copilot一年后的Build大会上,又一次真切地铺开了AI PC时代的画卷。另外,也正像纳德拉所说,PC不PC的也不是那么重要:“我相信 Copilot 未来会无处不在。”
1.让电脑预测你的意图
微软在5月20日发布的Copilot+PC,令人印象最深刻的当属Recall功能。
之前用户可能在电脑里存了无数张图片和笔记,然而却忘了放在哪个文件夹里。通过Recall功能,Windows 将不断捕获屏幕上的内容,并通过设备中的生成式AI模型处理并搜索所有内容。比如你可以搜索“带有鱼的那张PPT”——哪怕PPT中并没有“鱼”这个字,Recall也可以准确识别图像信息并找到它。
“它能记住我忘记的事情,”微软 Surface 电脑营销主管马特·巴洛 (Matt Barlow) 强烈推荐道。
然而,把用户在屏幕上的所有举动截图这件事,很容易引起大家的恐慌。微软方面目前保证,这些截图不会离开所在的电脑,不会发送到微软的服务器或用于训练未来的AI系统。而且用户可以限制 Recall 截取某些应用或网站的截图,或者完全关闭该功能。
其他新功能还包括44种语言的实时翻译——也包括视频通话和App试用期间;与AI共同创作图像的CoCreator功能等。
在一段5月20日公布过的演示中,有人在玩沙盒游戏“我的世界”时,Copilot已经明显可以看到屏幕上的游戏内容,并为玩家提供相应的游戏建议。
在Build大会上,纳德拉还给出一个全新的演示视频:一名男子把一只鞋子举到电脑前,询问Copilot这双鞋是否适合露营或徒步旅行。
Copilot用语音回应称不太好。然后该男子便让Copilot把适合露营的鞋子加到购物车里,Copilot也瞬间完成这项更加主动的“行为”。随后男子突然开始说西班牙语,Copilot也切换为西班牙语回应。
技术层面上,Copilot+ PC 拥有 40 多个设备内置 AI 模型,包括 8 个用于生成式 AI 的小语言模型。但要访问大型语言模型,就仍然需要连接到互联网。
6月18日起,全新的Windows PC将在微软的合作伙伴宏碁、华硕、戴尔、惠普、联想和三星生产的电脑以及微软的 Surface 新系列上推出,其中Copilot+Surface Pro售价 999 美元起,国内售价8688元起。
微软 Windows 部门高管尤素夫·梅迪 (Yusuf Mehdi) 表示,新款笔记本电脑将比搭载 M3 处理器的 MacBook Air“快 58%”,电池续航时间长达“一整天”。
纳德拉在大会前夕表示:“我们为 PC 创造了真正的快乐和惊奇的感觉。我们的追求一直是打造能够理解我们的计算机,而不是我们必须理解计算机,我觉得我们接近真正的突破了……我们正在进入一个新时代,计算机不仅能理解我们,还能预测我们想要什么和我们的意图。”
2.奥尔特曼闪现站台
上周OpenAI刚刚发布的GPT-4o模型,也即将加入Copilot。此前The Information报道称,微软将在此次大会上发布独立自研的5000亿参数大模型MAI-1,让外界以为OpenAI对于微软的重要性有所下降。然而此事并未成真。
纳德拉仍然表示,OpenAI是微软“最重要的战略合作伙伴”,并且OpenAI 上周演示的内容“非常神奇”。而这场大会的开场视频中也出现了OpenAI的视频生成应用Sora最著名的演示——一名戴墨镜的女子走在东京的街道上。
在纳德拉出场2个小时后,萨姆·奥尔特曼出现在Build大会的舞台上,不过与他同台的是微软首席技术官凯文·斯科特(Kevin Scott)。
短短9分钟的对话里,奥尔特曼没有介绍什么GPT-4o在Windows PC上的应用。他仅仅提到了自己认为最重要的事——虽然听起来是老生常谈——是“模型会变得更智能”。奥尔特曼强调,这句话可能比想象中深刻许多。“模型变得更智能了,更有用了。但潜在的能力,这种惊人的新兴特性……这种情况还会继续发生。”
同时新的模式对奥尔特曼来说很重要:“语音模式对我来说是一个真正的惊喜,我非常喜欢新的语音模式。”值得一提的是,在Build大会前24小时里,演员斯嘉丽·约翰逊刚刚公开指责OpenAI未经同意就在Sky语音功能模仿她的声音提供服务。OpenAI回应称将暂停Sky语音功能。
至于对在座开发者的建议,奥尔特曼提到了两点。第一,他重申了自己一直以来的观点,即当下是创业和打造新产品最好的时候。并且从手机或互联网的诞生开始,最大的机会都出现在平台转变的时候。
第二,奥尔特曼提到在智能手机革命刚开始时,人们还会标榜自己是一家“移动公司,做了个App”,但后来没有人再这样强调了。他认为人工智能的概念也是如此——AI本身不能成就一个伟大的产品或公司,不会自动打破商业规则。人们必须想清楚如何通过AI建立持久的价值,这是如同淘金热一般的狂热风潮中容易被忽视的一点。
3.网友暂时不买账
早在年初的CES展上,“2024年会是AI PC元年”就成为最响亮的口号。目前今年已经接近过半,微软也推出了Windows Copilot整整一年,但广大用户对AI PC的感知仍然没有那么明显。
美国亚利桑那州立大学人工智能教授兼研究员苏巴拉奥·坎巴姆帕蒂(Subbarao Kambhampati)表示,虽然新型AI PC内部的芯片专门用于处理复杂的人工智能任务,例如生成图像和汇总文档,但消费者可能仍无法察觉它带来的好处。
对于正在使用Mac的消费者来说,最新的Copilot+PC也不足以吸引他们换机。在《华尔街日报》的评论区,网友纷纷表示:“一旦用过Mac就再也回不去了(Once you go Mac, you never go back)”“微软产品的问题就是运行不了MacOS系统”。
对AI伦理考虑得更多的《纽约时报》读者,则产生了更多恐慌情绪。
来自纳什维尔的网友理查德(Richard)获得了评论区最多的赞:“计算机不仅能理解我们,还能预测我们想要什么和我们的意图……我可不希望我的计算机这样做。我想继续使用我自己的大脑,因为它现在仍然可以有效运作。我有一台已经用了 2 年的 MacBook Pro,配备 M1 芯片,它足够智能、足够快。”
加州长滩的约翰·麦考伊(John McCoy)表示:PC设备对于学习和处理信息至关重要。但是,不断引入无法关闭的操作系统和应用程序‘功能’已经成为严重的干扰,并且消耗了大量的空间和处理时间,我们都以某种方式为此付出了代价。我想要一个可以配置的操作系统和应用程序来满足我的需求,包括自行决定消除它们(以及底层代码)的选项。简而言之,我想控制我自己的电脑。我不希望微软或苹果决定我的工作方式。”
纽约州的格雷格(Greg)说:“我使用自己组装的电脑,我最不想做的就是将人工智能融入到我的流程中。我不需要更多的简便性,我更关心准确性。已经有大量的应用程序和程序可用于精简和简化,而不依赖于劣质的、容易出错的人工智能和数据隐私的暴露。这只是追逐最新科技流行口号的销售噱头。”
也有人给出肯定的观点。Creative Strategies 的分析师本·巴贾林 (Ben Bajarin) 表示:“人们只需要相信,设备本身的体验足以证明推出全新类别的 Copilot + 机器的合理性。”
微软乐观地相信,明年就将售出 5000 万台 Copilot+ PC 笔记本电脑。研究机构Gartner数据显示,去年全球PC出货量下降约 15%至 2.42 亿台,这意味着微软预计新款电脑将占到全球PC销量的五分之一以上。
密切跟踪市场的 IDC 分析师黄林(Linn Huang)表示,这些售价超过 1000 美元的新电脑初始销量将会很小。但他预测,到本世纪末——假设人工智能工具被证明是有用的——它们将“无处不在”。
Susquehanna International Group 分析师穆迪·霍塞伊尼( Mehdi Hosseini )在研究报告中写道,一些高端智能手机已经集成了AI芯片,但销量却出现下滑,因为这些功能“仍然不够复杂,无法带来更快的升级周期” 。他认为至少还需要一年的时间,AI PC的重大突破才会引起消费者的注意。
接下来,被纳德拉视为眼中钉的苹果将在6月中旬召开的全球开发者大会(WWDC)上公布其最新的人工智能战略。
最近一两年里,苹果持续被诟病在人工智能方面过于落后。但此次大会上,苹果可能将真正迎来AI层面的新突破。有报道称,苹果可能会在其 iOS 和 Mac 平台上引入生成式 AI,推出新版的Siri,同时苹果也有可能宣布与OpenAI或谷歌Gemini模型的合作。
微软vs苹果的战局,或者说这场大战是否真的能在2024年成立,还要留待WWDC上见分晓。
4.更完善的生态
无论是上周举行的谷歌I/O,还是刚刚开幕的微软Build,以及下个月初的WWDC,它们共同的名称都是“开发者大会”。科技巨头们通常利用这些场合阐述新一代产品的基础和架构,目标是吸引开发人员在自己的地盘,而不是竞争对手的地盘上打造新的软件项目。
此次大会上,纳德拉与微软高管也介绍了诸多为开发者提供的新功能,包括 Microsoft Fabric 中的实时智能、进一步自定义 GitHub Copilot 体验的能力、Azure AI Studio 中 GPT-4o 的可用性等等。
Microsoft Fabric 中的实时智能使公司能够“对大量、时间敏感且高度精细的数据采取行动,从而做出更快、更明智的业务决策”。同时微软还发布了新的Microsoft Workload Development Kit,使开发人员能够在Microsoft Fabric中扩展应用程序。
此外,微软宣布了一组 GitHub Copilot 插件,允许开发人员使用 Azure、Docker、Sentry 等服务定制他们的 GitHub Copilot 体验。例如,Azure 的 GitHub Copilot 允许开发人员探索和管理他们的 Azure 资源、解决问题以及查找日志和代码,所有这些都可以在 GitHub Copilot Chat 中进行。据纳德拉介绍,GitHub Copilot 擅长“让你一整天都保持流畅”,而开发者们长期以来一直都梦想着“保持流畅”。
同时微软与“AI程序员”Devin 背后的公司 Cognition 合作,Devin 现在将由 Azure 提供支持;PyTorch 和 Web 神经网络也将在 Windows 上本地运行,为开发人员提供了更多可用的工具。
另一方面,微软宣布Copilot 引入 Team Copilot新功能,它是 Microsoft 365 的 Copilot 的扩展。可以从 Microsoft 365 中的团队协作应用(例如 Teams、Loop、Planner 等)访问 Team Copilot。
例如,它可以通过管理议程、跟踪时间和做笔记来促进会议;在聊天中显示信息、跟踪项目并解决的问题;或者担任项目经理,并在有需要时通知团队成员。微软透露,这款工具将于今年晚些时候向企业客户提供,致力于提高团队的合作效率。
硬件层面,微软介绍了与英伟达和AMD的新合作,同时也发布了自研芯片Maia和Cobalt的新进展。
微软还宣布与教育辅导机构可汗学院达成合作,将向美国所有教师免费提供AI学习辅助工具“Khanmigo for Teachers”。
CCS Insight 首席执行官杰夫·布拉伯里(Geoff Blaber)对CNN表示:“随着时间的推移,人工智能将成为一种无处不在的功能,微软及其合作伙伴已经取得了良好的开端。”“但他们需要努力确保人工智能不仅仅是一个具有越来越多功能但毫无意义的描述符。”
参考资料:
《Can Artificial Intelligence Make the PC Cool Again?》,《The New York Times》
《Microsoft thinks it found a way to make PCs relevant again》,CNN