在微软Build2024大会上,首席执行官萨提亚·纳德拉高举高打地强调了微软半个世纪的两个梦想:1、让计算机能直接理解人类,而不是人类想尽办法让计算机理解自己;2、在一个信息疯狂爆炸的世界,计算机能更加高效地帮助人类推理、规划和处理所有这些信息。

纳德拉认为,这一波生成式人工智能就是实现梦想的答案。所以,今年的Build大会,微软一口气发布60种新产品和解决方案,且一切都与AI有关,与其说这是微软的年度开发者大会,不如说,这是微软2024 年大型人工智能计划公布现场。

作为微软进入AI时代最重要的合作伙伴,OpenAI CEO SamAltman毫无意外地现身现场,并剧透“下一个重要模型即将到来。”不在社交网站上,而在最重要合作伙伴的发布会上“官宣”这件事,外界又开始猜测“这次该轮到GPT-5”了吧。背景PPT十分简单,大大的两个联合logo,OpenAI✖️Microsoft(这波AI浪潮中的最牛独角兽✖️最风光巨头),Sam Altman的现身颇有些仪式感的味道。



整场究竟发布了什么?2024年的微软,究竟有哪些宏大的AI计划,我们在文章开头先简单速读:

Copilot+PC热身:在Build2024前一天,微软发布了Copilot+PC,搭载高通骁龙X Elite芯片押注Arm架构。

1、重头戏Copilot:推出Team Copilot,AI可以作为团队成员完成协作;Copilot Studio,Agent生态新玩法;Copilot Connector,可以自由结合企业数据;GitHub Copilot Extension,可扩展插件生态;Copilot Workspace,强大的编程及自动部署Agent。

2、模型生态:GPT-4o现可在Azure AI Studio中使用,也可作为API使用。微软开发的AI小语言模型(SLMs)Phi-3 系列也发布了一款新的——Phi-3-vision,并已可在 Azure 中使用。

3、硬件生态:自研硬件,推出全新的Cobalt 100 Arm-based虚拟机(VMs)预览版。强强联合,与AMD扩大合作关系,确定与英伟达的全面合作。

4、数据:新的 Microsoft Fabric 工作负载开发套件(Workload Development Kit)支持数据的实时分析。

一、Copilot+PC暖场:向苹果发起挑战

其实在今天凌晨的Build2024发布之前,微软已经进行了十分重要的热身,那就是发布了Copilot+PC,市场上已经有“AI PC”,但是微软CEO纳德拉却必须强调,微软发布的这批新品,都是Copilot+PC。

这些PC将搭载采用Arm架构的高通骁龙X Elite芯片。新设备配备了一个名为 Prism 的模拟层,承诺与 Windows 上的 x86 应用程序无缝兼容。苹果公司向自有 M 系列芯片的成功转型也归功于开发人员迅速将应用程序移植到完全原生。

纳德拉接受外媒采访时表示:“苹果在多个方面都表现得极为出色,我们现在正期待Windows与Mac能够重新展开真正意义上的对决。”



二、重头戏Copilot:微软AI的心智高地


在PC发布的时候,也必须抢到Copilot,这也显示了Copilot对AI时代的微软的意义。Copilot自被发布以来,已经成为一个个人AI助理的代名词,也是外界对微软AI能力的心智高地。

但是它曾经还仅仅是辅助的角色,需要人类主动呼唤,且发出比较精准的指令。Copilot能力的上限就是它所接入的基础大模型的能力上限。

今天,微软在Build大会上新公布的关于Copilot的能力又颠覆了传统的认知。

首先,Copilot从幕后的个人AI助手,扩展为团队成员。用户将能够在 Teams、Loop、Planner 等协作工具中调用Copilot。Team Copilot能够在会议中担任会议主持人,管理会议议程、跟踪会议时间并记录会议要点;也可以在聊天中作为协作者,提供重要信息、跟踪行动项目并解决未决问题。它还可以担任项目经理,帮助确保每个项目顺利推进,并及时通知团队进行输入。微软宣布,Team Copilot将在今年晚些时候推出预览版。

另外,Microsoft Copilot Studio 推出Agent代理功能,开发者能够根据特定任务和功能,构建主动响应数据和事件的Copilot。基于这类新功能的Copilot可通过记忆和知识了解上下文、推理操作和输入,基于用户反馈进行学习,并在不知道如何处理时寻求帮助,从而独立管理复杂、长期运行的业务流程。例如,从 IT 设备采购到销售和服务的客户接待,用户都可以让基于Microsoft Copilot Studio构建的Copilot为其工作。这就意味着,Copilot已经具有了自主性,将有希望进化为全自动的AI Agent。



而Copilot Connector、GitHub Copilot Extension可以将Copilot连接到新的数据源和应用程序,可以被称为能力增强神器。



GitHub Copilot Extension

三、模型生态:地表最强模型GPT-4o加持,新Phi-3-vision目标端侧

OpenAI的最强模型GPT-4o,被官宣可在Azure AI Studio中使用,也可作为API使用。

微软开发的AI小语言模型(SLMs)Phi-3 系列也发布了一款新的多模态模型——Phi-3-vision,并已可在 Azure 中使用。这是一款具有42亿参数的多模态小模型变种,能够支持通用视觉推理任务以及图表、图形和表格的推理。

随着AI技术的本地化和设备上的实施趋势,开发者们正在寻求更高效、更小型的AI模型。市场上的选择日益丰富,除了微软的Phi-3,还有谷歌的Gemma 2和Hugging Face的Zephyr等。微软的Phi-3系列提供了三种不同规模的模型:Phi-3-mini(38亿参数)、Phi-3-small(70亿参数)和Phi-3-medium(140亿参数)。微软宣称,Phi-3的性能与OpenAI的GPT-3.5相当,但更为轻量级。

Phi-3的发布时机恰逢AI个人电脑时代的到来,开发者们现在可以利用Phi-3的不同变体,将他们的AI产品带入笔记本电脑、移动设备和可穿戴设备,为用户带来更加丰富和便捷的智能体验。

开发者可在 Azure AI Playground 中体验这些最先进的前沿模型,并能在 Azure AI Studio 中开始构建和定制模型。

四、硬件生态:发布自研Cobalt,官宣AMD、英伟达合作

继推出首款自研计算处理器Azure Cobalt 100之后,微软在Build大会上宣布,基于去年11月发布的定制硅芯片推出全新的Cobalt 100 Arm-based虚拟机(VMs)预览版。Cobalt 100 Arm-based 虚拟机是第一代采用微软新Cobalt处理器的虚拟机,基于Arm架构定制,对运行通用工作负载和云原生工作负载时的效率和性能进行了优化。

同时确定了与英伟达的全面合作伙伴关系。宣布与AMD扩大合作,将MI300X AI加速器芯片用于客户AI训练和AI推理的云服务提供商。Azure ND MI300X v5已正式发布,针对高需求AI,以及诸如Azure OpenAI Service的高性能计算(HPC)工作负载进行了优化。



五、Microsoft Fabric解锁数据实时分析能力

Microsoft Fabric 推出全新的实时智能(Real-Time Intelligence)提供了端到端的软件即服务(SaaS)解决方案,能够对海量的、时间敏感的高颗粒度数据采取行动,更快、更明智地制定业务决策。能实时处理和收集来自各个来源的数据,比如传感器等。还能被PowerAI后续处理,变成可视化图表。提供及时的数据参考。

六、其它有些惊喜的小功能

1、Edge浏览器实时视频翻译功能


微软的 Edge 浏览器配备了人工智能驱动的实时视频翻译功能,可以为 YouTube、LinkedIn、Reuters和 Coursera 等网站的视频配音。该功能适用 于多种语言,提供从西班牙语到英语的翻译,反之亦然,或者从英语到德语、印地语、意大利语和俄语的翻译。微软表示该功能“即将推出”,未来将添加更多语言和视频平台。



2、 在Teams中使用自己创造的Emoji

微软正在其 Teams 通信平台中添加一项新功能,使用户能够上传自己的自定义表情符号以在反应和消息中使用。微软在周二的 Build 开发者大会上宣布,新的自定义表情符号将于下个月通过 Teams 公共预览版提供试用,其目标是帮助 Teams 用户协作并“更有创意、更真实地”表达自己。

使用 Teams 的企业的 IT 管理员将能够限制哪些用户可以上传或删除自定义表情符号,或者他们可以完全关闭该功能。将自定义表情符号上传到 Teams 后,它们将仅在同一组织域中可见。微软表示,自定义表情符号预计将于今年 7 月的某个时候全面上市。

3、高通版“Mac Mini”

高通公司刚刚推出了一款类似 Mac Mini 的盒子,表面上是专为开发人员设计的,售价 899.99 美元,配备了高通最强大的骁龙 X Elite 芯片系列(4.6 TFLOP GPU),以及 32GB 的 LPDDR5x RAM、512GB 的 NVMe 存储和大量端口,其体积与苹果的迷你台式机大致相同。



4、Windows 现在具有人工智能驱动的复制和粘贴功能



微软正在为 Windows 11 的 PowerToys 添加AI粘贴功能,可以帮助人们通过复制一种语言的代码并将其粘贴到另一种语言中来加快工作流程。

Advanced Paste 包含在 PowerToys 版本 0.81 中,一旦启用,可以使用特殊的键命令激活:Windows 键 + Shift + V。这将打开一个高级粘贴文本窗口,提供粘贴转换选项,包括纯文本、markdown 和 JSON。

又是一个量大管饱的发布会,但是开发者和创业者如何才能从这些新技术、新产品、新服务中构建自己的价值,可能还是一个无比艰巨的任务。能否淘到“真金”,比拼的可不仅仅是胆识。

空降嘉宾奥特曼把当前的创业环境与2008年的移动互联网热潮相提并论,甚至认为它可能与互联网的诞生相媲美,称之为“最激动人心的创业时期”。不过他也高声提醒与会的开发人员“人工智能本身是一种新的赋能者,但它并不会自动打破商业规则。”