谷歌“掉队了”,在新的 AI 浪潮下,这家硅谷巨头从引领者变成了追随者。
搜索巨头显然已经开始反攻,今年 5 月的 I/O 大会上,谷歌就亮出了接入 AI 的“谷歌全家桶”。而真正要反超对手,谷歌最大的战场可能是云计算。
当地时间 8 月 29 日,谷歌云在旧金山举行的 Next '23 大会上宣布了一系列产品更新,包括针对 AI 基础设施的改进、更强大的 Vertex AI 平台、以及 Duet AI 协作工具等创新。同时,Vertex AI 平台甚至引入了 Meta 和 Anthropic 等对手公司的重要模型,以供开发者选择。
据谷歌云首席执行官 Thomas Kurian 称,目前行业中超 50% 的 AI 初创公司、超过 70% 的生成式 AI 独角兽都是谷歌云的客户,其中包括 AI21、Anthropic、Cohere、Jasper、MosaicML、Replit、Runway 和 Typeface。谷歌云还宣布与通用汽车等公司建立新的合作。作为“万年老三”,谷歌云计算在 AI 上尝试弯道超车。
一、更具效率的AI新基础设施
在大会上,谷歌云发布了生成式 AI 关键的基础设施进展,其中包括 Cloud TPUv5e、搭载英伟达 H100 GPU 的 A3 VM、GKE 企业版本、跨云网络以及谷歌分布式云 GDC。
谷歌云首席执行官 Thomas Kurian 称,Cloud TPUv5e 是谷歌云迄今为止最经济、最多性和可扩展性的专用 AI 加速器。用户现在可以使用单一的 Cloud TPU 平台来运行大规模的 AI 训练和推理。
与上一代相比,TPUv5e 承诺每美元的训练性能提高了 2 倍,每美元的推理性能也提高了 2 倍甚至更多。谷歌云高管称其为“迄今为止最具成本效益和易于使用的云 TPU。”
除了下一代 TPUs,谷歌云宣布,由英伟达 H100 GPU 提供动力的 A3 VM 将于下个月正式推出,能够在之前一代 A2 上提供三倍的训练性能。
谷歌云还发布了 GKE 企业版本,使最具挑战性的、关键任务的 AI/ML 工作负载所需的多集群横向扩展成为可能。据 Thomas Kurian 称,用户已经看到了 45% 的生产率提升,同时减少了 70% 以上的软件部署时间,GKE 带来的好处包括自动扩展、工作负载编排,可以与 Cloud TPU v5e 一起使用。
鉴于现在大多数大型企业采用多个云服务提供商,谷歌云发布了跨云网络平台,旨在帮助用户在云中连接和保护应用程序,提供基于 ML 的零信任安全套件的支持。据称,相较于不通过谷歌网络传输流量的情况,使用跨云网络可将网络延迟降低 35%,成本降低 40%。
最后,在 Google 分布式云(GDC)方面,谷歌云正在增强 GDC 产品组合,以在边缘引入 AI,其中包括 Vertex AI 集成和 GDC Hosted 上的 AlloyDB Omni 的新托管版本。
二、“接入对手”的 Vertex AI 平台
除了基础设施更新,谷歌云还改进了它的综合 AI 平台 Vertex AI,该平台让用户能够构建、部署和扩展机器学习模型。
谷歌云首席执行官 Thomas Kurian 称其为“最全面的 AI 平台”,并指出今年 4 月到 7 月,谷歌云的生成式 AI 客户项目的数量增长了 150 多倍,客户可以访问 100 多个基础模型,包括第三方和流行的开源版本,以及面向行业的特定模型,如网络安全和医疗等。
在大会上,谷歌云宣布 Vertex AI Search 和 Conversation 现在已普遍可用,这个工具使用户能够在几分钟内,使用自己的数据创建搜索和聊天应用程序。
Vertex AI 的生成式 AI Studio 为用户提供了调整和自定义模型的工具,包括 Text Embeddings API,该 API 允许开发者基于对文本或图像的语义理解构建复杂的应用程序,并通过强化学习,深度定制和改进模型性能。
Vertex AI 平台还宣布推出了几个新模型和工具,包括将 PaLM 2 升级到 32000 个上下文窗口(相当于约 25000 个单词,大约 80 页双倍行距的文本),以便企业可以轻松处理更长的文档,如研究论文和书籍。此外,他们还将提高 Imagen 的视觉吸引力,并在 Codey 中支持新语言。
在工具方面,对于 PaLM 2 和 Codey,谷歌云正面向市场提供适配器调整,并引入一种名为 Style Tuning 的新方法,以便企业可以使用少量参考图像创建符合品牌需求的图像。
在新模型方面,谷歌云宣布来自 Meta 的 Llama 2,和 Code Llama 已经可供云客户使用,还有 Technology Innovative Institute 的 Falcon LLM(一款热门的开源模型)以及 Anthropic 的 Claude 2 聊天机器人。对于 Llama 2,谷歌云将成为唯一提供适配器调整和 RLHF 的云服务提供商。
在 Vertex AI 扩展方面,开发人员可以访问、构建和管理扩展,提供实时信息,整合公司数据,并代表用户执行操作,这为生成式 AI 应用程序提供了新的可能性。
另外一个值得注意的更新是,谷歌发布了 Vertex AI 上的数字水印技术,可以将数字水印嵌入到像素图像中,对人眼来不可见,难以篡改,用于负责任地创建和识别由 AI 生成的图像。
谷歌云自称是第一家为 AI 生成图像提供此技术的超大规模云服务提供商,但它并不是第一家推出数字水印工具的科技公司。
今年 5 月,微软承诺使用“加密方法”为 AI 生成的图像和视频添加水印,生成 AI 初创公司 Midjourney 也采用了相关指南,在生成 AI 创建的内容中嵌入标记,OpenAI 的 DALL-E 2 也会在生成的图像右下角插入一个小水印。
谷歌云的数字水印工具与谷歌 DeepMind 合作推出,目前处于测试阶段,只对 Google Vertex AI 的部分用户开放,而且只支持由谷歌自家的图像生成模型创建的图像。根据 DeepMind 的说法,能够识别 AI 生成的内容对于防止虚假信息的传播至关重要,该数字水印工具“并不是绝对可靠的,但它提供了一个有希望的技术途径,可以帮助人们和组织负责任地处理 AI 生成的内容。”
此外,据谷歌云首席执行官 Thomas Kurian 称,当用户使用 Vertex AI 自定义和训练模型时,包括来自 SaaS 应用程序、数据库或其他专有源的私有文档和数据,这些数据不会暴露给基础模型,用户的提示和数据不会用于改善他们的模型,也不会被其他客户访问。
三、更多功能的 Duet AI
Duet AI 是一款在线 AI 协作工具,于 5 月的 I/O 大会首次亮相,当时他们展示了它的各种功能。自那以来,谷歌一直在扩展其功能,并将其整合到谷歌 Workspace 和谷歌云的各种产品和服务中。
首先是 Workspace,据称已经有 30 多亿的用户和 1000 多万的付费客户。Duet AI 为 Workspace 增加了许多功能,包括在 Gmail 和 Google Docs 中帮用户编写和改进内容,在 Google Slides 中创建原始图像,以及将数据转化为 Google Sheets 中的见解等。
据谷歌云首席执行官 Thomas Kurian 称,自 Duet AI 发布以来,成千上万家公司和超过 100 万测试人员已经用过它。在 Next '23 大会上,谷歌云还宣布了 Duet AI 一些新的增强功能。
首先是 Google Meet 中的 Duet AI,它可以在视频会议期间记录笔记、发送会议摘要,还可自动将字幕翻译成 18 种语言。
然后是 Google Chat 中的 Duet AI,用户将能够直接与 Duet AI 聊天,询问有关内容的问题,获取在一个空间中共享的文档摘要,并跟踪错过的对话。
Google Chat 的产品经理形容,这相当于让用户拥有“一个具有无限记忆和惊人记忆力的同事”。
根据谷歌云的介绍,如果在会议中迟到,谷歌可以显示会议中间摘要,让人了解前面发生了什么;在会议期间,还可以与谷歌的聊天机器人私下交谈,讨论会议细节;在会议结束后,可以保存会议摘要,以便后续查看。
此外,用户甚至可以不用出席一场会议,让 Duet AI 代为出席,谷歌可以自动生成用户可能想讨论的内容。
事实上,除了谷歌,微软和 Zoom 已经推出了基于自身服务的 AI 会议摘要,这类 AI 总结有效的前提是会议内容清晰,能够被准确捕捉,谷歌是否能够如其宣传的那样,真的帮人开会,实际应用中 AI 是否会出错,还需要市场进一步验证。
除了 Workspace,Duet AI 现在还可以在各种谷歌云产品和服务中提供 AI 辅助,例如作为编程助手、专家顾问、数据分析师和安全顾问等。Duet AI 在谷歌云上的进展涵盖软件开发、应用程序运营、数据分析、网络安全等方方面面。
在软件开发方面,Duet AI 在整个软件开发生命周期中提供专家支持,通过最小化上下文切换来帮助开发人员更长时间保持流程状态,从而提高生产力。除了代码生成,它还可以协助代码重构,通过简单的自然语言提示即可完成。
在应用程序和基础设施运营方面,运营商可以在谷歌云控制台的多个服务中,使用自然语言与 Duet AI 聊天,以快速检索有关基础设施配置等信息。
在数据分析领域,BigQuery 中的 Duet AI 为编写 SQL 查询和 Python 代码提供上下文帮助,生成完整的函数和代码块,帮助用户分析和可视化数据,并以自然语言解释 SQL 语句,并可以根据模式和元数据生成建议。
在网络安全方面,Duet AI 还将应用于安全产品,在 Google Cloud Security Command Center 中提供安全建议,帮助识别、分类和快速解决漏洞和威胁。
谷歌云还声明,“数据就是你的数据”,用户代码、输入到 Duet AI 以及由 Duet AI 生成的建议将不会用于训练共享模型,也不会用于开发任何产品。
作为 AI 界的巨头和云计算领域的重要玩家,谷歌的身份类似微软,两者都既有云计算“基建”,同时在 C 端有大量应用,可供 AI 落地——两者的策略,从某种程度上也代表了巨头公司在这一波 AI 浪潮中的典型动作和思考。
例如,在 Vertex AI 平台,引入 Meta 和 Anthropic 的大语言模型,似乎印证了在 AI 工具平台层面,单模型模式一定走不通,而用更开放的心态,引入多模型模式,才符合大势。Duet AI 在 Google Meet 上的总结、替代开会等功能,又和钉钉刚刚发布的“数字员工”有异曲同工之处,说明在办公 SaaS 领域,AI 落地时能玩出的花样还不多,反而可能是更有潜力百花齐放的领域。
本文来自微信公众号:极客公园 (ID:geekpark),作者:芯芯,编辑:靖宇