农历春节除夕这一天,Google 直接来了一票大的:

Bard今后统称Gemini。

通过Gemini Advanced,即可访问Google能力最强的原生多模态大模型Gemini Ultra!

去年12月,Go ogle 推出Gem ini Pro和Gemini Nano,人们可以通过聊天机器人Bard、Pixel 8 Pro 和三星S24 系列手机免费使用。 而今天,Bard改头换面,带来由超大杯Ultra 1.0 驱动的会员版Gemini Advanced全新体验,同时推出支持安卓和iOS客户端的手机移动应用。

新服务订阅价格为每月19.99美金 ,和ChatGPT Plus、Perplexity Pro等主流生成式AI应用每月20美金的价格差不多。不过为了显示诚意,Google会提供前两个月免费试用。



Google最高阶多模态大模型,Gemini Ultra新时代开启


据Google CEO 桑达尔·皮查伊称,Ultra 1.0是首个在 MMLU(大规模多任务语言理解)上超越人类专家的模型,使用了包括数学、物理、历史、法律、医学和伦理学在内的57个学科组合来测试知识和解决问题的能力。

因此,Gemini Advanced在编码、逻辑推理、遵循微妙指令和协作创意项目等高度复杂的任务上将更加强大。不仅可以与用户进行更长、更详细的对话,还能更好地理解提示上下文。

比如:Gemini Advanced可以成为个人导师,为你创建逐步说明、个性化测验或根据学习风格量身定制回答;解决更复杂的编码场景,并协助评估不同的编程思路;成为数字创作者的创意伙伴,生成新鲜内容,分析最新趋势,制定商业计划书。值得一提的是,Gemini Ultra内由Imagen 2生成的所有图像都应用了数字水印(虽然你看不到它)。

随着新功能不断添加,用户将体验到更强的多模态能力、更多交互式编程功能以及更深入的数据分析。目前Gemini Advanced仅支持英语,可以在超过150个国家和地区使用,将逐步扩展到更多语言。

安卓和IOS手机端登场,Gmail、文档、表格可使用

Gemini Advanced作为全新Google One AI高级计划的一部分,还会给用户提供2TB存储空间。此外,AI高级订阅者很快就能够在Gmail、Docs、Slides、Sheets等之前被集合为Duet AI的应用中指调用Gemini Ultra。

为了实现手机端轻松访问,Google此次推出全新Gemini应用程序。

你可以拍摄一张车胎的照片请求说明,为晚宴邀请函生成自定义图像,或者要求撰写一条复杂短信。Google称之为“构建真正的AI助手的重要第一步,一个具有对话性、多模态的新型实用助理。”

安卓手机用户可以下载Gemini应用程序,或按照平时激活Google助手的方式——比如直接说“嘿,Google”来将它唤醒。Gemini 能为你刚拍摄的照片生成描述,回答阅读中文章的相关问题。许多Google助手的语音功能也将通过Gemini App可用,包括设置定时器、打电话和控制智能家居设备等。

虽然iOS应用还在路上,但Google表示在接下来的几周里即会上架App Store。



将Gemini 能力扩展至更多产品

Gemini也将全面应用于个人和企业每天使用的产品,包括 Workspace 和谷歌云服务。

Workspace:

皮查伊表示,目前已经有超过100万人正在使用像 「Help me write 」这样的功能,通过 Duet AI 提高生产力和创造力。从今天起,Duet AI 将改为 Gemini for Workspace,并且很快, Google One AI 高级计划订阅者就能在 Gmail、Docs、Sheets、Slides 和 Meet 等谷歌办公全套件中使用 Gemini Ultra。

谷歌云:

对于云客户来说,Gemini 将帮助提高企业生产力,协助开发人员更高效编写代码,并保护组织免受网络攻击。

开发者一直是每一次重大技术变革的基础,在 Gemini 生态系统中也扮演着同样重要的角色。现在已经有数十万技术人员和企业正在使用 Gemini 大模型进行开发。Google将在下周分享更多关于开发者和云客户未来权益的详细信息。

皮查伊还透露,Google已经在积极训练下一代 Gemini 模型了。

网友迫不及待,Gemini Ultra新鲜开测


去年12月6日Google发布Gemini Pro时,对标的是GPT-3.5。由于取消了原定的线下亮相,Gemini系列被媒体渲染得阴影重重。于是没隔几天,中杯大杯忽然集体登场,还以一个震慑三观的“鸭子”视频demo引发热烈讨论和网络打假。当时Google曾预告说在32项LLM广泛使用的基准测试中,Gemini Ultra有30项都超越了 ChatGPT代表的业界最先进水平。

究竟Ultra版本实力如何,现在终于可以上手一探究竟了。

用写LinkedIn Post来测试内容生成。结论是Gemini Ultra凭借更多标题选项、更快响应速度和“没有愚蠢的emoji表情”击败GPT-4成为绝对胜者。



网友 Alphabetting拿出一道逻辑推理题:Tabitha喜欢饼干但不喜欢蛋糕,喜欢羊肉但不喜欢羔羊肉,喜欢秋葵但不喜欢南瓜。它询问按照相同规则,Tabitha会喜欢樱桃还是梨。

Gemini Ultra给出的建议是:“Tabitha喜欢发音两个音节的食物,不喜欢一个音节的食物。”它列出谜题中每种食物的音节数,由于「cherries」有两个音节,因此答案是樱桃。

GPT-4认为Tabitha的偏好可能与单词最后一个字母有关。她喜欢的食物结尾是辅音,而她不喜欢的食物结尾是原因。这样的话,樱桃和梨都符合条件——有些棘手,但一定要选一个的话,那就樱桃吧。



他表示Gemini Ultra成功解决了被GPT-4搞到稀碎的逻辑测试。



用户Brett Winton测试两者的文生图功能,提示词是“生成一个画家试图在火箭外部画静物的图像,让它幽默一些,一幅插画“。左边是GPT-4,右边是Gemini Ultra。

AI模型的想象力见仁见智,不过Gemini图像里的画家比起绘画更像在吃东西,手部细节也有点问题。评论里都觉得GPT-4更好些。



他又紧接着对比了Gemini Ultra、 Claude和GPT-3.5对于8年级数学题计算能力。

题面是:Garcia正策划一个比萨派对,她需要确保30名学生每人至少得到3片,每个比萨有8片。为增加多样性, Garcia决定订购一半奶酪比萨和一半香肠比萨。然而有5名学生是素食者,只会吃奶酪比萨。

请回答:

1.Garcia需要订购多少个比萨,以确保每个学生至少3片?

2.每种类型比萨各多少个?

3.如果每个比萨12美元,总订单费用是多少?

在之前的测试中, Gemini Pro把这道题搞砸了。此次Ultra答对了总数12个比萨和费用144美元。但第2题的正确答案应该是两种比萨各6个,Ultra没通过。



Brett Winton表示,Gemini Ultra和Claude一样,数学计算都不如GPT-3.5准确。



编码能力上,网友Mervin Praison在Gemini Ultra用Python成功创建了一个贪吃蛇游戏。



更多更深入的用例,大家可以抓住两个月的免费试用福利,亲自上手玩一玩。

OpenAI开辟AI代理新战场,Google 不甘落后

谷歌副总裁兼Gemini体验和Google助手部门总经理Sissie Hsiao表示,“对谷歌来说,Gemini不仅仅是模型。它实际上是我们思考最先进技术,以及我们在其基础上构建的整个生态系统的转变,从影响数十亿用户的产品,到开发者和企业用来创新的API平台。”

就在昨天,The Information发表题为《OpenAI正将AI竞争焦点转移到能操作设备和自动化任务的软件上》的报道。



文中爆料,OpenAI正在开发一种代理软件,能有效接管手机和电脑,替用户执行复杂任务操作。你可以命令ChatGPT执行从文档到表格的数据转移,自动填写费用报告并输入到会计软件中,或者在特定预算下创建行程或预订机票等基于网络的任务。

随着越来越多全新大模型的推出,OpenAI也深知今年可能不再拥有市场上最强大LLM的可能性。所以加紧开辟新战场早做准备。

据知情人士称,这类请求将触发代理点击、光标移动、文本输入等其它人类动作。可能会将将ChatGPT变成Sam Altman私下称为「超智能个人工作助理」的工具,也将与微软Copilot和谷歌Gemini for Workspace 展开更直接竞争。

去年ChatGPT已经给OpenAI带来16亿美元收入,微软也靠生成式AI显著拉升了最新季度财报业绩。

而AI业务却还没有给Google带来明朗的现金流。如今付费版本Gemini Advanced和Ultra 1.0的推出会带来怎样的市场回馈,那些已经花钱订阅GPT的用户们会不会转投Gemini,人工智能整合进谷歌生态的全新究极样貌是什么?这些都让人期待。今年,注定继续是高潮迭起的AI拉锯战。