终于,谷歌与AI相关的无数产品,拥有了一个共同的名字:Gemini。它可能结束了谷歌许多部门都在搞AI,整个公司却不知如何与微软/OpenAI竞争的局面。


谷歌赶着中国龙年的除夕,发布了号称唯一胜过人类专家水平的大模型Gemini Ultra1。谷歌去年底曾发布了较低版本的Gemini Pro和用于终端设备的Nano1、Nano2。


“最大的模型Ultra 1.0是第一个在MMLU(大规模多任务语言理解)方面超越人类专家的模型,MMLU结合了57个科目——包括数学、物理、历史、法律、医学和伦理学——来测试知识和解决问题的能力。” 但究竟有多大,谁也不知道。


谷歌用来与ChatGPT竞争的Bard,也已经改名Gemini。一打开页面,它向我问好:



我先试了下它从英文翻译成中文的功能。它能提供三个翻译版本供选择。同时它披露,我的这个对话背后,有人在审核:


“为了更好地改进,经过培训的审核人员需要处理您的对话。


因此,在使用双子座时,请不要输入您不想让审核人员查看或谷歌用来改进服务的任何内容。


请注意,您的谷歌工作区内容,例如来自 Gmail 或 Drive 的内容,不会被用于改进双子座。”


然后我让它为我以“龙马精神,恭喜发财”为意,设计一幅恭贺新年的贺卡。它回答说还没有文生图功能。


于是我给它出了一道题,在英语里人们称之为Apple测试,即让它造出十个以Apple结尾的句子。我要求它给我造出十个以“龙”为结尾的句子,姑且命名为龙测试。来了:



审核得不错。我又让ChatGPT造出十个以“龙”字结尾的句子,如下:



接下来,我想试试它的文生图功能。我要求它设计一张图,以“龙马精神,恭喜发财”为意,贺中国新年。Gemini的回答是:



我以同样的意思,让GPT-4设计了一幅。能看懂上面的字吗?意思看懂了,就是不认得。



我让Gemini写一段代码,帮助我搜集一些好的素材,用来设计一幅龙年新年的贺卡。几行Python代码立刻出现,提供了三个方案。



我选择了其中的一个,这段代码使用 Unsplash API 来搜索素材。Unsplash 是一个提供高质量免费图片的网站。


最后,它会交付给我一个相关图片的链接列表。还能帮我找到10张龙的图片。


Gemini的发布,对于谷歌更重要的意义是,以往不同产品与服务的AI功能,都统称为Gemini。如Duet AI 将成为 Gemini for Workspace,很快拥有 Google One AI Premium  计划的消费者就可以在 Gmail、文档、表格、幻灯片和 Meet 中使用 Gemini。对于云客户来说,Duet AI 也将在未来几周内成为 Gemini。以往谷歌也做了一大堆大模型,今后谷歌的业务,都统一建立在Gemini的基础之上了。


Gemini(基于Pro模型)仍然免费,相当于ChatGPT(基于GPT-3.5);其高级版本Gemini Advanced(基于Ultra1模型),将每月收费19.9美元,与ChatGPT-Plus(基于GPT-4模型)相同。看来,使用高端人工智能的起始价格,就是每月20刀了。Gamini应用还推向安卓和iOS设备。


关于Gemini不明觉厉的地方,可以在谷歌的技术报告中找到一些答案。在这里你可以看到一大堆的测试报告,包括这次老老实实地标注出在最重要的MMLU综合测试中,Gemini Ultra的5样本测试并没有胜过GPT-4。



Gemini的完整推出,也完成了过去一年谷歌在AI战略上的抓狂。现在Gemini将会变得和Google一样重要,更重要的是,它们都可以用字母G作为开头。


谷歌所面对的挑战,是要同时与OpenAI和微软竞争。它需要研发出一个最起码匹敌GPT-4的大模型,同时,在应用其业务中,尤其是在生产力工具方面,要与微软竞争。但谷歌的优势在于,它拥有强大的消费群体,应用场景更丰富,创新新产品的空间更大。


都说大模型是大力出奇迹的结果,那么,谷歌既不缺算力,更不缺钱,为什么不出一个碾压GPT-4的大模型?这里面有几种可能:


首先,大模型的缩放法则,即更强的算力-更大的模型-更多的智能涌现,可能正在接近上限,而GPT-4 级别的模型,已经接近了大型语言技术所能达到的 AI 能力上限,这是否意味着 AI 能力的指数增长会暂告一段落。


其次,是谷歌的一个商业策略。它的确需要一个可以与 GPT-4 竞争的模型,因此训练了 Gemini 达到该水平,然后停止了研发。它要看下GPT-5会不会有重大突破,然后再考虑Ultra2。


最后,可能OpenAI 真的拥有其他公司无法复制的某种“独门秘籍”,只有OpenAI自己能超越自己,谷歌虽然尽了最大努力,却无法破解 OpenAI 的秘密。


过去的一年多来,GPT-4统治着大模型世界,今天终于有一家能与其竞争,这也许是一个新时代的开始。它也告诉人们,只有做到了GPT-4和Gemini的水平,才能进入真正的应用领域。这样看来,开源的模型面临更大的压力,拥有最大算力集群的Meta,今年不知何时能推出一个什么样的Llama3。


除夕谷歌发Gemini Ultra1,OpenAI的GPT-5还过得了十五吗?


本文来自微信公众号:未尽研究 (ID:Weijin_Research),作者:周健工