
Gemini的中文能力更是惊艳,在中文测试中,Gemini Pro和Advanced双双超越GPT-4o,分别排在第一、第二位。

此外,在Hard Prompts测试中,Gemini同样名列前茅。在Hard Prompts测试中,大模型需要面对那些更具挑战性的问题,Gemini 1.5 Pro在这一测试中排名第二,仅次于GPT-4o.

从大模型置信区间(Confidence Intervals)来看,Gemini的测试结果也名列前茅。

值得一提的是,两周前,在Google Gemini更新撞档GPT-4o发布时。Gemini因为羸弱的能力几乎引来了群嘲。根据多家科技博客的测评,即使谷歌已经对1.5 Pro进行了数月的改进,但从常识推理到多模态能力和代码能力,仍然无法与OpenAI最新的GPT-4o模型相媲美。唯一亮点就是更大的上下文窗口。
如今谷歌Gemini取得了如此神速的进步,显示出AI界届黄埔军校仍然有深厚的技术底蕴。