为了证实自家人工大模型有多强大,谷歌在昨天上线了展示Gemini的多模态功能视频,随后就取得了百万的观看,不过当时就有人质疑这“性能”造假。
从媒体质疑的情况看,Gemini能够迅速判断画面中的实物并给出像人一样的语音反馈,凸显出惊人的多模态功能,而从实际上手的情况看,根本达不到这个效果。
随后,Gemini负责人否认故意造假,称只是为了简洁缩短了反应时长,承认这段视频并不是实时的,而是使用了原始镜头中的静止图像帧,然后编写了文本提示。
谷歌的这些‘后期加工’,只能说明,他们太想让Gemini‘看起来’比竞品好太多了,但这么做就是赤裸裸的虚假宣传了。