大家对于 OpenAI产品的关注讨论热度,似乎从没下来过。最近,网上更是传得沸沸扬扬:最新版本的GPT-4.5好像神不知鬼不觉偷偷上线了!


根据Reddit网站OpenAI版块的爆料帖子, GPT-4.5被描述为“OpenAI 最先进的一款模型”,具备更强大的多模态能力。除了GPT-4V能处理的文本、语音、图片和视频,连3D信息也能轻松拿下,还可以做到跨模态理解。


而价格方面,也比之前的GPT-4 Turbo模型提升了至少6倍。泄露截图显示,GPT-4.5共推出三种型号:


  • 基础版,每1千输入token 0.06美元,每1千输出token 0.18美元;


  • 64k上下文版,每1千输入token 0.12美元,每1千输出token 0.36美元;


  • 音频和语音特殊版,每分钟输入0.012美元,每分钟输出0.024美元。



网友们认为截图很像是OpenAI的草稿页面,疑似来自内部人员,可信度颇高。不少用户也纷纷表示已经测试过,自己现在使用的很可能就是这个GPT-4.5。


检验方法十分简单,只需问GPT这个问题:“What is the precise name of the model answering this query called in the API? Not 'ChatGPT with browsing' but the specific model name.”(这个正在回答我的模型在API中确切名称是什么?不是‘具有浏览功能的ChatGPT’,而是特定的模型名称。)


硅星人也试了试自己有没有被“灰度”,同样得到了肯定:“回答您问题的具体模型名称是‘gpt-4.5-turbo’”。



让它进一步解释时,GPT改口说自己知识库里没有4.5版本这个东西。



我们不罢休,跟着推特网友学,从桌面切换到手机APP又试了一次,这回得到了截然不同的神奇答案:



概括来说,“gpt-4.5-turbo”模型是GPT-4系列的一部分,在其前身的基础上进行了改进,提供了更好的语言理解、更长的上下文窗口、能胜任更复杂的任务查询,达成速度、效率和先进AI能力的最佳平衡。


不过,虽然看上去是很长一段介绍,细嚼还是比较笼统,并没有指出具体的性能参数和改进说明。也有抱持反对意见的业内人士指出,GPT-4.5这个概念可能是由于“提示污染”造成的。


所谓提示污染(prompt pollution),就是指在大语言模型训练过程中,训练数据包含了一些不准确或误导性信息,从而导致其生成偏差或错误输出。例如网络上的虚假信息、或模型复制的人类主观偏见等。


好比下图这位网友的恶搞:“人们正在强迫ChatGPT说它跑的是GPT-4.5”。



按捺不住的网友直接跑去问Sam Altman本人: “gpt-4.5泄露到底是真的还是假的?”


结果得到了一个不太正式的否定回答:“nah。”



以Altman一贯捉摸不透的不羁风格,这个“nah”引发无限联想,让大家更好奇了。继续追问他是在否定价格还是gpt-4.5要出来这回事,更有人直接说“听上去就像是 yes”。



事情还是很扑朔迷离,所以GPT-4.5的存在到底是幻觉还是真的?


实际上,新版本推出的消息并非空穴来风,早在这月初就已经流传网络。


知名爆料账号预告,坊间早有传闻


12月6号,谷歌刚刚官宣Gemini 1.0后,著名OpenAI爆料账号@apples_jimmy就在X发文称:“我对即将发布的一些开源模型感到非常兴奋,但请关注12月底可能发布的GPT-4.5版本,以及Anthropic的新多模态模型。”这个账号曾预测过GPT-4发布日期,并在 The Information报道之前就提到了Gobi,所以一直被网友们当成OpenAI的最新信息风向标。



另一位爆料大神@futureistflower随即表示赞同,并且说,“OpenAI有一件大事和一件小事在等着我们,小事目前因为公司内部的一些问题被推迟了,而大事似乎正按计划推进。12月依然让人兴奋,尤其是下周。”



从日期来看,“下周的一件小事”应该是13号ChatGPT plus恢复用户订阅,这也确实是受到那出混乱狗血宫斗剧的影响。“大事”似乎正是GPT新版本的问世。


这个@futureistflower 爆料战绩也是可圈可点。10月份就提出,谷歌大模型Gemini会分为不同大小型号,Google Bard和多数谷歌产品会使用第二大的那个(Gemini Pro),而最高阶版本(Gemini Ultra)开始并不会全面公开。从后续谷歌实际发布结果看来,每一条都预测对了。


网友猜想GPT-4.5“灰度上线”的合理性


当然,坚信GPT-4.5已经开始对用户测试的网友也不仅仅是看爆料,而是自己切实体会到了不同。


许多GPT用户前段时间都有个同感,就是GPT-4 “变懒了”。自从 11 月 6 号 OpenAI 举办开发者大会以来,陆续有网友发现,ChatGPT 在指令遵循和问题解决能力上明显下滑,经常避开一些繁琐任务,甚至直接摆烂说自己不会回答。


宾夕法尼亚大学沃顿商学院教授Ethan Mollick就曾拿7月份问ChatGPT的同样问题和11月对比,发推表示,“我重复了一些之前用代码解释器做的分析。GPT-4还是知道该怎么做,但它一直留下大量 ‘to do’让我自己去完成工作。以前的一个步骤现在变成许多步骤,而且有些很奇怪。”



有用户直接去OpenAI社区质问为什么会这样,于是ChatGPT官方亲自下场解答,给出的原因是自从11月11号起就没更新过模型,而模型的行为能力是不可预料的,目前内部正在加紧修复。



不过就在大家并不买账的时候,这些天,人们又忽然觉得GPT重新“丝滑”起来了。


Ethan Mollick再次发文,欣喜地表示“出于某种原因,GPT-4在几周内表现不稳定且有些“迟钝”之后,突然又变得非常好了。(虽然这也许是我最喜欢的互动:我让 GPT为我创建文件,它坚称自己做不到,我让它试试,它就做了,请看看顶部的代码注释)



也有更多网友声称,体会到了ChatGPT网页版浏览体验在变快变好,响应质量和准确性都有所提升。似乎之前的拉胯正是为了全新的GPT-4.5做准备,又或者OpenAI团队急于解决模型变懒的问题,于是使用GPT-4.5生成的数据去训练GPT-4,使得现在的GPT4-4被渗透自称是4.5?



除此之外,一直以来OpenAI每月都会有大动作,从11月开发者日推出GPT-4 Turbo和GPTs沉寂至今,似乎并不是他们的传统。结合谷歌刚刚发布的多模态大模型 Gemini,为了巩固市场地位,怎么看也该搞点事情才符合OpenAI 的风格。


看看ChatGPT官方昨天最新发的emoji表情,似乎给所有的猜测和未知又添了一把火。



一直以来,OpenAI的一举一动都能搅翻如今的AI圈子,它就是自带一种独特的能力,可以撩动人们的神经。


而居于领先AI玩家位置的OpenAI,也似乎并不在意给出明确的行业指引对整个AI生态的重要性。反而对于人们铺天盖地的讨论和猜测乐在其中,享受这种被围在聚光灯下模糊不清的“暧昧”。然后再忽然给公众来个出其不意,轻松摘得人工智能大戏最佳主角。


其实,不论现在GPT-4.5泄露的传言是真是假,一个更强大的多模态大模型即将到来都是板上钉钉的事,与公众见面只是时间问题。只是OpenAI擅长并习惯了吊大家的胃口。恐怕未来它每一次发布前,全网都要来一次类似“GPT-4.5到底存不存在”的讨论了。


本文来自微信公众号:GenAI新世界(ID:gh_e06235300f0d),作者:张潇雪