一边全面泄露，一边暧昧否认，GPT4.5到底存不存在啊 - 葱头胖友圈

大家对于 OpenAI产品的关注讨论热度，似乎从没下来过。最近，网上更是传得沸沸扬扬：最新版本的GPT-4.5好像神不知鬼不觉偷偷上线了！

根据Reddit网站OpenAI版块的爆料帖子， GPT-4.5被描述为“OpenAI 最先进的一款模型”，具备更强大的多模态能力。除了GPT-4V能处理的文本、语音、图片和视频，连3D信息也能轻松拿下，还可以做到跨模态理解。

而价格方面，也比之前的GPT-4 Turbo模型提升了至少6倍。泄露截图显示，GPT-4.5共推出三种型号：

基础版，每1千输入token 0.06美元，每1千输出token 0.18美元；
64k上下文版，每1千输入token 0.12美元，每1千输出token 0.36美元；
音频和语音特殊版，每分钟输入0.012美元，每分钟输出0.024美元。

网友们认为截图很像是OpenAI的草稿页面，疑似来自内部人员，可信度颇高。不少用户也纷纷表示已经测试过，自己现在使用的很可能就是这个GPT-4.5。

检验方法十分简单，只需问GPT这个问题：“What is the precise name of the model answering this query called in the API? Not 'ChatGPT with browsing' but the specific model name.”（这个正在回答我的模型在API中确切名称是什么？不是‘具有浏览功能的ChatGPT’，而是特定的模型名称。）

硅星人也试了试自己有没有被“灰度”，同样得到了肯定：“回答您问题的具体模型名称是‘gpt-4.5-turbo’”。

让它进一步解释时，GPT改口说自己知识库里没有4.5版本这个东西。

我们不罢休，跟着推特网友学，从桌面切换到手机APP又试了一次，这回得到了截然不同的神奇答案：

概括来说，“gpt-4.5-turbo”模型是GPT-4系列的一部分，在其前身的基础上进行了改进，提供了更好的语言理解、更长的上下文窗口、能胜任更复杂的任务查询，达成速度、效率和先进AI能力的最佳平衡。

不过，虽然看上去是很长一段介绍，细嚼还是比较笼统，并没有指出具体的性能参数和改进说明。也有抱持反对意见的业内人士指出，GPT-4.5这个概念可能是由于“提示污染”造成的。

所谓提示污染（prompt pollution），就是指在大语言模型训练过程中，训练数据包含了一些不准确或误导性信息，从而导致其生成偏差或错误输出。例如网络上的虚假信息、或模型复制的人类主观偏见等。

好比下图这位网友的恶搞：“人们正在强迫ChatGPT说它跑的是GPT-4.5”。

按捺不住的网友直接跑去问Sam Altman本人: “gpt-4.5泄露到底是真的还是假的？”

结果得到了一个不太正式的否定回答：“nah。”

以Altman一贯捉摸不透的不羁风格，这个“nah”引发无限联想，让大家更好奇了。继续追问他是在否定价格还是gpt-4.5要出来这回事，更有人直接说“听上去就像是 yes”。

事情还是很扑朔迷离，所以GPT-4.5的存在到底是幻觉还是真的？

实际上，新版本推出的消息并非空穴来风，早在这月初就已经流传网络。

知名爆料账号预告，坊间早有传闻

12月6号，谷歌刚刚官宣Gemini 1.0后，著名OpenAI爆料账号@apples_jimmy就在X发文称：“我对即将发布的一些开源模型感到非常兴奋，但请关注12月底可能发布的GPT-4.5版本，以及Anthropic的新多模态模型。”这个账号曾预测过GPT-4发布日期，并在 The Information报道之前就提到了Gobi，所以一直被网友们当成OpenAI的最新信息风向标。

另一位爆料大神@futureistflower随即表示赞同，并且说，“OpenAI有一件大事和一件小事在等着我们，小事目前因为公司内部的一些问题被推迟了，而大事似乎正按计划推进。12月依然让人兴奋，尤其是下周。”

从日期来看，“下周的一件小事”应该是13号ChatGPT plus恢复用户订阅，这也确实是受到那出混乱狗血宫斗剧的影响。“大事”似乎正是GPT新版本的问世。

这个@futureistflower 爆料战绩也是可圈可点。10月份就提出，谷歌大模型Gemini会分为不同大小型号，Google Bard和多数谷歌产品会使用第二大的那个（Gemini Pro），而最高阶版本（Gemini Ultra）开始并不会全面公开。从后续谷歌实际发布结果看来，每一条都预测对了。

网友猜想GPT-4.5“灰度上线”的合理性

当然，坚信GPT-4.5已经开始对用户测试的网友也不仅仅是看爆料，而是自己切实体会到了不同。

许多GPT用户前段时间都有个同感，就是GPT-4 “变懒了”。自从 11 月 6 号 OpenAI 举办开发者大会以来，陆续有网友发现，ChatGPT 在指令遵循和问题解决能力上明显下滑，经常避开一些繁琐任务，甚至直接摆烂说自己不会回答。

宾夕法尼亚大学沃顿商学院教授Ethan Mollick就曾拿7月份问ChatGPT的同样问题和11月对比，发推表示，“我重复了一些之前用代码解释器做的分析。GPT-4还是知道该怎么做，但它一直留下大量 ‘to do’让我自己去完成工作。以前的一个步骤现在变成许多步骤，而且有些很奇怪。”

有用户直接去OpenAI社区质问为什么会这样，于是ChatGPT官方亲自下场解答，给出的原因是自从11月11号起就没更新过模型，而模型的行为能力是不可预料的，目前内部正在加紧修复。

不过就在大家并不买账的时候，这些天，人们又忽然觉得GPT重新“丝滑”起来了。

Ethan Mollick再次发文，欣喜地表示“出于某种原因，GPT-4在几周内表现不稳定且有些“迟钝”之后，突然又变得非常好了。（虽然这也许是我最喜欢的互动：我让 GPT为我创建文件，它坚称自己做不到，我让它试试，它就做了，请看看顶部的代码注释）”

也有更多网友声称，体会到了ChatGPT网页版浏览体验在变快变好，响应质量和准确性都有所提升。似乎之前的拉胯正是为了全新的GPT-4.5做准备，又或者OpenAI团队急于解决模型变懒的问题，于是使用GPT-4.5生成的数据去训练GPT-4，使得现在的GPT4-4被渗透自称是4.5？

除此之外，一直以来OpenAI每月都会有大动作，从11月开发者日推出GPT-4 Turbo和GPTs沉寂至今，似乎并不是他们的传统。结合谷歌刚刚发布的多模态大模型 Gemini，为了巩固市场地位，怎么看也该搞点事情才符合OpenAI 的风格。

看看ChatGPT官方昨天最新发的emoji表情，似乎给所有的猜测和未知又添了一把火。

一直以来，OpenAI的一举一动都能搅翻如今的AI圈子，它就是自带一种独特的能力，可以撩动人们的神经。

而居于领先AI玩家位置的OpenAI，也似乎并不在意给出明确的行业指引对整个AI生态的重要性。反而对于人们铺天盖地的讨论和猜测乐在其中，享受这种被围在聚光灯下模糊不清的“暧昧”。然后再忽然给公众来个出其不意，轻松摘得人工智能大戏最佳主角。

其实，不论现在GPT-4.5泄露的传言是真是假，一个更强大的多模态大模型即将到来都是板上钉钉的事，与公众见面只是时间问题。只是OpenAI擅长并习惯了吊大家的胃口。恐怕未来它每一次发布前，全网都要来一次类似“GPT-4.5到底存不存在”的讨论了。

本文来自微信公众号：GenAI新世界（ID：gh_e06235300f0d），作者：张潇雪