·OpenAI首届开发者大会上的一整套升级,为人们展现了一个未来:人人都能使用自然语言开发软件、拥有多个专属私人助理,像浏览应用一样购买流行的私人助理,就像在苹果应用商店里下载App。

·OpenAI宣布,ChatGPT每周用户数量已达到1亿。自3月发布ChatGPT的API功能以来,该公司现在已拥有超过200万开发人员,其中超过92%来自财富500强公司。




11月6日,OpenAI首席执行官山姆·奥特曼在该公司首届开发者大会上。


聊天机器人ChatGPT发布快一年之际,其开发机构OpenAI又迈出一大步:推出ChatGPT自定义功能,用户可为特定目的创建自己版本的ChatGPT,无需编码,被称为GPTs(GPT们),以构成不久后发布的GPT商店(GPT Store)。

当地时间11月6日,OpenAI 在旧金山举行的首届开发者大会DevDay上宣布了GPTs,并发布更强大、更便宜的GPT-4——GPT-4 Turbo,做出六大升级——更长的上下文长度、更强的控制、知识升级、多模态、模型微调定制和更高的速率限制。GPT-4的付费服务将“加量不加价”。

OpenAI还宣布,ChatGPT每周用户数量已达到1亿。自3月发布ChatGPT的API功能以来,该公司现在已拥有超过200万开发人员,其中超过92%来自财富500强公司。

开发者大会上的一整套升级,为人们展现了一个未来:人人都能使用自然语言开发软件、拥有多个专属私人助理,像浏览应用一样购买流行的私人助理,就像在苹果应用商店里下载App。人们不仅好奇,OpenAI是否会成为下一个苹果公司。

但OpenAI创办时确立的目标更远。该公司认为,GPT平台最终将使其更接近终极目标:创建AI超级智能或通用人工智能(AGI)。就目前而言,付费订阅者的访问将有助于提高该公司迅速增长的收入,据报道其正在寻求高达900亿美元的估值。

“任何人都可以轻松构建自己的GPT”

“GPTs是一种新方式,任何人都可以创建ChatGPT的定制版本,以便在日常生活、特定任务、工作或家庭中更有帮助,然后与其他人分享该创作。例如,GPT可以帮助您学习任何棋盘游戏的规则、帮助教您的孩子数学或设计贴纸。”当地时间11月6日,OpenAI在一份声明中表示,“任何人都可以轻松构建自己的GPT——无需编码。创建一个GPT就像开始对话一样简单,给它指令和额外的知识,然后选择它能做什么,比如搜索网络、制作图像或分析数据。”



GPT建造器(GPT Builder)页面。


这意味着,人人都能通过自然语言创建基于自己知识库的AI智能体(Agent),加入OpenAI的应用商店并获得分成。OpenAI首席执行官山姆·奥特曼(Sam Altman)在发布会上称,GPT商店将于本月晚些时候推出,供开发者上传其开发的GPT应用,就像苹果应用商店一样展示最受欢迎的GPT。

早在5月,OpenAI就开放了插件系统,首批上线了70个大模型相关的应用,包括猜词、翻译、查找股票数据等。当时,业界就将其类比于苹果的App Store时刻,将改变大模型应用生态。

“自从推出ChatGPT以来,人们一直在寻求定制ChatGPT的方法,以适应他们特定的使用方式。”OpenAI在声明中称,“我们在7月推出了自定义指令,让您可以设置一些首选项,但要求更多控制的请求不断出现。许多高级用户都会维护一份精心设计的提示和指令集列表,并将它们手动复制到ChatGPT中。 GPTs现在可以为您完成所有这些工作。”

每个GPT都可以访问网页、文生图工具DALL·E和OpenAI的代码解释器(Code Interpreter)工具。构建器界面中还有一个“知识”部分,用于上传自定义数据,例如开发日活动时间表。通过另一项名为Actions的功能,OpenAI让GPT连接到外部服务,以访问电子邮件、数据库等数据。OpenAI的界面可指导GPT如何与人们交互。

在演示中,OpenAI员工杰西卡·谢伊(Jessica Shay)利用软件Zapier链接了自己的日历和手机短信,通过与Zapier聊天的方式,直接安排了自己的日程,并通知同事。

而奥特曼则演示了如何让不懂代码的人轻松定义一个GPT。“在YC工作过很多年,我总是遇到开发者向我咨询商业意见。”他讲到,“我一直想,如果有一天有个机器人能帮我回答这些问题就好了。”

接着,奥特曼打开了GPT建造器(GPT Builder),先打上一段对这个GPT的定义,类似于帮助初创公司的创始人思考业务创意并获得建议,接着,在对话中,GPT Builder自己生成了这个GPT的名字、图标,并通过与奥特曼对话的形式,询问他是否要对生成的名字和图标等进行调整。接下来,GPT Builder主动向他询问这个应用该如何与用户交互,他表示可以从其过往演讲中选择合适且有建设性的回答,然后上传了一段自己过往的演讲。3分钟创建好后,访问这个GPT的人会收到GPT自动生成的对话开头,可以与这个GPT对话咨询创业相关的内容,得到类似于奥特曼本人的回答。



奥特曼演示如何生成一个他自己的GPT。


GPT发布后,应用可以选择私有、专属企业拥有和公开3种方式。OpenAI表示,将为受欢迎的应用提供利润分享。

自定义GPT的引入意味着OpenAI正在与其他AI机器人平台竞争,例如Character.AI和Meta公司的聊天机器人,Meta最近在旗下的WhatsApp、Instagram和Messenger中引入了一系列个性化AI 角色但OpenAI将其平台定位为比竞争对手更注重实用性,而不是强调拟人化,尽管它并不反对构建具有类人角色的GPT。

OpenAI表示,他们将监控活动,以阻止欺诈、仇恨言论和“成人主题”等行为。当GPT商店推出时,OpenAI将只接受已验证身份者的代理。

GPT-4变得更强大、更便宜


在会上,OpenAI宣布对其大型语言模型GPT-4和GPT-3.5进行更多改进,包括更新的知识库和更长的上下文窗口。



GPT-4进行了六大升级。


GPT-4 Turbo目前可通过API(应用程序编程接口)预览版获得,已使用2023年4月前的信息进行了训练。今年3月发布的早期版本GPT-4仅从截至2021年9月的数据中学习。“对于GPT的知识停留在2021年,我们和你们一样,甚至比你们更恼火。”奥特曼在台上说。

除了内部知识库的升级,用户现在还可以上传外部数据库或文件,来为GPT-4 Turbo提供外部知识库的支持。

GPT-4 Turbo将通过128K的上下文窗口“看到”更多数据,OpenAI称其“相当于单个提示中的300多页文本”,可供参考的长度大约是《呼啸山庄》和《哈利·波特》。一般来说,更大的上下文窗口可以让大型语言模型理解更多的问题并提供更经过深思熟虑的回答。此前,OpenAI发布了两个版本的GPT-4,一个版本的上下文窗口只有8K,另一个版本为32K。另一家AI开发公司Anthropic的大模型Claude 2的上下文窗口据称有100K。

OpenAI表示,GPT-4 Turbo对于开发人员来说运行成本更低。每1000个token(大模型读取文本或代码的基本单位)的提问费用仅为0.01美元,而GPT-4的提问费用为0.03美元。每1000个token的回答完成费用为0.03美元。图像处理GPT-4 Turbo的费用将取决于图像大小。总体而言,OpenAI表示,新版本的GPT-4比早期版本便宜三倍。

GPT-4 Turbo有两个版本:一个只能进行文本分析,另一个版本可以理解文本和图像的上下文。OpenAI表示计划在“未来几周内”提供这两种模型。

GPT-4 Turbo支持新的“JSON 模式”,确保模型以有效的JSON进行响应,这是一种开放标准文件格式和数据交换格式。OpenAI表示,这对于传输数据的网络应用程序非常有用。新模型还允许同时调用多个函数。

该公司表示,GPT-4 Turbo的改进意味着用户可以要求模型在一个提示中执行更复杂的任务。人们甚至可以告诉GPT-4 Turbo专门使用他们选择的代码语言来获取结果。

使用GPT-3.5 Turbo模型的用户也将看到上下文窗口、功能和定价方面的改进。默认情况下它将有一个16K的上下文窗口,并且更新了与GPT-4 Turbo相同的功能。该公司在3月发布了GPT-3.5 Turbo,8月发布了可以微调的版本。

0代码创建智能体


在开发者大会上,OpenAI宣布了一个新的API——Assistants API,将其描述为帮助开发者在其应用程序中构建“类似智能体的体验”,相当于0代码创建智能体。

在人工智能的术语中,智能体是指以智能方式行事的代理,能感知环境,自主采取行动以实现目标,并可以通过学习来提高自身性能。

使用Assistants API时,用户可以构建一个具有特定指令、利用外部知识并可以调用OpenAI生成式AI模型和工具来执行任务的“助手”。使用案例范围包括从基于自然语言的数据分析应用程序到编程助手,甚至是人工智能驱动的假期规划器。

为Assistants API提供支持的是OpenAI的工具代码解释器,可在沙盒执行环境中编写和运行Python代码。代码解释器于3月为ChatGPT推出,可以生成图形和图表并处理文件,让使用Assistants API创建的助手迭代运行代码来解决代码和数学问题。

Assistants API还可以使用检索组件,利用来自OpenAI模型外部的知识(例如公司员工提供的产品信息或文档)来增强开发人员创建的助手。它还支持函数调用,使助手能够调用开发人员定义的编程函数并将响应合并到消息中。

Assistants API目前还处于测试阶段,从11月6日开始可供所有开发人员使用。OpenAI表示,用于API的token将按所选模型的费用计费。未来,该公司计划允许客户提供自己的“辅助驾驶”工具,以补充其平台上的代码解释器、检索组件和函数调用。

DALL·E更安全了

OpenAI的另一个重要产品DALL·E 3也获得了更新。在首次登陆ChatGPT和Bing Chat后,DALL·E 3现在可以通过API获取。OpenAI表示,与之前版本的DALL·E类似,该API包含内置审核功能,有助于防止滥用。

DALL·E 3 API提供不同的格式和质量选项以及从1024×1024到1792×1024的分辨率,每个生成图像的起价为0.04美元。

与DALL·E 2 API 不同,DALL·E 3不能通过让模型替换预先存在图像的某些区域或创建现有图像的变体来创建图像的编辑版本。当生成请求发送到DALL·E 3时,OpenAI表示,它会“出于安全原因”和“添加更多细节”自动重写,这可能会导致结果不太精确,具体取决于提示。

此外,OpenAI现在提供文本转语音API,有6种预设声音以及两种生成式AI模型变体可供选择。该功能从11月6日上线,起价为每输入1000个字符0.015美元。

奥特曼在台上表示:“这比我们听到的任何其他方法都要自然得多,它可以使应用程序的交互更自然、更易于访问。” “它还解锁了许多用例,例如语言学习和语音帮助。”

加强模型训练数据的版权保护

OpenAI还宣布将追随微软和谷歌的脚步,通过名为“版权盾(Copyright Shield)”的计划为企业用户提供版权赔偿。

该公司在一份声明中表示:“如果您面临有关版权侵权的法律索赔,我们现在将介入并捍卫我们的客户,并支付由此产生的费用。”

版权盾将涵盖ChatGPT Enterprise和OpenAI开发者平台的普遍可用功能。但这些保护似乎并未扩展到所有OpenAI产品,例如ChatGPT的免费版和Plus版。

目前还不清楚OpenAI是否提供训练数据的赔偿,即客户因人工智能模型利用其数据进行训练而提出的索赔。

ChatGPT、GPT-4和DALL·E 3等生成式AI工具可以从示例中“学习”,以撰写文章和代码、创作艺术,甚至编写歌词来伴奏音乐。他们接受了数百万到数十亿的电子书、艺术品、电子邮件、歌曲、音频剪辑、录音等的训练,其中大部分来自公共网站,还有一些需要得到版权许可。

在内容治理机构Acrolinx最近对财富500强公司进行的一项调查中,近三分之一的公司表示,知识产权是他们对使用生成式人工智能最关心的问题。另一项民意调查发现,十分之九的开发者在决定是否使用生成式人工智能时“认真考虑”知识产权保护。

此前,IBM、微软、亚马逊、Getty Images、Shutterstock和Adobe等公司都明确表示,将就知识产权索赔向生成式AI客户进行赔偿。