本文来自微信公众号:凤凰网科技(ID:ifeng_tech),作者:萧雨,编辑:王晓斌,原文标题:《字节跳动被曝秘密使用OpenAI技术、账户被暂停,三方回应|AI前哨》,题图来自:视觉中国


北京时间12月16日,据外媒报道,在生成式AI竞争中处于落后的字节跳动想要“抄近道”,该公司一直在秘密使用OpenAI的技术开发自家大语言模型,这违反了OpenAI的服务条款。目前,字节跳动的账户已被OpenAI暂停。


外媒称,在AI领域,字节跳动的这一做法通常被视为一种“失礼”行为,也直接违反了OpenAI的服务条款。OpenAI的服务条款规定,该公司所输出的模型不能被用于“开发任何与我们的产品和服务竞争的AI模型”。字节跳动通过微软购买了OpenAI的访问权限,但是微软也制定了与OpenAI同样的政策。


外媒获得的字节跳动内部文件证实,字节跳动在几乎每个开发阶段都依赖OpenAI的应用程序接口(API)来开发其代号为“种子计划”(Project Seed)的基础大语言模型,包括训练和评估模型。参与“种子计划”的员工都深知这一行为的不良影响。根据字节跳动员工在内部通讯平台飞书海外版Lark的聊天记录,他们讨论了如何通过“数据脱敏”来粉饰证据。外媒称,字节跳动员工大量使用OpenAI的技术,以至于“种子计划”的员工经常达到OpenAI API的最大访问上限。


内部文件显示,字节跳动更多是在“种子计划”的早期阶段使用OpenAI的技术。几个月前,该公司命令该团队在“模型开发的任何阶段”停止使用GPT生成的文本。大约在这个时候,该公司获得了批准发布了自家AI大模型“豆包”,从而让“种子计划”上线。但是,字节跳动继续以违反OpenAI和微软服务条款的方式使用API,包括评估豆包背后模型的性能。一位对字节跳动内部情况有第一手了解的人士指出,“他们说他们想确保一切都是合法的,但他们实际上只是不想被抓住把柄”。


字节跳动发言人约迪·赛斯(Jodi Seth)对此回应称,GPT生成的数据在“种子计划”的早期开发中用于注解模型,并且在今年年中左右的时候已从字节跳动的训练数据中删除。“字节跳动获得了微软的许可能够使用GPT API。我们使用GPT驱动非中国市场的产品和功能,但使用我们自主开发的模型驱动豆包。豆包只在中国提供。”赛斯在声明中称。


OpenAI发言人尼克·菲利克斯(Niko Felix)发表声明,确认字节跳动的账户已被暂停。“所有API客户必须遵守我们的使用政策,以确保我们的技术被用于正确的领域。虽然字节跳动很少使用我们的API,但我们在进一步调查期间已暂停了他们的账户。如果我们发现他们的使用不符合公司政策,我们将要求他们做出必要的改变或终止他们的账户。”菲利克斯表示。


微软发言人弗兰克·肖(Frank Shaw)在一份声明中表示:“Azure OpenAI服务等微软AI解决方案属于我们有限访问框架的一部分,这意味着所有客户都必须申请并获得微软的批准才能访问。我们还制定了标准并提供资源,帮助我们的客户负责任地使用这些技术,并遵守我们的服务条款。我们还制定了发现滥用行为的流程,并在企业违反我们的行为准则时停止他们的访问。”


本文来自微信公众号:凤凰网科技(ID:ifeng_tech),作者:萧雨,编辑:王晓斌