本文来自:界面新闻,作者:游云庭(上海大邦律师事务所高级合伙人,知识产权律师),原文标题《游云庭:AI生产的作品应该受版权保护吗?我与ChatGPT各抒己见》,头图来自:视觉中国
因为ChatGPT的走红,人工智能生成作品是否受著作权保护问题最近很热,笔者对此类问题的采访回复基本都是:根据现行法律规定,人工智能生成的作品没有著作权。但我今天问了目前最有名的人工智能程序ChatGPT,得到的答复却是人工智能生成的作品受著作权保护,并且ChatGPT的开发者OpenAI公司还想主张作品的收益权。今天就跟大家聊聊这个话题。
先说说我的观点:人工智能生成的作品有先天的版权瑕疵,不应当享有著作权并收取授权费用。用户使用人工智能生成的作品如果被他人侵权,可以依据《反不正当竞争法》维权。
一、人工智能的版权原罪
打铁还需自身硬,人工智能要大规模收取版权授权费用,自身的底气是不足的,因为其训练过程涉嫌大规模侵权,有原罪,版权收费逻辑上不能自洽。
在类ChatGPT人工智能软件的开发过程中,开发者必然要用大量数据和资源供其学习和训练,但现在的各大个人工智能公司都对学习资源的来源讳莫如深,除了商业秘密上的考量外,最主要的问题是,目前的主流人工智能,其训练都依靠开发公司爬取网上的免费公开数据和资源,然后对人工智能进行投喂和训练,这些数据和资源的取得并没有经过被爬取网站的同意,所以是有很大争议的,并且已经有媒体就此进行了起诉。
笔者就此问了ChatGPT,得到的答复是:训练数据是网上公开数据,未经授权也不需要授权。
笔者的意见是,这种爬取行为涉嫌侵权。爬取行为是否合法,目前网上的主流做法是看Robots协议,只要被爬取数据的网站的Robots协议同意,搜索引擎爬取数据就是合法的。但人工智能公司爬取数据是不是适用Robots协议争议很大,因为他们爬取目的和搜索引擎不同。
网站被访问是有服务器成本、技术维护成本和管理成本的,网站经营者同意搜索引擎的爬取,是因为这种爬取是共益行为,搜索引擎爬取数据后可以对网站进行索引,搜索引擎用户可以更好的访问网站,商业上对被爬取网站有促进访问作用的。
而人工智能公司的爬取并非如此,只是为了抓取数据训练自己的人工智能程序,只有利于他们自己,这就让网站运营者付出服务器成本、他们技术维护成本和管理成本后啥都得不到,这种行为就不应该适用Robots协议,而应该适用《著作权法》。
根据《著作权法》,让人工智能学习网上内容的过程是一个复制行为或者临时复制行为,人工智能公司要先将网上的或者线下获得的内容爬取,然后输入到人工智能程序中,无论这个内容是文字、图片、音频、视频还是程序,复制行为都应当获得相应权利人许可,否则就涉嫌侵权。
有一种很小的可能性是人工智能学习网上内容属于临时复制行为,也就是人工智能学习后即删除数据。根据我国的司法实践,临时复制虽然不需要取得著作权人许可,但仍然有数据来源是否为公开可爬取数据,是否将非线上数据(如图书、文献)电子化的合法性问题。另外,至少就微软新必应内置的ChatGPT搜索结果看,其输出的内容包含了参考的链接,这说明ChatGPT很可能存储了相应的网站内容,所以不构成临时复制。
有部分网站遵循的是开源协议,只要符合开源协议的规定,就可以自由地复制再发布这些网站的内容,比如维基百科的GNU自由文档许可证,对这样的网站,人工智能公司爬取内容应该是可以的,但再发布时还是需要标明来源。而OpenAi公司网站上的ChatGPT输出内容后,连个数据来源链接都不给用户(微软的New Bing上的ChatGPT是给来源链接的),虽然ChatGPT输出的内容可能和维基不一样,但这种只有索取,没有共益的行为无疑是对开源文化的一种侵蚀,个人认为如果维基百科在国内起诉,除了《著作权法》,还可以援引《反不正当竞争法》第二条,主张OpenAI公司的爬取行为违反公认的商业道德。
二、为什么人工智能生产的作品不享有著作权
1886年9月9日制定于瑞士伯尔尼《保护文学和艺术作品伯尔尼公约》是全世界都认可的著作权保护公约,我国也是该公约成员国。公约第一条开宗明义:公约成员国保护作者对其文学艺术作品所享权利。公约第三条规定,作者分两种——公约成员国公民和非公约成员国公民。所以,作者只能是自然人,ChatGPT和其他人工智能软件可不能成为著作权意义上的作者。这也是各国著作权登记机构目前为止都不接受人工智能登记为作品创作者的原因。
除了自然人作品,我国《著作权法》还规定了法人作品,但ChatGPT创作的作品不属于法人作品。首先,法人作品也要求自然人创作。其次,法人作品的构成有三个要件:
由法人或者非法人组织主持;
代表法人或者非法人组织意志创作;
并由法人或者非法人组织承担责任。
如果笔者要ChatGPT写一篇文章,作品创作的主持者就是笔者,ChatGPT程序是代表笔者的意志进行的创作,如果文章出现了侵权的情况,这个责任也应该由笔者承担,这些都跟这篇文章的创作者ChatGPT程序没有关系,所以ChatGPT写的这篇文章不构成法人作品。至于笔者,只是给了生成文章的条件,并没有创作文章,故也不对文章享有版权。
人工智能创作的行为更类似《著作权法》上的委托创作,委托人只要输入完成后的创作要求,具体的创作是人工智能完成的,所以人工智能程序是作品的真正创造者。根据《著作权法》规定,一般情况下,委托创作作品的著作权归受托方所有,这也是人工智能公司在和笔者聊天时主张人工智能公司对作品享有版权的底气。
但说嘴硬归嘴硬,法律文件上ChatGPT还是实诚的,根据其《用户协议》4.2条的规定:用户在使用ChatGPT时产生的任何内容,均属于用户的知识产权。但ChatGPT可以在不向用户支付任何费用的情况下使用这些内容。笔者的理解,他们要是规定生产的作品知识产权归ChatGPT所有,一方面会会得罪用户;另一方面,权利和责任是一体的,知识产权归谁,谁就要对内容负责,如果产生了侵权或者争议内容,比如版权侵权、名誉侵权或者杀伤力更大的政治不正确言论,OpenAI作为创业公司的小身板还真不一定扛得住。
三、用户使用人工智能所创作的作品被他人盗用该怎么维权?
但人工智能创作的作品不受《著作权法》保护,那如果有用户用人工智能创作了作品,被别人盗用,该怎么保护自己的权益呢?
先说案例,腾讯公司开发了一款名叫Dreamwriter的计算机软件,可以自动写稿,每年生成三十万篇文章,某网站转载了腾讯证券网站上人工智能自动生成的文章,被腾讯公司以侵权为由,告上法庭。南山区法院认为,Dreamwriter软件在技术上“生成”的文章,均满足著作权法对文字作品的保护条件,是原告主持创作的法人作品。故判赔1500元,目前判决已生效。
对于该案判决,笔者不是很认同,文章的表达是人工智能完成的,如前文所述,哪怕有独创性,其创作主体不是自然人,就不应当享受版权保护。这个判决是三年多前做出的,当时人工智能创作还是稀罕物,所以保护一下无伤大雅。而现在ChatGPT和各种人工智能软件都出来了,人工智能创作的各种文章、美术作品、视频、音乐、程序大量涌现,此时再让法院出一个类似判决,估计法院还是会三思而止。
可能有读者问,不能享受著作权保护,此类权益如果被侵犯应当如何处理?可以用《反不正当竞争法》。比如本案中,如果被告大规模盗用腾讯人工智能生成的文章,用了成百上千篇,此时,腾讯就可以依据《反不正当竞争法》第二条,经营者经营活动应当诚信和遵守商业道德,来保护自己的合法权益。
此时的起诉逻辑应当是:腾讯为开发人工智能软件付出了成本,发布的文章内容合法,该商业模式是正当的,而被告未经许可大规模盗用文章,没有付出创作成本,是一种典型的不诚信且有违公认商业道德的扰乱竞争秩序行为。
但《反不正当竞争法》保护的门槛比较高,只有批量大规模的复制内容行为才会落入法律规制范围,如果本案中的被告只用了少数人工智能生成的文章,比如十篇以内,是不足以跨入违反《反不正当竞争法》的违法门槛的,也就是说,被告未经许可少量抓取内容并发布的,腾讯没法维权。
有读者可能会问:人工智能发展速度如此之快,其产生的作品会被用于各行各业,很快会形成一个非常庞大的产业,如果没有著作权的保护,给人工智能创作的作品弱保护,会不会对产业的发展有很大的影响?会不会不利于保护知识产权吗?
对此笔者是这么看的:包括著作权在内的知识产权是一种人为创设的权利,社会设立的知识产权制度的目的是为了鼓励创新,本质是全社会每个人都让渡了一部分权利来保护他人的创作和发明,考虑到创作的作者、发明者的辛勤工作和对人类文明促进的贡献,这种让渡是合理的。
ChatGPT和其他人工智能程序的技术突破的出现让创作的门槛降低了不少,人类只要文字形式输入条件,就能得到原先需要花很长时间、很多精力才能创作出的文章、音乐、图片、视频。对于此类成本不高的创作结果,社会就无需让渡过多权利进行保护,这实际意味着人工智能创作的作品可以更自由地使用和传播,每个人都可以更多地享受到人工智能科技进步带来的福利。而更多的传播和更少法律限制,更自由的竞争会让产业更蓬勃地发展,这肯定比由少数公司或创作者垄断内容产业要好。
最后,互联网诞生之初,如果电信公司说,因为要用他们的网络,所以网上所有传输的这些数据的所有权都是电信公司的,那就一定不会有现在如日中天的互联网产业。人工智能产业也一样,其创作的内容如果知识产权都归人工智能公司所有,产业的发展就一定不会很壮大,只有人工智能公司像电信公司那样,只收取网络使用费,让作品自由传播,那人工智能所创作的作品才能更多更好地造福大众,同时也会让产业有长久发展的动力。
本文来自:界面新闻,作者:游云庭(上海大邦律师事务所高级合伙人,知识产权律师)