本文来自微信公众号:林华(ID:gh_4d992808ffdf),作者:林华,头图来自:视觉中国


一、上帝出题,众生求解


用孙燕姿声音数据训练AI翻唱的数字孙燕姿很快代替本尊成为顶流,孙燕姿亲笔一份低吟浅唱皆无奈的公开信更把持续争议推高到各大平台热搜榜首。


孙燕姿被动带火的AI歌手引起了几乎所有社会圈层的热切关注。AI就像上帝给全世界出的题目,世间众生各寻百态解题。


乐迷和媒体对数字孙燕姿的态度处于惊与喜之间,既乐见音乐多了新的玩法,又迷惘于混沌的未来走向。


互联网一如既往地欢迎任何新流量。音乐行业在AI挑战面前又是一阵冷颤,而文字、视频等内容行业也心领神会地感受到唇齿间寒气在传递。


音乐行业主流对AI充满警惕,强烈反对未经授权的AI二创。环球音乐等行业大佬已经要求网络平台禁止发布利用未经许可的版权作品训练的AI音乐。音乐人中也有少数派(包括中国和海外歌手),可能是少数中的少数,用类似开源或者许可方式另辟蹊径,尝试做最早的AI创作迎合者。


AI孙燕姿本身也是一个有趣的法律分析话题。但在做法律分析前需要先厘清一个影响判断的事实,AI孙燕姿带来的是新热点,但并不是新问题。


二、深度伪造,新衣服下的老问题


1. 数字孙燕姿和生成式AI无关


数字孙燕姿蹿红正好接在ChatGPT火爆的时间点上,大多数话题有意无意地关联到大火的生成式AI。事实上数字孙燕姿和ChatGPT以及OpenAI毫无关系,甚至和支撑ChatGPT的大语言模型(LLMs)以及生成式人工智能技术(Generative AI)也无关。


数字孙燕姿实质是通过声音模型训练出的音源,通过提取的歌手声音特征,模仿出具有特定嗓音和演唱风格的任意歌曲演唱效果,听上去非常接近用以作为训练数据来源的歌手亲唱。


不论使用哪一种声音训练模型,这类在广义也属于人工智能的技术和生成式AI,有实质的差别。简单地说,以ChatGPT为代表的大语言模型通过数据训练创造出人类预期之外的结果,这也是ChatGPT被称为生成式AI的原因之一。声音模型训练产出的却是指定结果,一旦数字孙燕姿生成到不像孙燕姿就肯定是技术上的失败。


换句话说,AI演唱是“模仿”技术,AI作曲才是“生成”技术,前者比后者在人工智能技术发展阶段上早得多,也简单得多。还记得曾在B站大热的神曲“Are you OK”?这首鬼畜填词用雷军声音配唱原版“Angelina”,早在2015年就让大家体验了一把AI演唱。


2. 数字孙燕姿技术属于深度伪造


从本质来说,产生数字孙燕姿的技术符合Deep fake类技术的特征。AI演唱既然是模仿的技术,未经授权也没有其它合法依据的高仿声演唱就是深度伪造。


伪造技术由来已久,数字伪造技术也远非新闻,甚至同样基于AI的Deep fake技术也早在2017年就不断以虚假视频形式挑战了所谓“眼见为实”的古话。那么这一次以模仿声音形式出现的数字孙燕姿又是戳中哪个流量或者社会关注的痛点?


答案并不在于AI歌手出现了,而是在于AI技术快速发展使生产高度仿真的AI歌手容易到唾手可得。


程序实现的机器翻译产生已经有几十年,AI技术使机器翻译效果更好速度更快。数字伪造技术虽然也由来已久,但近年来卷积神经网络(记得DeepMind家的AlphaGo/阿法狗么)和生成式人工智能的大模型技术所代表的技术进步,使得AI在产出效果和性价比上都实现了突破,极大降低了实现特定技术效果的成本和难度。


技术发展使得AI变得容易、廉价、完美和普及,犹如运输和贸易的发展使香料从曾经贵比黄金到进入每个超市的货架和寻常百姓家。免费工具可供随意生成仿真度很高的AI歌手,速度伪造已成为低门槛和稍懂操作的人触手可及的事。


与其说AI歌手触动了孙燕姿,不如说数字孙燕姿展现的技术普及趋势惊动了音乐行业。


三、法律的答案


实际上对数字孙燕姿的各界态度中,最值得关注的应该是法律界。每当新事物涌现,合法性判断在一定程度上对推动还是阻滞其发展起到决定性作用。


1. 法律旧瓶可以装AI新酒


AI歌手并非太阳底下的新鲜事,即便真的新问题也可能用现有规则就足以解决。


一款主打写作辅导的APP笔神作文最近公开指控学而思用爬虫非法访问和扒取自己服务器大量数据,并用于学而思即将推出竞品的AI大模型训练。假设以上主张事实成立,就非法利用爬虫获取数据这一关键行为而言,即便相关数据


集合不构成作品也可以用《著作权法》以及《反不正当竞争法》保护进行覆盖。


2. 著作权保护的障碍


大众眼中的AI歌手争议其实包含了不同的法律关系和不同的法律问题。


从法律关系来看,利用AI翻唱他人歌曲中的词和曲都是受到版权保护的作品,各自作者或者权利人都可以向控制翻唱的当事人提出基于版权法的主张。


数字孙燕姿的核心争议是利用歌手声音训练和生成高仿AI演唱,是独立于词曲作品的表演,涉及的法律关系需要单独梳理。


《著作权法》第39条规定表演者对表演享有署名(表明表演者身份)和许可他人使用等权利。但如果歌手并没有演唱而只是以其声音素材训练及用AI模仿演唱情况下,表演者权在逻辑上就没有产生,歌手难以对并非自己亲唱的歌曲主张表演者权。


与此类似的争议是,在对以第三人名义(通常冒用知名作者)署名作品行为的法律分析中,主流意见是第三人并未创作争议作品从而不能就他人冒用自己署名而主张著作权保护,从而需通过主张民法或反不正当竞争法获得救济。


将歌手声音作为训练数据则又是一个问题。


以孙燕姿为例,歌后虽然对自己的歌唱表演依法享有前述邻接权,但是将演唱声音作为训练数据是否合法在著作权法上仍存争议而未有定论。至少依据《著作权法》第24条以及《民法典》第1020条和第1023条,无关传播而单纯为欣赏目的使用声音数据进行训练本身,符合合理使用的规定。


前引《著作权法》第24条等法条规定为个人学习、研究或者欣赏,使用他人声音或已经发表的作品的行为属于合理使用,但合理使用的范围并不能自动延伸到利用训练结果进行发布和传播,后者是否适用著作权保护存在争议。


3. 老药赛新方——民法保护是好选择


解决新问题未必一定要重新配方,规范数字孙燕姿和AI歌手的争议,适用民法保护是有效手段。


《民法典》对声音的保护有两条路径:


(1)适用保护自然人声音的规定:


声音权的保护见《民法典》第1023条,该条规定对自然人声音的保护参照适用对肖像权的规定(包括第1019条)。因此除符合法定合理使用情形外,歌手有权禁止他人擅自制作、使用、公开本人声音。


(2)适用保护个人信息的规定:


对个人敏感信息的保护见《民法典》第1034条。该条规定自然人的个人信息受法律保护,个人信息是以电子或者其他方式记录的能够单独或者与其他信息结合识别特定自然人的各种信息,包括自然人的姓名和生物识别信息等。个人信息中的私密信息,适用有关隐私权的规定;没有规定的,适用有关个人信息保护的规定。


孙燕姿的声线声纹不属于著作权保护的作品,但明显属于个人生物特征。通常歌手知名度越高,可识别度也越高,声音特征越明显。保护个人声音特征除了适用《民法典》,形式上也符合《个人信息保护法》第二十八条对敏感个人信息的规定,尽管理论上对歌手声音是否属于敏感个人信息仍有探讨可能。


四、人类如何与AI相处


技术可以作为人类断代史的依据,从石器、青铜器、铁器划分到蒸汽机和互联网时代。


声音模仿是早在生成式AI所代表的强大的通用人工智能产生前就大量应用的技术,AI歌手对当下的人工智能技术来说只是入门级别的应用。


数字孙燕姿并不是人工智能在技术发展高度上的炫技,而只是AI为人类轻轻敲响钟声,预告我的时代已经到来的。


快速发展的人工智能正在向真正的独立智能发展,不断融化组成这个世界的一系列关键词。这既可能是福音也可能是对人类未来釜底抽薪式的挑战。


金刚经说,凡所有相皆是虚妄。让事实和虚幻边界不断模糊的AI,可能比大多数人更懂金刚经的譬喻。


当孙燕姿面对数字孙燕姿,从法律到道德还都有有力后手。但即使不谈未来AI会发展到多么匪夷所思,当下的各种AI应用就已经在雨后春笋一样生长和包围世界,在改写我们的环境、理念,以及工作和生活方式,这是用包括法律在内所有手段都无法改变的。


AI正在不断降低普及成本和使用难度。在一个不可阻挡的广谱AI时代,AI将是我们不可或缺的一部分。


未来必然是人类和AI互相适应。站在未来思考当下,我们才能提前找到最合适自己的位置。


本文来自微信公众号:林华(ID:gh_4d992808ffdf),作者:林华