谁是《下一个伦勃朗》的作者?

2020-09-23 18:13:58
——AI生成作品的著作权实务问题探讨
1600848778408434
——AI生成作品的著作权实务问题探讨


作者 | 许建 朱韶斌  美国摩根路易斯律师事务所编辑 | 布鲁斯


人工智能并不是未来科技,它已经在我们身边了[1]。我们会经常阅读电脑程序自动生成的新闻资讯,浏览智能手机为我们编辑好的专属相册,甚至收到机器人打来的骚扰电话。同时, 随着机器学习等技术的日益发展,人工智能正在挑战人类更为复杂的思维表达活动-文学艺术创作。著名的人工智能虚拟机器人“微软小冰”已经不仅掌握了写诗的能力,而且还可以通过一段文字生成符合该文字意境的画作、创作并演唱接近人类水平的歌曲等。然而,被反复提起但又始终未解决的问题是:这些作品是否可以获得版权法的保护?谁又是作品的作者呢?


在有着深厚文学艺术底蕴的欧洲,人们也在尝试利用人工智能(Artificial Intelligence, “AI”)尤其是机器学习(Machine Learning)技术进行艺术创作。其中,一幅名为《下一个伦勃朗》的人工智能作品更是备受各界关注。伦勃朗是17世纪荷兰黄金时代绘画的主要人物,被称为荷兰历史上最伟大的画家[2]。2016年,来自微软、代尔夫特理工大学、莫瑞泰斯皇家美术馆以及阿姆斯特丹伦勃朗博物馆的多位大数据科学家、软件工程师和艺术家经过18个月的共同努力,利用人工智能程序创作完成一幅颇具伦勃朗风格的绘画作品,并将其命名为《下一个伦勃朗》[3]。这些跨领域的专家们首先利用大数据、3D扫描和机器学习等技术对168,263个伦勃朗过往作品的片段进行分析,再将伦勃朗的绘画习惯和作品细节转换成数据培训AI系统。经过深度学习的AI系统进而“创作“出一幅与伦勃朗过往任何作品都不尽相同但风格又十分近似的全新数字绘画作品,专家们再通过3D打印技术将其立体地呈现在画布上。画作生动再现了这位17世纪著名画家的绘画风格和笔触,仿佛是伦勃朗本人的新作。然而,人们在惊叹于人工智能高超的“创作”能力的同时,也不禁会思考究竟谁才是这幅作品的作者?


1600848778311788

(图片来源:www.nextrembrandt.com)


无独有偶,2018年,佳士得公司以432,500美金的成交价完成了历史上首次人工智能作品的拍卖。据称,来自巴黎的人工智能与艺术团体“Obvious”选取了14世纪到20世纪的15,000幅人物肖像画,将这些绘画作品转化为数据输入到以开源网络Generative Adversarial Network (“GAN”)为基础的机器学习程序中,最终生成了一幅具有抽象派艺术特征的肖像画《Edmond de Belamy》。然而,这幅由人工智能生成的作品一经问世便受到多方质疑[4]。美术界体质疑它并非原创作品,而是一种衍生作品;有软件开发者质疑“Obvious”未经授权使用了他人编写的代码。


由于其所依赖的原始素材早已进入公有领域,上述两幅AI作品并未引发法律纠纷,我们也无从知晓相关版权问题的答案。然而,中国法院近几年审理的两起涉AI作品的案件似乎为我们提供了“破题思路”。2019年12月24日,深圳市南山区人民法院对腾讯诉网贷之家案[5](“腾讯案”)作出一审判决。法院认为,由人工智能程序Dreamwriter编写的文章系受我国著作权法保护的作品,腾讯公司对其拥有著作权。而在北京互联网法院审理的北京菲林律师事务所诉北京百度网讯科技有限公司一案中(“菲林案”)[6],法院认为,涉案的威科先行数据库生成的图表未体现个性化的表达,不满足独创性要求,因此不构成著作权法意义上的作品。


目前,对于人工智能创作内容的著作权问题各国的立法和司法实践还处于探索阶段,本文将从以下三个方面对相关问题进行梳理和探讨。


1600848778998523

人工智能生成内容的可版权性问题


1600848778998523

中国法院承认AI作品的可版权性

1600848778998523


是否存在“人”的创造性参与是决定AI生成内容可版权性的重要考量因素。我国《著作权法》第二条规定,“中国公民、法人或者其他组织的作品,不论是否发表,依照本法享有著作权。”《著作权法实施条例》第二条规定, “著作权法所称作品,是指文学、艺术和科学领域内具有独创性并能以某种有形形式复制的智力成果。”因此,享有著作权的作品必须是“人”的“独创性”智力成果。换言之,如果输出内容主要依赖于预设的程序和指令,不能体现人(特别是AI程序的使用者)的判断、选择或其他创造性智力活动的,将很难得到著作权法的保护。


在菲林案中,北京互联网法院否定了AI生成的图表的可版权性。法院认为,“虽然[表格]会因数据变化呈现出不同的形状,但图形形状的不同是基于数据差异产生,而非基于创作产生。针对相同的数据,不同的使用者应用相同的软件进行处理,最终形成的图形应是相同的;即使使用不同软件,只要使用者利用常规图形类别展示数据,其表达也是相同的”。因此,原告通过向威科先行数据库输入关键词,从而生成的反映电影行业案件趋势的图表不符合图形作品的独创性要求。尽管原告主张其对这些自动生成的图表进行过人工筛选以及后期美化处理,从而使表格具备了独创性,但法院并未采纳此观点。


然而,在评述威科先行数据库自动生成的分析报告时,法院主要从作品必须体现“自然人”的独创性的角度否定了报告的可版权性。法院强调,“自然人创作完成仍应是著作权法上作品的必要条件”。尽管“使用‘可视化’功能自动生成的分析报告,其内容……符合文字作品的形式要求……具有一定的独创性”,但是“软件用户仅提交了关键词进行搜索,应用‘可视化’功能自动生成的分析报告亦非传递软件用户思想、感情的独创性表达,故该分析报告亦不宜认定为使用者创作完成”。法院同时认为, “某种意义上讲可认定威科先行库‘创作’了该分析报告。由于分析报告不是自然人创作的,因此,即使威科先行库‘创作’的分析报告具有独创性,该分析报告仍不是著作权法意义上的作品”。


事实上,威科先行数据库生成图表或分析报告的过程并非典型的机器学习过程,而是机器通过一些列预设好的规则根据用户指令直接输出结果,缺少了深度“学习”这一关键步骤。在这种情况下,数据库使用者对其输出结果的选择和独创性表达空间很小。因此,正如北京互联网法院所分析的,图表和分析报告并没有传递出软件使用者具有独创性的思想或情感表达。


与菲林案不同的是,腾讯案法院认定,由人工智能程序Dreamwriter编写的文章系受我国著作权法保护的作品。该案中,原告挑选大量原始数据培训AI学习写作的能力,再由AI生成相关文章,其中经历了数据服务、触发和写作、智能校验和智能分发四个环节。法院认为,在上述环节中,“数据类型的输入与数据格式的处理、触发条件的设定、文章框架模板的选择和语料的设定、智能校验算法模型的训练等均由主创团队相关人员选择与安排。” 而这些选择与安排“属于与涉案文章的特定表现形式之间具有直接联系的智力活动”,应当纳入到涉案作品的创作过程中。因此,法院认定“从涉案文章的生成过程来分析,该文章的表现形式是由原告主创团队相关人员个性化的安排与选择所决定的,其表现形式并非唯一,具有一定的独创性。” 同理,不难想象,“微软小冰”生成的颇具水平的诗歌和绘画作品凝聚了AI团队前期更为缜密、复杂的选择和安排,从而使作品更能传递出人类具有独创性的思维与情感。


1600848778998523

美国法律尚未给出明确答案

1600848778998523


与之相似的,美国版权法旨在保护“作者的原创智力成果”,美国版权局明确表示拒绝登记非由人类创作或者缺少人的创造性输入或干预而由机器自动生成的内容[7]。然而,面对机器学习这一类兼具人工干预和机器自动“创作”的新技术时,仍然存在诸多问题亟待美国立法机构或法院做出进一步解释。2019年,美国专利商标局(USPTO)就人工智能技术将对版权、专利权等知识产权造成何种影响等问题向社会公开征询意见,其中包括,“一个缺少自然人对输出内容的贡献仅由AI算法生成的作品是否可以构成美国版权法保护的作品”,以及“假设有自然人的参与,那么何种参与程度会使该作品能够得到版权法的保护”等一些列备受关注的问题 [8]。USPTO收到了数十条书面评论,但各方观点分歧很大。
1600848778107209


1600848778998523

谁可以成为人工智能生成内容的作者


如前所述,通过人工智能技术生成艺术作品的过程需要软件开发者、艺术家和大数据专家的跨领域合作。如果最终输出的内容可以成为受著作权法保护的作品,那么谁才是该作品的作者?以人工智能肖像画《Edmond de Belamy》为例,该画作的完成至少涉及以下几个主体:AI程序本身、Lan Goodfellow、Robbie Barrat和“Obvious”团队[9]。


1600848778998523

AI程序本身

1600848778998523


如上所述,目前中美两国的法律似乎都不支持AI程序本身作为一件作品的作者。在菲林案中,法院特别强调,“虽然随着科学技术的发展,计算机软件智能生成的此类‘作品’在内容、形态,甚至表达方式上日趋接近自然人,但根据现实的科技及产业发展水平,若在现行法律的权利保护体系内可以对此类软件的智力、经济投入予以充分保护,则不宜对民法主体的基本规范予以突破。” 然而,也有学者认AI系统本身具有“创造性、自治性、不可预测性和不断进化等特点”,况且作品生成过程中的参与方太多,没有一方是AI生成作品的主要贡献者,因此“AI系统本身应当对它的作品负责”[10]。也许,当人工智能技术发展到具有高度接近人类的思维能力和自主性时,可以考虑赋予其一定的法律主体地位。但这一问题不仅关乎法律,还需要考虑伦理、文化等多方面因素。


1600848778998523

Lan Goodfellow 和 Robbie Barrat-AI程序开发者和优化者

1600848778998523


AI程序的开发者或优化者,可能难以成为最终AI输出作品的作者。2014年,时任微软公司AI工程师的Lan Goodfellow与其他几位研究人员共同开发了名为Generative Adversarial Networks (“GAN”)的深度学习模型,Facebook人工智能首席科学家Yann LeCun称其为“近十年来机器学习领域最有趣的创意”[11]。GANs模型包括两个人工神经网络:Generator(生成器)和Discriminator(判别器)。生成器通过机器生成数据(如图像数据),目的是“骗过”判别器;判别器判定这张图像是真实的还是机器生成的,目的是找出机器生成的“假图片”并反馈给生成器。通过循环反复的训练,生成器最终会生成效果逼真、令人意想不到的图片[12]。由于GANs系统自身的缺陷,有很多软件开发者对GANs模型进行了优化。其中,一名来自美国弗吉尼亚州的程序员Robbie Barrat编写并公开了一套优化程序代码,这套代码可以使通过GANs生成的图片更具真实性和艺术性,因此受到广泛欢迎[13]。AI程序的开发者、优化者Lan Goodfellow和Robbie Barrat对各自编写的软件程序代码本身享有版权是毋庸置疑的。但他们是否对于AI输出的作品《Edmond de Belamy》也有拥有版权呢?如果“Obvious”只是用了Lan Goodfellow和Robbie Barrat构建的GANs网络和相关优化程序,而自行选择图片并对AI进行培训,笔者认为这两位软件程序开发者只是为“Obvious”创作工具的提供者,就像摄影器材提供商之于摄影师的关系。由于缺少对最终作品的选择、判断等原创性参与活动,因此Lan Goodfellow和Robbie Barrat不宜视为最终作品的作者。


1600848778998523

“Obvious”团队-AI程序使用者

1600848778998523


参与培训人工智能程序的AI使用者宜被认定为AI作品的作者。“Obvious”团队被认为很大程度上使用了Robbie Barrat编写的代码,通过对GANs网络的持续培训,从而最终生成上述作品。在生成作品的过程中,GANs的使用者通常至少会在三个阶段参与其中。首先,在决定用哪些图像数据培训判别器时,需要人为的选择。在本案中,“Obvious”据称从14世纪到20世纪公开发表的画作中选取了15,000幅作为培训素材。其次,在培训生成器和判断器的过程中需要人来检验生成图片的质量,并有针对性的对培训素材、方法进行调整,甚至改写代码。最后,在图片生成以后,需要人工挑选符合一定标准的图片进行打印或后期处理[14]。在这种情况下,笔者认为“Obvious”的参与体现了人的选择、判断、安排等思维表达,具备一定的独创性。此外,“Obvious”还可能对用于培训AI的数据库拥有版权。然而,在这幅画公开拍卖以后Robbie Barrat公开发言称,“Obvious”使用了自己的代码和数据集,同时在推特公开了9幅经由他训练的人工智能网络生成的作品[15],这些作品与《Edmond de Belamy》的风格近似。如果事实如此,那么Obvious更像是在摄影师布完景,调好光圈和拍摄角度后按下了快门,而无论是“Obvious”还是其他人在按下快门后所呈现的影像并不会有太大差别。这种情况下“Obvious”还能成为最终作品的作者吗?


同样,在腾讯案中,法院分析了Dreamwriter幕后团队在培训AI网络过程中的创造性参与过程,进而查明“涉案文章是由原告主持的多团队、多人分工形成的整体智力创作完成了作品”。此外,由于文章末尾注明“本文由腾讯机器人Dreamwriter自动撰写”,因此法院认为,在无相反证据的情况下,涉案作品应属于系腾讯公司享有著作权的法人作品。由于AI系统的开发和培训均由腾讯公司员工完成,因此避免了AI作品创作主体之间潜在的所有权确权问题。


1600848779505966


1600848778998523

使用受版权保护的作品培训AI是否构成侵权


在美国,如果受版权保护的作品被高度转换性使用,使用该作品培训AI程序的侵权风险将大大降低。在上述《Edmond de Belamy》案例中,由于Obvious培训AI所使用的画作都已经进入公有领域,因此人们并未关注使用这些作品用于AI深度学习是否构成侵权的问题。然而,如果用于训练AI的作品尚未过版权保护期,这些作品的使用人是否构成版权侵权呢?美国法院在该问题上有过多起判决。在这种情况下,被告对于复制原告作品这一事实通常并无争议,但会以“合理使用”进行抗辩。根据美国法典17 U.S.C. § 107条的规定,合理使用应当考虑以下因素:1) 使用的目的和性质,包括这种使用具有商业性质还是为了非营利的教育目的;2) 作品的性质;3) 被使用部分的內容和数量与整个作品的关系;以及4) 这种使用对作品的潜在市场或价值所产生的影响。对于第一个因素而言,如果使用目的具有“转换性”,将有利于合理使用的认定。美国联邦最高法院在Campbell v. Acuff–Rose Music, Inc.中指出,调查使用的目的和性质主要为了考察“新作品仅仅取代了原作品的客体,还是在原作品基础上增加了具有不同目的或特点的新内容,从而改变了原作品的表达、意义或信息;换言之,是否或在何种程度上,新作品被转换性使用”[16]。最高法院还认为,“尽管转换性使用不是决定合理使用的绝对必要因素......但是新作品的转换程度越高,其他几个考虑因素的权重越低”[17]。


在著名的Authors Guild v. Google案[18](“Google图书案”)中,美国第二巡回上诉法院维持了地区法院的判决,认定Google收录大量图书用于开发在线图书搜索功能的行为系合理使用。法院指出,“当未作改动的复制行为合理地用于实现复制者转换性使用的目的,且该转换性使用并未提供与原作品构成竞争的替代性作品时,这种复制行为应当认定为合理使用”[19]。在分析合理使用的全部四个要素之后,法院认为,谷歌的行为将使公众更容易获取图书的相关信息,且并未提供原作品或其衍生作品的替代作品,因此构成转换为目的的合理使用。


在更早之前的A.V. ex rel. Vanderhye v. iParadigms, LLC案[20]中,法院同样支持了被告的转换性合理使用抗辩。该案被告提供一种防抄袭对比服务,他们将学生的手写作业数字化并存储在数据库中,用于和其他学生通过计算机打字生成的作业做比对,从而判断作业的相似程度。法院认为,这种使用方式是具有高度转换性的合理使用,因为该使用完全与原作品的表达内容无关,而是为了检测和打击抄袭。


然而,并非所有的转换性使用都构成合理使用。在Fox News Network, LLC v. TvEyes, Inc.案[21]中,被告TvEyes的合理使用抗辩就未能被法院采纳。该案中,被告使用原告Fox公司的新闻视频制作可供用户搜索的数据库,此外用户可以预览每条视频最多10分钟的内容。TvEyes主张自己的行为与Google图书案中Google收录图书并向公众提供图书快照的行为相似,应当构成合理使用。在分析了TvEyes的商业模式后,法院认可了其行为的转换性目的,因此判定第一个因素有利于被告。然而,与Google图书案不同的是,本案中涉案作品为新闻类视频,用户通常看10分钟时长的视频后就会基本了解新闻的主要内容。而谷歌快照只显示三行字,每个用户只能最多浏览每本书的三个快照,这对整本书而言,复制的内容和数量都是微不足道的。因此,法院认为第三个因素有利于原告Fox。此外,法院认定第四个因素也有利于原告,因为TvEyes的行为将剥夺Fox自己或授权其他公司提供类似搜索服务的商业机会。综合以上因素,最终法院判决被告TvEyes的使用行为不构成合理使用。
1600848780367672


1600848778998523

给AI相关从业者的建议


人工智能生成内容的版权问题在各国的立法和司法实践中均存在诸多模糊地带和不确定性。是否需要单独为此立法,还是根据现行法律进行解释,也存在不同声音。尽管美国在人工智能技术方面处于世界领先地位,但目前尚未出台相关法案或具有约束力的判例。中国的两个司法判例在一定程度上提供了解决问题的思路,但案件的审理法院位皆较低,且无相关的司法解释作为支持。在这种情况下,AI行业从业者需要紧密关注相关法律、政策和指导性案例,做好事前风险评估和防范。对此,我们提供以下建议:


1. 确保拥有AI系统软件的著作权。建议人工智能企业通过自行研发或者委托开发获得AI系统软件的著作权。如果使用开源软件或在开源软件基础上做改动,首先需要区分该开源软件许可协议属于完全开源(permissive free-software license )还是半开源(copyleft)模式;如果是后者,应当认真阅读开源软件协议,了解协议中对衍生作品的权利限制。如果软件在美国开发完成,需要在美国版权局进行登记,否则遭遇侵权时权利人将无法有效维权。


2. 在培训AI系统时要充分研究相关国家和地区的法律,评估使用他人作品是否构成侵权。企业需要在作品输入、机器学习以及作品输出等多个环考虑版权侵权的风险。如果AI学习的过程发生在美国,为了提供合理使用抗辩的成功率,企业需要考虑这种使用方式能否为原作品带来具有转换性的新价值,还是仅仅将原作品当作原始材料使用;是否新作品构成对原作品或其衍生作品的替代;是否该使用方式已经形成商业市场,即是否可能剥夺原作品所有人通过相同方法获取商业利益的机会;使用原作品的数量和质量是否合理和必要等。


3. 在培训AI系统时要充分体现人的参与。越多体现人类的思考、选择与安排,作品越有可能受到版权法的保护。企业应当避免为了达到商业效果,在广告宣传中声称自己的AI系统可以完全自主的创作作品。同时,当AI的开发和使用分属于不同主体时,需要通过合同妥善安排参与AI作品创作人员的权利义务,以避免今后的权属纠纷。


注释:

[1] See Pamela McCorduck: This Could Be Important: My Life and Times with the Artificial Intelligentsia (2019), available at https://computerhistory.org/blog/ai-is-already-here-for-good-or-bad/.

[2] See https://artsandculture.google.com/entity/%2Fm%2F0bskv2?hl=zh-CN.

[3] See Mark Brown, “New Rembrandt” to be unveiled in Amsterdam, The Guardian (Sep. 17, 2020, 15:25 PM), https://www.theguardian.com/artanddesign/2016/apr/05/new-rembrandt-to-be-unveiled-in-amsterdam.

[4] See Ahmed Elgammal, What the Art World Is Failing to Grasp about Christie’s AI Portrait Coup, Art SY (Sep. 17, 2020, 15:26 PM), https://www.artsy.net/article/artsy-editorial-art-failing-grasp-christies-ai-portrait-coup.

[5] (2019)粤0305民初14010号判决书

[6] (2018)京0491民初239号判决书

[7] See § 102 Copyright Act 1976; see also Copyright Office Compendium 313.2 (“will not register works produced by a machine or mere mechanical process that operates randomly or automatically without any creative input or intervention from a human author.”); 306 (“Because copyright law is limited

to ‘original intellectual conceptions of the author,’ the Office will refuse to register a claim if it

determines that a human being did not create the work.”). 

[8] See https://www.federalregister.gov/documents/2019/10/30/2019-23638/request-for-comments-on-intellectual-property-protection-for-artificial-intelligence-innovation; see also https://www.jdsupra.com/legalnews/how-does-ai-impact-tm-copyright-law-11076/.

[9] See Ahmed Elgammal, What the Art World Is Failing to Grasp about Christie’s AI Portrait Coup, Art SY (Sep. 17, 2020, 14:34 PM), https://www.artsy.net/article/artsy-editorial-art-failing-grasp-christies-ai-portrait-coup; see also https://zhuanlan.zhihu.com/p/48015572.

[10] Shlomit Yanisky-Ravid, Generating Rembrandt: Artificial Intelligence, Copyright, and Accountability in the 3A Era—The Human-Like Authors Are Already Here—A New Model, 2017 MICH. ST. L. REV. 659,

 at pp. 693 and 697 (2017), available at https://digitalcommons.law.msu.edu/cgi/viewcontent.cgi?article=1199&context=lr.

[11] Joseph Rocca, Understanding Generative Adversarial Networks (GANs), Towards Data Science (Sep. 17, 2020, 14:28 PM), https://towardsdatascience.com/understanding-generative-adversarial-networks-gans-cd6e4651a29.

[12] See https://easyai.tech/ai-definition/gan/.

[13] See Ahmed Elgammal, What the Art World Is Failing to Grasp about Christie’s AI Portrait Coup, Art SY (Sep. 17, 2020, 14:34 PM), https://www.artsy.net/article/artsy-editorial-art-failing-grasp-christies-ai-portrait-coup; see also https://zhuanlan.zhihu.com/p/48015572.

[14] See Ahmed Elgammal’s presentation at the symposium of Copyright in the Age of Artificial Intelligence, available at https://www.copyright.gov/events/artificial-intelligence/.

[15] See Ahmed Elgammal, What the Art World Is Failing to Grasp about Christie’s AI Portrait Coup, Art SY (Sep. 17, 2020, 14:34 PM), https://www.artsy.net/article/artsy-editorial-art-failing-grasp-christies-ai-portrait-coup; see also https://zhuanlan.zhihu.com/p/48015572.

[16] Campbell v. Acuff-Rose Music, Inc., 510 U.S. 569 at 579 (1994)

[17] Id.

[18] Authors Guild v. Google, 804 F.3d 202 (2nd Cir. 2015).

[19] Id. at 221.

[20] A.V. ex rel. Vanderhye v. iParadigms, LLC, 562 F.3d 630 (4th Cir. 2009).

[21] Fox News Network, LLC v. TvEyes, Inc., 883 F.3d 169 (2nd Cir. 2018).



(本文仅代表作者观点,不代表知产力立场)图片来源 | 网络
+1
0

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
评论区

    下一篇

    《大清著作权律》完全采用了英美法系的著作权立法模式,在当前我国著作权法修改之际,有必要重温一下我国第一部著作权立法,探究其对当前我国著作权法修改的积极启示。

    2020-09-22 19:33:47