热点 | “AI生成图片著作权侵权第一案”审理思路与评议
作者 | 马军 宁人律师事务所
编辑 | 布鲁斯
2023年11月27日,北京互联网法院判决认为被告刘某某发布文章配图使用了原告李某利用AI声称的图片构成侵权。值得注意的是,北京互联网法院认为涉案人工智能生成图片(AI绘画图片)“春风送来了温柔”具备“独创性”要件,体现了人的独创性智力投入,应当被认定为著作权法保护。这是我国首次将AI生成图片认定为著作权法保护,本文试对北京互联网法院判决焦点及问题整理,并提出自己的想法以供大家讨论。
01
案件事实及裁判思路
原告李某使用选取开源软件Stable Diffusion模型,对开源模型进行图片生成参数调整,调整后在输入提示词生成图片,根据生成的效果再调整参数最终生成涉案图片后发布于小红书平台并有水印;被告系百家号博主,发布自己撰写的文章,并且配图使用了原告利用通过Stable Diffusion生成的图片,该图片并无水印,原告遂起诉。经过当庭勘验,原告通过变更个别参数、其生成的图片结果不同。
北京互联网法院在审理过程中认为本案有以下三个争议焦点:
一、关于AI生成物是否属于智力成果,北京互联网法院认为该AI生成图片体现了人的智力投入,属于智力成果。该AI生成图片是原告李某希望通过AI生成满足自己预期的图片,并且原告在此过程中具有选择模型并且设计人物的呈现方式、选择提示词、调整参数等充分表现原告李某发挥主观能动、智力投入的活动。
二、关于AI生成物是否具有独创性,北京互联网法院认为不能将AI生成物一概认为具有独创性,而是应该个案审理。本案中,该AI生成图片是原告李某利用Stable Diffusion模型画的,且在此过程中原告对画面布图构局等通过参数进行了设置,体现了原告的选择和安排,并且原告在生成该图片过程中不断调整参数、输入提示词等方式获得最终图片,而这些过程体现原告的审美选择和个性判断,所以该图片并非“机械性智力成果”,具有独创性。
三、人工智能模型本身不能成为著作权法上的作者。北京互联网法院认为,作者限于自然人、法人或非法人组织,这与民法典规定的民事主体一致,所以虽然涉案图片是人工智能所画,但是该模型无法成为涉案图片的作者。
综上,北京互联网法院认为该涉案AI图片属于作品,且原告是该涉案AI图片的作者享有著作权。本案中被告未经原告许可擅自使用该涉案图品构成侵权。故被告去除水印的行为且使用该图片发布在自己账号的行为侵害了原告的署名权和信息网络传播权。
02
针对此案的几点疑问
“
对开源模型的参数调整是否构成生成图片的独创性?
北京互联网法院该AI生成图片是原告李某利用开源Stable Diffusion模型画的,众所周知Stable Diffusion系专门用于AI绘图的专业模型,它的开源软件本身就具备绘画的能力,在裁判文书中也明确说明了开源方许可协议中并未主张任何知识产权。开源软件是互联网行业常用的营销手段,开源软件一般会开源参数而不会开源软件或模型的底层代码,Stable Diffusion亦是如此,下载开源软件方可对开源模型进行参数调整以达到完善模型的目的。需要注意的是,参数的调整主要是基于开源模型本身,而并非图片生成。从本案判决书中可知,原告的角色相当于使用开源模型方,而生成的图片更多的是对模型参数调整后,输入提示词后图片生成的效果。从这里可知,模型参数的调整和提示词指令的发出更多是预训练阶段,只不过在预训练阶段对模型参数的调整和图片生成会混为一体。
笔者认为在Stable Diffusion开源模型下对模型参数的调整所产生的知识产权应当是对开源模型的独创性,对模型参数的调整本身是生成图片的通用规则,并不会具象化成为图片生成的直接贡献。另外,开源模型开源方并不会开源底层代码,开源模型的核心技术仍然掌握在底层代码中,使用开源软件进行微调改变不了Stable Diffusion核心功能和底层算法逻辑,只能是对模型的优化和调整。众所周知,人工智能算法黑箱技术无法解决,人类无法识别人工智能算法真正生成物的过程,不论针对Stable Diffusion模型进行何种参数调整,都无法识别出到底对生成的图片作出了哪些有用的贡献。何况Stable Diffusion开源模型就是一个绘图通用的模型技术,参数的调整会影响任何图片的生成,不仅仅是涉案图片。那么,图片是如何生成的?在技术上,模型的预训练就是在给模型教授知识,让它听懂人类的指令,并根据指令输出已学习到的知识。在本案中,虽然原告通过多次参数和提示词调整最终生成了图片,该行为仍然是对模型本身的训练调整,而图片生成仅有一个动作那就是输入提示词。原告多次修改参数和提示词其实是两个行为,会产生两个知识产权法律的后果,一个是参数的调整会影响在开源基础上对模型参数的调整,属于对开源模型的二次创作,是否构成新的知识产权需要按照开源协议约定判断。另一个是输入提示词生成一张图片是否是著作权法中的作品,是否构成独创性,是否是人的智力成果需要深度讨论,也是本案的关键点。
因此,在本案中,要想讨论生成物的知识产权只需要讨论输入提示词是否构成独创性。本案的特殊性在于这两个行为都是一个主体完成的,如何区分可能仁者见仁智者见智。笔者认为本案中原告具体操作步骤为设计人物的呈现方式、选择提示词、安排提示词的顺序、设置相关的参数,这些操作步骤的针对对象始终为Stable Diffusion模型,并非图片的具体参数。原告在该开源模型上进行修改参数等操作最后生成图片步骤实际上仍然属于对该开源模型的二次创作的训练阶段,尽管后期有修改提示词的等于涉案图片直接相关的操作步骤,但是这些步骤本质并未脱离训练模型本身。不管如何,如果两个行为并非一个主体完成,是需要严格区分两个知识产权的,而并非混为一谈,关于该开源模型生成图片的独创性仍需进一步论证。
“
开源模型生成物是否属于智力成果?
对于开源模型的产物是否属于智力成果和前述独创性标准论述一致。本案中,北京市互联网法院认为涉案图片是人工智能所“画”,但又否定该图片为人工智能的生成物,此处逻辑自相矛盾。故北京市互联网法院混淆本案原告的创作对象,错将原告创作对象为生成图片而非开源模型本身,所以认为该生成图片是原告利用开源模型作为“工具”生成图片,但是本案原告调整参数等创作步骤全部针对于该开源模型,并非图片本身,所以笔者认为该图片应该为开源模型生成物。但人工智能模型既没有创作涉案图片的意愿,图片的生成依据是使用者输入的提示词,实践中大部分模型为刷题式的记忆模型,并非逻辑计算和推理模型。笔者认为,涉案开源模型只是涉案图片的生产者,并不是创作者,它所执行的不过是设计者或操作者的意志,无论该人工智能有多“智能“,它始终按照既定的程序、算法、规则进行运作,究其本身并未突破人类辅助工具的范畴,不能完全独立自主生成物品。所以,对于开源模型生成物是否属于智力成果,笔者持否定意见。
03
可知识产权后的影响
北京互联网法院认为案涉图片是原告使用开源模型Stable Diffusion创作的具有独创性的智力成果,认为其是著作权规定客体,受著作权法保护,作为开源模型生成物著作权领域第一案判决,即认可开源模型生成物符合法律规定知识产权构成要件、受知识产权领域法律保护,将对开源模型行业领域上下游知识产权保护产生诸多影响。
首先,认定开源模型生成物可知识产权可能会陷入对开源模型训练阶段用到的现有作品著作权无法保护的制度困境。可以将利用开源模型生成产物的过程理解为开源模型通过学习数据库中并素材提取素材中的要素,后期在使用时根据用户端输入的关键词关联相关要素,基于某种算法融合数据库与关键词相关的要素,即这个过程大致分为模型学习素材、模型拆解素材、模型“拼接”产物。尽管随机性很大,但在拆解过程中必然会拆解受著作权法保护原始素材即现有作品,这些作品在被拆分再拼凑起来势必会生成与原有素材要素相同的“作品”,此时如果认为该“作品”可以认定为满足知识产权构成要件,受知识产权法保护,现有作品著作权与该“作品”著作权就会产生权利冲突。按照北京互联网法院观点认为本案是将创作该模型作为生成“作品”的工具,那么如果仅将该开源模型作为工具,修改的参数认为创作的表达,表达的结果认为是思想的具体表达形式。开源模型所有人在模型学习过程中使用了现有著作权人的作品并学习拆解,而开源模型使用者根据优化后开源模型使用关键词再次组装,组装产物可以视为现有作品的衍生物,可能会与现有作品实质性相似进而侵害现有作品著作权,作为作出共同侵权行为的行为人,二者并无共同侵权的故意。根据我国侵权相关法律规定,二人以上共同实施侵权行为,造成他人损害的,应当承担连带责任,但是共同加害行为的构成要件是有两个以上的加害人且每一个加害人都实施了加害行为,行为给他人权益造成了损害其和各加害人之间存在共同过错。而在上述开源模型所有人与开源模型使用者共同侵权情形下,由于“共同”性的缺乏,即二者之间不具有共同过错,并不符合共同加害行为的要件,无法适用共同加害行为的相关规则加以规制;根据著作权法领域现有接触+实质性相似规则,开源模型使用者使用开源模型的生成物与现有作品构成实质性相似,但可主张是由开源模型所有人接触原有作品而自己并无接触现有作品的可能性从而规避侵权责任。此时就会出现现有作品著作权人被侵权而无法确定侵权人的制度困境。
其次,认定开源模型生成物可知识产权或将开源模型所有人和开源模型使用者造成巨大经济损失。上述论述中无论侵权人是否确定,侵权损失实际存在,制度陷入困境也必将会有人承担侵权责任。第一,尽管开源模型所有人在生成物的阶段并不直接参与,但是在训练阶段开源模型所有人学习拆分现有作品,开源模型所有人可能会因此行为承担经济规模宏大赔偿责任。本案中Stable Diffusion学习阶段使用了规模巨大数据库,开源模型即生成式人工智能通常都需要数据库提供数量庞大的素材以供给模型学习,其中大多数素材受著作权保护,涉案开源模型Stable Diffusion拥有包含 58.5 亿个 CLIP 过滤的图像-文本对的数据集,是世界第一大规模、多模态的文本图像数据集,其中原始素材大多数受著作权保护,如果生成产物可知识产权那么数据库中所有现有作品都可能会受到侵权,按照互联网法院涉案生成物侵权损失500元来进行估算,涉案Stable Diffusion所有人可能会承担上亿规模赔偿责任带来的经济损失。人工智能是新世纪科技发展的实力表征,也是未来科技发展的趋势,人工智能领域必然会诞生诸多人工智能模型企业,而这些企业要面临的问题可能首先就要考虑侵权所带来的经济损失。开源模型使用者在使用开源模型修改参数二次创作生成作品可能会因为二次创作行为生成物侵权而承担损失,虽然个体损失不高,但诸多使用者使用开源模型生成物物侵权损失总和也会达到上亿规模,用户可能因此放弃对该开源模型的使用。
最后,认定开源模型生成物可知识产权不利于行业领域向前发展。类似于本案中原告操作步骤,某位开源模型使用者仅仅是修改了参数,而并无对开源模型底层软件逻辑、参数、命令进行修改编辑,就会产生对该实际仍在学习训练阶段模型生成物的著作权,可能会导致该开源模型直接丧失商业价值。开源模型参数可以在有限次数内穷尽,开源模型参数修改的次数也可以在有限次数穷尽,那么出现恶意修改参数,穷尽参数修改所有路径,从而达到对实际仍在优化阶段开源模型所有生成物享有著作权,达到对该开源模型使用的垄断也并非无可能性。此时此时该开源模型使用者并没有具体思想表达,也没有智力成果,但可以通过大量体力劳动修改参数对开源模型的生成物享有著作权进而达到对该开源模型的掌控,因为开源模型使用者此时对生成物享有著作权那么其它使用者使用开源模型并无实用价值,开源模型所有人可能会因为该使用者者上述操作导致该开源模型无经济价值。作为营销手段的开源模型在此时带来的负面效果就会远远高于收益,此时类似学习模型所有人将不会开放应用层给客户,无论是对所有人本身还是对使用者都丧失了此种高效的模型优化途径。
相关阅读
版权案例 | 全国首例!“AI文生图”著作权案:AIGC构成受著作权法保护的作品
(本文仅代表作者观点,不代表知产力立场)
封面来源 | 知产力