人工智能写作并非人类的“创作”工具
作者 | 金玮 北京市中凯律师事务所
编辑 | 布鲁斯
(本文仅代表个人观点,不代表任职机构观点)
人工智能程序生成的文字是否能够被《著作权法》保护已被较多地讨论。其中支持其具有可版权性的一方的一种观点认为:人工智能程序是人类为了“创作”而开发并使用的“工具”,因此,人工智能程序生成文字是人“假借于物”进行“创作”,其生成的文字体现了人类的精神思想和独创性表达,也属于人类创作的文字,故具有可版权性。
对于这种观点,需要考虑的是,在人工智能程序生成文字过程中,其对生成文字所起到的作用到底是什么?是如同钢笔、键盘、输入法一样将人类的思想和表达落实在纸张或磁盘上,还是其他形态?其到底是不是人类“创作”的工具?
一、人工智能程序生成文字的过程分析
1、人创作文字过程
对于人类来说,人的正常写作总是先进行思考活动。通过认知到的事实和或体会到的感受,思考有什么需要阐述,思考如何表达。通过思考,在脑海中形成文字,默读它们,斟酌、选择,然后用文字符号将自己选择和确定的文字记录下来。读者读到文字符号段落后,体会到作者的思想。整个过程如下:
作者在脑海中形成文字段落——作者将脑海中的文字段落书写下来——读者阅读文字符号段落领会作者的思考。
2、人工智能生成文字过程
而对于人工智能程序来说,按照媒体报道以及一些人工智能公司的描述,人工智能写作程序一般使用算法、规则、模板,通过输入的素材生成文字符号段落。例如,写财经报道的程序会形成财经报道模板,依据素材(例如公开的财务报表)形成财经报道;写体育报道的程序会依据赛场比分情况自动套用相应的模板,生成文字符号段落描述赛场的比赛状况。
虽然人类在设计人工智能程序时对模板、用词规则等进行过思考,但在人工智能程序生成文字符号段落前,人并没有看到最终生成的文字符号段落,人没有在脑海中形成要表达的文字。只有在人工智能程序生成文字符号段落后,人才读到了文字符号的段落,才将其阅读,进而了解其思想。整个过程如下:
人工智能程序生成文字符号段落——读者阅读文字符号段落领会符号段落的思想。
所以,笔者认为,对于人工智能程序生成文字,没有人类在脑海中思考形成其所要表达的文字的过程,因此不能说人工智能程序是人类的“创作”的工具。
二、两个人工智能程序生成文字的例子
我们也许会问,在生成文字段落时,如果没有人类通过思考从而在脑海中形成文字段落,如何能生成文字,再被读者领会为思想呢?笔者的回答是,文字符号段落被读者领会为思想并不一定是其在生成时因人类的相应思考而形成,只要文字符号段落的生成结果符合一定的语法规则、成文习惯、逻辑规则,就能被读者作为思想而领会,即便它本身不是因思考而生成。
下面,笔者举两例子来说明,没有人类在脑海中思考形成其所要表达的文字,由人工智能程序生成文字段落,并被领会的情形。
第一个例子:人工智能体育报道程序
甲足球队与乙足球队进行比赛,甲队在23分钟,78分钟进两球;乙队在80、86、92分钟(加时)进三球。A公司人工智能写作程序读取了两队进球时间数据后,自动生成一则体育报道:“甲乙两队在某日进行比赛,甲队在23、78分钟分进两球,但在最后10分钟未能咬紧牙关,被乙队连灌三球,痛失好局,令人扼腕。”其中,A公司程序员事先就设计了依据比赛进球时间数据可套用的“先赢后输”模板,并在模板中事先确定可以使用“未能咬紧牙关”、“痛失好局”、“令人扼腕”等表达。
但是,A公司程序员或A公司均无人观看了这场凌晨进行的比赛,都在家中睡觉(或者,由于全球赛事太多,他们都不记得这场比赛的存在),他们在第二天早晨才在A公司网站上看到这条人工智能程序生成的新闻。生成该报道时,A公司程序员和A公司对这场比赛并没有目睹到或了解到甲队先赢后输的事实,也没有人对甲队表现进行“未能咬紧牙关”的性质认定,也没有体会过“痛失好局”的痛苦感,感受到“令其扼腕”般的惋惜。生成这则报道时,并非基于一个人类作者对这场比赛的事实的认知、情感、感受和判断,更没有人针对这场比赛在脑海中形成文字符号段落。但依据体育赛事数据和用词的对应关系,人工智能程序依然生成出一则报道。
笔者认为,这则报道实际是一则违反新闻伦理的“伪报道”,因为其并非是人对事实的观察、认知、感受、思想的表达,而是计算机“模拟一个人类”面对这个现实“有可能”做出怎样的表达。由于《著作权法》所说的“创作”是指人类对思想、情感的表达,所以A公司或程序员对人工智能程序的使用,并非是作为著作权法上所说的“创作”工具使用,而是作为“生产”工具来使用。
第二个例子:人工智能写诗程序
笔者用自己设计的人工智能程序来实现写诗的功能。笔者先来给人工智能程序设定一个模板,这个模板来源于胡适的《梦与诗》的句子:
…醉过才知酒浓,
爱过才知情重,
你不能做我的诗,
正如
我不能做你的梦。
笔者依据词性规律转为模板:
不及物动词+“过才知”+名词+形容词
不及物动词+“过才知”+名词+形容词
名词A+“不能做”+名词B+的+名词
“正如”
名词B+“不能做”+名词A+的+名词
下面笔者来选取素材,笔者将尼采的《扎拉图斯特拉如是说》任取一页,291页,假设笔者的人工智能程序能够严格按顺序识别出符合词性的词语作为模板素材:
不及物动词:呼啸
名词:海面
形容词:炎热
不及物动词:长吁短叹
名词:牙齿
形容词:聪明
名词A:恣意
名词B:好意
名词:冬天
名词:寒风
套入模板,生成诗句A:
呼啸过才知海面炎热
长吁短叹过才知牙齿聪明
恣意不能做好意的冬天
正如
好意不能做恣意的寒风
下面笔者再来选取另一素材,笔者将《格林童话》任取一页,89页,人工智能程序严格按顺序截取符合词性的词语作为模板素材:
不及物动词:等候
名词:莴苣
形容词:野
不及物动词:爬
名词:塔顶
形容词:野
名词A:女人
名词B:面容
名词:眼睛
名词:怒火
套入模板,生成诗句B:
等候过才知莴苣野
爬过才知塔顶野
女人不能做面容的眼睛
正如
面容不能做女人的怒火
诗句A的第一、二句都相当“成功”。“呼啸过才知海面炎热”,虽然诗句没有写主语,但通过呼啸、海面两个词语,可以推测其描述的是海风。海风知道海面的炎热,使用了拟人的手法。而“呼啸”又充满了动感、力量感,似乎告诉我们要体会热带海面的温度,要像海风一样充满激情地去呼啸、去领略。“长吁短叹过才知牙齿聪明”,则告诉我们,要声情并茂地去说话才能领会语言在人的齿间所能产生的魅力。
笔者作为这个写诗程序的设计者和使用者,虽然在程序的设计中有所思考和选择,但在写诗程序运行前,在脑海中完全没有形成诗句所体现出的思想和表达。写诗程序依据素材运行后,两段文字符号段落形成,才能读出思想了。所以,由于笔者并没有形成这些诗句的思想,笔者对人工智能程序的使用,并非是作为著作权法上所说的“创作”工具使用,而是作为“生产”工具来使用。
此外,程序依据素材的不同,产生了诗句A和诗句B,如果人工智能程序是作为我的创作工具使用,必然依赖于我“每次”的创作思想和独创性表达。但事实上,我仅在设计程序时对程序进行了“一次”思考,此后程序产生不同文字段落完全是因素材的不同而导致的,我并没有进行创作,也说明人工智能程序不是我创作诗的工具,而是“生产”工具。
结 论
笔者认为,由于人工智能程序生成文字符号段落时,没有人类在脑海中思考形成其所要表达的文字的过程,因此不能说人工智能程序是人类的“创作”工具。上面两个例子也说明,人工智能程序生成文字具有“生产”属性。而《著作权法》保护的是人类的创作,保护人类的独创性表达,所以用《著作权法》来保护人工智能“生产”的文字,使得其获得与“人类创作”同样的保护理由和同等的保护力度,并不合理。
(图片来源 | 网络)