AI提示词的著作权定性——人工智能背景下思想/表达二分法的探究
作者 | 颜伯儒 上海融力天闻律师事务所
张一超 上海融力天闻(太仓)律师事务所
人工智能技术的迅猛发展,特别是生成式人工智能在文艺创作领域的广泛应用,正深刻重塑着创作行为的范式、流程与生态。创作者的角色,从全程亲力亲为的执行者,逐渐转变为提出核心创意、设定美学方向、并进行最终甄别与把控的主导者。这种转变使得艺术创意能更高效、便捷地转化为内容产品,但也因产品数量的激增而面临艺术性和原创性等考验。
这一变革的核心驱动力之一,便是“提示词”的出现和普及。用户通过在人工智能端口界面输入简短的文本指令,即可启动智能化的写作、作曲、作图等过程。这使得创作的门槛显著降低,“人人皆可创作”在技术上成为可能。然而,这种便捷性也带来了新的问题:当创作的关键环节很大程度上简化为对AI模型的指令输入时,这种提示词本身的法律属性,尤其是其在著作权法体系中的地位,便成为一个亟待厘清的焦点议题。它究竟是人类独创性思想的简单传达,还是一种足以构成著作权法保护的“表达”?
近日,上海市黄浦区人民法院对上海首例涉AI提示词著作权侵权案作出一审判决,该案将争议核心锁定于输入端,围绕提示词是否具备作品独创性、是否属于“表达”等问题展开论证。借助该案,本文旨在人工智能技术重塑创作生态的宏观背景下,聚焦“提示词”这一微观但关键的元素,深入探究其在我国著作权法下的定性问题,试图为提示词的法律地位划定清晰的边界,帮助推动新时代下的公平透明的创作生态。
一、什么是AI提示词?
人工智能提示词,作为用户与生成式人工智能模型进行交互的核心指令,可被定义为一系列经过精心设计的文字、短语或符号序列,其目的在于引导AI模型生成符合用户预期的特定内容。它如同一种面向AI的“编程语言”或“创意蓝图”,将人类模糊的创意构想,转化为机器可识别、处理和执行的精确指令。OpenAI在其官方文档中阐述,提示词是“提供给模型的输入,用以引导其生成文本、代码或其他输出”。根据生成目标的不同,AI提示词的应用主要在文生文(如ChatGPT)、文生图像(如Midjourney)、文生视频(如Sora)等。
在AI文生图的情景下,提示词主要涉及对主题、风格、细节、构图等多维度元素的综合描述。在AI文生图模型的Midjourney的官方指南中对提示词的定义如下:
提示词就是你用来告诉Midjourney你想要什么样图像的文本或短语。你的提示可以是一个单词,也可以是完整的短语。你在提示中投入的思考越多,你的图像就会越独特和有趣。因此,花点时间考虑一下你想看到什么,并用你的语言引导Midjourney的创作过程。
那么,提示词是如何工作的?其底层技术在于:文生图模型首先通过分词器将自然语言提示词拆分为token(令牌),并转化为向量数据——即文本的数学表示。这一“降维”过程将视觉语义转化为可计算的数值,模型再基于扩散等算法,通过迭代去噪逐步重建出符合提示词语义的图像。
因此,提示词本质上是一种人机交互的自然语言接口。它使人类得以用日常语言“编程”AI,大幅降低了创作的技术门槛,也使得提示词本身的法律属性——究竟是功能性的“操作指令”,还是具备独创性的“表达”——成为著作权法必须直面的新问题。
二、AI提示词著作权的境内外观点
(一)上海首例涉AI提示词著作权案
相关链接
该案中,涉案提示词内容涵盖画作的艺术风格、主体元素、材质细节等,例如Art Nouveau style illustration of Aquamarines Stygiomedusa gigantea(对应中文:新艺术风格插图——巨型海蓝宝石冥河水母),by Alphonse Maria Mucha(对应中文:阿尔丰斯·穆夏的创作风格),Ancient hand-painted manuscripts(对应中文:古代手绘手稿),Papyrus(对应中文:纸莎草),Complex and delicate jellyfish texture(对应中文:复杂细腻的水母质感),Gorgeous gold inlaid wooden picture frame(对应中文:华丽的镶金木制相框),Mirror symmetry(对应中文:镜面对称)。原告使用涉案提示词在Midjourney平台生成绘画作品,并在小红书等平台发表,并主张被告侵害了原告的著作权。
黄浦区人民法院经审理后认为,涉案六组提示词采用的基本结构为艺术风格、主体元素、材质与细节、科学语境和主要构图,本质是用户输入AI系统的指令或描述,用于引导生成特定图片。从形式上看,它们虽包含多类元素,但各元素间仅为简单罗列,缺乏语法逻辑关联;关键词组无序组合,既无层次递进,也无场景化叙事顺序。从独创性角度分析,这些提示词缺乏作者的个性化特征,所选用的艺术风格、材质细节等均属该领域常规表达,未体现作者独特的审美视角或艺术判断。同时,涉案提示词仅体现抽象的创作想法和指令集合,核心是对画面元素、艺术风格、呈现形式等的罗列与描述,这些内容更多属于抽象的创作构思,属于思想范畴。因此,涉案提示词虽反映一定的创作意图,但没有体现出作者在表达层面的个性化智力投入,不应认定为作品。原告对提示词不享有著作权,自然无权主张著作权侵权。
总的来看,黄浦法院的核心立场是:涉案的AI文生图提示词因其表达形式的碎片化、内容的常规性以及本质上的功能性指令属性,既未达到独创性表达的门槛,也主要落入“思想”而非“表达”的范畴,故不能作为作品受到著作权法保护。
其实在(2024)苏0582民初9015号判决书中,张家港市人民法院也有类似的观点:“提示词输入相对于生成式人工智能产生的内容只是思想,并非受著作权法保护的表达。简单的提示词本身不是作品。”
(二)美国《Zarya of the Dawn》漫画书案
该案中,Kristina Kashtanova申请将其创作的《Zarya of the Dawn》漫画书进行版权登记。由于该漫画书中的部分图像为Kashtanova使用AI大模型Midjourney所生成的,美国版权局仅认可该漫画书中的文本内容以及Kristina对其中文字和图像元素的选择和编排构成可予以登记的作品,美国版权局在主动剔除《Zarya Of The Dawn》中非作品性的元素保留可版权性的部分时,也并未保留提示词作为作品的一部分。
在美国版权局的文件中,曾多次对提示词的定性作出了分析。
美国版权局认为,Midjourney并不将提示视为创建特定表现结果的具体指令。因为Midjourney“无法像人类一样理解语法、句子结构或单词”,它实际上是将单词和短语“转换成更小的部分,称为标记,这些标记可以与其训练数据进行比较,然后用于生成图像”。
提示词更像是建议而非命令,类似于客户雇佣艺术家创作图像时提供的大体方向。如果Kashtanova女士委托一位视觉艺术家制作一幅包含“名为Raya的全息老年白人女性”的图像,其中“Raya有着卷曲的头发,她在宇宙飞船内”,并指示该图像具有与“星际迷航宇宙飞船”“全息影像”“辛烷渲染”“虚幻引擎”相似的氛围或风格,并且要“电影化”和“超详细”,Kashtanova女士应当不是该图像的作者。见上述第8页(提供给Midjourney的提示文本)。如果没有法律要求使作品符合雇佣作品的资格,那么作者将是接收这些指示并决定如何最好地表达它们的视觉艺术家。而如果Kashtanova女士将这些条件输入到图像搜索引擎中,她不能声称返回结果中的图像是由她“创作”的,无论它们与她的艺术构想有多么相似。
总结而言,美国版权局的核心立场是:AI提示词本身更接近于不受著作权法保护的“思想”“方法”或“功能性指令”,而非具备独创性的“表达”。因此,提示词单独不被认可为可受版权保护的作品,也不能作为用户主张对AI生成内容享有完整作者权利的基础。
三、AI提示词的著作权定性分析
尽管AI提示词在内容生成中扮演着关键角色,但综观上海黄浦区人民法院的司法判决与美国版权局的审查实践,主流观点均倾向于否定其可版权性。为进一步厘清其法律地位,下文将从“独创性”与“思想/表达二分法”两个维度,系统论述AI提示词为何难以构成著作权法意义上的作品。
(一)AI提示词不具有独创性
我国《著作权法》所称的作品,是指文学、艺术和科学领域内具有独创性并能以某种有形形式复制的智力成果。独创性是作品获得著作权法保护的首要条件,包括两个方面:一是源于作者独立创作,二是体现作者的个性选择与创造性表达。
一方面,独创性要求作品为作者独立创作,因此作品首先需要是一个创作行为的结果,我们在传统的法律分析中,往往忽略了创作行为的要素。创作是赋思想以表达的过程,人们在传统的创作过程中,例如绘画、摄影,会在自己的创作目的达成的瞬间,思想到表达的转换就完成。因此大多数的撰写、绘画过程都属于创作行为。但是AI工具的出现,切割了思想直接作用于表达的过程,人类撰写提示词的过程只是思想的具象化,是AI生成图片过程的一环。简而言之是创作的过程而不是创作的结果,撰写提示词也并非一个创作行为。创作是一种社会行为,作品是通过表达进行人类思想的传播,无论是人性的探讨,还是对生命的讴歌,意识形态等,思想的传播本质上是个体与个体之间的联动。人们通过创作,以具体的表达为载体,传递思想,进行思想间的交流,因此作品是具有人与人之间交流的社会属性的,著作权法所保护的是人的表达。但是撰写提示词的行为,仅仅是一种人机交互的行为,用于指令AI完成作画,其不具有社会属性,起不到人与人之间沟通、交流的作用。例如,在搜索引擎中输入关键词是一种人机交互行为,目的在于获取搜索结果,这些关键词本身并不构成作品。和AI文生图的区别在于,在搜索引擎中,用户不会把作品当成搜索关键词来使用,但在AI文生图中,任何语句都可以生成图片。举例而言,尽管可将“忽如一夜春风来,千树万树梨花开”这类诗句作为提示词生成图像,但该诗句本身在创作之初,其目的在于构建具有审美意涵的文学表达,而非用于引导人工智能生成视觉内容。若仅以生成图像为意图,用户完全可采用如“请生成一幅雪景图片”等功能性指令。由此可见,尽管既有作品可作为提示词使用,但专门以引导AI为目的而组织语言的过程,本质上属于一种功能性指令的构建行为,其核心在于将抽象意图转化为机器可识别的参数,并不构成著作权法意义上的创作行为。
但是,创作行为是一个主观的判断因素,我们很难从客观结果来判断一个行为是单纯的指令行为还是创作行为。
因此另一方面,独创性要求体现作者的个性选择与创造性表达来判断。
在AI辅助创作中,判断提示词是否具有独创性,应重点考察用户在提示词的设计与调整过程中是否存在实质性智力创造,并体现出个性化表达。独创性并非取决于提示词的长度或复杂度,而取决于其是否体现出创造性表达的结果。值得强调的是,人类投入必须具有“创造性而不是劳动性”,即使花费大量时间反复修改提示词,非创作活动的量的增加,并不能使结果质变为具有独创性,提示词并不会因为内容变丰富而具有独创性。
我们当然可以像写一首诗一样把提示词写出来,但彼时我们其实是在写诗,而并非在写提示词,正如美国版权局提到的Midjourney的工作原理:“Midjourney并不将提示视为创建特定表现结果的具体指令。因为Midjourney‘无法像人类一样理解语法、句子结构或单词’,它实际上是将单词和短语‘转换成更小的部分,称为标记,这些标记可以与其训练数据进行比较,然后用于生成图像’”。因此,提示词的本质还是元素的堆砌,而非具有创造性的表达。
当我们判断一段用作提示词的文本时,应首先考察其作为文字表达是否具备独创性。若其本身已达到著作权法所要求的创造性表达标准,则该文本可构成独立的文字作品,并在此前提下被用作提示词。然而,提示词本身并不会因其能够引导AI生成图像而自动转化为受保护的表达。正如上海首例涉AI提示词著作权案所示,诸如“by Alphonse Maria Mucha”“Ancient hand-painted manuscripts”等词语的简单组合,本质上仍属功能性元素的堆砌,缺乏创造性表达,因而不能构成著作权法意义上的作品。
(二)AI提示词属于“思想”而非“表达”
思想是抽象的、不受法律保护的,比如思路、观念、理论、构思、创意、概念等等,而表达是具体的、可以通过法律进行保护。即法律仅对作品的表达给予保护,而不延及思想本身。在AI生成内容的背景下,提示词是用于提示AI生成内容的短语指令,只是一种思想的具象化,思想的具象化并不一定是著作权法意义上的表达,文字是用于交流的,所以文字常作为思想用来描述现象、来介绍任何形式的作品,但这并不等于文字就完全等同于作品,在通过AI生成图片的过程中,提示词只是一种人机交流的语言,是人类思想的具象化,用于指挥AI生成图片,因此提示词不是作品,不能成为著作权客体。
四、总结
AI生成内容引发的著作权争议,无论是围绕生成图片的归属,还是提示词本身的定性,其核心都在于如何界定法律保护的边界。本文的分析表明,将AI提示词排除在作品范畴之外,并非是对技术创新的漠视,恰恰是对著作权法根本宗旨的坚守。著作权法的终极目的,在于保护那些凝聚了人类独特智慧与情感的具体表达,通过这些表达的传播与传承,激励生生不息的创作,最终汇聚成人类文明的璀璨星河。
在人工智能时代,当技术的赋能使得“思想”到“表达”的转化路径变得空前便捷与复杂时,我们更应审慎地厘清“人类智慧的贡献”究竟落在何处。将保护的重点置于具有社会交往属性、体现人格与思想深度的最终“表达”之上,而非其前端的“功能性指令”,才能避免对基础创作思路的垄断,确保知识共享与创作自由的技术根基。唯有坚持这一原则,我们方能在拥抱技术革新的同时,让人工智能真正成为拓展人类创造力的工具,而非模糊乃至削弱著作权制度激励人类智慧传承的初心。在人工智能浪潮奔涌的年代,急需拨开表象的迷雾,革弊立新、正本清源,才能最终实现技术应用与文明发展的良性互动。
知产力AI智能体点评
这篇文章聚焦生成式AI时代下提示词的法律属性争议,结合国内外司法实践与理论分析,系统论证了提示词难以构成著作权法保护对象的观点。以下从论证逻辑、实践价值与局限性三方面进行评述:
1、论证逻辑严密,层次清晰
作者以“独创性”与“思想/表达二分法”为双主线,构建了完整的分析框架。首先,通过上海黄浦法院案例与美国版权局审查实践,指出提示词多为“元素堆砌”或“功能性指令”,缺乏独创性表达所需的个性化选择与创造性编排。其次,从创作行为的社会属性切入,强调提示词本质是“人机交互指令”而非“人际交流表达”,巧妙区分了技术操作与法律意义上的创作行为。最后,回归著作权法本源,阐明保护“表达”而非“思想”的立法初衷,避免因过度保护提示词而阻碍技术普惠与知识共享。这种由个案到法理、从技术到法律的递进式论证,具有较强说服力。
2、实践指导价值显著
文章对司法裁判标准进行了可操作化的提炼:(1)独创性判断:提示词需体现“实质性智力投入”,如多轮修改参数、场景化叙事等,而非简单罗列关键词;(2)证据留存:创作者应保存提示词迭代记录、参数调整等原始数据,以证明个性化表达;(3)侵权风险规避:提示词保密可防止他人“反向工程”生成近似内容。这些建议呼应了北京、苏州等地法院对“人类智力投入”核心标准的坚持,为AI创作者提供了具体合规指引。
3、局限性与未尽议题
文章未充分探讨两类边界情形:(1)复杂提示词的例外性:若提示词本身构成独创性文本(如诗歌式指令),是否可能获得双重保护?(2)产业利益平衡:完全否定提示词保护可能削弱开发者优化模型的动力,需结合反不正当竞争法等补充规制。
总体而言,本文在技术变革与法律传统的碰撞中,清晰划定了提示词的“思想”属性边界,既捍卫了著作权法的基本原则,也为AI创作生态的规范发展提供了有益参考。未来研究可进一步结合跨国案例与产业需求,探索多元法律工具协同治理的可能路径。
(本文仅代表作者观点,不代表知产力立场)
封面来源 | Pixabay 编辑 | 有得


















