观韬视点 | 一文详解DeepSeek等大模型AI生成内容相关著作权法律问题及案例
作者:李嘉颖 徐荣元
前言:2022年11月30日,在2018年初代GPT-1的基础上经过历次升级和迭代之后,OpenAI终于推出基于GPT-3.5语言技术的ChatGPT,该模型掌握多门语言,并可根据用户需求动态生成语境相关的智能回复,让生成式人工智能(Artificial Intelligence,通常简称为“AI”)逐渐进入普通公众的视野。
2024年12底,DeepSeek的发布再次引发国内外人工智能领域的高度关注与热烈讨论,其流畅的逻辑思维以及深度思考能力,不仅展现了人工智能技术在创新应用方面的巨大潜力,也重新点燃了科技界与法律界关于人工智能与版权保护之间平衡的讨论。自ChatGPT问世以来,生成式人工智能生成内容的著作权问题在司法界与理论界经历了多轮探讨。2025年1月,美国版权局发布《版权与人工智能,第二部分:可版权性报告》(Copyright and Artificial Intelligence, Part 2 Copyrightability Report)(以下简称“报告”),报告表示,反复修改提示词无法作为使用者对输出内容拥有版权的充分依据。用户多次修改并提交提示词,相当于在 “重新掷骰子”(“re-rolling” the dice),没有改变使用者对创作过程的控制程度。无论提示词被修改并重新提交多少次,最终的输出内容所反映的是用户对人工智能系统解读结果的认可,而不是用户对其中所包含表达的作者身份归属。基于上述背景,本篇文章将结合现有生成式人工智能应用的用户协议、司法案例、法学理论等对AI生成内容的著作权问题进行初步探讨。
一、现有大模型AI应用用户协议规定
目前,国际上比较通行的做法是在用户协议中明确约定生成内容的著作权归属。比如,ChatGPT在其服务协议“CONTENT”部分中明确约定使用ChatGPT所生成的内容一切权利均归属于使用者。
在立法层面,中国并未就人工智能生成内容的权利归属作出明确规定,但是,根据《生成式人工智能服务管理暂行办法》第九条的规定:“提供者应当与注册其服务的生成式人工智能服务使用者签订服务协议,明确双方权利义务。”因此,在通常情况下,人工智能生成内容的权利归属需要参考用户协议的约定内容。
从应用层面而言,中国多数大模型AI应用服务协议针对生成内容的权利归属进行了规定,下面以DeepSeek、豆包与kimi的用户协议为例。
● DeepSeek
“4.2 在符合法律规定和我们的条款的条件下,您对本服务的输入与输出享有以下权利:(1)您保留在提交的输入中拥有的任何权利、所有权和利益(如有);(2)我们将本服务输出的内容的任何权利、所有权和利益(如有)归属于您。(3)您可将本服务的输入与输出应用于广泛的使用场景中,包括个人使用、学术研究、衍生产品开发、训练其他模型(如模型蒸馏)等。”
● 豆包
“8.1 在你使用本软件及相关服务期间,你可以向本软件及相关服务提交文本、音频或其他内容或信息(合称“输入”),并接收响应你的输入而生成的内容(称“输出”、“生成”)。在你和公司之间,在适用法律允许的范围内,你提供的输入的知识产权归属于你或者依法享有这些知识产权的权利人。公司不主张输出内容的所有权。如果输入和/或输出本身包含了公司享有知识产权或其他合法权益的内容,则前述输入和/或输出的相应权利仍由公司享有,不因包含在输出当中而改变其权属。”
● Kimi
“您基于 Kimi 智能助手生成的内容的版权由您自行维护并对其独立判断后使用,基于 Kimi 智能助手生成内容产生的任何知识产权问题由您自行处理,北京月之暗面科技有限公司对由此造成的任何损失不负责任,您由此给北京月之暗面科技有限公司造成损失的北京月之暗面科技有限公司有权向您追偿。”
从上述用户协议可以看出,部分大模型AI应用在输出内容的著作权归属中,用语较为模糊,例如,仅使用“权利”或“所有权”一词,而未明确使用“著作权”一词,对于生成的内容是否享有版权等未予以明确肯定。部分大模型AI应用则直接将输出内容的知识产权归属于用户,但同时约定用户不得进行商业性使用等。然而,在实际应用中,如果遇到权利纠纷,用户协议中的约定并非当然作为权利归属的依据,还需由法官结合案件的具体情况,例如使用者的创作过程、智力投入等,判断生成内容的权利归属。
二、生成式人工智能案件解读
目前,我国司法实践中已经出现了使用者以其生成内容主张维权的案例,以下将以三个典型案例为例,分析法院的认定思路:
● 《伴心》案——(2024)苏0581民初6697号
基本事实:原告利用Midjourney与Photoshop制作图片《伴心》,后发布在小红书平台,并在国家版权局将该作品登记为美术作品。创作过程为在Midjourney上通过不断修改提示词生成图片,并通过Photoshop进行编辑。被告在小红书等媒体上发布与《伴心》高度相似的图片,原告认为被告的图片与其美术作品实质性相似,构成侵权。此外,Midjourney软件服务条款显示,除例外情况外,根据适用法律,用户在最大范围内拥有其使用服务创建的所有资产。
法院认为:案涉《伴心》图以城市、水面、建筑、爱心及水中倒影为主要元素,在场景、环境、色彩、光影、角度及其排列组合等方面,体现了作者独特的选择与安排,具有独创性,构成著作权法意义上的美术作品,应受到著作权法保护。
● 王某诉武汉某科技有限公司案——(2024)鄂0192知民初968号
案件事实:原告系某人工智能生成内容创作者,其将生成内容发布至小红书,后发现被告通过抖音账号发布AI绘画训练营广告,用于AI绘画授课。该广告中引用图片与被诉图片一致。
法院认为:原告使用的关键词均与画面的元素及效果对应,生成的图片和原告的创作活动之间具有一定的“映射性”。在原告设置调整关键词、参数、风格光影效果并挑选图片最终获得被诉图片的过程中,原告对生成作品具有一定程度的“控制和预见”,创作过程反映了原告的构思、创作技法、审美选择,体现了原告的个性化表达。故,被诉图片凝结了原告的智力劳动成果,应予保护。原告为被诉图片的作者及著作权人,有权提起本案诉讼。
● “春风送来了温柔”案——(2023)京0491民初11279号
案件事实:原告通过Stable Diffusion生成一张图片,后将图片上传至小红书,发布内容标题为“春风送来了温柔”。被告在未经授权的情况下,在某账号文章中使用原告图片作为配图并截去了案涉图片上的水印。原告认为被告侵犯了原告对生成作品的署名权以及信息网络传播权。
法院认为:从涉案图片生成过程来看,一方面,虽然原告并没有动笔去画具体的线条,但是,原告对于人物及其呈现方式等画面元素通过提示词进行了设计,对于画面布局构图等通过参数进行了设置,体现了原告的选择和安排。另一方面,原告通过输入提示词、设置相关参数,获得了第一张图片后,其继续增加提示词、修改参数,不断调整修正,最终获得了涉案图片,这一调整修正过程亦体现了原告的审美选择和个性判断。总结而言,人工智能生成图片,只要能体现出人的独创性智力投入,就应当被认定为作品,受到著作权法保护。
从上述案件的法院判决综合分析可得出,目前,中国司法界对于生成式人工智能生成内容能否构成作品,总体上持肯定态度,但需满足一定的条件。具体而言,司法实践主要关注生成内容是否具有“独创性”,在论证独创性的过程中,认为使用者在利用AI生成内容时,其输入的指令必须能够体现使用者自身的选择和安排,并且对输出内容具有表达性的贡献,用户的指令越丰富、越详细,则生成内容构成作品的可能性越大。如果生成内容系完全由AI生成,没有使用者的创造性投入,则不太容易被认定为属于著作权法中的作品。
三、生成式人工智能生成内容的法理分析
一个作品能否构成著作权法意义上的“作品”从而受到著作权法的保护,需要从主体与客体两个维度进行考量。生成式人工智能产物能否成为著作权法意义上的作品,实际上涉及三个核心问题,其本质也是围绕主体与客体展开:(1)生成内容是否构成著作权法意义上的作品;(2)如果构成,谁应当成为作品的作者;(3)如果构成,则属于作品类别中的哪一类作品。鉴于问题(3)较为复杂,考虑到文章篇幅原因,本篇文章将重点聚焦于前两个问题进行分析。
(一)生成内容是否构成著作权法意义上的作品
《著作权法》第三条规定“作品,是指文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果”。该条对作品的定义可以拆解成四部分:(1)文学、艺术和科学领域;(2)以一定形式表现;(3)智力成果;(4)独创性。目前,对于(1)(2)(3)而言,司法界与学术界争议较少,主要是围绕生成内容是否具备(4)进行展开。
作品的独创性,系指作者于创作过程中注入的特定的智力劳动,进而使所创作之作品具备最低限度的创造性[1]。独创性是著作权客体的重要组成部分,没有独创性,则作品不受到著作权法保护。独,并非指独特、首创,而是指由作者独立完成,即便两个人创作出相同的作品,只要两个人系独立完成,则均受到著作权法所保护;创,是指作品应当是智力性创造的结果。从此出发,分析生成内容是否具备独创性。根据前文分析,司法实践目前的主流观点是生成内容是否具有独创性取决于使用者指令的输入。如果输入的指令足够详细,能够体现输入者的构思、审美偏好、个性化选择,则生成内容能够受到输入者的控制,系输入者在引导AI进行创作,此时,生成内容具备独创性。从现有的AI生成内容的输出过程出发,大部分使用者为呈现出完美的作品,一般会对输入指令进行反复的修改与调试。例如,Boris Eldagsen在创作《虚妄记忆:电工》(PSEUDOMNESIA: The Electrician)时,对于输入的文字提示进行了细致的描述,例如人物的表情、创作艺术时期、镜头类型、光圈、分辨率等,整个内容生成过程涉及20个调试与修改步骤,如图1所示。前文所述的《伴心》案中,原告亦是通过不断修改关键词等生成江边爱心气球的夜景图片。
图1 《虚妄记忆:电工》创作过程;All images © Boris Eldagsen[2]
在此情形下,部分观点认为AI与日常使用的照相机、Photoshop等工具相似,在内容的生成过程中,本质上是人利用工具在进行内容创作,“整个创作过程中进行智力投入的是人而非人工智能模型”[3]。因此,如果使用者对生成内容进行了创作性的投入,作品的生成能够体现使用者独特的选择与安排,则具有独创性,构成著作权法意义上的作品。
然而,此观点存在一定的问题。用户是否能够控制输出的内容存在疑问。比如,笔者通过某AI软件,连续三次输入指令:“请生成一张可爱小狗的图片。要求:身体的颜色是黄色,鼻子的颜色是棕色,眼睛圆而大,四肢短小,尾巴弯曲,正对着主人微笑”,其结果如图2所示,尽管每一张图片均符合指令的要求,但每一次均给出了不同的小狗图片。
图2 连续三次输入指令时的输出结果
以生成文字内容为主的ChatGPT、DeepSeek等AI大模型亦是如此,尽管被赋予相同的文字指令,要求它们产出一段文学作品或文字内容,但每次的产出内容具有一定的随机性与差异性,并不能受到用户指令的直接控制,用户对于产出内容的认可与其说是在“创作”,不如说是在“选择”。
可以发现,目前人类主体对于AI的输出结果其实并不具备完全的控制性。正如美国版权局的报告所言,这一过程更像是在 “重新掷骰子”(“re-rolling” the dice),用户输入的指令实则是其思想的具象化体现,而人工智能生成的结果只不过是在用户限定的框架范围内随机生成,仅通过提示词的输入,用户难以对AI生成内容的表达性元素进行实质性干预。正如华东政法大学王迁教授举例所言,美术老师向30名学生布置了一个绘画作业,并就该绘画作业提出了一系列详细的要求,此时,美术老师自然不是该30幅美术作品的作者,其细致的要求相对于学生而言本质上属于“思想-表达”二分法中的思想[4],而思想并不受著作权法保护。在著作权法语境下,创作工具仅能作为实现创作者意志所决定作品的表达性要素的消极工具,而不能实质性地介入作品表达性要素的决策环节[5]。然而,在生成式人工智能生成内容的过程中,无论是技术背后的研发者,还是输入提示词的用户,都无法决定生成式人工智能自行产生的内容,作品产生的表达性要素实际上是由生成式AI应用自动生成,已经脱离了人类创作者的直接控制范围。
那么,到底什么样的AI作品才属于著作权法保护的作品?结合美国版权局的报告,笔者认为至少下述三类AI作品可受到著作权法保护:
(1)以自身具有版权的作品进行投喂,输出内容具有原版权作品的表达性要素。此时的投喂与单纯的输入指令不同,并非是传递创作的思想,而是进行表达性投入,能够对生成内容产生实质性的干预与影响。而对于生成的内容,作者也并非是对整个创作作品享有版权,而是要排除作品中非人类主体的表达元素。正如报告中的例子所示(见图3),使用者输入的作品本身就是受版权保护的作品,而该作品中具有表达性的元素也在输出结果中是清晰可辨的,例如其中的鼻子。嘴巴、面具的轮廓等。此时,使用者至少是新作品中这些能够被识别的表达性要素的作者,但对于其中人工智能生成的元素并不享有版权。
图3 源自美国版权局《版权与人工智能,第二部分:可版权性报告》
(2)在AI生成内容之后,由用户自身再次进行能够体现使用者表达性要素的编辑。此时,AI相当于为作者提供了一个“底稿”,而作者通过后续的编辑行为,对AI生成内容进行了创造性的编排,是智力劳动的投入,因此,作者同样对该作品享有著作权,但也应当排除其中的非人类表达性要素。
(3)人工智能生成内容系作为作品的一部分存在,作者仍可就整个作品主张著作权。此时的生成内容并不影响作者对于整体作品表达性要素的塑造,整体作品仍然能够体现作者的选择、编排和设计,因此,作者对于整个作品仍享有著作权。
(二)谁应当成为生成内容的作者
在探讨了生成内容是否构成作品后,接下来需要明确谁应当是生成内容的作者。目前,理论界主要有两种流派,一种是认为人工智能存在被认定为“作者”的可能性。有学者主张,人工智能在创作过程中表现了相当的自主性,具有事实作者的一般特征,可以拟制承认其作者身份,但不必赋予其著作权人资格[6]。另一种是认为著作权要坚守人类作者中心主义,只有自然人才能成为作者。笔者认同第二种观点。
首先,《著作权法》第十一条规定,创作作品的自然人是作者。即作者必须是自然人,该法条背后实际上是体现了人类作者中心主义的色彩。作者中心主义可追溯至法国大革命时期,与美国等版权体系国家不同,法国作为典型的作者权体系国家,认为作者是作品的创造者,同时也是作者人格的体现,作者权则是人的自然权利[7]。“人是目的”,尽管现有的生成式人工智能可以创作出类似人类创作的作品,且此类作品也能够传达出一定的思想、情感,但是该创作的过程从本质上而言是既定程序算法的逻辑性输出,并不存在类似于人类的思考,产生的作品也不会承载着人类的人格。作为具有强烈人身属性的作品,其价值不仅在于所呈现的外在形式与传达内容,更在于创作主体在作品中所付出的智力劳动与独立思考,人工智能恰恰基于其本质属性在这方面无法企及。
其次,从著作权法的立法目的出发。知识产权的目的在于借助激励创造以此推动学习、创新和知识传播,从而服务于公共利益,并确保社会资源在价值层面实现高效的分配和利用[8]。《著作权法》第一条也对此予以明晰,并通过赋予作者与传播者一系列的专有权利以维护其对于作品创作与传播的贡献。反观人工智能,无论是作为应用软件、模型,还是算法,其本身没有内在的创作动机与需求,其进行作品的创作实则是来自于人类的创作需求,基于人类的指令输入而触发既定的预设程序,进而产生出非自主意识生成的作品。因此,如果赋予人工智能以作者的地位,并不会产生激励创作的作用,反而导致那些真正投入创造性劳动的人类创作者的权益被边缘化。不论是否赋予人工智能主体地位,都不会改变人工智能的“创作热情”。
最后,结合上文对何种AI生成内容属于作品的分析。笔者认为,对于符合作品要件的AI生成内容,应当由创作生成内容的使用者成为作者,因为作品的独创性以及表达性要素均由使用者提供,应当对使用者的智力投入予以保护。其次,在认定作者身份后,还需考虑谁是“著作权人”。“著作权人”与“作者”并非等同概念,作者仅能够是自然人,而著作权人则除自然人外,还包括法人与非法人组织。此时,需结合AI生成应用的用户协议中关于权利归属的约定,并结合案件具体情况,判断谁是著作权人。
结语
如今,生成式人工智能应用已广泛分布于各行各业,逐渐成为提高工作效率、优化服务体验的高科技工具。回顾历史,录音机、照相机、云存储等技术工具的出现,始终伴随着著作权法律的适应与调整。每一次技术变革,都为法律体系带来新的挑战,促使法律不断调试与完善。生成式人工智能的兴起同样如此。DeepSeek-R1的发布,再次彰显了国产大模型AI技术革新与进步的惊人潜力,它所生成的内容无论是在风格、逻辑,还是在情感表达上都与人类创作的作品极为接近,并且在技术性能上对标和追赶OpenAI的ChatGPT o1。面对海量的生成内容,如何在保障公众文化创新和创作权益的同时,推动技术的有序发展,成为一大难题。本文对生成式人工智能生成内容著作权法律问题和案例做初步探讨,未来,随着法律与技术之间互动关系的逐渐深化,AI生成内容上下游相关的著作权保护问题或许还将面临更多挑战与机遇,对此前沿领域,我们也将持续关注和研究。
参考文献
[1]李明德,许超:《著作权法》(第三版),法律出版社2023年版,第31页。
[2]https://talking-pictures.online/2023/04/01/boris-eldagsen-the-woman-who-never-was/,访问日期2025-02-25。
[3]北京互联网法院(2023)京0491民初11279号民事判决书。
[4]王迁:《知识产权法教程》(第八版),中国人民大学出版社2024年版,第68页。
[5]朱阁,崔国斌,王迁,张湖月:《人工智能生成的内容(AIGC)受著作权法保护吗》,载《中国法律评论》2024年第3期,第7页。
[6]吴汉东:《论人工智能生成内容的可版权性:实务、法理与制度》,载《中国法律评论》2024年第3期,第121页。
[7]林秀芹,刘文献:《作者中心主义及其合法性危机——基于作者权体系的哲学考察》,载《云南师范大学学报》(哲学社会科学版)2015年第2期,第84-85页。
[8]周贺微:《著作权法激励理论研究》,中国政法大学出版社2017年版,第14页。