观韬视点 | 企业大模型落地合规实践(一)——大模型采购合同要点
作者:王渝伟 杨欣如 周丹
【前言】
随着生成式人工智能大模型的快速迭代,企业界对其潜在的业务赋能能力予以极大的关注,尤其是部分自身并不具备大模型研发能力的企业,已经开始积极探索将市场上现有的通用大模型能力整合进自身业务场景的模式。这种整合模式不仅有助于拓展员工的知识边界,还能够显著提升工作效率和业务流程的智能化水平。展望未来,大模型在企业对外业务场景中的应用潜力巨大,预计能够为企业创造更多的商业价值,并推动大模型技术向更高层次的精准性和智能化发展。然而,随着大模型技术的广泛应用,企业也不可避免地面临着一系列复杂的法律合规挑战。
本系列文章将结合团队的实务经验,深入分析企业在应用大模型过程中可能遇到的法律问题,旨在为企业构建一个既合规又稳健的大模型应用框架。这将帮助企业在充分利用大模型技术带来的优势的同时,有效识别和管理潜在的法律风险,确保企业的长期稳定发展。
一、大模型应用方法论:RAG
目前大模型应用落地最常用的一种方法论:RAG,即增强检索。企业可以将所拥有的知识和私有化的知识库与大模型能力结合,将大模型能力集成到企业自身应用中,从而解决企业场景化的问题。对于绝大多数企业而言,自行训练大型模型不具有现实条件且没有必要。训练大模型存在成本过高、技术能力缺乏、数据参数不足等难题。在此背景下,采购市面上较为成熟的基础大模型,比如百度的文心、腾讯的混元以及讯飞的星火等,通过调用API的方式,来实现业务需求就成为越来越多企业的选择。
为确保通用大模型的输出内容尽可能地符合业务需求和企业预期,通常企业在采购基础大模型API服务的同时,还会采购大模型相关的配套产品与服务。本文将关注大模型采购中合同条款的拟定和签约主体的安排,以期通过对合同关键要点的探讨,为企业提供把控风险的思路。
二、大模型采购合同的关注要点
基于国内生成式人工智能服务相关的监管要求,相较于通常的产品、服务采购,大模型的采购需要特别关注与人工智能生成技术、数据等紧密相关的合规条款。对此,我们根据目前主要的监管规定以及业务实践,筛选、整理了在审核大模型采购合同时需要特别关注的条款。
(一)关于交付模型要求的条款
目前,相关监管规定中规制的对象通常是“模型服务提供者”,然而在实践中,尤其是服务提供者与技术支持者为不同主体的情况下,由于基础大模型的投入成本高、算法难度大,企业通常会选择直接以API调用大模型能力并对外提供服务,或者在此基础上,结合垂直领域需求对提示词进行优化后再对外提供服务,通过借助大模型通识能力更好地契合业务场景,但基本上不会对模型本身的算法或技术特征进行调整。也即,企业要确保模型相关合规义务的落实,更多取决于基础模型供应商侧的响应能力。因此,企业在大模型采购合同中需要事先列明交付模型应满足的合规要求。
结合监管规定,此类义务通常涉及与模型技术、算法等密切相关的方面,例如在合同中可以要求供应商通过设置敏感词库等方式确保其所提供的模型可以识别违法和不良信息,并确保相关网络日志的记录和留存。同时,合同中可以要求供应商提供的模型能够支持内容标识,以提醒公众注意深度合成技术的存在。除此之外,根据企业特定的业务需求,可以要求对模型的响应范围或功能进行定制,例如限制模型回答与企业业务无关的问题等。
除静态合规外,企业还应考虑动态合规性,即当监管要求或企业需求发生变化时,供应商应能够及时调整模型的算法、特征库等,以确保持续符合最新的规定和需求。
(二)关于协助履行义务的条款
如前所述,模型服务提供者通常并不都具备训练或调整模型的能力。因此,监管规定涉及服务提供者履行的部分义务仍需技术支持者协助后方可落实,对于此类协助义务,建议企业在采购合同中予以一并列明。
结合监管规定,此类协助履行义务可能涉及协助模型备案、用户实名认证、个人信息主体权利响应、违法内容监测与处罚措施等。例如基于算法备案的要求,企业在进行备案时如需基础模型供应商提供相关技术或算法描述的,应当事先进行相关条款安排。同时,在合同中可以要求由基础模型供应商协助提供违法内容识别、阻拦以及相应的账户限制功能。
除此之外,在采购协议中可以视情况安排舆情条款,例如因模型自身原因导致企业被监管问询、处罚或负面舆情的,基础模型供应商应当配合审计、消除相关影响等。
(三)关于服务稳定性的条款
对于企业而言,如无法保障模型提供服务的稳定性,可能会给企业的经济利益和服务口碑带来较大损失。特别是对于考虑接入境外大模型的企业而言,由于部分大模型的服务器部署于境外,通过API接口交互的数据必须在服务器进行备份缓存,因此涉及数据跨境相关风险。其次,如企业选择使用未备案境外大模型的,在未来面临监管要求收紧的情况下,可能会导致相关服务中断,影响服务的正常使用。
对此,除了在选择基础模型供应商时应予以特别考量外,企业在模型采购合同中也应当安排相关条款,例如在合同中明确大模型应已履行境内的备案等行政手续,具备相关资质,又如在服务中断或稳定性问题出现时,应要求基础模型供应商能够迅速响应,对服务进行恢复或启用备用模型,以确保服务稳定运行。
(四)关于数据保护与应用限制的条款
就目前普遍采取的API调用方式而言,在企业调用模型的过程中,基础模型供应商端需要存储相关交互数据以进行响应,而在模型交互过程中,尤其是面向C端提供模型服务的场景,交互内容中可能会不可避免地包含个人的信息甚至是敏感信息,因此,在合同中需要约定基础模型供应商对于数据采取的技术保护措施,例如采取加密方式、数据访问控制措施等,以确保数据传输的安全性。
同时,基于业务保护或商业秘密的考量,企业应当在协议中禁止基础模型供应商使用这部分数据进行二次加工或模型训练,以避免业务内容或商业秘密的泄漏。
(五)关于知识产权保护的条款
知识产权作为企业的重要无形资产,合同双方应当就采购涉及的大模型及其配套产品的授权使用以及定制开发新形成的成果物知识产权归属问题予以明确约定。
1. 关于大模型及其配套产品的授权使用
大模型的知识产权及其配套产品的知识产权通常归属于产品/服务提供方所有,因此企业在采购合同中应当明确约定大模型及其配套产品的授权使用问题。双方需就授权的对象、使用范围、使用期限等方面予以明确,确保该授权合法有效,以保障企业在业务需求范围内合法使用。目前,部分大模型供应商建立了AI开放平台,如智谱清言建立有“智谱AI开放平台”,企业可以通过同意该线上平台的《用户协议》等,实现大模型的API接口的线上下单和签约。企业应当特别注意相关条款对大模型授权使用方面的限制,确保企业可在业务需求范围内合法使用。
2. 关于定制开发新形成的成果物的知识产权归属
若企业对于大模型及其配套产品存在定制开发的情形,对于定制开发产生的成果物,建议企业在合同中明确其知识产权归属。通常而言,为确保企业对定制开发部分智力成果的投入得到保护,企业应当明确对于定制开发新形成的智力成果,其知识产权归属企业所有。
实践中,可能会存在定制开发形成的智力成果与大模型或者大模型配套产品不可分割的情形,从而导致其无法单独作为知识产权保护对象。为保障企业关于定制开发形成的智力成果的权益,合同应当具体约定针对定制开发部分的成果物的知识产权权利行使限制,如未经甲方授权同意,乙方不得将定制开发部分的成果物授权给第三人使用,乙方自身也不得使用。
三、与合同签订主体相关的特殊情形
从规制主体的视角来审视生成式人工智能服务相关监管规定,《生成式人工智能服务管理办法》规定了“生成式人工智能服务提供者”和“服务使用者”,《互联网信息服务深度合成管理规定》中规定了“深度合成服务提供者”“服务使用者”和“技术支持者”,而《互联网信息服务算法推荐管理规定》中规定了“算法推荐服务提供者”。综上,我们不难发现生成式人工智能服务场景下通常涉及三个基础主体:技术支持者、服务提供者以及服务使用者。
企业在采购生成式AI产品或服务时,可能会采取不同的采购模式。企业直接向基础模型供应商采购的场景中采用的为“服务提供者-技术支持者”的采购模式。然而,在实际操作中,企业可能不会直接与基础模型供应商签订合同,而是通过第三方来采购模型,例如技术总包商或模型整合平台等。在这种情况下,企业应特别注意以下风险与限制:
(1)合同相对性限制:基于合同相对性原则,即便企业在与第三方的协议中约定了基础模型供应商的相关义务内容,基于合同的相对性,如义务未能履行,企业也仅能追究第三方的相关违约责任。对此,企业可以在与第三方的协议中约定,要求第三方在与基础模型供应商的合同中添加相关义务条款,以确保相关义务得以落实。除此之外,结合前文分析,考虑到部分义务能否实际履行与基础模型供应商之间密切相关,因此,协议还应在转委托相关条款中明确约定受托主体,以防出现因第三方擅自更换基础模型供应商而导致相关义务无法履行的风险。
(2)开放平台规则限制:如涉及第三方通过开放平台调用模型的,企业还应确认其开放平台规则的相关限制条款,例如某平台在其发布的《用户协议》中,约定“为了改善我们向您提供的产品和服务的质量,我们可能利用您使用大模型平台或平台内模型过程中产生的数据,定位、维护和优化我们的产品和服务,但是您与XX(本平台)另有约定的除外。”这意味着,如果企业与第三方的合同中并未明确约定数据使用的目的、方式和范围,那么模型交互数据可能会被平台用于二次训练,这可能引发企业商业秘密泄露或个人信息保护不当的风险,因此,如企业不希望交互数据被用于二次训练的,应当事前查阅相关平台条款并进行例外约定。