天天看点

凌赵华 | AIGC时代,企业IP合规实践及探索

作者:知产前沿
凌赵华 | AIGC时代,企业IP合规实践及探索
凌赵华 | AIGC时代,企业IP合规实践及探索
凌赵华 | AIGC时代,企业IP合规实践及探索

仲冬启幕,万象焕新。在众多人工智能知识产权界专家、IPR、律师朋友的关心与支持下,第三届知产前沿人工智能论坛(IFAF 2023)于2023年12月8日在北京海淀永泰福朋喜来登酒店顺利闭幕。

此次活动由 YIP Events & 知产前沿新媒体 & 合规Plus 联合主办,两天的大会及半天的会前研讨会以“智能时代的知识产权保护与创新价值”为主题。

凌赵华 | AIGC时代,企业IP合规实践及探索

在12月8日的论坛上,水滴公司知识产权负责人凌赵华为本次大会带来“AIGC时代,企业IP合规实践及探索”主题演讲。知产前沿现将凌老师的现场主题发言内容整理成文,供知识产权业内人士参考学习。

目次

第一部分:AIGC服务“提供者”的IP合规要求及风险应对

1.1 《生成式人工智能服务管理暂行办法》(简称《暂行办法》)对AIGC企业的要求

1.2 AIGC企业面临的著作权合规风险

1.3 针对AIGC企业的著作权合规建议

1.4 AIGC企业面临的商标合规风险

1.5 针对AIGC企业的商标合规建议

1.6 AIGC企业的专利合规风险及建议

第二部分:AIGC服务“使用者”的IP合规要求及风险应对

2.1 AIGC服务使用者的著作权合规风险及建议

2.2 AIGC生成内容使用者的著作权合规风险案例

2.3 AIGC服务使用者的其他IP合规风险及建议

第三部分:对AIGC知识产权合规治理的一点思考和建议

3.1 关于AIGC训练数据的知识产权合规治理思考

3.2 关于AIGC生成内容的知识产权合规治理思考

第一部分AIGC服务“提供者”的IP合规要求及风险应对

1.1 《生成式人工智能服务管理暂行办法》(简称《暂行办法》)对AIGC企业的要求

《暂行办法》对AIGC企业的基本要求是要尊重他人知识产权。其第四条规定:“提供和使用生成式人工智能服务,应当遵守法律、行政法规,尊重社会公德和伦理道德,遵守以下规定:......1、尊重知识产权、商业道德,保守商业秘密,不得利用算法、数据、平台等优势,实施垄断和不正当竞争行为;2、尊重他人合法权益,不得危害他人身心健康,不得侵害他人肖像权、 名誉权、荣誉权、隐私权和个人信息权益;.......”

《暂行办法》对AIGC企业的模型训练阶段的具体要求体现在第七条:“生成式人工智能服务提供者(以下称提供者)应当依法开展预训练、优化训练等训练数据处理活动,遵守以下规定:1、使用具有合法来源的数据和基础模型;2、涉及知识产权的,不得侵害他人依法享有的知识产权;3、涉及个人信息的,应当取得个人同意或者符合法律、行政法规规定的其他情形;......”

《暂行办法》对AIGC企业的内容生成阶段的具体要求体现在第九条:“提供者应当依法承担网络信息内容生产者责任,履行网络信息安全义务。涉及个人信息的,依法承担个人信息处理者责任,履行个人信息保护义务。提供者应当与注册其服务的生成式人工智能服务使用者(以下称使用者)签订服务协议,明确双方权利义务。”

1.2 AIGC企业面临的著作权合规风险

1.2.1 AIGC企业存在著作权风险归类

AIGC企业存在著作权风险的阶段仍然主要是模型训练和内容产生阶段。模型训练阶段就是训练数据、基础模型带来的风险,例如作品复制权侵权风险、违反作品CC协议风险、违反代码开源许可证风险、违反开源模型许可协议风险等。内容生产阶段主要是AI生成物的著作权合规风险,例如生成物侵犯作品复制权、改编权、汇编权、翻译权、信息网络传播权等风险。

凌赵华 | AIGC时代,企业IP合规实践及探索

1.2.2 AIGC大模型训练常用数据集(数据源)

AIGC大模型训练常用数据集(数据源)及其功能有以下几种:

1、CommonCrawl(免费商用,遵守ToU):网站抓取的2008年至今的超大型数据集,包含原始网页等(网页类);

2、Wikipedia(遵守CC-BY-SA-4.0协议):维基百科网站数据集,百科知识内容涵盖全世界20多种语言(百科类);

3、Github(遵守开源许可证):GitHub公共数据集,只保留在Apache、BSD和MIT许可证下发布的项目(代码类);

4、Gutenberg & Books3(遵守ToU):Gutenberg为公共领域的书籍,Books3也是书籍类公开数据集(书籍类);

5、ArXiv(遵守CC协议):免费的在线论文预印本数据集,包含了240多万篇学术论文,非同行评议型期刊(论文类);

6、Stack Exchange(遵守CC-BY-SA-4.0协议):来源于Stack Overflow问答网站整理编辑的问题和答案(问答类);

7、LAION-5B(遵守CC-BY-4.0协议):包含了58.5亿个经过了CLIP模型过滤的图像-文本对的图文数据集(图像类)。

1.2.3 国外知名AIGC企业著作权类风险案例

在AIGC训练大模型时训练数据可能被认为侵犯版权,国内案例较少(近期小红书有类似纠纷,仍在立案阶段),在美国已经较多了。典型案例如下,目前仍然还未出现判决。

凌赵华 | AIGC时代,企业IP合规实践及探索

1.2.4 “合理使用”认定

(1)“合理使用”认定的中美差异

作为AIGC企业遭到起诉时,可能使用合理使用抗辩,即使用受版权保护的作品训练模型是否构成“合理使用”。“中国标准”是“三步检验法”和“封闭式列举+半兜底”:在下列情况下使用作品(规定的特殊情形),可以不经著作权人许可,不向其支付报酬,但应当指明作者姓名或者名称、作品名称,并且不得影响该作品的正常使用,也不得不合理地损害著作权人的合法权益:(一)为个人学习、研究或者欣赏…… ……(十三)法律、行政法规规定的其他情形。

“美国标准”是“四要素分析法”和开放式列举:为了批评、评论、新闻报道、教学、学术或研究等而使用作品的,……,系合理使用……。在判断作品使用行为是否构成合理使用时,需考虑的因素应当包括:

1、作品使用行为的性质和目的,这是美国法院判断的权重最高的因素;

2、被使用作品的性质;

3、被使用部分的数量和质量;

4、使用对作品潜在市场或价值的影响。

(2)中国法院对“合理使用”标准的改革

中国法院对“合理使用”现行标准进行了部分突破(借鉴了美国四要素法),由于大陆《著作权法》对权利限制进行了穷尽式的规定,同时类型过少,难以满足现实需要,最高人民法院通过发布司法政策,允许法院在审理著作权侵权纠纷时,突破《著作权法》的明文限定,认定个案中某种未经许可利用作品的行为不构成侵权。最高人民法院2011年颁布的《关于充分发挥知识产权审判职能作用推动社会主义文化大发展大繁荣和促进经济自主协调发展若干问题的意见》第8条指出:“妥当运用著作权的限制和例外规定,正确判定被诉侵权行为的合法性,……。在促进技术创新和商业发展确有必要的特殊情形下,考虑作品使用行为的性质和目的、被使用作品的性质、被使用部分的数量和质量、使用对作品潜在市场或价值的影响等因素,如果该使用行为既不与作品的正常使用相冲突,也不至于不合理地损害作者的正当利益,可以认定为合理使用。……”

(3)谷歌数字图书馆案:中美类案不类判(转换性使用?)

该案在中美都起诉了,美国法院直接通过四要素法中的第一要素认定谷歌公司的复制扫描行为具有高度转换性,以及通过第三要素认定其显示的文字数量是有限的,最终判定谷歌构成合理使用。而中国法院认为谷歌对作品的信息网络传播行为是合理使用,但其复制行为构成侵权,整体对合理使用的认定标准较高。

具体来看,北京市高级人民法院二审((2013)高民终字第1221号)认为:在《著作权法》第二十二条规定的具体情形外认定合理使用,应当从严掌握认定标准。除非使用人充分证明其使用行为构成合理使用,否则应当推定使用行为构成侵权。判断是否构成合理使用,一般应当考虑使用作品的目的和性质、受著作权保护的作品的性质、所使用部分的质量及其在整个作品中的比例和使用行为对作品现实和潜在市场及价值的影响等因素。上述考虑因素中涉及到的事实问题,应当由使用者承担举证责任。在本案中,谷歌公司仅提交证据证明中国法院对本案无管辖权,并未就复制行为是否构成合理 使用提交证据,因此其主张复制行为构成合理使用,证据不足。

而美国第二巡回法院二审(The Authors Guild v. Google, Inc.)认为:谷歌未经授权将受版权保护的书籍进行电子扫描、设立搜索功能并将上述书籍的片段在网络上显示的行为属于非侵权式的合理使用。谷歌所采取的扫描行为是高度转换性的,其显示的文字数量是有限的,而向公众提供的只言片语也不会与原作品构成竞争或替代关系。因此,即便谷歌是一家追求利润的商业公司,这也不妨碍认定谷歌数字图书馆的行为属于合理使用。

(4)AI训练是否构成转换性使用?

转换性使用是在1990年美国法官皮埃尔在《合理使用标准》一文中首次提出“转换性使用”(transformative use),并以之作为评价合理使用第一要素(使用作品的目的和特征)的方法,指出法院应当评价新作品是否是以及是在何种程度上对原作品的转换性使用,这一评价标准后来被美国最高法院采纳。

国内王迁教授对是否构成转换性使用的判定标准解读如下:

1、对原作品的使用并非为了单纯地再现原作品本身的文学、艺术价值或者实现其内在功能或目的;

2、通过增加新的美学内容、新的视角、新的理念或通过其他方式,使原作品在被使用过程中具有了新的价值、功能或性质;

3、改变了作品原先的功能或目的。

1.3 针对AIGC企业的著作权合规建议

(1)模型训练阶段

针对AIGC企业模型训练阶段的著作权合规建议,首先,建议优先使用已进入公共领域不受著作权法保护的作品和数据,包括非著作权法意义上的作品、已过了保护期的作品、作者声明永久放弃版权的作品等。

其次,可以使用开源模型、开源代码、开源数据集以及CC协议下的作品,但应尽量选择宽松型的开源许可证以及友好型的CC协议,并遵守许可协议条款。

再者,通过第三方采购训练数据,并通过协议等方式要求供应商对训练数据的知识产权提供无瑕疵担保或者不侵权保证,约定侵权责任转移条款。

再次,规范使用爬虫、Open API等技术手段获取训练数据,重点评估爬虫行为的合规性以及抓取数据行为是否破坏了网站的技术防护措施等。

再其次,谨慎使用强版权性的作品和数据,如确需使用,建议提前获取权利人的合法有效授权,并在授权范 围内合规使用。

最后,搭建有效的“作品退出机制”(opt-outs),在技术上为作品版权人提供便利的作品查询与检索机制,并允许版权人自由选择是否从训练数据库中将其版权作品删除。

(2)内容生成阶段

针对AIGC企业的内容生成阶段的著作权合规建议,第一,建立后台敏感词库,将可能导致高侵权风险的提示词(Prompt)列入该库,并据此采取技术措施对用户输入的高风险内容进行识别、审核以及屏蔽。

第二,利用版权过滤技术、图像相似度检测技术等技术手段对AI生成的高风险内容进行识别、比对、过滤以及重新生成。

第三,在服务协议、用户协议等有关文件中增加针对生成内容的权利归属约定、侵权责任承担、使用限制等条款。

最后,建立内容侵权投诉反馈渠道,对于确定的侵权内容及时采取断开链接、删除、通知使用用户等措施。

1.4 AIGC企业面临的商标合规风险

1.4.1 AIGC企业常见的商标合规风险类型及场景

(1)第一类——商标使用侵权风险

商标使用侵权风险主要有以下几种:

1、大模型、聊天机器人、AI助手等各类AIGC产品名称商标侵权;

2、APP、小程序、公众账号等名称/昵称/头像/icon商标侵权;

3、自制栏目名称、节目名称、直播间名称、官网域名商标侵权;

4、突出使用企业字号、公司简称、组织名称等商标侵权。

(2)第二类——商标一般违法风险

商标一般违法风险主要有以下几类:

1、将法律规定不得作为商标使用的标志用于产品名/品牌名中;

2、将未注册商标冒充注册商标使用,如擅自标注注册标记等;

3、自行改变注册商标标志或超出注册商标核定商品范围使用;

4、抢注热点、公共事件、他人有一定影响商标;商标恶意注册。

(3)第三类——商标不可注册风险

商标可能存在不可注册风险:

1、缺乏显著性(通用名称、型号、图形;仅表示服务内容、特点等);

2、带有欺骗性(服务内容、质量、来源等误认;名义、人物等误认);

3、有不良影响(道德、政治、经济、文化、民族、宗教、社会等);

4、有在先权利(版权、外观专利权、字号权、姓名权、肖像权、地标等)。

1.4.2 AIGC企业典型商标合规风险案例

2023年8月,OpenAI公司起诉了Open Artificial Intelligence公司及其总裁Guy Ravine,其主要诉请为请求法院判定两被告构成商标侵权及不正当竞争、构成欺诈性注册、请求法院撤销被告侵权商标“Open AI”的注册,并将被告注册的域名www.open.ai转让给原告等。然而,OpenAI公司到目前为止,仍未在美国成功注册OpenAI商标,而被告Open Artificial Intelligence公司却已成功注册了Open AI商标,被告注册的这件Open AI商标,其申请日为2015年12月11日,而这个日期恰好是OpenAI公司正式宣布成立的日子,这一新闻曾在包括《纽约时报》在内的多家媒体上广泛报道,这也是OpenAI公司指责被告欺诈性注册的理由。另外,被告的这件Open AI商标是注册在美国商标副簿(Supplemental)上的,说明USPTO也认为该商标缺乏显著性,无法直接注册在主簿上。与主簿注册商标相比,在副簿上注册的商标不需要经过异议期、权利相对不稳定,但同样可以阻止在后相同或近似商标的注册,也同样能基于该商标权利进行合法维权。总之,这个案子中还有很多值得挖掘和探讨的法律问题,我们目前也很难预测这个案子最终的走向。但无论是对OpenAI公司还是被告来说,或许和解OR收购才是最佳的双赢方案!

凌赵华 | AIGC时代,企业IP合规实践及探索
凌赵华 | AIGC时代,企业IP合规实践及探索

此外,对于AIGC产品名称来说,也存在商标可注册性的风险。例如,以下红框内的商标是否有显著性就存疑。

凌赵华 | AIGC时代,企业IP合规实践及探索

又比如,好多企业都使用了“COPILOT”作为人工智能领域的产品名称,所以单独使用“COPILOT”作为商标注册,显著性就很低。

凌赵华 | AIGC时代,企业IP合规实践及探索

1.5 针对AIGC企业的商标合规建议

针对AIGC企业的商标合规建议,主要有以下几点:

1、企业应养成商标“先注册、后使用”的良好意识习惯,把商标品牌规划工作提前到AI项目/产品开发的早期去做;

2、“专业的事交给专业的人”——品牌命名、商标保护相关工作应听取企业内知识产权法务或者外部合作服务机构的专业建议;

3、产品/品牌名称在投入使用前一定要经过专业的评估,包括商标侵权风险评估、商标一般违法风险评估和商标可注册性评估;

4、商标注册后需规范使用,应尽量避免修改商标标志使用,尤其不要改变商标主要识别部分使用,其不仅有商标一般违法风险,还有侵犯他人商标专用权风险;

5、远离商标抢注(抢注热点、抢注他人等)、不以使用为目的的商标恶意注册、商标囤积等行为。

1.6 AIGC企业的专利合规风险及建议

AIGC企业的专利合规风险,可以分为以下14个风险场景共33个风险点。

凌赵华 | AIGC时代,企业IP合规实践及探索

可以建议的是,要密切关注国内外友商的AI专利申请及授权情况,提前针对自研大模型及产品做FTO,评估专利侵权风险;合作开发中应约定前景知识产权的归属和使用方式,并约定免责条款及专利侵权责任的承担方式;谨慎评估AI模型及其应用产品的知识产权保护方式(用开源,还是闭源?核心专利是用发明专利还是商业秘密?);跟踪了解各地专利局对AI算法、模型相关专利的审查政策,根据当地规则制定相适应的专利布局策略;避免不以保护创新为目的、不以真实发明创造活动为基础的专利非正常申请行为。

第二部分AIGC服务“使用者”的IP合规要求及风险应对

2.1 AIGC服务使用者的著作权合规风险及建议

2.1.1 AIGC服务使用者的著作权风险场景

使用AIGC产品的主要版权风险场景如下:

(1)使用AIGC产品生成与他人受版权保护的作品实质相似的内容,并进行商用;

(2)直接输入他人受版权保护的作品,让AIGC产品进行修改、改编或润色;

(3)使用盗版AIGC产品或者通过非官方授权账号/API接口使用AIGC产品;

(4)使用AIGC产品时未遵守其ToU或开源许可证,或者超出其授权范围使用。

2.1.2 AIGC服务使用者的著作权风合规建议

针对上述风险场景,我们建议:

(1)AIGC生成疑似侵权内容后可进行AI微调,即通过调整Prompt/参数等重新生成内容,或直接对生 成内容进行人工调整及修改;

(2)避免直接输入他人版权作品或利用Prompt让AIGC产品输出他人版权作品(公司规范约束);

(3)通过官方渠道或合法渠道获取AIGC产品和账号;

(4)使用AIGC时严格遵守其服务协议或者其适用的开源许可证,不超出其授权使用的范围和用途。

2.2 AIGC生成内容使用者的著作权合规风险案例

1、国内AIGC生成图片著作权侵权第一案【(2023)京0491民初11279号】

本案件基本时间线如下:

  • 2023年2月24日,原告使用AI软件Stable Diffusion通过输入提示词的方式生成了涉案AI图片,并于2月26日发布于小红书平台,并打上了“AI插画”等标签。
  • 3月2日,被告在百家号平台上发表了一首原创诗歌,其中未经原告许可使用了涉案AI图片作为配图之一,并截去了原告在小红书平台的署名水印。
  • 5月25日,北京互联网法院就原告起诉被告侵害作品署名权及信息网络传播权纠纷一案正式立案。
  • 8月24日,法院公开开庭审理此案,并对庭审过程进行了直播,引起业内广泛关注。
  • 11月27日,法院一审判决认定被告构成侵权,判令被告赔礼道歉并赔偿原告经济损失500元。

北京互联网法院一审核心观点认为:

①从涉案图片的生成过程来看,原告进行了一定的智力投入,比如设计人物的呈现方式、选择提示词、安排提示词的顺序、设置相关的参数、选定哪个图片符合预期等等,故涉案图片具备“智力成果”要件;

②原告对于人物及其呈现方式等画面元素通过提示词进行了设计,对于画面布局构图等通过参数进行了设置,体现了原告的选择和 安排;另一方面,原告在获得了第一张图片后,通过不断调整修正,最终获得了涉案图片,这一调整修正过程亦体现了原告 的审美选择和个性判断,故涉案图片具备“独创性”要件;

③人们利用人工智能模型生成图片时,本质上仍然是人利用工具进行创作, 即整个创作过程中进行智力投入的是人而非人工智能模型,只要能体现出人的独创性智力投入,就应当被认定为作品,受到著作权法保护。

2、“腾讯诉盈讯案”【(2019)粤0305民初14010号】

广东省深圳市南山区人民法院认为:

①涉案文章由原告主创团队人员运用Dreamwriter软件生成,其外在表现符合文字作品的形式要求,……。

②综上,从涉案文章的外在表现形式与生成过程来分析,该文章的特定表现形式及其源 于创作者个性化的选择与安排,并由Dreamwriter软件在技术上“生成”的创作过程均满足著作权法对文字作品的保护条件,本院认定涉案文章属于大陆著作权法所保护的文字作品。本院认定涉案文章是原告主持创作的法人作品。

3、“菲林诉百度案”【(2019)京73民终2030号】

北京知识产权法院二审认为:

涉案文章的文字内容并非威科先行库“可视化”功能自动生成,而是菲林律师事务所独立创作完成,具有独创性,构成文字作品。涉案文章中的图形部分是菲林律师事务所基于收集的数据,利用相关软件制作完成,虽然会因数据变化呈现出不同的形状,但图形形状的不同是基于数据差异产生,而非基于创作产生,不能体现菲林律师事务所的独创性表达。因此,涉案文章中的图形不构成图形作品,一审法院对此认定正确,本院予以确认。

2.3 AIGC服务使用者的其他IP合规风险及建议

2.3.1 AIGC服务使用者的其他IP风险场景

AIGC服务使用者的其他风险场景一般有以下几种:

(1)因输入不当信息而造成公司商业秘密、商业数据泄露风险;

(2)因生成并不当使用虚假内容而构成虚假商业宣传风险;

(3)因生成并不当使用他人知名商品包装/装潢而构成不正当竞争风险;

(4)因生成并不当使用含他人商标内容而造成商标侵权风险。

2.3.2 AIGC服务使用者的其他IP合规建议

针对上述风险场景,我们建议:

(1)建议公司对员工的AIGC产品使用行为制定相应管理制度、规范或指引,禁止员工不当使用行为;

(2)建议公司在有条件的情况下采取特定技术措施阻止员工在AIGC产品中输入商业秘密、商业数据、个人信息等不当信息;

(3)建议公司在有条件的情况下采取不当内容过滤措施,对AIGC生成的不当内容进行及时过滤及屏蔽,避免不当使用;

(4)建议公司法务或知识产权部门在AIGC生成内容投入商用前做好审核,避免风险内容用作商业宣传。

第三部分对AIGC知识产权合规治理的一点思考和建议

3.1 关于AIGC训练数据的知识产权合规治理思考

从客观情况来看,大模型训练所需数据量巨大、数据类型繁多、数据来源分散,导致训练数据所涉知识产权权利人数量众多且分散面广,传统的“授权-许可”模式在模型训练阶段可操作性低。

从使用方式及目的方面考虑,作为训练数据的作品,其使用方式明显不同于该作品的传统使用方式,其使用目的也并非再现原作品原本的美感和功能,而是创造了作品新的使用方式和新的价值。

从使用影响角度看,在模型训练阶段对作品的使用,并未影响该作品的正常使用,也未不合理地损害著作权人的合法权益,未在市场上对原作品产生竞争或替代关系。

基于以上分析,可以给出的治理建议是:(1)修改《著作权法》,将作品用于AIGC模型训练增加为一种特殊的合理使用情形,但由于《著作权法》刚修订完不久,短期内再修订的可能性很低;(2)通过发布司法解释或司法政策的方式将AIGC模型训练解释为一种合理使用情形;(3)对人工智能专门立法(如《人工智能法(示范法)》)或者制定/修订行政法规(如《著作权法实施条例》),并将AIGC模型训练规定为一种合理使用情形;(4)采用其他可减轻AIGC企业法律责任或负担的方式:如作品先使用后付费、作品集中授权(一站式授权)、颁布专门针对训练数据所涉作品的授权使用费指导文件等。

3.2 关于AIGC生成内容的知识产权合规治理思考

从客观情况看,AIGC生成内容在被正式“使用”前可修改、可调整、可重新生成、可删除、可弃用等,不存在使用“侵权”的不可避免/不可规避性。

从使用方式及目的来看,当前大多数“使用者”对AIGC生成内容的使用方式和目的与其对普通作品的传统使用方式及目的均相同,都是为了体现该作品/内容原本的美感和功能,并未创造出新价值、新美感、新意义、新用途。

从使用影响来评估,在内容生成阶段对“新作品”的使用,影响了原作品(被侵权作品)的正常使用,在市场上对原作品产生了竞争或替代作用,且不合理地损害了原著作权人的合法权益。

基于以上分析,可以给出的治理建议是:(1)对AIGC生成内容可按照现有的“接触+实质性相似”的著作权侵权判断原则去评估是否侵权;(2)对AIGC生成内容的使用不应作为一种合理使用情形来规避侵权责任;(3)对于AIGC服务提供者和使用者的侵权责任分配问题,建议约定优先,并可以参考适用“避风港原则”。

凌赵华 | AIGC时代,企业IP合规实践及探索

作者:凌赵华

编辑:Eleven

凌赵华 | AIGC时代,企业IP合规实践及探索