最高法法官:在大模型训练数据输入端构建合理使用制度
创始人
2025-07-01 17:25:35
0

大模型公司把作品作为训练数据是否要经过权利人许可?最高人民法院法官亓蕾近期就此撰文认为,大模型训练的技术实现具有更为优位的价值位阶,她建议采取“宽进严出”的制度设计思路:在训练数据“输入端”,构建数据合理使用制度;在AI应用“输出端”采取较为严格的制度设计,兼顾AI技术发展和权利人利益保护。

上述观点发表于最高人民法院机关刊《人民司法》杂志2025年第11期。亓蕾认为,AI训练数据虽然属于“输入端”的问题,但该问题的解决不能割裂AI的“输出端”。“宽进严出”的制度设计思路,首先是建立在对AI大模型的认知基础上,即应当区分认识“大模型的能力”和“大模型的应用”,前者对应“输入端”,后者对应“输出端”。

亓蕾表示,AI训练数据在某种意义上属于技术研发,单纯的模型训练不会直接影响权利人,真正的风险来自于模型训练后投入应用。目前,AI大模型应用造成风险的概率和严重程度尚不清楚,还未产生规模风险,对“输入端”进行源头风险预防的正当性并不充分。其次,若在“输入端”严格规制,AI开发者训练数据要么面临极高的授权成本,要么面临极高的法律风险,均将阻碍人工智能的技术创新。此外,多数国家和地区对对AI训练数据均采取宽容态度。

此前不少声音赞同将AI训练数据纳入合理使用的依据在于,如果采用传统的版权许可模式,会因版权成本高昂、磋商交易繁杂而抑制大模型公司的创新,甚至会变相激励大模型公司游走版权保护灰色边缘,等版权人诉讼再被动应付;而版权法定许可模式的缺陷依然明显,对大模型公司而言,承担的成本仍然高昂,而且还要求版权管理组织在当中付出较高的法定许可费管理成本。

亓蕾亦认同,著作权法上的授权许可、法定许可和合理使用制度均为解决训练数据合法性的方案,但前两种方案均面临交易成本过高的问题。

亓蕾建议,通过立法,将AI训练数据作为著作权合理使用的特定情形。理由在于,AI模型训练数据之于AI产业属于底层技术支撑,具有较强的公共利益性与价值优位性。其次,AI将作品作为训练预料并非为了复制存储作品,而是机器学习作品中蕴含的人类自然语言规律,以在输出端生成新的知识信息,数字化的作品在AI模型训练中已经被碾细碎化,作为参数内嵌于AI模型。

“传统意义上的使用,犹如厨师对原材料的烹饪过程,而大模型对训练数据的使用则近似于‘分子料理’般的打散重塑。”亓蕾如是类比说。

允许合理使用,并非不予关照版权权利人的利益。亓蕾表示,应同步赋予著作权人在前端数据合法取得以及后端侵权风险规制上的救济手段,也就是说,法律通过赋予著作权人对作品设置有效技术措施的权利,以及要求AI服务提供者对生成内容的合法性负有注意义务等规定,对合理使用进行动态平衡。

近期,美国法院相继作出两份关于大模型训练数据合理使用问题的裁决,引起中国国内业界和学界的关注。

当地时间6月23日,加州北区地方法院在作家诉Anthropic案中裁决,大模型公司未经过许可使用图书来训练AI模型,属于版权法上的合理使用;但在数据采集阶段,必须确保来源合法,才能避免担责。(详见:)

随后6月25日,加州北区地方法院另一法官又在作家诉Meta案中认定,Meta对作家作品的使用虽被判定为合理使用,但这主要是因为,原告作者未能提供证据支持作品市场价值被稀释的正确论点,并不代表Meta使用受版权保护的作品训练其大模型是合法的。该案法院提到,未经许可使用受版权保护的作品来训练大模型,在许多情况下都是违法的。

“这两起案件对我国有很大的借鉴意义。”在6月28日的中国科学技术法学会首届“中国科技法治纵横谈”论坛上,网易(杭州)网络有限公司法务总监汪海涛建议,应当在具体个案中去考察大模型公司使用作者作品,是否会对作品的市场价值产生不利影响,而不是抽象地判断是否构成合理使用。

采写:南都记者 杨柳

相关内容

热门资讯

上下班途中、居家工作等工伤认定... 11月20日,人力资源社会保障部发布关于执行《工伤保险条例》若干问题的意见(三),进一步提高依法行政...
17岁女孩被继父强奸时不敢反抗... 11月21日,最高人民法院发布2025年中国反家暴典型案例,其中“张某强奸案”值得关注。 据介绍,2...
江西已在中亚地区打造“三所一中... 【中亚专线】江西已在中亚地区打造“三所一中心”法律服务网络 中新社南昌11月21日电 (记者 吴鹏泉...
汉滨区住建局开展消防安全及农民... 为全面提升建筑施工现场消防安全管理水平,切实保障农民工工资支付权益,近日,汉滨区住建局建管股与消防监...
新能泰山:已制定信息披露事务管... 证券之星消息,新能泰山(000720)11月21日在投资者关系平台上答复投资者关心的问题。 投资者提...
调解π丨沂源法院:从“判也不还... 编者按 案件无小事,事事连民心。近年来,淄博法院干警始终坚持以人民为中心,深入践行“如我在诉” ,做...
特斯拉诉无忧传媒合同纠纷案已达... 2025-11-21 11:20:55 作者:狼叫兽 近日,关于特斯拉与杭州无忧传媒有限公司之间...
一年拉锯战终落幕 亚康股份涉股... 11月21日,亚康股份(301085)发布公告,控股股东及公司作为第三人参加诉讼的案件进展情况。根据...
原创 新... 在中日关系紧张的背景下,新加坡总理黄循财的发言无疑给这个局势增添了不少戏剧性。就在11月19日,他在...