Adobe 因使用 SlimPajama 数据集遭作家起诉
创始人
2025-12-29 10:48:15
0

AIPress.com.cn报道

12月29日消息,作为全球创意软件巨头,Adobe 正面临其首起重大的人工智能版权集体诉讼。根据加州联邦法院的案卷显示,作家 Elizabeth Lyon 指控 Adobe 在开发其 SlimLM(一种针对移动设备优化的轻量级语言模型)时,使用了未经授权的盗版书籍。

这一指控的核心在于数据溯源链的“污染”:SlimLM 是基于开源数据集 SlimPajama-627B 训练的,而该数据集被认为包含了臭名昭著的 Books3 库——一个拥有超过 19 万本盗版图书的非官方资源集。

对于一直标榜“数据来源合法、对创作者友好”的 Adobe 来说,这起诉讼无疑是一次严重的品牌危机。原告律师指出,尽管 Adobe 是通过第三方开源渠道获取的这些数据,但其在下载、存储和处理这些包含侵权内容的语料时,已经构成了直接的版权侵犯。

此前,苹果(Apple)和 Salesforce 也曾因涉及类似的数据集而陷入法律纠纷,而 Anthropic 更是为此支付了高达 15 亿美元 的和解金。这表明,法律界正逐渐达成共识:AI 开发者必须对整个数据供应链的合规性负责,而不能以“开源”为由逃避责任。

此案对营销人员和内容创作者同样具有极高的警示意义。它揭示了生成式 AI 工具背后潜藏的“声誉风险”和“法律责任”。如果 AI 模型的底层数据本身是不合法的,那么使用该工具产出的商业内容可能面临潜在的版权追溯。

随着 2026 年 AI 监管力度的预期加强,企业在选择 AI 供应商时,必须要求对方提供清晰的 数据溯源证明(Data Provenance),并在合同中加入赔偿条款。Adobe 的这次法律阵痛,或许会倒逼整个行业从追求“大而快”的数据收集,转向建立更加透明、经得起审计的“清洁数据”生态。(AI普瑞斯编译)

相关内容

热门资讯

铸法治之魂 优营商之境 聚发展... 营商环境是区域发展的核心竞争力,也是激发市场主体活力的关键所在。 2025年12月3日,《毕节市优化...
“惠民政策落不到村”,紧抓! “重点研究周武村党组织软弱涣散的问题,大家直奔主题,谈谈看法。”山西长治市潞城区店上镇会议室里,一场...
《南阳市中医药产业发展促进条例... 河南日报客户端记者 曾倩 12月26日,南阳市政府新闻办公室召开《南阳市中医药产业发展促进条例》(以...
资讯|蓝天彬律师应邀参加研讨会... 2025年12月27日,由北京市海淀区律师协会、北京市西城区律师协会、南京市律师协会联合主办,北京市...
河北一男子称因挪车问题,与一女... 据媒体报道,12月27日,河北衡水龙先生称一女司机以车辆被挡为由,要求他挪车,随后两人因此产生纠纷,...
天津一律师简介宣传爱人是“市局... 12月28日,天津一名刑辩何姓律师的社交平台账号在介绍中称自己是“警嫂”,“爱人是市局经侦办案警官”...
教育部:学籍变动管理实行“一人... 北京商报讯(记者 关子辰 牛清妍)12月29日,记者从教育部官网获悉,《全国学前儿童学籍管理办法(试...
共逐封关政策红利 全球闽商海南... 中新网海口12月29日电 (记者 符宇群)“此行我想了解更多海南封关运作后的相关政策导向,并引导大湾...
国资委:研究制定国有企业履行战... 12月29日,国务院国资委主任张玉卓在学习时报发文表示,党的二十届三中全会明确的各项改革任务需要在2...