被指在AI训练中滥用盗版书籍,Adobe面临集体诉讼
创始人
2025-12-18 21:28:09
0

IT之家 12 月 18 日消息,据外媒 TechCrunch 今日报道,一项由作家 Elizabeth Lyon 发起的集体诉讼对 Adobe 发出新的指控,称对方在训练 SlimLM 语言模型时,使用了包括 Lyon 本人的作品在内的大量盗版书籍。Lyon 来自俄勒冈州,长期从事非虚构写作,并出版多本写作指导类书籍。

Adobe 方面介绍,SlimLM 是一套面向移动设备文档辅助场景的小语言模型,其预训练基础为 SlimPajama-627B 数据集。该数据集由 Cerebras 于 2023 年发布,被描述为去重、多语料的开源集合。然而诉讼认为,SlimPajama 本身来源存在问题。

诉讼文件指出,SlimPajama 是在复制并加工 RedPajama 数据集的基础上生成的,而 RedPajama 包含广受争议的 Books3 数据集。Books3 收录约 19.1 万本书籍,其中包含大量受版权保护作品

诉讼明确指出,作为 RedPajama 的派生数据集,SlimPajama 同样包含 Books3 内容,因此不可避免地纳入了原告及其他作者的版权作品。

围绕 Books3 和 RedPajama 的争议,早已不止于 Adobe。此前,苹果和 Salesforce 均因涉嫌在 AI 训练中使用相关数据集而遭到起诉,相关案件指控企业未经授权使用受版权保护内容。

在更广泛的行业背景下,类似诉讼正在成为常态。AI 模型对训练数据规模的高度依赖,使数据来源问题频频引发法律风险。今年 9 月,Anthropic 同意向多名作者支付 15 亿美元(IT之家注:现汇率约合 105.77 亿元人民币),就其训练 Claude 时使用盗版作品的指控达成和解。该案件被外界视为 AI 训练版权争议的重要节点,然而行业内持续扩大的法律挑战仍未终结。

相关内容

热门资讯

丝芭传媒披露鞠婧祎8年收入近1... 近日,艺人鞠婧祎与此前合作的上海丝芭文化传媒集团有限公司(后简称“丝芭传媒”)之间的合同纠纷事件引发...
不仅罚款还要拘留,法律“拴紧”... ▲社区居民清理花园里的宠物粪便。新京报记者 郭延冰 摄 遛狗不拴绳,将涉嫌违法,轻则罚款,重则拘留。...
被吐槽“大字吹牛小字免责”,插... 本文自南都·湾财社。 采写 | 南都·湾财社记者 邱康正 编辑 | 子衿 近期,插线板巨头公牛集团股...
泉阳泉因1.80亿诉讼未及时披... 雷达财经 文|杨洋 编|李亦辉 12月18日,上交所发布关于对吉林泉阳泉股份有限公司及有关责任人予以...
鞠婧祎与丝芭传媒纠纷背后 丝芭... 12月17日,鞠婧祎工作室发布声明,措辞强硬地指控前经纪公司丝芭传媒涉嫌“伪造协议、骚扰合作方” 等...
【天眼问法】“荔即解”:为旅游... 在荔波小七孔景区旅游速裁法官工作站内,法官正通过移动设备联动多部门协调处置纠纷。这一幕,正是荔波县法...
扶持更全面!横琴金融产业政策焕... 12月18日,横琴粤澳深度合作区金融发展局正式印发修订后的《横琴粤澳深度合作区促进金融产业高质量发展...
蓉园社区“调解+”新模式上线,... 长沙晚报掌上长沙12月18日讯(通讯员 廖双剑)12月18日,芙蓉区韭菜园街道蓉园社区联合同行者社工...
同行质疑公牛误导宣传,公牛起诉... 公牛“10户7家用公牛”公告语遭同行质疑误导宣传,公牛起诉同行索赔420万,回应称不清楚是否调整 ...