OpenAI意外删除《纽约时报》版权诉讼中潜在证据
创始人
2024-11-21 21:06:40
0

鞭牛士报道,11月21日消息,据外电报道,《纽约时报》和《每日新闻》起诉OpenAI未经许可抓取其作品来训练其 AI 模型,两家公司的律师表示,OpenAI 工程师意外删除了可能与案件相关的数据。

今年秋初,OpenAI 同意提供两台虚拟机,以便《纽约时报》和《每日新闻》的律师可以在其 AI 训练集中搜索其受版权保护的内容。

虚拟机是基于软件的计算机,存在于另一台计算机的操作系统中,通常用于测试、备份数据和运行应用程序。

出版商的律师在一封信中表示,他们和他们聘请的专家自 11 月 1 日以来已经花了 150 多个小时搜索 OpenAI 的训练数据。

但根据上述信件(该信件于周三晚间提交给纽约南区美国地方法院)显示,11 月 14 日,OpenAI 工程师删除了其中一台虚拟机上存储的所有出版商的搜索数据。

OpenAI 尝试恢复数据,并且基本成功。然而,由于文件夹结构和文件名无法挽回地丢失,恢复的数据无法用于确定新闻原告复制的文章在何处用于构建OpenAI模型。

「新闻原告被迫投入大量人力和计算机处理时间,从头开始重新制作他们的工作。」《纽约时报》和《每日新闻》的律师写道。「新闻原告昨天才得知恢复的数据无法使用,专家和律师整整一周的工作必须重新完成,这就是今天提交这封补充信的原因。」

原告律师明确表示,他们没有理由相信删除是故意的。但他们表示,这一事件凸显了 OpenAI最有能力利用自己的工具在自己的数据集中搜索潜在的侵权内容。

OpenAI 发言人拒绝发表声明。

在本案和其他案件中,OpenAI 一直坚持认为,使用公开数据(包括《纽约时报》和《每日新闻》的文章)训练模型是合理使用。

换句话说,在创建 GPT-4o这样的模型时,OpenAI 认为它不需要获得许可或以其他方式为这些示例付费——即使它从这些模型中赚钱。GPT-4o 可以从数十亿电子书、论文等示例中学习以生成听起来像人类的文本。

话虽如此,OpenAI 已经与越来越多的新出版商签署了许可协议,其中包括美联社、Business Insider 所有者 Axel Springer、金融时报、People 母公司 Dotdash Meredith 和新闻集团。OpenAI 拒绝公开这些交易的条款,但据报道,其中一个内容合作伙伴 Dotdash每年至少获得 1600 万美元的报酬。

OpenAI 既没有确认也没有否认其在未经许可的情况下将其 AI 系统训练在任何特定的受版权保护的作品上。

相关内容

热门资讯

“中国版英伟达”,中签号公布! 25日晚间,被市场视为“中国版英伟达”的摩尔线程,发布首次公开发行股票并在科创板上市网下初步配售结果...
华与华创始人华杉称西贝“被人算... 红星资本局11月26日消息,日前,“西贝员工回应涨薪500元”的话题在社交平台引发关注,西贝品牌顾问...
原创 日... 近期,国际局势呈现出令人瞩目的动向。美日首脑之间的通话,特别是特朗普对高市早苗的突然联系,无疑投射出...
厦门渊亭信息科技取得恶意诉讼智... 国家知识产权局信息显示,厦门渊亭信息科技有限公司取得一项名为“恶意诉讼智能监督方法、系统、设备及存储...
李在明评高市言论:引起相当大争... 【文/观察者网 齐倩】 近日,东北亚局势骤紧。日本首相高市早苗挑起中日外交争端,中方予以强力反制。...
原创 特... 在当前复杂多变的国际关系中,尤其是亚洲地区的地缘政治局势,日美之间的亲密合作无疑成为了一个引人瞩目的...
今晚很多股民都在晒截图:“很遗... 11月25日晚间,摩尔线程发布首次公开发行股票并在科创板上市网下初步配售结果及网上中签结果公告,本次...
“撤回发言,立即辞职!”日本爆... “我们会持续进行抗议,一场一场地抗争下去。”一名日本民众说道。日本首相高市早苗近日涉台错误言论,已在...
山东推动三项制度改革,经理层薪... 齐鲁晚报·齐鲁壹点记者 张玉岩 11月26日,山东省政府新闻办举行新闻发布会,邀请省国资委负责同志等...
政策托底+执法护航!江苏近20... 10月22日,南京39艘老旧营运船舶拆解全部完成;11月8日,扬州94艘老旧营运船舶中的最后一艘成品...