Anthropic在关于AI训练数据的版权案件中获得部分胜利

人工智能公司Anthropic在关于人工智能公司如何使用受版权保护的材料来训练其模型的版权斗争中赢得了一项关键的法律胜利，但这场斗争远未结束。

美国地区法官威廉·阿尔苏普发现，Anthropic使用受版权保护的书籍来训练其AI聊天机器人Claude符合美国版权法下的“合理使用”，在周一晚间的裁决中作出此判决。

“就像任何渴望成为作家的读者一样，Anthropic的LLMs训练这些作品并不是为了超越、复制或取代它们——而是为了转变方向，创造出不同的东西，”美国地区法官威廉·阿尔苏普在裁决中表示。

但法官也指责这家由亚马逊和谷歌支持的公司建立和维护一个庞大的“中央图书馆”，其中包含盗版书籍，称其运营的这一部分明显违反版权法。

“没有例外”来自版权法

此案由作者安德里亚·巴茨、查尔斯·格雷伯和柯克·华莱士·约翰逊于去年八月提起，指控Anthropic利用从臭名昭著的网站如Library Genesis和Pirate Library Mirror下载的数百万本盗版书籍来构建Claude。

该诉讼寻求赔偿和永久禁令，指控Anthropic“通过盗窃数十万本受版权保护的书籍建立了一个价值数十亿美元的商业”，以训练Claude及其AI模型系列。

阿尔苏普表示，AI训练可以是“极具变革性的”，并指出Claude的输出并不复制或重复作者的作品，而是生成与原作“正交”的新文本。

法庭记录显示，Anthropic下载了至少七百万本盗版书籍，包括每位作者作品的副本，以组建其图书馆。

内部邮件显示，Anthropic的联合创始人试图避免“法律/实践/商业的繁琐”，而员工则将目标描述为创建一个“世界上所有书籍”的数字收藏，以便“永远保存”。

“然而，版权法并没有为AI公司提供例外，”阿尔苏普表示，并指出维护一个永久的盗版作品库——即使只有部分用于训练——如果被允许，将“摧毁学术出版市场”。

威廉·阿尔苏普法官的裁决是美国联邦法院首次实质性地分析和应用合理使用原则，特别是针对使用受版权保护的材料来训练生成性AI模型。

法院区分了直接用于AI训练的副本，这些被视为合理使用，以及保留的盗版副本，这些副本将面临进一步的法律程序，包括潜在的赔偿。

虽然已经提起了几起诉讼——包括针对OpenAI、Meta等的高调案件——这些案件仍处于早期阶段，正在等待驳回动议或进行证据收集。

OpenAI和Meta都面临来自作者团体的诉讼，指控他们在未经同意的情况下利用其受版权保护的作品来训练大型语言模型，如ChatGPT和LLaMA。

纽约时报在2023年起诉OpenAI和微软，指控他们在未获许可的情况下使用数百万篇时报文章来开发AI工具。

Reddit最近也起诉了Anthropic，指控其在未经授权的情况下抓取Reddit平台超过10万次来训练Claude，尽管声称已停止。

免责声明：本文章仅代表作者个人观点，不代表本平台的立场和观点。本文章仅供信息分享，不构成对任何人的任何投资建议。用户与作者之间的任何争议，与本平台无关。如网页中刊载的文章或图片涉及侵权，请提供相关的权利证明和身份证明发送邮件到support@aicoin.com，本平台相关工作人员将会进行核查。