首页 技术综合正文

Sarah Silverman 起诉 OpenAI 和 Meta:指控 AI 公司侵权版权

hezhisheng026 技术综合 2023-12-04 21:00:01 93 0

站长之家(ChinaZ.com) 7月10日消息:喜剧演员和作家 Sarah Silverman,以及作家 Christopher Golden 和 Richard Kadrey,正在美国地方法院分别起诉 OpenAIMeta ,指控其侵犯版权。

诉讼中称,OpenAI 的 ChatGPT 和 Meta 的 LLaMA 是通过非法获取的包含他们作品的数据集进行训练的,这些数据集据称来自于像 Bibliotik、Library Genesis、Z-Library 等「影子图书馆」网站,指出这些书籍「通过种子系统批量提供」。

在针对 OpenAI 的诉讼中,这三人提供了证据,显示当询问时,ChatGPT 会总结他们的书籍,侵犯他们的版权。Silverman 的《Bedwetter》是展示 ChatGPT 总结的第一本书,在证据中还使用了 Golden 的《Ararat》和 Kadrey 的《Sandman Slim》。诉讼称,聊天机器人从未费心去「复制任何原告在他们的出版作品中包含的版权管理信息」。

至于针对 Meta 的独立诉讼,诉讼声称作者的书籍在 Meta 用来训练 LLaMA 模型的数据集中是可以访问的,LLaMA 模型是该公司于 2 月推出的四个开源 AI 模型之一。

诉讼中详细列出了原告认为这些数据集具有非法来源的步骤。在 Meta 的 LLaMA 详细介绍文件中,该公司指出其训练数据集的来源之一是称为 ThePile 的数据集,该数据集由 EleutherAI 公司组合而成。诉讼指出,ThePile 在 EleutherAI 的一份文件中被描述为由「Bibliotik 私人追踪器的内容副本」组成。诉讼称,Bibliotik 和其他列出的「影子图书馆」是「公然非法的」。

在这两起诉讼中,作者称他们「未同意将其版权书籍用作公司的 AI 模型的训练材料」。他们的诉讼各包含六项版权侵权、过失、不当得利和不公平竞争等各种指控。作者们寻求法定损害赔偿、利润归还等。

代表这三位作者的律师 Joseph Saveri 和 Matthew Butterick 在他们的 LLMlitigation 网站上写道,他们收到了「担心 [ChatGPT] 惊人地能够生成类似于受版权保护的文本材料(包括数千本书籍)」的作家、作者和出版商的来信。

Saveri 还代表程序员和艺术家起诉了 AI 公司。Getty Images 也提起了一起 AI 诉讼,声称创建了 AI 图像生成工具 Stable Diffusion 的 Stability AI 在其模型的训练中使用了「数百万受版权保护的图像」。Saveri 和 Butterick 还代表作者 Mona Awad 和 Paul Tremblay 在一起类似的诉讼中起诉了该公司的聊天机器人。

像这样的诉讼不仅让 OpenAI 和其他人工智能公司头疼,也挑战了版权的极限。每当有人谈到版权法时,我们都会看到围绕此类问题的诉讼多年来持续发生。

版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

本文链接:https://www.16i.cc/post/48845.html