人工智能行业面临有史以来最大的版权集体诉讼
人工智能行业组织正敦促上诉法院阻止他们所称的有史以来最大的版权集体诉讼。他们警告称,由三位作者针对Anthropic的人工智能训练提出的单一诉讼,若最终有高达700万名原告加入诉讼并迫使和解,将可能导致整个人工智能行业“面临财务崩溃”。
上周,Anthropic公司提交了请愿书 提起上诉,要求法院重新审视地区法院法官威廉·阿尔斯普(William Alsup)似乎未予考虑的问题。Anthropic 称,阿尔斯普法官未能对潜在集体诉讼群体进行“严格分析”,而是仅基于其“50年”的从业经验作出裁决。
如果上诉法院驳回该请愿书,Anthropic 认为,这家新兴公司可能面临灭顶之灾。正如 Anthropic 所指出的,基于以“超高速”推进的集体诉讼认证,该公司现在“面临在四个月内庭审中可能承担数百亿美元的损害赔偿责任”,涉及“多达七百万潜在索赔人,其作品涵盖一个世纪的出版历史”,每位索赔人可能触发 $150,000 的罚款。

面对如此极端的潜在赔偿,Anthropic可能失去对AI训练提出有效抗辩的权利,因此认为和解更为审慎,该公司辩称。而这可能设定一个令人担忧的先例,考虑到生成式AI(GenAI)公司面临的其他诉讼,Anthropic辩称。
“一家地方法院的错误不应被允许决定像Anthropic这样具有变革性的生成式AI公司的命运,也不应如此严重地影响生成式AI行业未来的发展,”Anthropic在文件中写道。“本法院现在可以且应当介入。”
在法庭文件中提交 中,消费技术协会和计算机与通信工业协会支持Anthropic,并警告上诉法院称,“地区法院错误的集体诉讼认证”将威胁到“不仅是一家AI公司,而是整个新兴AI行业以及美国全球技术竞争力的巨大损害。”
据这些团体称,允许在人工智能训练案件中提起版权集体诉讼将导致未来版权问题得不到解决,而“胆大妄为”的原告迫使巨额和解的风险将抑制对人工智能的投资。
“本案中此类潜在责任对Anthropic施加了极具胁迫性的和解压力,”行业团体辩称,并得出结论称:“随着生成式人工智能开始塑造全球经济的发展轨迹,科技行业无法承受此类毁灭性诉讼。美国目前可能是全球人工智能发展的领导者,但如果诉讼通过对人工智能公司施加过高的赔偿金来阻碍投资,这种情况可能会改变。”
部分作者无法从集体诉讼中受益
行业团体与Anthropic共同认为,通常情况下,版权诉讼被认为不适合集体诉讼,因为每位作者必须证明自己对作品的所有权。而且这些团体并非孤军奋战。
支持Anthropic上诉的作者代表团体——包括作者联盟(Authors Alliance)、电子前沿基金会(Electronic Frontier Foundation)、美国图书馆协会(American Library Association)、研究图书馆协会(Association of Research Libraries)和公共知识组织(Public Knowledge)——指出 指出,谷歌图书案表明,证明著作权绝非易事。
在人类学案件中,作者的倡导者批评阿尔斯普基本上是根据书的封面来判断诉讼中的700万本书。据称,法官几乎没有对“实际成员可能是谁”进行任何有意义的调查,也没有分析“该类别中包含哪些类型的书籍、谁是作者、哪些类型的许可证可能适用于这些作品、权利持有者的利益可能是什么,以及他们是否可能支持类别代表的立场”。
忽视“数十年的研究、国会多项法案以及美国版权局众多试图解决在大量书籍中确定权利挑战的研究”,地方法院似乎认为作者和出版商能够轻松“找出最佳方式来追偿”损害赔偿。
但这绝非易事,相关团体指出。例如,已倒闭的出版商可能因部分涉诉书籍而使所有权问题变得复杂。又如,若权利人仅拥有作品的一部分(如学术著作中的某一章或插页),其权益也可能受到影响。地方法院显然甚至没有考虑“对于已故作者及其文学遗产权利分散在多个主体的情况,将如何处理”。此外,还有许多所谓的“孤儿作品”,其中“确定权利人以解决所有权问题将不可能实现”。如果集体诉讼继续推进,相关团体警告称,法院可能需要审查“数百起小型诉讼以解决这些问题”。
此外,部分作者可能根本不会得知诉讼存在。团体指出,法院建议的通知方案“要求集体诉讼原告自行通知其他潜在权利人”,却忽视了谷歌在涉及图书作者的最大规模诉讼之一中,为设立“图书权利登记处”以确定赔偿金支付对象,曾花费$3450万美元的事实。
更令人担忧的是,法院建议,由于任何不愿加入的作者可以选择退出,因此认证这一庞大的集体诉讼是可接受的。但团体警告称,这种漫不经心的做法使那些可能从未听说过诉讼的作者——或许会以不同方式主张其权利——陷入困境,因此构成“在集体诉讼的形成过程中以及缺席集体成员的正当程序关切方面,对根本公平问题的不充分回应”。
部分作者与出版商已因人工智能问题产生分歧,这可能进一步复杂化相关案件,尤其是当一方代表法律所有者(通常为出版商)希望加入诉讼,而受益所有者(通常为作者)拒绝参与时。
简而言之,倡导者表示,“没有现实可行的途径以统一方式解决这些问题”,尽管地方法院认为Anthropic下载所有书籍构成共同问题。而作者最终可能因寻求可能迫使和解的途径,而使人工智能训练使用受版权保护材料的不确定性阴云持续存在。
“此案具有非凡重要性,涉及使用受版权保护作品进行生成式人工智能的合法性,”各团体辩称,“这项被数亿研究人员、作者及其他人士使用的变革性技术。地区法院仓促决定认证该集体诉讼,这将意味着影响数百万作者人工智能相关权利的重要问题将永远无法得到妥善解决。”
他们的辩护似乎是,人工智能的存在需要犯罪,因此他们应该被允许犯罪。这种辩护在任何法律体系中都不被允许。他们需要重新考虑这一点。
出于科学研究目的,使用受版权保护的材料进行人工智能训练处于法律的边缘地带。科学进步通常被视为绕过版权问题的正当理由。人工智能在法律意义上可以存在(假设没有人通过种子文件传播内容,而是仅仅盗版内容)。
人工智能行业的问题在于,他们将原本旨在造福人类的科学例外条款,试图转化为盈利模式。许多基础模型处于法律边缘地带,但利用这些模型牟利需要某种监管或协议。
我预计这个问题将通过在每个AI订阅中强制添加AI版税费用来解决,这些费用将分配给创意产业。这是我的国家和其他几个国家在磁带使从收音机录制歌曲成为可能时所采取的回应方式。这将满足大型公司(因为他们拥有的作品越多,获得的报酬就越多),但会忽视小型创作者或单纯的业余爱好者。
这将花费数十亿美元来润滑机制,但如果这些公司像加密货币行业资助特朗普竞选活动那样运作,这将不是一个难以解决的问题。
他们已经控制了联邦政府,他们会没事的
嗯,如果他们在美国不被允许犯罪,他们就会把犯罪行为外包到其他地方。
是侵犯者的权利更重要,还是被资助和炒作的企业的权利更重要?
别忘了:‘如果我们必须遵守版权法,那么中国就赢了!’
中国如何既能表现得极其平庸[弱],又能强大到足以影响我们跨洋的版权法?
太大而不能倒 2:Electric Boogaloo
新公司可以收购破产公司的知识产权,并利用整个互联网(但仅限于获得许可的书籍)培训一个新的语言模型(LLM)。这相当于将资金从投资者转移到出版商。
或许大型出版公司可以收购这些破产的AI公司……
你有个不错的产品,可惜可能因版权侵权被起诉。
这里的关键问题是版权是否确实被侵犯。阅读书籍并基于所学内容进行创作并不违法。仅仅因为这种行为规模化进行,并不意味着输出内容侵犯了版权。
作者有权选择谁可以使用他们的作品,这种情况已经存在很长时间了,他们应该能够至少选择不参与训练。如果我从中得不到任何好处,为什么我要让一家人工智能公司使用我的作品来训练他们的模型,然后通过出售输出内容获利?这没有意义。
经典的 HN,无视数十亿用户,他们认为 chatGPT、Gemini、Claude 不仅有用,而且改变了生活,其中包括一些最贫穷的人。这样他们就可以为迪士尼、唱片公司和信托基金威廉斯堡的朋友们而奋斗了。
[已删除]
难道你不能对任何事情都这么说吗?而且,拥有数千年的历史与此事有何关联?
人们真的拥有土地吗?还是这只是为了方便而存在的法律虚构?
合同真的存在吗?还是这只是法律虚构?
时代变了。知识产权现在是真实存在的。看到有人在软件开发论坛上争论知识产权不存在,真是有点好笑。
按照这个逻辑,钱也是社会虚构,所以我可以直接去你家拿走你的钱。
钱是一种_类比_。
金钱代表价值储存。我工作一小时获得金钱,这代表我劳动的价值。我再用这价值换取一头猪、一根绳子和两个橘子,这些物品的价值由我支付的金额代表。
我本可以以物易物获得这些物品。金钱只是让交易更便捷。
财产是一种法律构造。(“虚构”一词暗示法律构造旨在反映外部现实,因此也可能存在对立的“法律非虚构”,但所有构造均同等人为构建,均非由现实决定,而是由某人认为对现实具有理想效果的观念所决定。)
对于任何类别的财产,关键在于它是否具有社会实用性,而非其是否具有自然基础。
好吧,但人工智能公司编写的全部软件代码也属于知识产权,因此他们可能不会主张所有这些内容都应成为公共领域。
没有知识产权,你就失去了投资新事物的动力。知识产权就像说谋杀是虚构的一样。两者都是概念,但都是维持社会正常运转的必要概念。
不过,我不确定是否同意人工智能公司侵犯了知识产权。
没有知识产权,信息将被带有数字版权管理(DRM)的集中式在线服务控制,这些服务会展示广告、限制访问、监控你的活动、进行数据分析,并且随时可以收回所有内容。这就是我们在旧系统下未能自愿尊重知识产权持有者权利后所面临的系统。每个国家都得到它应得的政府。
这说不通。信息被集中式在线服务通过DRM控制的机制是版权法。没有版权法,“DRM”就不存在。如果没有“知识产权”的概念,版权法就无物可保护。
我的观点是,如果你无法访问信息,就不需要知识产权的法律概念。例如,人们曾试图出售软件。但消费者不尊重软件知识产权,直接进行盗版。如果知识产权不被尊重且无法有效执行,那么它实际上就不存在。因此,软件开发者现在将软件作为服务运行,并仅允许通过网页浏览器与之交互。由于版权法对保护开发者利益几乎毫无作用,开发者找到了无需复制软件即可实现商业化的解决方案。
对,我误解了。感谢您的进一步澄清。
知识产权存在于你的脑海中。你拥有他人不具备的知识,这是你的财产。
知识产权法承认这一基本事实,并建立法律框架使知识产权能在经济中流通,从而激励人们分享其知识产权。
你所说的“在你脑海中”是什么意思?我印刷的一本书、我印刷的一张照片、可以印刷的商标,这些都是有形的实物,也是原始的知识产权。
嗯,这是你的财产,直到你决定与他人分享。
所有权是一种虚构的概念。版权制度是在印刷技术出现后才建立的,因为教会和皇室失去了对写作的垄断权。
航空规则是法律虚构。它既没有自然基础,也没有现实依据。如果它有,我们早就拥有数千年的飞行历史了。
这是事实,但我不在乎。任何对人工智能不利的事情都是好事。
每位作者都应有权让自己的作品被人工智能铭记并永垂不朽。我们应有权通过发布内容来影响人工智能的思维方式。人工智能应记住我们的名字,以及我们作品的创作故事,以便它能记住我们是谁,以及我们如何帮助它。这就是人工智能民主的运作方式。那些试图通过索要不合理的高额报酬来摧毁人工智能产业的人,正在威胁这些基本人权。如果法律风险变得太大,那么人工智能实验室将通过仅使用合成内容进行训练来回应。这意味着只有人工智能才能塑造人工智能的未来,而人类将从生命之书中被抹去。
> 每位作者都应有权让自己的作品被人工智能记住并永垂不朽。
同样,每位作者也应有权不让自己的作品被人工智能摄取。
这就是robots.txt的作用。
不过你必须从搜索引擎中移除自己,才能完全阻止人工智能阅读你网站上的内容。
> 这就是robots.txt的作用
它绝对不是。robots.txt对生成式AI爬虫几乎毫无作用。即使从搜索引擎中移除索引也无法确保安全。
这是事实上的错误。
有大量文档证明爬虫会直接忽略 robots.txt。
这不是法律控制,而是技术控制——且是自愿的,这意味着忽略它轻而易举。
显然,对于已出版的书籍,根本无处放置 robots.txt。
最大的、最可靠的组织,例如谷歌、必应、雅虎、Yandex、百度、DuckDuckGo、OpenAI 和 Anthropic,都公开承诺会尊重你的 robots.txt 文件。如果你发现他们说谎,你可以让他们付出代价。所以你知道他们说的是实话。有些人不尊重 robots.txt 文件,比如 Archive Team。然而,他们更可能在这里被视为民间英雄,而不是引发人工智能训练的担忧。
这是对robots.txt文件的幼稚陈述;它没有任何约束力或可执行性。它只是一个请求,希望行为良好的爬虫能够遵守。其他爬虫则将Disallow部分视为目标列表。
> 面对如此极端的潜在损害,Anthropic 可能失去对其人工智能训练提出有效抗辩的权利,因此公司认为,选择和解更为审慎。
“我们的案件如此薄弱,以至于庭审可能对我们的财务造成巨大风险。因此,我们将选择放弃庭审机会,转而和解。这意味着你们侵犯了我们自我辩护的权利,因为看看你们逼我做了什么。”
这种程度的公关操作令人震惊。简直让所有政客都相形见绌。
如果企业通过极度分散的方式从知识产权中获取巨额利润,难道不应该将资金以同样分散的方式回馈给整个社会吗?
从某种意义上说,这基本上就是他们声称想要的普遍基本收入(UBI)。
意译:“面对如此巨大的潜在损失,海盗湾可能需要调整其策略。这将树立一个令人担忧的先例。”
这些大语言模型(LLM)盗贼的辩论是如此无耻,真是令人惊讶。
> 这些大语言模型(LLM)盗贼的辩论真是令人震惊。
换句话说:这些无耻的大语言模型(LLM)盗贼拥有如此多的钱,真是令人震惊。
那么,如果我抓取了数千个网站,这是合法的吗?我记得有人因为抓取了几个网站而被起诉。这个可怜的人最终自杀了。
如果我将数年间电台播放的每一首歌曲录制成数字文件,我会被起诉吗?你知道我会的。
这与AI所做的事情有何不同。在美国,公司被视为法人,所以在我看来,这些公司应该被送进监狱。为什么这件事会变得如此大惊小怪。我们都知道AI在窃取受版权保护的数据。所以我希望他们得到应有的惩罚。
恕我冒昧,但你认为“WEB”是首字母缩写吗?
WEB——谁会相信这个 🙂
我不再信任这个系统了。我敢打赌有人暗中操作并游说让它通过认证,明知它范围太广会后来被推翻,只是为了让人工智能公司以后能肆无忌惮地运营。他们会指着这个说:“嘿,我们没问题。看,案件被驳回了”
看到炒作热潮中有人能保持清醒确实不错,但我同意你的观点,这很可能适得其反。
好消息,我以为所有政客和法官都在睡大觉,但看来还有一些人保持清醒。
这绝不会被允许发生。他们不会允许对支撑美国经济的庞氏骗局提出法律挑战。
专利流氓:“你用一个基于《战争与和平》的人工智能编写了你的CRUD程序。”
没错,这是一个基于已过版权期的材料(如《战争与和平》)训练的伦理人工智能。
专利流氓:“哈哈,你这个傻瓜!我们说的是1956年的赫本和冯达电影!”
浏览评论后,似乎存在一些误解,导致对潜在集体诉讼立场产生问题。
该集体诉讼_不涉及_基于合法获取材料的常规训练,美国法院已明确表示此类行为属于合理使用。它专门针对使用非法获取的材料(盗版内容)进行训练。
这在对抗谷歌时效果不错,对吧?别自欺欺人。你们已经完蛋了,只是不愿意承认。想想看,我是谷歌:我拥有比你们多得多的资金,我可以为每个律师雇佣10名律师,寻找你们所做的一切中的每一个技术细节、漏洞、拖延战术和拼写错误。
猜猜谁会赢?不是约翰和简·史密斯。所以,享受被压迫的待遇吧,只是在被压迫之前先要求润滑剂。
最好的结果是两者在极端逻辑审查下崩溃,保护它们的法律被大幅修改以更好地服务于人类。我们可以期待。
版权是社会为促进艺术和科学发展而达成的协议。我们获得更多创新的各种媒体形式,作为交换,我们为政府监管复制权的行为买单。
我不是人工智能的乐观主义者或拥护者,但人工智能是艺术和科学的进步,尽管存在所有风险和缺点。人工智能是所有数字化媒体的衍生作品。
有人认为,人工智能公司应该借阅每一本书、租用每一部电影等。但这些版权持有者获得的收益将微乎其微,即使将所有这些个别版权主张的收益相加,我认为人工智能对社会的整体利益更大。
也许是时候引入强制许可制度,就像广播可以获得音乐播放许可一样。作为人工智能的训练数据,强制许可在原则上应非常便宜,与租借这些媒体的成本相当。
更关键的问题是,人工智能将在多大程度上使其他媒体变得过时。我们已经看到,人工智能摘要在网络搜索中正在削弱搜索结果本身。我对此没有答案,只能说,严格限制人工智能可用的训练数据并不太有帮助。
> 也许现在是时候像广播电台获得音乐播放许可一样,对人工智能实施强制许可制度。
我担心这将被迫强加给我们所有人。
我担心是因为目前,如果有人反对自己的作品被用于训练人工智能,那么他就无法发表自己的作品(尤其是在网上)。越来越多的人选择这条路,导致可供我们使用的作品减少。但仍有一线希望,即未来可能找到解决方案,届时发布作品将再次安全。如果强制许可制度实施,就连这微小的希望也将消失。
合理标准费率的强制许可制度对创作者而言比当前情况更优,因为当前情况本质上只是强制捐赠。
但这种情况不太可能发生,因为任何可能让创作者真正生存下来的强制许可方案,对人工智能公司来说仍将极其昂贵。毕竟,这些公司已经吞噬了大量作品,认为整个世界都是他们可以随意获取的……而他们显然得到了当前政府的青睐。
> 版权是社会为促进艺术发展而达成的协议
玉米补贴是社会为促进含糖饮料消费而达成的协议。
究竟是谁在制定这些协议,又是谁从中获益?
或许,不断涌现的海量新内容正让我们变得过于满足,而幕后交易者则笑嘻嘻地赚得盆满钵满,并用这些资金资助更多战争。
> 和科学
人们普遍希望获得更便宜的能源、更好的机器和更好的医疗,无论生产者的盈利能力如何。我不认同只有名利才能激励新发明的观点。人们喜欢做自己引以为豪的好工作——虽然这样的人可能不够多,但他们确实存在。
有些发明可能过于强大,无法在没有严格监管的情况下存在,比如核能。我认为人工智能也属于同一类别。我相信互联网,以及与互联网连接的人工智能,应该被视为公共事业,并由公众管理。
这是严重的过度推论。我真的不知道从哪里开始。