当前位置：首页 » 资讯 » 新科技 » 正文

英伟达涉版权侵权诉讼，被指从影子图书馆获取 500TB 盗版数据

IP属地中国·北京 环球网资讯 时间：2026-01-21 12:29:47

环球网
1月21日消息，据Albase报道，芯片巨头英伟达近日陷入一场备受关注的版权集体诉讼。多位图书作者通过修订后的起诉状指控，英伟达为训练自主研发的人工智能模型，蓄意从“安娜档案馆”等多个“影子图书馆”获取海量盗版数据，涉案数据规模达500TB，包含数百万本受版权保护的图书，相关行为已涉嫌侵犯著作权。
作为人工智能热潮中的核心受益企业之一，英伟达凭借人工智能训练芯片及数据中心服务的市场需求，营收持续大幅增长。与此同时，该公司也在积极布局自主AI模型研发，推出了NeMo、Retro-48B等多款模型，这些模型的训练均依赖海量文本数据支撑。然而，其数据获取方式的合法性一直备受质疑。

早在2024年初，就有多位作者以侵犯版权为由将英伟达诉至法院，指控其AI模型使用包含盗版作品的Books3数据集进行训练。英伟达当时辩称相关行为属于“合理使用”，声称书籍对其AI模型而言仅为统计关联数据，但这一说法并未平息争议。随着诉讼推进，原告方在证据开示阶段发现了更多关键线索，并据此提交了修订后的起诉状，大幅扩大了诉讼范围。
新诉状援引英伟达内部邮件及文件显示，受市场竞争压力驱动，该公司数据战略团队成员曾主动联系“安娜档案馆”——这一目前规模较大且颇具争议的“影子图书馆”，寻求获取数百万份盗版资料，并探讨将其纳入大语言模型预训练数据的可行性。“安娜档案馆”明确告知英伟达其藏书均为非法获取和留存，并要求英伟达高管确认是否已获得内部授权推进合作。令人关注的是，英伟达管理层在知晓数据非法性的数天后，仍于一周内批准了相关合作，“安娜档案馆”随后向其开放了约500TB的盗版数据访问权限，其中包含的数百万本图书，原本多仅能通过“互联网档案馆”的数字借阅系统获取，而该档案馆自身也已身陷相关诉讼。
除“安娜档案馆”外，起诉状还指出英伟达存在多渠道获取盗版数据的行为，其不仅从“图书馆基因”（LibGen）、“科学枢纽”（Sci-Hub）、“Z图书馆”（Z-Library）等平台下载图书，还向企业客户分发脚本和工具，助力客户自动下载包含盗版Books3数据集的“The Pile”数据库。基于此，原告方新增了辅助侵权与共同侵权两项诉讼主张，认为英伟达通过为他人获取盗版数据集提供便利牟利。
据悉，这是美国大型科技公司与“安娜档案馆”的往来函件首次被公开披露。此前不久，“安娜档案馆”已丢失多个域名，此次与英伟达的侵权纠纷进一步提升了这家盗版图书馆的公众关注度。目前，诉状尚未明确提及英伟达是否向“安娜档案馆”支付了数据访问费用。（纯钧）

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

马化腾官宣：自研龙虾、本地虾、云端虾等陆续赶来，外媒曝还在开发智能体

中央网信办、国家互联网应急中心发布“养龙虾”安全提醒

国家互联网应急中心发风险提示！使用OpenClaw需留意这些

谷歌发布首个原生多模态嵌入模型Gemini Embedding 2

刚刚，微信被曝打造绝密 AI 智能体

OpenClaw曝多重高危风险，国家互联网应急中心提示防范数据泄露与系统失控

全站最新

马化腾官宣：自研龙虾、本地虾、云端虾等陆续赶来，外媒曝还在开发智能体

中央网信办、国家互联网应急中心发布“养龙虾”安全提醒

国家互联网应急中心发风险提示！使用OpenClaw需留意这些

谷歌发布首个原生多模态嵌入模型Gemini Embedding 2

热门推荐

马化腾官宣：自研龙虾、本地虾、云端虾等陆续赶来，外媒曝还在开发智能体

中央网信办、国家互联网应急中心发布“养龙虾”安全提醒

国家互联网应急中心发风险提示！使用OpenClaw需留意这些

谷歌发布首个原生多模态嵌入模型Gemini Embedding 2

刚刚，微信被曝打造绝密 AI 智能体

OpenClaw曝多重高危风险，国家互联网应急中心提示防范数据泄露与系统失控

再现排队“养龙虾”，百度在京举办首场线下市集

马化腾发朋友圈，官宣全系“龙虾”矩阵

马化腾凌晨朋友圈晒“龙虾”矩阵，腾讯被曝秘密开发微信智能体

大厂内卷到摆摊！继腾讯后百度推出园区龙虾市集

iPhone 18 Pro外观不会有惊喜？消息称无缘屏下人脸识别仍将是灵动岛

三星电子去年研发及设施投资超过600亿美元半导体是重点

腾讯云官宣混元模型Token涨价

微信把超级Agent之战一把拉进了自己的舒适圈

安卓厂商被迫提价苹果凭什么“不涨反降”？