3月18日,苹果公司因涉嫌使用含有盗版书籍的“The Pile”数据集进行人工智能训练,再次被心灵鸡汤出版社(Chicken Soup for the Soul, LLC)列为版权侵权诉讼的被告方。此次诉讼规模庞大,除苹果外,meta、xAI、谷歌、Anthropic、OpenAI、Perplexity及英伟达等全球顶尖科技巨头均在诉讼名单之列。案件的核心争议点在于该数据集中名为“Books3”的影子图书馆模块,其包含了大量受版权保护的文学作品。
针对指控,苹果公司重申其自2024年起便致力于以合法且合乎道德的方式构建AI数据集。尽管苹果研究人员曾在OpenELMs开源项目中使用过“The Pile”数据,但官方强调该项目仅供公开研究,并未用于驱动核心的Apple Intelligence系统。然而,法律界分析认为,由于苹果的基座模型曾借助Google Gemini进行辅助训练,若谷歌在此案中被判定违规,苹果可能因技术供应链的联结而面临复杂的连带法律责任。
目前,Perplexity等公司已为其网络抓取行为辩护,而苹果则坚持其训练模型的透明度与合规性。随着AI监管环境收紧,这起针对底层训练数据的集体诉讼,不仅标志着创作者群体对科技巨头“数据掠夺”的反击升级,也将迫使行业重新审视模型训练中“数据溯源”的合规成本与技术边界。





京公网安备 11011402013531号