当前位置: 首页 » 资讯 » 新科技 » 正文

微软下架争议博文:教用户用盗版《哈利·波特》全集训练AI

IP属地 中国·北京 编辑:陈阳 IT之家 时间:2026-02-21 14:09:19

IT之家 2 月 21 日消息,科技媒体 Ars Technica 昨日(2 月 20 日)发布博文,报道称微软遭到舆论强烈反弹后,删除了 Azure 官方博客上一篇发布于 2024 年 11 月的技术教程。

IT之家援引博文介绍,该文章由微软高级产品经理 Pooja Kamath 撰写,主要演示如何利用 Azure SQL 数据库和 LangChain 技术快速构建生成式 AI 应用。

不过文章的核心演示案例竟是指导用户下载并使用盗版的《哈利 波特》全集来训练大语言模型(LLM)。

图源:已删除的微软博客

为了展示新功能的“亲和力”,该教程设计了两个应用场景:构建问答系统和生成同人小说。作者展示了一个由 AI 生成的营销故事:

在霍格沃茨特快列车上,哈利 波特遇到了一位新朋友,这位朋友向哈利热情推销微软 SQL 中的“原生向量支持”(Native Vector Support)功能,并将其比作“麻瓜世界的魔法”。

教程还附带了一张哈利与朋友带有微软 Logo 的生成图片。法律专家 Cathay Y. N. Smith 指出,这种利用受版权保护的角色进行商业营销的行为,极易触犯版权法。

教程中提供的训练数据链接指向数据科学平台 Kaggle 上的一个数据集。该数据集包含《哈利 波特》全七册电子书,且被上传者 Shubham Maindola 错误地标记为“公有领域(Public Domain)”。

尽管该数据集已存在多年并积累了超过一万次下载,但《哈利 波特》系列显然仍处于版权保护期内。在媒体 Ars Technica 联系上传者后,Maindola 承认标记错误并删除了数据集,称其本无意误导版权状态。

标签: 哈利 数据 用户 教程 波特 版权保护 博文 全集 魔法 媒体 角色 博客 朋友 争议 文章 标记 功能 法律 误导 系统 向量 图片 状态 场景 原生 专家 版权 案例 上传者 霍格 亲和力 链接

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。