一项新研究显示,AI 模型经过仅两本书的微调训练后,可以生成著名作家的写作风格,且读者对这些作品的偏好甚至超过了专业模仿者。此项研究由圣 ony Brook 大学和哥伦比亚法学院的研究团队进行,涉及了50位知名作家的风格创作,包括诺贝尔奖得主韩江和布克奖得主萨尔曼・鲁西迪。
在研究中,159名参与者,包括28名写作专家和131名非专家,通过众包平台 Prolific 评判了不同文本段落。评判过程中,参与者并不知道文本是由人类还是 AI 创作的。研究采用了两种主要的 AI 训练方式:上下文提示和特定作者微调。在上下文提示中,研究团队使用了 GPT-4o、Claude3.5Sonnet 和 Gemini1.5Pro 三种主要的 AI 系统,给予相同的指令和样本文本进行生成。而在特定作者的微调中,仅有 GPT-4o 支持所需的 API 功能,因此研究团队为30位作家购买了数字版书籍,并为每位作家训练了独立的模型。
参与者被要求将两段文本进行比较,并选择他们认为更优秀的一段。对于风格评估,参与者还会看到原作者的一段摘录。研究结果显示,使用基本的上下文提示时,专家对人类文本的偏好显著,而非专家的选择则相对分散。然而,在经过微调后,专家在风格方面更倾向于选择 AI 生成的文本,数量增加了八倍;在写作质量上,选择 AI 文本的比例也达到了两倍。现代 AI 检测工具对标准 AI 输出的识别率高达97%,而对经过微调的输出则仅有3%。
此外,研究还发现,训练数据的数量并不影响结果。一些仅出版过两本书的作家,其风格也能被良好模拟。专家与非专家在评判标准上的趋同,表明经过微调的 AI 文本质量得到了普遍认可。由于专业的写作费用高达2.5万美元,而训练 AI 的成本仅约81美元,经济效益也相当显著。
这些研究结果恰逢美国法院正在审理有关 AI 如何获取和使用版权材料的诉讼。研究团队建议,对于专门模仿特定作家的 AI,法律应有明确区分,可能需要禁止 AI 复制个人作家的风格,或要求对 AI 生成文本进行清晰标识。
划重点:





京公网安备 11011402013531号