IT之家 10 月 17 日消息,科技媒体 Appleinsider 昨日(10 月 16 日)发布博文,报道称苹果公司公布了 3 项 AI AI 研究成果,深入探讨了如何运用人工智能(AI)与大语言模型(LLM)提升软件开发与测试的效率。
这些研究分别聚焦于自动化质量工程(QE)测试、修复代码错误以及预测软件缺陷,旨在解决传统手动测试耗时、昂贵且易出错的痛点。
一、Agentic RAG framework
第一项研究提出了一个“智能体 RAG 框架”(Agentic RAG framework),专门用于软件自动化测试。
传统模式下,质量工程师需要花费 30-40% 的时间手动编写测试方案和脚本。为解决此问题,苹果设计了一个由六个专业 AI 智能体组成的协同系统,分别负责法规遵从、历史案例分析、测试生成等任务。
该框架取得了显著成效:不仅将测试准确率从 65% 提升至 94.8%,还将所需时间大幅缩短了 85%,同时 BUG 检测率也提高了 35%。
二、SWE-Gym
第二项研究则推出了一个名为“SWE-Gym”的训练环境,专门用于培养 AI 智能体解决真实世界的软件工程问题。
该环境整合了来自 11 个知名 Python 代码库的 2438 个真实 GitHub 问题,让 AI 在模拟环境中学习诊断并修复错误。
经过训练,基于语言模型的 AI 智能体成功解决了 72.5% 的编程任务。这项研究旨在通过 AI 辅助提升开发人员的生产力,并为探索“人机协作”编程模式提供了新方向。
三、ADE-QVAET
第三项研究聚焦于软件 BUG 的“事前预测”,并为此开发了名为“ADE-QVAET”的 AI 模型。
它结合了自适应优化技术(ADE)与量子变分自动编码器(QVAET),通过深度学习和模式识别来精准定位高维特征中的异常。
该研究的目标是利用 AI 从“被动修复”转向“主动预防”,从根本上提升软件质量。
IT之家附上参考地址