随着AI Agent的快速发展,让大模型直接操控专业软件(如图像编辑、3D建模、办公套件等)已成为开发者社区的痛点。传统的UI自动化方案容易崩溃,手动编写脚本对接又耗时费力。香港大学数据智能实验室(HKUDS)近日推出开源项目CLI-Anything,彻底颠覆这一现状:只需一条命令,就能将任意软件转化为AI Agent可直接调用的结构化命令行工具,真正实现“Agent-Native”软件生态。
核心创新:自动化生成CLI,让软件“听懂”AI指令
CLI-Anything采用全自动7阶段流水线(分析源码 → 架构设计 → 实现Click CLI → 测试规划 → 测试编写 → 文档生成 → 发布Python包),从软件源码或仓库出发,自动构建生产级命令行接口。生成的CLI具备以下关键特性:
结构化与可组合:命令文本完美匹配大模型输入,支持链式调用复杂工作流;JSON原生输出:所有命令支持--json标志,便于AI解析,避免复杂后处理;自我描述:标准--help提供自动文档,Agent可自行发现功能;交互REPL模式:统一终端交互界面,支持历史记录与进度显示;高可靠性:已覆盖1588+项测试(包括单元测试与端到端测试),全部通过。不同于脆弱的GUI自动化或RPA方案,CLI-Anything直接调用软件真实后端(如Blender渲染引擎、LibreOffice文件处理),生成标准项目文件(SVG、ODF、MLT XML等),确保功能完整且确定性强。
已支持软件矩阵持续扩展
项目目前已为13款主流开源/专业软件生成完整CLI支持,包括:
GIMP(图像编辑)Blender(3D建模)Inkscape(矢量图形)Audacity(音频制作)LibreOffice(办公套件)OBS Studio(直播录制)Kdenlive / Shotcut(视频剪辑)Zoom(视频会议)Draw.io / Mermaid(图表绘制)ComfyUI(AI图像生成)等。团队表示,未来将覆盖更多领域,如CAD、DAW、IDE、科学计算工具等,并欢迎社区贡献自定义软件的CLI封装。
安装与接入极简,一键接入主流Agent框架
安装门槛极低,尤其针对Claude Code用户:
通过插件市场直接添加:
/plugin marketplace add HKUDS/CLI-Anything
/plugin install cli-anything
随后即可运行:
/cli-anything <软件路径或仓库>
项目还支持OpenClaw(通过SKILL.md技能文件)、OpenCode、Codex、Qodercli等多种Agent框架的无缝集成。全程本地运行,无需云端依赖或复杂配置。
社区反响热烈,GitHub星标已破1.7万
自开源以来,CLI-Anything迅速登上GitHub趋势榜,短短时间内收获数万星标。开发者们纷纷表示,这不仅是工具,更是通向“Agent操控一切软件”未来的关键基础设施。许多人已开始尝试将其接入个人工作流,实现AI自动批量处理图像、渲染3D模型、编辑视频等场景。
项目地址:https://github.com/HKUDS/CLI-Anything
AIbase点评:CLI-Anything的出现,让“软件为人服务”向“软件为Agent服务”迈出坚实一步。它避开了UI自动化的所有坑,用最古老却最可靠的CLI形式,重新激活人类积累几十年的软件资产。对于AI Agent开发者、自动化爱好者和生产力工具追求者而言,这个项目值得立即 star 并深入研究。未来,谁先掌握“Agent-Native”接口,谁就掌握下一代生产力钥匙。





京公网安备 11011402013531号