当前位置: 首页 » 资讯 » 新科技 » 正文

走向“模型自我进化” MiniMax发布新一代大模型M2.7

IP属地 中国·北京 证券时报 时间:2026-03-18 16:22:59

国产AI大模型公司MiniMax于3月18日发布新一代模型M2.7,首次展示“模型自我进化”路径。该模型通过构建Agent Harness(智能体执行框架)体系,深度参与自身训练与优化流程,在部分研发场景中可承担30%—50%的工作量,并在内部评测集上实现约30%的效果提升。

相较于此前M2系列,M2.7的核心突破不再局限于性能提升,而是提出了一个更具范式意义的方向——“模型自我进化”,即让模型深度参与自身的训练、优化与迭代过程,推动AI从被动执行走向主动演化。

M2.7现已在MiniMax Agent与开放平台全球上线。业内人士认为,随着“龙虾”走红,Agent范式加速落地,M2.7标志着AI正从工具阶段迈向具备自我演化能力的系统阶段。

以Agent为核心的自我进化系统

记者从MiniMax了解到,M2.7的关键在于构建了一套以Agent为核心的自我进化系统。在该体系中,模型不仅承担生成与推理任务,还通过构建复杂的Agent Harness(智能体执行框架),参与数据处理、实验设计、训练调优与评测反馈等完整研发流程。换言之,模型开始成为模型研发流程的一部分,而非单一工具。

具体实践中,MiniMax将M2系列早期版本引导为一个研究型Agent,可与不同项目组协同工作,覆盖数据流水线、训练环境、评测体系以及跨团队协作。

以强化学习(RL)场景为例,Agent能够从实验设想出发,通过与研究员讨论,协助研究员完成文献调研、实验设计、任务执行,并在过程中自动进行日志分析、Bug排查、指标优化和代码修复,显著降低人工介入频率。官方数据显示,在部分研发流程中,M2.7已可承担30%至50%的工作量。

同时,M2.7具备“自我优化闭环”。在内部测试中,模型可连续执行超过100轮“分析—改进—验证”的循环,自主调整采样参数、优化工作流策略,并在内部评测集中实现约30%的效果提升。这种能力意味着,模型不再完全依赖人工调参,而是具备一定程度的“自主进化能力”。

多智能体协作与交互范式探索

根据测试数据,M2.7在SWE-bench Pro中取得56.22%成绩,接近国际一线水平;同时在VIBE-Pro、Terminal Bench 2等真实工程测试中表现突出,支持端到端项目交付与复杂系统理解。办公场景方面,其在 GDPval-AA 的ELO得分是1495,为开源最高,并显著提升Office文档处理与多轮编辑能力。

M2.7强化了“多智能体协作”(Agent Teams)能力。在这一模式下,模型需同时承担多个角色,进行对抗性推理与协同决策。这对模型的身份保持、逻辑一致性与协议遵循提出更高要求,也被视为Agent应用从单点能力走向复杂系统的重要标志。

与此同时,MiniMax也在探索Agent的“非生产力边界”。通过增强模型的人设保持与情感交互能力,M2.7开始具备更强的互动属性,并支撑起MiniMax最新推出的互动娱乐产品OpenRoom,将AI交互延伸至沉浸式Web环境,探索“对话即界面”的新交互范式。

从行业层面来看,随着OpenClaw等Agent框架的走红,AI竞争正从“模型能力”转向“执行系统能力”。M2.7的发布,意味着国内厂商正在尝试定义下一阶段的技术路线——即以Agent为核心、以自我进化为驱动的AI系统。

分析人士认为,如果自我进化能力进一步成熟,未来AI系统有望实现从数据构建、模型训练到评测优化的全流程自动化,这将显著压缩研发周期,并重塑AI产业的成本结构与竞争格局。

目前,M2.7已在MiniMax Agent及开放平台上线。随着开发者与企业用户的持续接入,其在真实场景中的表现,将成为检验“自我进化模型”商业价值的关键。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新