当前位置: 首页 » 资讯 » 新科技 » 正文

MiniMax闫俊杰:AI领域会多玩家共存,成本也会更可控

IP属地 中国·北京 编辑:陆辰风 21世纪经济报道 时间:2025-07-27 00:18:14

21世纪经济报道记者 邓浩 上海报道

自从年初Deepseek R1开源模型“掀桌”以来,接入Deepseek成为几乎所有下游AI应用厂商的选择,甚至有部分资本市场人士感叹大模型的战争已经结束了。

事实果然如此吗?

7月26日,大模型六小虎之一的MiniMax创始人、CEO闫俊杰在2025世界人工智能大会(WAIC)首日的主题演讲上给出了自己的回答,“我们认为,AI领域一定会有多个玩家持续存在。”

在闫俊杰看来,AI一定会被掌握在多家公司的手中,其中有不少可以自洽的逻辑。

首先,由于所有模型,都依赖对齐(Model Alignment),模型不同,对齐目标也会不一样。其举例称,有的模型对齐目标是一个靠谱的程序员,那么做 Agent 就会特别的强;有的模型它对齐目标是与人的交互,那么它就会比较有情商,能够做流畅的对话;有的模型可能会充满想象力。因此,这或许可以给模型带上属于开发者自己的价值观和思想偏好。

其次,闫俊杰透露,MiniMax最近半年用的AI系统其实都已经不是单个模型了,而是一个多Agent系统,里面涉及多个模型,不同的模型也可以使用不同的工具,通过这样的方式让AI智能水平越来越高,能够解决越来越复杂的问题。“这个东西带来的结果是,单一模型的优势在这样一个多Agent 系统里逐渐变弱。”

最后,闫俊杰认为是过去一年开源模型如雨后春笋般涌现,开源模型变得越来越有影响力。最好的开源模型越来越多,同时也在不断逼近最好的闭源模型。

无独有偶,不久前,月之暗面推出了Kimi K2基础大模型,并且选择了开源,引发资本市场的一波热炒。华西证券评价称,相较过去的基座模型,K2更强调代码能力和通用Agent任务能力。在多个标准测试集下,具备与OpenAI和Anthropic旗下大模型接近的能力。

6月,MiniMax已经推出了号称世界上第一个开源的大规模混合架构的推理模型MiniMax-M1,被业内视为面对DeepSeek R1强劲竞争给出的回应。

在以闪电注意力机制为主的混合架构帮助下,MiniMax推算,在生成长度为10万tokens的场景下,MiniMax-M1的计算量(FLOPs)为DeepSeek R1的25%,在长文本处理任务中具备显著优势。

成本节约则更具优势,在进行8万Token的深度推理时,M1所需的算力仅为DeepSeek R1的约30%;生成10万token时,只需要后者的25%。

一个有趣的观察是,在过去一年半, 业内可使用算力显著增加的情况下,AI模型的大小却没有发生特别大的变化,比如前述的Kimi K2总参数达到1T,激活参数为32B。

闫俊杰认为,原因在于对所有实用模型而言,计算速度是一个比较关键的因素。如果模型计算速度特别慢,就会降低用户的使用意愿,所以所有公司都关注模型的参数量和智能水平之间的平衡。

此外,闫俊杰判断,通过大量的计算网络系统和优化算法,在接下来一两年之内,最好模型的推理成本可能还能再降低一个数量级。进而其认为训练单个模型的成本不会显著地增加。

不过,尽管技术演进优化或许可以让AI研发不再那么烧钱,但是算力使用可能还会继续飞速增长。

闫俊杰透露,“尽管 Token 会变得很便宜,但是使用 Token 的数量会显著增加。去年ChatBot单个对话只要消耗几千个Token,现在 Agent 单个对话可能消耗几百万个Token,并且因为AI解决的问题越来越复杂,越来越实用,那么用的人也会越来越多。”

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。