“推理需求在过去一段时间内已经近十倍的增长,今年整体Token增长会不会到100倍?”
![]()
会议现场。澎湃新闻记者 范佳来 摄
3月27日,在2026中关村论坛上,最近外界颇为关注的“AI才女”、小米MiMo大模型负责人罗福莉与月之暗面创始人杨植麟、无问芯穹联合创始人兼CEO夏立雪、智谱华章CEO张鹏、香港大学助理教授&博士生导师黄超现场对话,分享了自己对AI行业趋势和“龙虾(OpenClaw)等热点的看法,这也是罗福莉首次在小米之外的公开活动中亮相。
“OpenClaw的核心价值在两方面,首先是开源,有利于整个社区深入参与到框架改进。”罗福莉表示,此外OpenClaw也告诉了外界,AI智能体存在巨大想象空间。
AI技术的飞速进步已经改变了人们的生活,当杨植麟抛出问题:“未来12个月内大模型发展趋势是什么”,罗福莉直言:“还好这个问题的期限是一年,如果是五年的话,在我心中某种意义上AGI(通用人工智能)已经实现了。”
罗福莉认为,面向AI时代的底层模型结构创新,将成为决定大模型行业竞争格局的核心变量;而长上下文推理的效率突破、模型自迭代能力的落地,以及算力、芯片到人才的全链条比拼,将成为未来行业竞争的核心主线。
值得注意的是,除了传统的大模型路线,当前全球范围的AI行业已掀起下一代大模型基础结构的探索热潮,多家厂商在布局相关技术路线。
据她透露,无论是近期行业内热议的稀疏化、可控机制结构创新,还是小米等企业推出的、面向下一代技术的SSM(状态空间模型)架构,都是行业跳出现有主流架构框架,面向AI时代做出的前置性结构创新探索。
最近“Token(词元)”无疑是AI圈最火热的话题,也成为这场论坛的讨论核心,“大家真实使用大模型会发现,它的能力会随着使用持续提升,而这一切的核心前提,是它具备高效的Token处理能力。”罗福莉表示,
当前行业内已有模型在长上下文场景下展现出极强的性能表现,同时实现极低的推理成本,但绝大多数大模型推理成本过高、推理速度过慢,无法落地到真实的产业场景中。
“只有实现超长上下文场景下的低成本、高效率推理,才能把真正具备高生产力价值的任务交给大模型,进而支撑它完成更高复杂度的任务,最终才有可能更大规模Token的上下文量级下,实现模型的自进化。”罗福莉表示。
她认为,模型的自进化会是未来一段时间最重要的趋势:具体而言,是指大模型能够在复杂环境中,依靠超强的长上下文处理能力完成自我迭代——这种进化既可能针对模型架构本身,也可能针对模型参数。而要实现这一目标,不仅需要在预训练阶段搭建起高可扩展性的模型架构,更要在推理侧实现极致的效率优化,这是一场覆盖大模型全技术链路的全方位竞争。
“一年前我觉得大模型需要3-5年才能做到这个,现在我觉得1-2年就能完成了。”罗福莉坦言。
罗福莉介绍,推理需求的爆发将把大模型行业的竞争推向全新的维度。这场竞争将不止于模型架构与算法的创新,更将向下延伸至算力基础设施、推理芯片,最终落到核心人才的竞争上,未来行业仍然有巨大的想象空间。
公开资料显示,罗福莉本科毕业于北京师范大学计算机专业,硕士阶段进入北京大学计算语言学深造。硕士毕业后,罗福莉加入阿里巴巴达摩院,担任机器智能实验室研究员,负责开发多语言预训练模型VECO,并推动AliceMind项目的开源工作。
2022年,罗福莉加入DeepSeek母公司幻方量化从事深度学习相关工作,后又担任DeepSeek的深度学习研究员,参与研发DeepSeek-V2等模型。





京公网安备 11011402013531号