当前位置: 首页 » 资讯 » 新科技 » 正文

给未来AI的时间胶囊|缪宇航:未来,多模态的融合是一个重要趋势

IP属地 中国·北京 编辑:顾雨柔 上观新闻 时间:2025-07-25 10:29:39



不知不觉,世界人工智能大会已经来到了第8年。

这8年,我们和读者一起,见证了AI的飞速发展。我们曾感慨“小灵通”漫游的世界来了,可放到今天,这些“科幻”,已经是AI世界里,最基本的操作了。

我们曾遨游元宇宙,也曾疑惑大模型究竟是什么……不管怎样,我们的生活的的确确,因为AI改变着。

再过两年,世界人工智能大会将来到“十周年”的关键节点。2027年,被AI“接管”的世界会是什么模样?AI自身又将走向何方?

在2025世界人工智能大会开幕之际,本报邀请了9家AI领域头部企业的高级管理人、首席科学家、核心研发者,畅谈他们眼中未来两年AI的发展。两年后,我们也会“重启”这份“时间胶囊”,看看大家的预测是大胆的,准确的;还是像曾经我们对AI的想象那样,略显保守。

对于MiniMax来说,世界人工智能大会是一次与全球开发者、创作者们共同学习交流的机会。我们在沉浸式展厅中为观众带来MiniMax Chat、MiniMax Agent等多款旗下AI原生产品,还有AI智能硬件产品及生态应用,还有MiniMax M1等最新自研推理模型的技术亮点,对话互动体验,观众也能看到海螺AI、MiniMax Audio生成的精彩音视频内容。

在模型和产品研发的过程中,我们不断试错,积累了很多经验,也有了一些新的思考。MiniMax M1模型开源发布后,国内外技术社区有许多讨论,对M1的混合注意力机制尤为感兴趣。我们举办了一场面向全球的技术探讨会,和全球学者切磋交流。大家在讨论中提到,随着对大规模部署和低延迟需求的增长,人们会越来越关心推理效率和模型的推理能力,而混合架构也将成为模型设计的主流。


M1系列在长上下文理解任务中,全面超越所有开源权重模型。不难发现,在面向生产力的复杂场景中,长上下文能力尤为重要,在Agent工作流中更有巨大潜力。从Text-01到M1,我们的自研模型的超长上下文能力,解锁了许多全新的企业级应用场景。而随着企业级应用需求不断增加,长上下文模型的部署会越来越广泛。

不久前,相信大家一定看过由Hailuo 02引爆的“动物跳水”视频,这也得益于MiniMax在视频模型上的不断积累和创新。我们坚持深耕多模态技术,视频和语音模型在国际榜单上也取得了前两名的成绩。未来,多模态的融合是一个重要趋势,模型需要更好地理解多种模态之间的复杂关联和语义映射,来实现更全面、准确的信息理解和表达,这是AI产业征程的必经之路。

最近,我们的通用智能体上新了全栈开发功能,是目前最“靠谱”、交付最稳定的通用智能体。业界也在思考,通用智能体要如何演进,下一代智能体应该是什么样的?我们认为,多模态融合、长上下文窗口、自主规划调用多模型能力、高任务复杂度、多智能体协作是下一代智能体自主进化的路径。

如果说Chat是此前大模型的标准User Interface(人机交互界面),那么Agent已成为大模型新的User Interface。此外,算法、工程、产品的边界会变得更加模糊,一体化创新加速到来。Agent本身,将成为工业级任务的自动化核心。

迄今,MiniMax的自研多模态模型和AI原生应用,已受到超过200个国家及地区的用户的欢迎。我们始终相信,坚持自主创新,开放共享,以开放的态度与生态伙伴携手促进行业发展,才能一起推动人工智能成为普惠全球的技术。

作者:MiniMax研发工程师 缪宇航

原标题:《给未来AI的时间胶囊|缪宇航:未来,多模态的融合是一个重要趋势》

栏目编辑:郜阳 文字编辑:郜阳 新民晚报 制图

作者:缪宇航

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。