当前位置: 首页 » 资讯 » 新科技 » 正文

谜底揭晓:全网猜了一周的“DeepSeek V4”,竟是小米自研王牌

IP属地 中国·北京 编辑:顾雨柔 TechWeb 时间:2026-03-19 19:34:18

3月19日消息, 18日深夜,人工智能领域迎来了一场突如其来的“官宣”。

小米在一夜之间发布了三款自研大模型——MiMo-V2-Pro、MiMo-V2-Omni和MiMo-V2-TTS,不仅以强劲的性能参数震撼业界,也揭开了过去一周席卷全球开发者社区的一个“神秘谜团”。

目前,用户已经可以在网页端直接体验这些小米的最新大模型,还可以一键部署免费养龙虾。

匿名亮相

一周前,在全球最大的API聚合平台OpenRouter上,突然出现了两个代号为Hunter Alpha和Healer Alpha的匿名模型。上线伊始,它们便以惊人的调用量持续霸榜,短短几天内消耗量突破1万亿tokens,引发全球开发者社群的广泛关注与讨论。

由于其强悍的代码生成能力和复杂的任务处理表现,加之当时恰逢DeepSeek V4发布的传闻期,不少业内人士纷纷猜测,这很可能是DeepSeek的“马甲”型号。OpenClaw创始人Peter Steinberger甚至专门在社交平台X上发文,打听这两个匿名模型的身份信息。

然而,真相在3月18日深夜水落石出。小米正式揭晓,Hunter Alpha正是旗舰基座模型MiMo-V2-Pro的早期测试版本,而Healer Alpha则对应全模态模型MiMo-V2-Omni。这场持续一周的“匿名猜谜”,最终以小米的华丽登场画上句号。

网页端可体验,还能一键养龙虾

根据官方介绍,小米此次发布的三款模型,分别瞄准了智能体时代的三大核心能力:高强度的任务执行、全模态的理解交互,以及有温度的声音合成。

MiMo-V2-Pro作为旗舰基座模型,专为现实世界中高强度的Agent工作场景打造。其总参数量突破1万亿,激活参数达420亿,并支持高达100万tokens的超长上下文窗口。

在全球权威的大模型综合智能排行榜Artificial Analysis上,MiMo-V2-Pro位列全球第八、国内第二,在编程Agent、通用Agent和工具使用能力方面,与Claude Sonnet 4.6、GPT-5.2、Gemini 3.0 Pro等国际顶尖模型处于同一梯队。在OpenClaw标准评测榜单PinchBench上,它也拿下了全球第三的好成绩。

MiMo-V2-Omni则是面向复杂多模态交互的全能型选手。它融合了文本、视觉、语音的全模态感知能力,在音频理解上甚至超越了Gemini 3 Pro,支持超过10小时的连续长音频深度理解;图像理解能力也超过Claude Opus 4.6,逼近Gemini 3 Pro。在实际应用场景中,它可以像人一样操控浏览器——自主打开小红书研究手机配置、跨店比价,甚至转接客服砍价。

MiMo-V2-TTS则让智能体的声音真正“有温度”。基于自研的Audio Tokenizer和多码本语音-文本联合建模架构,经过上亿小时语音数据的训练,它支持东北话、四川话、粤语等多种方言,甚至能实现同一句话内的情感转折和高质量的歌声合成。

小米提供了Web端访问和API访问两种模式供用户使用最新的MiMo-V2系列大模型。

在网页端,用户除了可以直接和大模型对话互动外,还可以一键部署、体验免费养龙虾Xiaomi MiMo Claw。

API调用定价策略上,小米展现出极高的诚意:MiMo-V2-Pro的API定价仅为Claude Opus 4.6的五分之一,输入每百万tokens最低仅需1美元。

为何必须自研大模型?

在小米MiMo大模型的背后,站着一位被业内称为“天才少女”的关键人物——罗福莉。作为原DeepSeek核心成员,她在AI学术与工程领域早已声名鹊起。2024年,她正式加入小米,出任MiMo大模型负责人。

罗福莉的加盟,被外界视为小米AI研发从“应用集成”向“核心自研”跨越的重要标志。

2024年10月,小米AI团队与北京大学联合发布聚焦MoE与强化学习的论文,罗福莉作为核心作者亮相;2026年3月,她再次与北大合作,研发出统一的资源管理系统ARL-Tangram,在真实世界的智能体强化学习任务中,可将训练步骤持续时间缩短至多1.5倍,并节省高达71.2%的外部算力成本。这一突破,直接提升了小米大模型的训练效率和成本竞争力。她的团队,被认为正在为小米构建面向AGI时代的底层技术基石。

小米为何要在此时推出独立的自研大模型?答案或许藏在它的生态布局里。

小米拥有全球最大的消费级IoT平台,覆盖手机、汽车、智能家居等海量设备。小米集团合伙人、总裁、手机部总裁、小米品牌总经理卢伟冰此前曾透露,小米计划将玄戒自研芯片、HyperOS操作系统与AI助手进行“三合一”深度整合。只有掌握底层大模型的核心能力,才能在系统层面实现真正的原生智能体验,让AI流畅地调用设备权限、调度多任务,而不是简单地外挂一个“聊天机器人”。

小米的场景覆盖从语音唤醒到车载导航,从家居控制到办公文档,需要的是真正理解物理世界的全模态能力。当AI能力要嵌入小爱同学、MIUI系统乃至汽车座舱时,自研模型能从根本上控制推理成本,实现商业上的可持续。

这场深夜发布,或许正是小米迈向“AI+硬件”深度融合时代的重要转折点。(果青)

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。