当前位置: 首页 » 资讯 » 新科技 » 正文

MiniMax 和月之暗面:中国 AI 创业公司的两种路径和共同难题

IP属地 中国·北京 晚点LatePost 时间:2025-11-24 20:14:09



一时的技术成果或者用户增长,很难成为 AI 公司的竞争优势。

文丨王与桐

编辑丨贺乾明

大会结束,月之暗面创始人杨植麟被观众层层围住,有人举着手机想加他微信,有人追到茶歇区要签名。投资这家公司的机构,拉一整大巴的投资人去拜访他,“让一线投资人见见好的创业者是什么样子”。

MiniMax 创始人闫俊杰很少公开露面,网上能搜到的照片没几张。这无碍他在投资行业的热度。MiniMax 估值长期排在中国大模型创业公司前列,投资人要靠 “抢” 才能拿到份额。

这一切发生在 DeepSeek 爆火前。今年初,两家明星创业公司一起被挤到聚光灯边缘。

春节后的第一个工作周,两家公司的二号位各自召开了内部会议,讨论 DeepSeek 之后该怎么做增长。月之暗面在长达 6 个小时的会议后,决定暂缓投放,回归产品和技术本身。在 MiniMax,DAU 被称为 “虚荣指标”。

两家公司有员工觉得,这是一种 “解脱”:不用再绝望地消耗资源与字节等巨头竞争,也无需拼命证明 “中国能诞生 OpenAI”。问题已经失去意义。

在这之后,两家公司取得更好的技术进展。MiniMax 的视频生成模型,宣称在一些场景超过 Google 的 Veo3;其开源的 M2 文本模型,在部分测评中位列全球开源模型第一。月之暗面的 K2 模型,被称为 “中国又一个 DeepSeek”;近期发布的 K2 Thinking,宣称部分基准测试得分超过 GPT-5。

他们的压力并没有消失。MiniMax 和月之暗面曾用较少的资源证明过增长潜力。两家公司因此拿到中国大模型创投领域大多数资金,总计超过 200 亿元人民币。

这笔钱很少,让他们难与字节、阿里,甚至是 DeepSeek 正面竞争,或者是对标 OpenAI、Anthropic 这些海外同行。但这笔钱又足够多,让他们无法收敛野心。

闫俊杰和杨植麟是中国大模型领域的 “双子星”。他们几乎在同一时间走进公众视野,讲着相似的理想——相信技术,追求 AGI;也都在融资、流量、争议与期待中长期被同一个问题拷问:中国的 OpenAI,会诞生在哪?

两人的相同之处并不多。闫俊杰崇尚 “系统理性”,想要在庞杂的约束中寻找最优解。他把公司视作可以设计和优化的函数,坚信组织的力量能够催生创新与增长。

他敢于决断,然后接受冲突,迅速迭代。他创办的 MiniMax,在技术路线上选择多模态模型,是中国最早推出 MoE 模型的团队之一。

杨植麟则相信人才的力量,公司的核心产品 “Kimi” 也是他的英文名,个人光环与公司品牌深度绑定。

他看重 “共识驱动”,相信少数精英能引领方向。与 MiniMax 不同,他创办的月之暗面更执着于无损的语言模型本身的力量,一度不怎么在意 MoE。

现在他们要解决的问题是一样的。之前三年过山车般的经历表明,一时的技术成果或者用户增长,很难成为竞争优势。他们还要建立让技术和用户增长持续产生的组织能力。

技术 CEO、管家二号位

2017 年,在商汤担任 CEO 助理的贠烨祎,就向云启资本合伙人、也是她在约翰霍普金斯的师兄陈昱提出过创业设想,但因为缺合伙人没能推进。四年后,她再次找到陈昱:“我终于找到创业搭子了。”

这个搭子,就是闫俊杰。

闫俊杰是典型的 “系统内优胜者”。他出生于 1989 年,在河南的县城长大,博士就读于中国科学院自动化所。

2014 年博士毕业后,闫俊杰加入商汤,在这家核心成员大多来自香港中文大学和海外高校博士生的公司中,他只用了五年时间,就从算法工程师一路做到最年轻的副总裁、研究院副院长,负责智慧城市、游戏等多个业务。他参与了商汤底层算法到工程落地的体系建设,发表上百篇论文。



MiniMax 创始人闫俊杰。图片来自视觉中国。

闫俊杰第一次见陈昱,就给对方留下深刻印象:一是光头,“一看就是绝顶聪明”;二是闫俊杰跟他讲,可以用基础模型,解决更加通用和泛化的问题。

“现在看来当然是常识,但在行业都还在讲用若干小模型解决复杂问题的 2021 年,令人耳目一新。” 陈昱说。

2021 年底,闫俊杰离职创办 MiniMax。闫俊杰负责技术,贠烨祎负责技术之外的产品、融资等事务。一位 MiniMax 早期人士说:“闫俊杰想要做全世界最伟大的技术,贠烨祎想做全世界最伟大的公司。”

闫俊杰把 AGI 视为 “普通人每天都会用的一个产品、一个服务”。一位 MiniMax 前员工说,他加入 MiniMax,是被会议室墙上的一行字打动——Intelligence for Everyone。

MiniMax 的第一轮融资印证了这套故事的吸引力:闫俊杰在与高瓴创始人张磊聊过后,高瓴直接取代云启,拿下首轮 2000 万美元融资的领投。MiniMax 投后估值达到 2 亿美元。

月之暗面起步没那么顺利。2023 年初,刚成立的月之暗面想融资 2000 万美元还不顺利。在投资人眼里,杨植麟只有 “技术” 标签,缺少产品、管理、融资经验。

出生于 1992 年的杨植麟是广东汕头人,头发茂密,他在卡耐基梅隆读博期间,发布的大语言模型相关论文 XLNet 和 Transformer-XL,现在引用接近两万。



月之暗面创始人杨植麟。图片来自视觉中国。

同样在读博士期间,27 岁的杨植麟参与创办 AI 公司循环智能。他在自己的个人主页上写道:“我所有工作的目标,包括研究和商业,都是最大化人工智能的价值。”

月之暗面的起点,是杨植麟在循环智能负责的团队。2021 年,杨植麟主导了华为云合作的千亿级盘古大模型,团队就叫 “Moonshot”。两年后,他推动 “Moonshot” 从循环独立,成立月之暗面。他认为要 “专门建一家公司,而不是从别的业务里拐出一条支线。”

起步融资遇挫,杨植麟想到循环智能的投资人、也是他的清华学姐张予彤。在 2019 年,还在金沙江创投的张予彤就主导投资了循环智能。

在张予彤的推动下,月之暗面最终在 2023 年上半年完成第一笔融资,红杉、真格、Monolith 的下注让杨植麟赶上了窗口期。张予彤如今在月之暗面的角色是二号位,与贠烨祎在 MiniMax 类似,负责融资、增长等业务。不过张予彤的加入,后来也让月之暗面陷入潜在的利益冲突与仲裁风波。

虽然起步方式不同,两位创始人在公司的发展上做出了类似的选择:用大半年时间研发基础模型后,尝试做 C 端产品,并迎来了第一个爆发点。

2022 年中,MiniMax 投入数名员工,用一个月的时间做出了 AI 对话产品 Glow,用户可以在这个产品上自由创建角色,并和角色对话。他们本想用游戏化的方式收集数据,“没人想到这个产品会一炮而红”。Glow 上线 4 个月后注册用户超过五百万。

“Glow 出乎意料的成功让公司的重心转向了 C 端产品。” 一位 MiniMax 员工说。2023 年底,MiniMax 有约 300 名员工,其中近 200 人在产品线,远超同类大模型创业公司。

月之暗面的故事类似。2023 年 8 月,他们第一个模型训练到后期,开始立项做 AI 助理 Kimi,当时整个公司只有 50 人,预期只是 “展示模型能力”。上线之后,Kimi 连续数月月活用户环比增长超过 100%。

“用了最少的钱,最少的人,最少的卡,做到了最好的状态。” Monolith 创始合伙人曹曦曾如此评价月之暗面,他的基金跟进了月之暗面三轮融资。

到 2023 底再融资时,月之暗面成为资本追捧的对象。小红书投前 9 亿美元估值的价格很快被阿里压过:投资近 8 亿美元,将月之暗面的估值抬升到 23.4 亿美元。

这让它的估值与 2021 年就成立的 MiniMax 并驾齐驱,膨胀速度远超上一代 AI 公司。同一时间,MiniMax 也拿到阿里投资的 6 亿美元资源,估值又超过月之暗面。

两笔融资 2024 年初完成,合计超 14 亿美元(100 亿元人民币),超过中国大模型创投领域上一年公开融资总额,改写了行业格局。

早期增长吸引大额投资,也成了竞争中的弱点

大额资本的注入放大了两位创始人的野心。2024 年初,闫俊杰定下激进目标:技术达到 GPT-4 的水平,把产品用户规模翻十倍,单个产品能突破千万 DAU。

这一年的 MiniMax 很像字节跳动:同时推进多条产品线,从 Talkie、星野到海螺 AI,还有几个没有上线过就放弃的产品。年中,MiniMax 员工总数增长到 400 左右。

公司成立刚一年,杨植麟定下覆盖多个方向的目标:技术上深入无损长文本、视频生成、多阶段推理;产品上追求 DAU 增长、出海;并加大商业化力度。到年中,信奉精英策略的月之暗面,员工也翻了一番。

问题跟着爆发。MiniMax 陷入纠结与摇摆,这年 1 月,MiniMax 视觉模型团队开始押注视频模型;3 月,他们抽调星野 /Talkie 和开放平台的一部分研发人员,做产品形态类似即梦的视频生成项目;5 月,他们放弃这个产品形态项目。

到了 8 月,高层要求在一周内让模型 “能用”,要赶上公司的 Open Day。一位员工回忆,那时模型生成的人物 “手脚还在乱飞”,而承载视频模型的产品项目早已放弃。

最终团队先做了网页版上线,让用户测试,移动端往后延,嫁接到原本主打语音交互的海螺 AI 上。不过就像 Glow 一样,他们对这个产品期望不高。但第二个月,其网页端访问量就接近 500 万。

一位 MiniMax 员工回忆,2024 年的大部分时间,他们都被这种 “既要又要” 的气氛影响——公司既想增长,又不想将模型往 “软色情” 方向调整,但 “一健康就不增长”。高层一度要求暂停在 Talkie、星野等产品上增加广告位,但收入下滑后又陷入焦虑。

闫俊杰说,他经历过技术被资本裹挟的过程:“如果一家企业必须靠不断融资才能前进,那它优化的就不再是产品,而是如何说服投资人继续给钱。”

月之暗面的精英策略也没有在新方向上发挥太多效果。他们想要复现 Sora 的视频模型,但效果一直未及预期,唯一的 “亮相”,是几位联合创始人在朋友圈里发布的几条视频,称由自家视频模型生成;月之暗面低调上线的两款出海产品 Ohai 和 Noisee,几个月后便停止运营。

在这期间,月之暗面创始团队出售股份,迅速在创投领域引发风波。关键不在于卖股份,而在于月之暗面背后的叙事失调。产品未定型、格局未稳固的时刻,创始团队出售股份,很容易被理解为 “急于落袋为安”。

风波之中,我们曾问他此事,他以一句 “Fake news” 简短作答。

2024 年中,“大模型进展放缓” 的论调开始流行。当技术可能很难带来巨大突破时,市场和投资人衡量公司增长潜力的指标,转向最直接的 DAU 数据。

在月之暗面,张予彤主导大规模投流,拉高了 B 站等平台的 AI 产品投流价格。MiniMax 也在高层反复的纠结后,最终决定跟进。

他们再一次被资本看好。MiniMax 拿到腾讯等机构的投资;8 月,月之暗面获得腾讯、高榕创投等 3 亿美元融资。资本意志开始更深地介入公司经营,部分投资人频繁给他们提供增长 “建议”:哪些海外 AI 应用公司增长更快,哪些投流策略更高效,哪类产品功能更能带来留存。

可一同出现的还有更强的对手。字节跳动发动了饱和式进攻:产品线覆盖一切,从生产力到娱乐,从助手到硬件。我们了解到,字节还严格控制外部 AI 产品在抖音上的投放,而豆包等作为字节系产品,还能享受折扣。

一位月之暗面员工回忆,那是公司的士气低谷,“面对字节这样的敌人,是打不过的。” 一位投资人称,如果不推动公司转型,“除了硬着头皮跟字节拼消耗,似乎别无他法”。

到这一年 10 月,一场数位投了大模型的投资人参加的聚会中,他们开始讨论 “如何能卖掉部分手里的大模型创业公司股份?”

追求技术可以是一种选择,但空间越来越小

DeepSeek “解救” 了 MiniMax 和月之暗面。他们靠着远超市场预期的模型,没花一分钱投流,就在一周内吸引了数千万用户,制造了中国自己的 ChatGPT 时刻。

“如果你在对手更强的赛道,那你就没有胜的可能。” 一位月之暗面员工说,DeepSeek 带来的热潮,让他明显感觉到公司内部情绪有了好转,“只要技术够强,就有机会逆天改命。”

月之暗面不再更新 K1 系列的模型,集中资源投入基础算法与新模型 K2。这个新模型被寄予厚望,月之暗面研发团队几乎全员参与,杨植麟本人也亲自下场写代码。

张予彤在社交平台上写道,“小伙伴为了这次发布直接睡在公司里”,配图是一个带有 “离发布还有 0 天” 标语的图片,标语下是一张沙发床。

几个月高强度开发后,月之暗面在 7 月发布并开源万亿参数的 MoE 模型 Kimi K2,宣称在自主编程、工具调用和数学推理等维度上超过 DeepSeek-V3 和阿里 Qwen3。在这之前,杨植麟相信 “闭源是正确的路”。《自然》杂志网站的一篇文章称其为 “中国的又一个 DeepSeek 时刻”。

MiniMax 也完成了类似的聚焦。他们将重点从 “模型与产品并重” 收缩到 “模型优先”。视频、语音等多模态模型依然在研究,这是他们有优势的方向。我们了解到,闫俊杰还把一部分产品的员工转到模型团队,并为文本模型重新分配算力,核心资源集中到语言模型的基础能力上,增加数学与编程数据的比重。他之前说,MiniMax 没必要为了一篇新闻稿,就训练一个类似 o1 那样的推理模型。

他们 10 月开源语言模型 M2 时,强调它的编程和推理能力突出,使用量在 OpenRouter 上已经增长到了前五。“应该创业第一天就开源。” 闫俊杰年初说。

两家公司似乎回到了刚创业时的状态,都把提升模型的能力当作主线,投资方也不再过多给公司提建议。公司的经营依赖创业者本身管理能力。

闫俊杰看上去温和,但一旦做出决定,执行起来极为坚决。在 MiniMax 创业初期,团队曾尝试过 3D 数字人方向。项目尚未上线,闫俊杰判断这条路与公司长期技术路线不符,就立即叫停。项目解散,刚组建的团队经历第一轮震荡。

2024 年起,MiniMax 的中层开始密集流动:产品负责人、商务负责人、数据科学负责人、增长负责人、战投负责人等陆续离开。比如 MiniMax 对齐团队两年内换了三任负责人——第一任因与闫俊杰激烈争论技术进展,被降为普通工程师;第二任由下属提拔,半年后离职。MiniMax 早期的一百名员工,如今已走了一半。

“不是同路人的这些同事,我会请他们离开。我已经请走了几位。” 闫俊杰曾在公司全员会上说。

在他看来,好的成果不是某个人灵光一现的产物,而是科学方法和团队配合下的必然发现,哪怕个人能力不算顶尖,只要能让团队跑得更快,就是合适的人才。

闫俊杰认为,管理公司就是优化函数,目标是商业化效率、调用量等变量,管理的核心任务就是找到 “梯度下降最快的方向”,不断逼近最优解。

MiniMax 的很多决策,比如不做 3D、选择 MoE 架构、做视频模型,都属于 “算出来的结果”。甚至 MiniMax 每两周一次的全员分享会,也叫 “CD”(Coordinate Decent 算法)。

杨植麟相信那些能提出新想法的人才,“因为在这个领域,创新本身最有价值”。他愿意为了招揽一名自己欣赏的技术人才,从北京飞到深圳,聊上十个小时,第二天赶早班机返回;也会让优秀的研究者自己一个人在异地自由工作。

他倾向于先达成共识,再迅速行动。月之暗面的第一款模型亮相时,主打 20 万长文本上下文。但一开始,核心团队有人并不看好这个方向。一位月之暗面早期员工回忆,2023 年 5 月公司就有人提过做长文本,却被其他人否决,理由是算法视角里,这只是压缩问题,是工程活,不是技术突破。这个方向就没有推进。

两个月后,Anthropic 发布处理 50 万文本的 Claude 模型,引发行业震动。长文本成为月之暗面内部共识。“Lossless long context is everything” 成了杨植麟经常提的一句话。

但如今 AI 公司把追求模型能力当做公司经营的核心变得愈发困难。早期的 OpenAI 是一个参考答案。他们的团队延续了 “学术式” 的工作节奏,用实验和试错推动技术研究,领先技术成果诞生后加上山姆·阿尔特曼(Sam Altman)从 YC 带来的增长策略,推动公司持续发展。DeepSeek 的 “学术循环” 模式——批判性思考、原子化创新、推动科学边界——也是一种策略,但它不用太过于关注商业化和用户增长。

MiniMax 和月之暗面很难找到这样的空间和资源。这场资本密集游戏里,资金、算力和生态支持至关重要。OpenAI 的估值已达到 5000 亿美元,要顶着万亿美元估值上市;xAI 和 Anthropic 的估值也都逼近 2000 亿美元。而 MiniMax 和月之暗面的估值都在 40 亿美元左右。这让谁能成为中国 OpenAI 的问题变得没有意义。

体量较大的美元基金退潮后,中国拥有大规模资金的巨头不愿为创业公司持续输血,反而成为 AI 公司的竞争对手。阿里、字节、腾讯,甚至是 DeepSeek,研发基础模型都有主营业务(电商、广告、量化)供血,短期没有盈利压力。

MiniMax 和月之暗面都在尝试用更专业的功能(月之暗面的 OK Computer、深度研究;MiniMax 的专业模式)吸引用户付费订阅。但只要字节等公司的同类产品免费,去年下半年的竞争问题必然会再次出现。

他们还在继续找钱。市场消息称,MiniMax 正筹备赴港上市。月之暗面又开了一轮新融资。

大模型注定是需要几百亿美元,甚至上千亿美元投入的游戏。创业公司想要走完这条路,创始人们必须证明,这是一场需要他们参与的长期探索,才能获得更多的理解和支持。

这是一道更难的证明题:在巨头林立、算力稀缺、资本收缩的市场中,是否还有空间容纳一种既做基础研究、又不属于任何巨头的 AI 公司?

这不仅需要更多技术突破,也需要一种在当前中国环境下罕见的能力——靠投资机构和业务收入,维持一支高密度的研究团队持续产出。

题图Vacation, 2015

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。