21世纪经济报道记者孔海丽 北京报道
“百模”大战后,最艰难的考验已经到来。
当Manus清空微博和小红书账号、官网挂出“地区不可用”的提示时,这个曾因邀请码炒至10万元而刷屏的AI明星,已悄然将总部迁至新加坡。
几乎同时,有消息传出,AI大模型“六小虎”之一的百川智能,其联合创始人谢剑即将离职。公司核心高管只剩下王小川在勉力支撑他的医疗AI梦。
斯坦福大学今年4月初发布的《2025年人工智能指数报告》显示,到2025年2月,头部模型性能差距已从去年初的9.26%缩小至1.70%。
随着技术壁垒的减弱,大模型竞争呈现两个鲜明特征:一是成本急剧降低。以GPT-3.5水平为基准,调用成本从2022年20美元/百万token跌至2024年0.07美元/百万token,18个月骤降99.65%。其中最具代表性的当然是DeepSeek的崛起,在全球AI界掀起了工程优化和成本效率革命的浪潮至今未息。
二是资本、资源消耗战。虽然DeepSeek走出了一条从架构到性能优化的路径,但大模型的进阶,本质上仍然离不开资金、芯片的持续消耗。
麦肯锡报告显示,2024年全球生成式AI投资逾八成流向美国。前不久有报道称,马斯克的xAI拟展开新一轮融资,估值达2000亿美元——这超过中国所有大模型初创企业估值总和。
烧钱不是中国大模型的方向,尽快找到商业化应用场景才是。
早在2022年7月,科技部、工信部等六部门发出通知,在城市管理、交通治理、生态环保、医疗健康、教育、养老等领域持续挖掘人工智能应用场景机会,开展智能社会场景应用示范。
今年7月11日,工业和信息化部发布信息化和工业化融合2025年工作要点提出,支持企业在重点场景应用通用大模型、行业大模型和智能体。
我国大模型的商业化应用,在两个方向展开。
一是小模型+精调路线。DeepSeek-V2以极致性价比席卷开发者社区,证明在制造业预测维护、供应链优化等场景中,轻量化模型结合RAG(检索增强生成)技术,比追求数千亿参数更加实用。
今年初,零一万物创始人李开复宣布了公司重大战略调整:超大模型交给阿里训练,零一万物负责小参数、适中的行业模型,即“小而美”的模型。7月4日,零一万物联合创始人马杰透露,零一万物去年转型以来,收入增长很快,今年收入至少增长几倍。
二是垂直深潜战略。医疗是公认的最适合人工智能垂直应用的领域之一。百川智能就聚焦于医疗AI。但这个赛道投入大、周期长,而且华为、阿里、京东、字节、华大、科大讯飞都在做,竞争非常激烈。
酒旅、物流也是垂直大模型的应用领域。首旅集团、携程、京东等企业正在探索这些领域的AI商用,以实现可量化的生产效率增益。
过去三年,AI大模型可谓波澜起伏,从最初的兴奋,到中间的冷静,再到现在的煎熬,这也正是新兴行业的正常发展曲线。
如今,生存成为大模型企业的第一要务。对初创企业来说,要么继续融资,要么要细分赛道取得尽可能多的收入。
如果大模型有一道生存公式的话,那可能是,技术护城河 = 垂直场景知识密度 × 行业逻辑理解深度 × 商业闭环速度。
百川智能的背水一战,是验证这条公式的实践案例。参照科大讯飞在安徽医疗领域的实践,称得上是资金、耐心与时间的长跑。而Manus能否在异地重生,除芯片资源获取的难易,更大程度是“放弃短期收入换用户规模”的逻辑能否走通。
场景深潜能力正成为初创企业大模型淘汰赛的一把标尺。与OpenAI用ChatGPT重构工作流、xAI以Grok-4重塑社交相比,中国大模型在商业和消费的应用场景要宽广得多。王小川押注医疗AI的决绝,或是行业蜕变的隐喻,把技术根系扎进产业土壤,中国大模型才能真正成为新质生产力。