![]()
IDC数据显示,2024年中国AI大模型解决方案市场规模达34.9亿元,同比增长126.4%,而MaaS(模型即服务)市场更是实现215.7%的爆发式增长。这背后,是MaaS 正通过“技术优化+模式创新”,显著降低企业AI应用的综合成本,使“低成本规模化”成为可能。
企业级AI规模化挑战
与市场规模不断增长相对的,目前企业级AI应用看似诸多落地,但又似乎有一些缺失。
首先是成本,英伟达预测2030年全球AI基础设施开支将达3-4万亿美元,2025-2030年复合增长率达38%-46%。
在不断增加的基础设施开支的背后,是算力成本高企制约企业AI规模化应用的痛点,尤其对中小企业形成显著门槛。据硅基流动的运营数据显示,单一企业大模型训练单次成本常超百万,而推理阶段的算力消耗更是持续产生的“刚性支出”。
以教育机构为例,据测算,为100万用户提供AI个性化学习服务,仅GPU租赁费用每年就需数千万元,远超其营收承受能力。
成本压力来自“低效使用”与“结构失衡”双重因素。一方面,算力资源利用率偏低。多数企业采用固定算力配置,无法根据业务潮汐波动动态调整,导致白天高峰期算力不足、夜间闲置期资源浪费。
某电力巨头在引入硅基流动的动态扩缩容方案前,算力利用率仅为35%,夜间闲置算力占比达60%;另一方面,成本结构不合理。英伟达算力虽性能强劲但价格昂贵,国产算力虽成本较低但需额外优化投入,企业难以找到“性能”与“成本”的最佳平衡点。
这种成本失衡形成恶性循环:企业因担心投入回报比不足,不敢加大AI投入,导致应用深度不够,进一步降低价值产出,最终陷入 “小投入-低产出-更少投入” 的困境。IDC数据显示,中小企业AI平均投入仅320万元,不足大型企业的1/10,这使得其应用集中于智能客服等基础场景,难以实现深度业务变革。
除了成本之外,企业还面临着“技术困局”。企业级AI应用的技术复杂度远超个人场景,集中体现在算力管理与模型适配两大难题上。算力管理层面,在国产算力崛起的背后,是企业逐渐面临着“国产多品牌芯片+英伟达芯片”共存的异构形态,但不同芯片的指令集、优化逻辑差异显著,导致 “算力孤岛” 现象普遍存在。对此,硅基流动联合创始人兼首席产品官胡健表示,硅基流动观察到,某能源企业早期部署的千卡级算力池,因缺乏统一纳管工具,算力利用率不足40%,部分国产卡甚至处于闲置状态。
模型适配的滞后性进一步制约应用深度。企业往往需要根据业务场景快速迭代模型,但传统模式下,新模型适配周期长达1~4周,且性能难以保障。胡健告诉笔者,稠密模型适配需数周,MoE类模型因结构复杂更是耗时良久。
即便企业翻越了“技术”与“成本”两座大山,还将面临安全合规,与AI人才不足等困境,现阶段对于企业AI应用来说,一面是AI带来的技术红利,另一面则是AI应用过程中存在的多重阻碍。
MaaS能让企业级AI“照进现实么?
在胡健看来,MaaS的服务模式将成为企业级AI落地过程中的最佳方式。MaaS通过“模型仓库+推理引擎+运维工具链”的一体化解决方案,将以硅基流动为代表的服务商的技术能力转化为企业可直接使用的标准化服务。
IDC发布的《中国模型即服务(MaaS)及AI大模型解决方案市场追踪,2024H2》报告中指出,2024 年中国 MaaS市场呈现爆发式增长,全年规模达 7.1 亿元人民币,较 2023 年实现215.7% 的同比激增,其中 2024 下半年市场规模达4.6亿元人民币。同时,《报告》预计,展望2024-2029 年,MaaS市场将以66.1%的年均复合增长率高速扩容,预计2029年市场规模将达到90亿元人民币。
成本是MaaS模式最为明显的优势之一。MaaS 服务通过“技术优化+模式创新”,显著降低了企业AI应用的综合成本,使“低成本规模化”成为可能。
在硬件成本方面,MaaS服务商通过大规模采购与国产算力适配,为企业提供高性价比选项。据胡健介绍,通过与华为深度合作,硅基流动实现了昇腾卡推理成本比英伟达低50%以上,某能源企业采用该方案后,千卡级算力池年成本下降近千万元。
不仅于此,胡健介绍,通过硅基流动的动态扩缩容技术,还可使企业能根据业务量实时调整算力资源,避免闲置浪费,在降低了算力成本的同时,还能提升算力资源利用率。
除了硅基流动之外,也有不少大模型服务商通过不同的方式,降低了算力成本。比如,火山引擎通过“规模效应”进一步降低单位成本,其豆包大模型日均Tokens调用量达16.4万亿,通过飞轮效应使单位Token成本降至行业低位。
MssS服务在成本方面的核心价值在于——让企业从“购买算力”转向“购买价值”,通过服务的模式,让企业无需为底层技术投入买单。IDC数据显示,采用MaaS模式的企业,AI投入回报率较传统模式提升2~3倍,金融行业更是达到4倍以上。
成本优势固然是MaaS服务能够出现的重要原因,但MaaS服务真正的优势还是在于让企业实现了“AI平权”——通过“封装复杂技术”降低应用门槛,使企业无需专业AI Infra团队即可实现规模化部署。
以硅基流动的MaaS服务为例,胡健介绍,硅基流动的企业级MaaS构建了低代码操作界面与可视化仪表盘,将模型部署、算力调度等复杂操作转化为“一键式”流程,传统运维人员经过简单培训即可上手。某电力巨头通过该系统,实现了非技术人员参与Agent开发,使AI应用覆盖从电力运维到合同审核的全业务链,日Token消耗达百亿级。
除此之外,MaaS服务通过底层技术优化与系统性调度,实现了算力效率与模型性能的双重提升,破解了企业“硬件强、软件弱”的困境。胡健与笔者分享了硅基流动MaaS平台的一些经验,他指出,硅基流动MaaS平台支持异构算力统一纳管,已适配英伟达、华为昇腾、沐曦等国内外主流芯片,通过智能路由算法将不同任务分配至最优算力节点。并且,基于自研推理引擎,硅基流动MaaS平台实现了“dense类模型当天上线、MoE类模型1~2天适配”,较行业平均周期缩短80%以上。
MaaS服务未来路在何方?
当前,中国MaaS市场已形成“头部引领、多元竞争”的格局,同时在技术迭代与需求驱动下,正朝着“智能体化、国产化、生态化”方向演进。IDC数据显示,2024年中国MaaS市场规模达7.1亿元,2025年上半年公有云大模型调用量已达536.7万亿Tokens,较2024年全年增长近400%,印证了市场的爆发式增长。硅基流动等服务商的实践,不仅勾勒出当前市场的基本面貌,更揭示了未来发展的核心方向。
从市场发展上看,现阶段MaaS服务呈现出“公有云普及、私有化深化”的发展态势。
公有云MaaS以低门槛、高弹性为优势,主要服务个人开发者与中小企业。比如,硅基流动的MaaS平台已积累超过700万用户,2024年中旬适配DeepSeek V2后,单月用户从50万激增至 500万,成为国内少数大规模用国产卡提供服务的平台。火山引擎则凭借公有云优势占据市场主导,2025年上半年以49.2%的Token调用量份额位居第一,其豆包大模型日均Tokens调用量达16.4万亿。
相对公有云的模式来说,选择私有化部署的大多数是央国企或大型企业。这部分企业看重的是私有化MaaS以安全合规与定制化为核心的竞争力。据胡健介绍,目前硅基流动已经完成了某电力巨头、某石化等头部案例落地,其私有化方案通过“模型仓库+推理引擎+运维工具链”的一体化架构,满足企业数据本地化、算力自主化的需求。
值得注意的是,百度智能云同样在私有化市场表现突出,据公开数据显示,百度智能云已经服务超600家金融客户,并与国家电网联合打造了“光明电力大模型”。
这种分化源于客户需求差异:中小企业更关注成本与便捷性,而央国企则将安全合规与国产适配置于首位。
在“双线”发展的基础之上,MaaS市场将呈现“公有云向中小企业下沉、私有化向高端定制深化”的分化趋势。公有云方面,随着单位Token成本持续下降(火山引擎已实现 “厘计价”),中小企业的AI应用门槛将进一步降低,预计2027年中小企业MaaS渗透率将从当前的30%提升至60%。“硅基流动计划通过PLG模式(中小开发者驱动)拓展海外市场,提供标准化API服务。”胡健如是说。
私有化方面,MaaS将向“全栈定制+国产替代”方向深化。央国企与头部企业的需求已从“模型部署”升级为“AI 能力体系构建”,这就对MaaS服务商提出了新的要求——提供从算力规划、模型微调至应用开发的全流程服务。
从技术层面来看,MaaS服务正从单一模型调用向“AI Agent+多模态”的综合平台演进,成为企业智能生产力的核心载体。AI Agent的融入将实现从“任务执行”到“决策支撑”的升级。基于此,胡健表示,硅基流动计划推出的SaaS产品“Function and Service”,将聚焦代码生成、语音交互等场景,构建“目标导向”的智能体能力。
未来,随着AI Agent与多模态技术的融入,MaaS服务将从“辅助工具”升级为“智能生产力系统”,成为企业数字化转型的核心基础设施。而MaaS的终极价值,是让AI真正成为所有企业都能驾驭的生产力工具,推动产业智能化进入“人均Agent”的新时代。(文|Leo张ToB杂谈,作者|张申宇,编辑丨盖虹达)





京公网安备 11011402013531号