在人工智能技术加速重构全球竞争格局的关键时期,国务院日前发布《关于深入实施“人工智能+”行动的意见》,标志着我国人工智能发展从技术突破迈向全要素赋能的历史性机遇。
作为继“互联网+”之后国家推动数字经济发展的顶层战略设计,这一行动将人工智能定位为培育新质生产力的核心引擎,旨在通过科技、产业、民生、治理等六大领域的深度融合,构建“人机协同、跨界融合、共创分享”的智能经济与社会新形态,目标锚定“2027年智能终端普及率超70%”“2035年全面步入智能社会”。
作为打通技术落地“最后一公里”,推动创新链、产业链与人才链的闭环协同的关键推动力量,中国人工智能企业也在这场行动中扮演了重要角色。
2025年上半年,随着与国际巨头的技术代差,从2年前的18个月压缩至不足半年,大模型技术进入新发展阶段,生成式AI应用渗透不断提高,突破更多场景“工业红线”。中国AI巨头们也以“闭环能力”为矛,刺破同质化竞争的僵局,加速转向规模化落地。尤其是字节跳动、阿里巴巴、商汤科技、百度为代表的中国大模型四巨头,不再单纯追逐模型性能,将竞争焦点转向场景渗透与生态协同效率。闭环能力正成为衡量AI价值的终极标尺。
技术突破与路径分化:从参数竞赛到生态构建
在国内市场,字节跳动的全场景覆盖、阿里的开源生态、商汤的多模态垂直整合、百度的AI原生应用扩张,大模型四巨头格局逐渐突出重围。
字节跳动:全场景覆盖的“开源+可控推理”
8月推出的Seed-OSS-36B大语言模型,以512K上下文窗口打破长文本处理瓶颈,支持单次输入90万汉字。其引入“思考预算”机制,用户可通过设定token数量,控制模型思考的深度。例如对于复杂数学推理或代码生成,可以给更多预算让它深思熟虑。该模型依托火山引擎算力底座,形成“开源模型+开发工具链+内容生态”闭环,其核心模型能力已赋能豆包等旗舰应用。
阿里巴巴:商业闭环与多模态生成的垂直整合
通义千问大模型聚焦商业场景闭环,其升级版“通义万相Wan2.2-S2V”正式开源,可基于人物图片和人声音频文件,生成高质量的人物说话、唱歌、表演动态视频。同时推出AI编程工具Qoder,支持代码库语义搜索与架构洞察,支持自然语言任务委派与一键“维基化”代码库。阿里以“开源模型+行业工具”组合提升AI模型的场景渗透率。
商汤科技:多模态与具身智能的垂直深耕
商汤日日新V6.5多模态大模型,率先突破“图文交错思维链”技术,推理性能比肩Gemini 2.5 Pro、Claude-4 Sonnet;同时更新模型架构,性价比提升3倍。围绕“生产力工具”和“互动工具”两大场景快速渗透。最强办公智能体“商汤小浣熊”,金融、教育、政务三大版本,用户数突破300万。并在互动工具领域,实现文本与音视频融合。商汤还推出“悟能具身智能平台”, 依托感知、导航和交互三大核心能力,构建AI与物理世界交互的高效通路,赋能具身智能发展。
百度:AI原生应用与行业赋能双引擎
百度开源文心大模型4.5系列模型,并实现预训练权重和推理代码的完全开源。同时,文心X1行业大模型面向金融、医疗、制造等垂直领域,通过行业知识增强技术实现专业术语理解准确率提升至92.7%。
另外,多模态大模型技术已成为通用人工智能(AGI)路径的关键战场。商汤科技联合创始人、首席科学家林达华认为,智能的核心就是与外界(包括世界或者其他人)进行自主交互的能力。这是一种综合能力,涵盖感知、推理、决策、学习等。单靠语言模型并不能构建真正意义的 AGI,多模态信息感知与处理的能力是 AGI 的核心要求,也是从语言模型迈向 AGI 的必由之路。这是商汤选择以多模态为技术主轴背后的核心技术判断。
阿里巴巴集团副总裁许主洪也强调,多模态大模型是实现通用人工智能(AGI)的必经之路,因为它能让AI像人类一样,通过整合文本、图像、音频、视频等多种信息,更全面地理解世界,并带来前所未有的自然交互和丰富的应用场景。
算力生态比拼
算力基建的竞赛从未停歇,如今胜负关键已经从规模扩张,转向性价比与协同创新。四巨头通过架构优化和升级实现算力效能跃迁:
企业
算力基建策略
性能突破
成本优化
字节跳动
火山引擎+动态推理框架
512K上下文窗口实时处理
思考预算机制降低复杂任务算力消耗
阿里巴巴
含光800芯片+ECS超算集群
百万级上下文窗口支持
通义模型推理效率提升40%
商汤科技
大装置+异构集群+SenseCore 2.0
总算力2.5万P,算力效能比提升20%
多模态推理成本大幅降低,降至LLM同级
百度
飞桨平台+昆仑芯片
支持自动驾驶模型训练效率提升50%
通过开源工具,降低部署成本
商汤大装置SenseCore 2.0平台升级,强大的训推优化能力,自研训练框架+双推理引擎(vLLM + LightLLM),线上推理性能提升15%。而字节跳动的动态推理框架(如思考预算机制)则开创算力弹性分配范式,使其在多项测试中表现优异。
根据IDC发布的《中国大模型平台市场份额,2024年》报告显示,百度智能云、阿里云、商汤科技分别位居行业前三,站稳国内行业第一梯队。IDC指出,过去一年,大模型平台竞争的重点已经开始向智能体开发平台倾斜,厂商比拼的核心包括工具链的完善度Token 的调用、头部客户的争取等。同时,沙利文联合头豹研究院发布的《2025年中国AI基础设施市场报告》中,位于“领导者象限”前列的分别是阿里云、腾讯云和商汤科技。由此可见中国AI基础设施第一梯队格局。
面向未来的场景和落地
技术优势的价值兑现,取决于垂直场景渗透力与商业转化效率。四巨头的落地策略呈现鲜明特色。
字节跳动:内容生态的全链路重构
豆包大模型支撑抖音AIGC月活破亿,豆包(通用助手)、Gauth(教育)、Coze(开发平台)等五款应用入选全球Top100,通过“爆款复制+流量垄断+赛马研发”三策略构建内容生成生态。
阿里巴巴:开源系列与行业赋能
阿里已开源超过300个通义系列模型,全球下载量突破 4亿次。基于通义千问二次开发的衍生模型数量超14万个。超30万家企业接入通义大模型API。例如,通过接入通义大模型,可实现商家工具升级,智能客服效率提升50%。
商汤科技:教育金融等行业的深度智能化
商汤2025年上半年收入增长36%。“小浣熊”三大版本用户数突破300万。教育版覆盖500+院校、10余种教育场景、25万+教师和学生,帮助学生提升学习效率15~30%,课堂参与度提高 2.1倍。与紫光汉图联合推出的作业批改机,准确率99%+,10分钟完成全班批改。金融版与客户共建效率提升300%。多模态实时互动时长增长510%。视觉AI服务国内外客户660余家。
百度:自动驾驶与城市智能化
文心大模型以开源生态战略构建竞争壁垒,日均调用量达16.5亿次,深度整合医疗、教育行业解决方案。在自动驾驶领域,Apollo车路协同系统覆盖全国30城,L4级测试里程突破8000万公里,技术落地速度领先行业。
四巨头的实践揭示AGI的终极逻辑:技术优势需转化为生态势能,参数竞赛终将让位于场景深耕。当大模型战争进入深水区,技术代差趋于消失,场景定义能力与开源生态整合力,将成为未来AI的决胜关键。