12月18日早间,商汤科技在港交所发布公告,根据一般授权配售新B类股份。此次配售不少于六家机构积极认购,充分反映市场对商汤科技长期价值的坚定信心。公告显示,此轮配售款项较多比例用于持续扩大AIDC“大装置”的规模和提高国产化比例。
值得关注的是,在本周(12月15日)寒武纪宣布完成对商汤日日新Seko系列多模态模型的适配,且是“Day 0”级别的同步支持。在寒武纪的官方适配名单中,能做到Day 0响应的,此前只有两家:一家是主攻大语言模型的DeepSeek,另一家就是商汤“日日新”多模态大模型。
这一细节意味深长,亦是中国AI产业迎来了一个看似静水流深、实则波澜壮阔的节点。如果说适配DeepSeek代表的是国产芯片在文本逻辑处理上的成熟,那么商汤“日日新”Seko模型系列的适配,则标志着国产算力在高带宽、高并发的多模态场景中实现了关键跨越。
从客观技术条件来看,这首先是为了抵抗Scaling Law遭遇的供应链约束、以及单纯依赖堆叠算力的线性增长路径的失效。
从商业视角来看,这比“国产芯片+国产模型”的技术握手更加深远,因为它预示着AI产业的下半场不再是参数的规模竞逐,而是要回归物理现实。与此同时,原生AI企业正在成为国产芯片成熟化的“加速器”。
不难发现,过去一年的时间里,中国AI行业的目光逐渐从云端收回,开始审视一个棘手的灰犀牛:AI进化的重心,已经悄然下沉到算力层的自主可控。
然而,AI的“国产化突围”不是简单的硬件替代,而是一场意味着“重塑”的系统工程。因此,在“算力主权时代”的前夜,从业者面临的并非坦途。
虽然国产芯片力量正如雨后春笋般涌现,但中国芯的生机之下,却也伴随着不可避免的熵增:硬件架构的不统一,形成了一座座孤岛,导致训练与推理的迁移成本极高,形成了一座新的“巴别塔”。
面对这一现状,商汤科技选择了一条极具长期主义色彩的路径:全面拥抱国产化,做那个“修塔”的人。
![]()
大装置,国产芯片的“练兵场”
中国AI的突围,真的只能死磕纳米级的芯片制程工艺吗?
这是一块长期盘旋在行业上空的阴云。限制摆在眼前,我们似乎撞上了一堵墙,而商汤这些AI厂商则看到了墙上的另一扇门。
这家公司给出的答案是:当下比和工艺同样重要的,是生态的“可战性”。
而商汤大装置(SenseCore)在这一战略中扮演的角色,已经超越了传统的算力中心,而是一个巨大的异构调度与适配平台。它更像是一个国产芯片的“练兵场”和“试飞中心”。
![]()
为什么说它是练兵场?因为只有在商汤这样千亿参数级、超大规模并发的真实业务场景中,国产芯片的潜能和优化空间才能被极限激发出来。
在练兵的同时,商汤大装置又做出了像飞机一样精密灵活的产品:在原本异构的国产硬件之上,商汤抽象出了一层统一的软件介质,实现了跨异构加速卡的统一训练,为上层应用留出了一个标准化的接口,开发者可以在不同品牌的芯片之间无缝切换,让端侧用户能够简单地获取高性能、高性价比的国产算力。
看起来只是“算力服务化”,其实背后是由一个“多维共生”的算力生态支撑起来的。
商汤与寒武纪的合作,一开始就没有只停留在硬件采购的维度,而是进入了深度耦合的深水区。商汤利用自身在大模型研发、基础设施构建上的经验,反哺芯片设计,双方共同构建了“阶梯式产品创新体系”,实现了真正意义上的软硬协同。相比单一的芯片销售,国产算力目前的一大优势恰恰在于提供完整的生态服务。
面对拥有全功能GPU属性的摩尔线程,商汤的合作模式更像是一种互补的“技术共生”。摩尔线程提供AI计算能力,其在图形渲染领域的积累,恰好满足商汤在AIGC视频生成中的复合算力需求。
面对刚刚登陆科创板的新兴算力势力沐曦,商汤也通过在具体业务场景中的适配广度,验证了新架构芯片在特定高难度任务上的潜力,双方确立了“算力集群+行业拓展”的全方位合作。针对沐曦曦云C系列GPU的高性能与生态兼容性,双方打通了从需求到供给的优化闭环:商汤的大装置为沐曦提供了日日新大模型的丰富场景验证,而沐曦的高性价比算力则有效降低了商汤的建设成本。
值得注意的是,商汤在国内市场首次完成了华为昇腾910C的超节点全面适配,不是简单的单卡跑通,而是基于384卡超大规模集群的系统级协同。在这样的规模下,芯片间的通信延迟、带宽瓶颈、稳定性等方面的挑战,也会被指数级放大。这是国产GPU首次在千亿参数级大模型的训练与推理中,通过了工业级标准的严苛考验,成功通过了大模型时代的“高压测试”。这一突破也意味着国产算力和国产架构在以一体化的方式,从“可用”走向“好用”。
商汤用大装置SenseCore和日日新大模型体系全面适配为国产芯片“练兵”的战略,解决了AI国产化进程中关键的应用基础设施难题。
至此,商汤的“大装置-大模型-应用”三位一体战略,也越来越具有含金量。它在试图论证一个核心逻辑:国产AI的野心,不应止步于降低落地成本。在算力主权时代,系统级协同能力,有能力重塑生产力。
![]()
在创新中,验证效率最优解
国产化大装置适配与协同只是第一步,就像路修好了,还要想办法让车跑得更快。
对于中国的AI从业者而言,国产芯片在短期内与顶尖水准仍存在客观差距,而国产硬件的优势则在于更好的生态,与原生AI企业长期磨合、联手从工程化走向商业化的长期定力。
这也是寒武纪与商汤“日日新”Seko系列多模态模型适配的战略级价值。文本模型尚且处于国产算力的浅水区,而在视频生成与多模态交互上想要跑出极致性价比,则需要攻克更多挑战——不仅算力消耗巨大,对带宽和显存的要求更是苛刻。
这不只是技术问题,也是商业化的“胜负手”。
商汤展示出来的工程化能力,暗示了未来五到十年内的趋势:在计算方式和架构创新的加持下,国产算力集群完全有能力实现效率上的反超,为商业化落地找到极具竞争力的成本优势。
更具前瞻性的一个案例是,商汤与记忆张量合作,攻克了“GPGPU架构适配难度远高于NPU”的行业难题,双方实现了PD(Prefill-Decoding)分离技术的首次大规模商用落地,通过将预填充与解码过程在物理上分离并异构部署,如同将一条拥堵的混合车道拆解为两个高速并行的专用车道。结果是惊人的:国产GPU的推理性价比提升了150%。
离“未来”最近的领域,则是视频生成。这既是当下AI竞争的新高地,也是一个公认的“算力黑洞”。商汤开源了LightX2V推理框架,这是行业首个能实现实时视频生成的框架,目前下载量已突破350万次。
LightX2V的战略意义在于它的国产化适配插件模式,体现出了可观的兼容性——不仅支持昇腾910B、海光DCU等主流国产芯片,还在设计之初就引入了低比特量化、稀疏注意力等硬件友好机制,在几乎不损失画质的前提下,将推理性能提升了3倍以上。
这种设计极大地释放了国产算力的优势,打破了过去“国产算力只能做好文本推理,做不了复杂视频生成”的刻板认知。国产芯片同样可以承载高带宽、高算力的多模态任务。
如果说推理框架是工具,那么模型能力就是试金石。
在长视频生成中,保持人物、场景的一致性是最大的挑战之一。商汤的Seko系列模型作为行业首个多剧集生成智能体,在视频一致性上的突破,依托的正是商汤自研技术底座与国产算力的长期磨合。
而这一能力的呈现,与商汤三位一体的战略密不可分。商汤“全面国产化”的定力,为国产大模型的规模化落地,尤其是处理高维、动态、复杂数据等高价值密度赛道的任务,提供了更多可行性。
此外,这家公司目前正在通过开源生态,将复杂的硬件适配工作封装在底层。上层应用开发者不需要关心芯片差异,只需要关注应用的效率和效果。
![]()
最后一公里,走向“交付级”
所有的技术决策,最终都要回归到商业的“最后一公里”。
如何彻底验证国产化的“三位一体”具有优越性,而不是退而求其次的无奈之举?终局,还是应用落地。
因此,商汤战略触角中很重要的一环就是“应用”。它们并没有止步于云端大装置,而是延伸到了端侧世界。目前,商汤的产品矩阵涵盖了从大装置到日日新多模态模型、再到端侧应用的全栈生态。
以小浣熊这款AI办公应用为例,不仅完成了国产芯片适配,其端侧模型精度能够对标云端。“国产算力难以在终端普及”的魔咒被打破。AI数字人生成平台如影,也在国产算力底座上实现了高效运行,为视频内容创作提供了自主可控的生产力工具。
![]()
商汤智能办公助手—办公小浣熊Raccoon
未来,高性能AI会像普惠的水电煤一样,走入寻常百姓家。
特别是在城市管理、金融、医疗等对数据主权极其敏感的业务上,无论是企业还是个人客户,几乎都面临着高性能、便捷性、自主可控的不可能三角。公有云更便捷,但数据安全得不到保障;私有部署更安全,但国产硬件适配难度大、性能不稳定。商汤提供的全栈国产化私有化部署方案,精准地击中了这一痛点。
目前,商汤已经在这些领域实现了对国产芯片的全面适配与正式交付。这也意味着,基于国产算力和国产大模型的解决方案,已经从技术验证走向了真正的商业化。
商汤正在走出一条属于中国科技企业的长期主义之路。将“算力国产化”的宏大叙事转化为每个人都看得见、用得起的生产力工具,需要用实打实的应用层交付量来书写信心。这不仅是中国AI产业走向独立自主的一张技术信任票,也是商汤“三位一体”模式的最后一公里。





京公网安备 11011402013531号