当前位置：首页 » 资讯 » 新科技 » 正文

模型之问｜“上海队”该如何保持领先？

IP属地中国·北京 编辑：杨凌霄上观新闻 时间：2025-07-28 14:08:28

转载自：解放日报

■“大模型发展至今，已经不是一个单纯的技术问题，也不再是单家公司做某一款产品的问题，而是需要共同创造一个社区，以通往agi的未来。生态发挥着重要作用。”
■国产模型与国产算力之间，正在加速双向奔赴。未来模型对推理算力的需求，将是训练算力的百倍甚至千倍。与此同时，算力基础设施正在走向系统化，相关的软硬件技术，已不再是芯片公司单独可以完成，而是需要跨行业的协作，多方聚力，构建系统化解决方案
纯语言模型的能力或触顶，多模态融合才可能最终通往agi（通用人工智能）？在专注基模研发和商业落地agent（智能体）之间，该如何抉择？除了从闭源走向开源，大模型产业界在生态协同上还能做些什么？
今年世界人工智能大会的重大创新，在于切中数学、科学、模型要害，提出“ai三问”。昨天，由商汤科技承办的一场大模型论坛，邀请来自阶跃星辰、上海人工智能实验室、第四范式、智谱等大模型公司的大咖进行技术交流，“模型之问”贯穿始终。记者发现，在这场基本集齐上海“四大基模”的现场，大模型“上海队”的抉择凸显出它们“留在牌桌上”的暂时领先优势。
全球出圈
自chatgpt在2022年11月30日一夜爆火后，大语言模型厂商们在对标路上狂奔两年多。然而它们所有的努力，几乎被今年初发布的deepseek-r1抹平。
好在行业反转很快出现。权威机构预测，语言模型将在2028年耗尽人类文本数据。与此同时，deepseek-r1等语言大模型不时传出边际效益递减的问题。基于此，业内愈发意识到，多模态大模型可能是迈向agi的入场券。为此，openai、谷歌、meta等科技巨头陆续发布了gpt-4.5、gemini 2.5 pro、llama 4等多个性能强大的多模态基模。
但巨头们没想到，今年以来，来自上海的多模态大模型此起彼伏地出圈。
如成立于2014年的商汤科技，以计算机视觉起家，近两年果断进行大模型技术革新，是极少数能迅速转弯、从视觉算法跨越到大模型技术周期且保持算法领先的ai公司。今年4月，商汤发布新一代6000亿参数多模态大模型“日日新v6”，其多模态综合能力看齐gpt-4.5，局部还有超越，并且率先引入长思维链，将多模态与深度思考结合起来。比如，面对四张描绘“乌龟羡慕长颈鹿脖子长”的连环画，“日日新v6”能完整讲述故事，并在结尾升华为“长颈鹿有它的优势，但你也有你的价值”。
短短三个半月后，商汤在此次大会上发布“日日新v6.5”。商汤科技董事长兼ceo徐立说，相比v6版本，“日日新v6.5”的强化学习效率增加了40%，性价比提升了三倍，使模型应用有了更大利润空间。“以单年维度看，一年内模型推理成本大幅度下降大有可能。”
取得如此成绩，需要底层架构、高质量数据清洗、上层算法的整体创新。
相比积淀深厚且迅速转向的上海老牌ai公司，不到4岁的minimax和刚满2岁的阶跃星辰，则在创业之初就锚定多模态。
如阶跃星辰，坚信多模态是通往agi的必经之路，2023年4月成立迄今，已发布基模超过20款，且多模态占比70%，是业内公认的“多模态卷王”。7月25日，阶跃星辰发布其新一代基模step 3，拥有强大视觉感知和复杂推理能力。比如，能敏锐识别图中隐蔽的字母；又如，即便菜单反光严重，仍能准确还原菜单内容；再如，结合微信群聊天记录，输入购物小票，模型即能聪明计算aa制消费分摊。
而6月，上海独角兽企业minimax则发布了全球首个开源大规模混合架构推理模型——minimax-m1，目前在权威评测榜单已位列全球开源模型第二；minimax同期发布的视频生成大模型hailuo 02，因实现了对物理世界规律的极致理解，可直接叫板谷歌第三代视频生成模型veo3。过往ai视频模型中难以解决的体操、杂技等复杂运动中常出现的运动主体肢体错乱、五官扭曲等“翻车”状况，在hailuo 02中都被消灭。目前，minimax视频生成应用hailuo ai已力压海外的sora、runway等产品，持续保持全球第一，并帮助200个国家和地区的创作者生成了超过3.7亿个视频。
晒“朋友圈”
尽管高频出圈，仍要面临选择：是向左，持续投入基模研发，还是向右，快速构建商业闭环？对于这样的问题，无论是来自北京的智谱、第四范式，还是大模型“上海队”，都有相同态度——既要又要。
正如智谱华章科技股份有限公司总裁王绍兰所言，持续的基模研发，关乎决心。“但如果大模型一直做纯理论研究而不做商业化落地，怎么证明大模型真正改变产业呢？”
事实上，迫于内部成本与外部竞争，国内外大模型公司无不在加速收敛。国内百模大战也已经收缩为个位数竞争。大模型“上海队”在基模研发上、造血盈利上都不拉垮，这属实可贵。
比如，商汤科技运用于代码、办公领域的生产力工具“小浣熊”，现已拥有超过1000万家行业用户。今年的大会上，商汤展区秀出其“朋友圈”，都是日日新大模型所赋能的智能硬件，包括了元萝卜ai下棋机器人，以及钛虎、傅利叶、lumos鹿明等多个品牌的人形机器人，以及小米眼镜等，涉及教育培训、家庭陪伴、景区导览等多个应用场景。徐立还特别演示了日日新大模型赋能下人形机器人讲解《长安的荔枝》案例。机器人讲解时，可自行翻页ppt，其解说风格诙谐幽默，可以被打断，可识别意图，还有全局记忆，即便被多次“扯远”，依旧能回到最初话题，应用落地潜力巨大。
阶跃星辰的商业化进程也不错，已与车、手机、具身智能领域的头部厂商合作，部分旗舰机型进入量产，包括吉利银河m9、曾被马斯克点赞的家庭情感机器人tcl ai me等。阶跃日前也公开透露，今年全年收入预计近10亿元。
模芯联动
“大模型发展至今，已经不是一个单纯的技术问题，也不再是单家公司做某一款产品的问题，而是需要共同创造一个社区，以通往agi的未来。生态发挥着重要作用。”各模型公司道出心声。
在此次“模型之问”论坛上，商汤科技联合华为、库帕思、海光、寒武纪、曦望sunrise、壁仞科技、麒麟软件、摩尔线程等十余家国产生态伙伴，共同发布“商汤大装置算力mall”。此举在当前大模型时代对算力需求持续激增、算力供应链安全挑战日益严峻的背景下尤显意义。
种种迹象表明，国产模型与国产算力之间，正在加速双向奔赴。7月25日，阶跃星辰发布step 3时，也同时宣布联合近十家芯片及基础设施厂商，发起“模芯生态创新联盟”。其中，燧原科技受邀成为首批成员，且运行step 3也已初步实现。据测算，step 3在国产芯片上“跑”，模型成本是友商的三分之一。
根据燧原科技创始人赵立东的判断，未来模型对推理算力的需求，将是训练算力的百倍甚至千倍。与此同时，算力基础设施正在走向系统化，相关的软硬件技术，包括超节点、网络技术、全光互联、低精度、分布式并行计算、虚拟化等，已不再是芯片公司单独可以完成，而是需要跨行业的协作，多方聚力，构建系统化解决方案。
赵立东说，燧原科技拥抱与众多伙伴的合作，已在算力基建、算力调度、算力服务、算力应用等多个方面深入携手，共同在国产智算关键领域寻求破局。
但大模型发展是一场长跑，其决赛季远未到来。面对平均每三个月就能带来“行业一震”，大模型“上海队”都表示，其目标只有一个——保持敬畏，继续留在牌桌上。
欢迎转发，但请注明出处“上海经信委”
上观号作者：上海经信委

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

抖音精选科技创作者“U航”登上世界人工智能大会

京东大模型品牌全新升级为JoyAI 加速产业走向深度应用

上海发布大模型“云宇星空”，城市治理迈入AI时代

B站发布站内最受年轻人关注的TOP30 AI应用

倪光南：机器人产业是下个万亿级产业，要提升对于环境感知和交互决策的投入

“湖北首富”难当？

全站最新

抖音精选科技创作者“U航”登上世界人工智能大会

京东大模型品牌全新升级为JoyAI 加速产业走向深度应用

上海发布大模型“云宇星空”，城市治理迈入AI时代

B站发布站内最受年轻人关注的TOP30 AI应用

热门推荐

“挣窝囊费，漂窝囊流”，它为何引爆今夏？

全球最大火电厂里，藏着中国发展的秘密

办公室里恋情多

抖音精选科技创作者“U航”登上世界人工智能大会

京东大模型品牌全新升级为JoyAI 加速产业走向深度应用

上海发布大模型“云宇星空”，城市治理迈入AI时代

B站发布站内最受年轻人关注的TOP30 AI应用

Perplexity Comet颠覆学习体验！AI导师随身辅导，YouTube变身超级教育利器！

金山办公发布WPS AI 3.0"灵犀"版本打造原生Office智能体

浦东发布 20 亿元人工智能种子基金首期 5 亿专注早期投资

周鸿祎称苹果AI彻头彻尾败了如今面临一个关键抉择

消息称智谱AI将于今晚发布GLM-4.5

BOSS直聘通报“王某香”涉黄简历：男子恶意编造已被刑拘

北电数智亮相WAIC：用AI驱动百业革新，开启智慧未来！

只需100行代码，这款迷你编程Agent就能修复65%真实项目Bug！