当前位置: 首页 » 资讯 » 新科技 » 正文

中信建投:全球大模型迭代 看好国内AI加速赶超海外

IP属地 中国·北京 智通财经 时间:2025-11-17 08:11:30

智通财经APP获悉,中信建投证券发布研报称,海外GPT-5.1更新围绕效率和个性化升级,国内模型同样加速迭代。百度(09888)文心5.0多模态理解能力较为突出,有望为后续模型迭代提供更丰富的数据语料。MiniMax M2和Kimi k2 Thinking接连荣登开源模型榜首,前者专为 Agent 和代码而生,成本仅为Claude 3.5 Sonnet的8%;后者则将在token效率、情感表达等模型工程化方向不断迭代,优化模型表现。后续凭借国内工程化优势,以及庞大用户群体提供的使用反馈,国产模型及AI应用产品存在赶超海外的基础。

中信建投主要观点如下:

GPT-5.1更新,围绕效率和个性化升级。2025年11月13日,OpenAI发布GPT-5.1,包括GPT-5.1 Instant和GPT-5.1 Thinking两个版本。据OpenAI官方公告,Instant比其前代产品“更热情、更智能,也更善于遵循用户指令”,Thinking则“更容易理解,处理简单任务速度更快,处理复杂任务也更持久”。同时,OpenAI进一步升级GPT的路由能力,使其能根据问题复杂程度精准地调整思考时间。此外,OpenAI还进一步优化了GPT的风格特征设置,目前除默认设置外,还支持专业、友好、直言、古怪、高效、讽刺及书呆子等多种风格。

GPT-5.1相较于OpenAI之前的模型更新更注重用户偏好的提升(指令遵循、高效路由和风格预设),这意味着OpenAI也开始注重模型的工程化。当前全球头部模型能力基本满足大多通用场景需求,通过工程化提高效率和体验成为了各厂商亟待重视的方向。


国内模型加速突破,能力较国际前沿进一步看齐。近期国内模型加速迭代,开源模型榜首多次易主,进一步反映国内AI领域已逐步向海外前沿靠拢。后续凭借国内工程化优势,以及庞大用户群体提供的使用反馈,国产模型及AI应用产品存在赶超海外的基础。

百度:11月13日,文心5.0于2025百度世界大会发布,其采用原生全模态统一建模,支持文本、图像、音频、视频等多种信息的联合输入与输出,实现了原生的全模态统一理解与生成。在总参数规模上,文心 5.0 达到了系列最高的2.4万亿,并位列业界已公开模型之首,激活参数比例低于3%,在保持模型强大能力的同时有效提升推理效率。能力方面,文心5.0在多模态理解、指令遵循、创意写作、事实性、智能体规划与工具应用等方面表现突出,拥有强大的理解、逻辑、记忆和说服力。在40余项权威基准的综合评测中,其语言与多模态理解能力与 Gemini-2.5-Pro、GPT-5-High 等模型持平,图像与视频生成能力与垂直领域专精模型相当,达到全球领先水平。11月8日,LMArena 大模型竞技场最新排名显示,文心模型 ERNIE-5.0-Preview-1022在文本任务评测中位列全球并列第二、中国第一,尤其在创意写作、复杂问题理解等方面表现突出。

文心5.0从跑分看能力并不突出,但多模态理解的能力则较为突出。目前海外大厂中Gemini在视频理解上布局较快,其他如OpenAI的GPT-4o单次只能理解音频或视频;国内大厂亦推出了部分视频理解模型,但尚未集成至统一的大模型之中。多模态理解能力有助于囊括更丰富的数据语料,帮助模型不断迭代,践行李彦宏 “智能本身是最大的应用,而技术迭代速度是唯一护城河”的发展思路。


Kimi:Kimi k2 Thinking于11月6日正式发布,在人类最后的考试(HLE)、自主网络浏览能力(BrowseComp)、复杂信息收集推理(SEAL-0)等多项基准测试中表现达到 SOTA 水平,并在 Agentic 搜索、Agentic 编程、写作和综合推理能力等方面取得全面提升。具体而言,Kimi k2 Thinking共1TB参数,激活32B,采用INT4精度(对推理硬件的兼容性更强,对国产加速计算芯片更友好),支持256K上下文窗口,训练成本仅460万美元(CNBC,杨植麟后在社媒否认,称训练成本很难量化,系大部分用于研究和实验)。

Kimi团队在Reddit的回复也透露出了更多信息:1)受模型的“长链式推理机制”影响,k2 Thinking推理效果好但回复慢,后续将进一步优化token效率。2)当前k2 Thinking模型的“人性张力”不足,未来版本可能在情绪表达上更开放、更真实。

Kimi k2 Thinking继MiniMax-M2后再次拿下开源模型宝座的位置,进一步反映国产模型迭代加速趋势。k2 Thinking后续同样会在token效率、情感表达上进一步优化,验证模型工程化重要性。


MiniMax:10月27日,MiniMax正式开源并上线了专为 Agent 和代码而生的MiniMax M2模型,发布时Artificial Analysis (AA)的测评中取得全球第五、开源第一的成绩。M2模型在使用工具和深度搜索的能力都非常接近了海外最好的模型,在编程上逊色于海外最好的模型,但也达到国内最好的一档。此外,M2使用了完全注意力架构,但稀疏程度进一步优化(总参数230B,激活参数量10B),实现定价2.1人民币(0.3美元)每百万输入Token,8.4人民币(1.2美元)每百万输出Token,仅Claude 3.5 Sonnet的8%。


尽管MiniMax-M2只有230B参数量,激活10B,但这为其使用全注意力仍然实现低成本奠定了基础。其将上下文窗口也从前代的100万token缩减至20万,但已能够完成其主攻的智能体和代码任务,并能进一步优化响应速度。总体而言,M2仍然在践行当前模型一贯的迭代方向——更好性能和更低成本,其中注意力机制、Agent、泛化、数据等细节打磨还有较大空间,上述技术方向研究预计将促进模型迭代将进一步加速。

总结:海外GPT-5.1更新围绕效率和个性化升级,国内模型同样加速迭代。百度文心5.0多模态理解能力较为突出,有望为后续模型迭代提供更丰富的数据语料。MiniMax M2和Kimi k2 Thinking接连荣登开源模型榜首,前者专为 Agent 和代码而生,成本仅为Claude 3.5 Sonnet的8%;后者则将在token效率、情感表达等模型工程化方向不断迭代,优化模型表现。后续凭借国内工程化优势,以及庞大用户群体提供的使用反馈,国产模型及AI应用产品存在赶超海外的基础。

投资建议:国内模型加速突破,工程化为AI落地重要方向。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。