当前位置: 首页 » 资讯 » 新科技 » 正文

又是量化基金,第二个DeepSeek时刻到来了?

IP属地 中国·北京 编辑:刘敏 字母榜 时间:2026-01-02 12:09:43

九坤投资旗下的至知创新研究院发布了开源编程Agent模型IQuest-Coder-V1。至知研究院在AI领域名气不大,但这个模型的benchmark数据直接对标了行业顶尖水平。

母公司是量化私募,发布时间是1月,这两个特征组合在一起,很容易让人想起去年同期的DeepSeek R1。

事实上,去年DeepSeek R1发布的时候也是相同的情况,一个知名度不高的公司,发布了一个行业顶尖的模型。

那么IQuest-Coder-V1会是下一个“DeepSeek时刻”吗?

暂时还不好下结论。

根据JetBrains的《2025 开发者生态系统现状报告》,全球85%的开发者已经在使用AI工具,全球41%的代码由AI生成,但这些工具大多停留在辅助层面。

从OpenAI到Anthropic,各家在2025年底密集推出的agent产品,都将代码作为突破口。

所以至少可以肯定,编程Agent就是下一个风口。

01

IQuest-Coder-V1不是一个简单的代码补全工具,而是一个能够自主完成软件工程全流程的代码大语言模型。

过去的AI编程助手的作用是自动补全,你写一半代码,它帮你接下去。而IQuest-Coder-V1则是能够从零开始理解需求、设计架构、编写代码、测试调试,甚至进行多轮迭代优化。

IQuest-Coder-V1有三个很关键的技术点。

第一是40B的参数规模。相比GPT-5和Gemini 3等动辄数千亿参数的模型,40B只是它们的几十分之一左右。

也就是说,IQuest-Coder-V1可以在性能稍好的消费级硬件上运行,而不需要专业的数据中心级别算力。

第二个特点是Loop架构。

这个名字很直白,模型会循环迭代自己的输出。就像程序员写完代码会回过头检查、修改、重构一样,Loop架构让模型在生成代码后能够反思和改进。

但Loop架构不是简单的多次调用,而是将迭代优化的过程内化到模型架构中。简单概括就是IQuest-Coder-V1会超额完成任务,以确保最终输出的结果覆盖用户的需求。

Loop版本让模型“走两遍”相同的神经网络,就像你读文章时会回头重读关键段落,第二遍往往能发现第一遍没注意到的问题。

第三个特点是code-flow训练范式。

传统的代码模型学习的是代码片段,学习的是静态的语法和API调用模式。用大白话来解释,AI可以完美复刻它所学习的代码,却不理解为什么要这么写。

但IQuest-Coder-V1学习的是软件如何一步步演化出来的,学习的是动态的逻辑演进。这让模型不仅理解“这段代码是什么”,还理解“这段代码为什么这样写”、“下一步应该怎么改”。

IQuest-Coder-V1使用32k高质量轨迹数据进行强化学习训练,这些轨迹通过multi-agent role-playing自动生成。

系统会模拟用户、Agent、Server三方交互,用户提出需求,Agent编写代码,Server返回执行结果,整个过程无需人工标注。训练目标不是单次代码生成,而是完整的软件演化过程。

这些技术设计在benchmark上得到了验证。在SWE-Bench Verified这个衡量真实软件工程能力的测试中,IQuest-Coder-V1达到了81.4%的准确率,超过了Claude Sonnet 4.5的77.2%。在LiveCodeBench v6上的表现是81.1%,在BigCodeBench上是49.9%。

IQuest-Coder-V1来自九坤投资创始团队发起设立的至知创新研究院。这个研究院独立于九坤的量化投研体系,其职能是研究多个AI应用方向。

九坤投资本身是中国最早一批量化私募之一,成立于2012年,目前管理规模超过600亿人民币,和明汯、幻方、灵均并称量化“四大天王”。

创始人王琛拥有清华大学数学物理学士和计算机博士学位,师从图灵奖唯一华人得主姚期智院士。联合创始人姚齐聪是北京大学数学学士、金融数学硕士。

两人都来自华尔街顶级对冲基金千禧年(Millennium),2010年看准中国股指期货上市的机遇回国创业。

九坤从2020年开始建设名为北溟的超算集群,内部设有AI Lab、Data Lab和水滴实验室。

这些基础设施原本服务于量化投资业务,现在也为大模型研发提供了算力支持。

量化机构拥有大规模算力集群和数据处理能力,这与大模型训练的资源需求相匹配。同时在人才结构上,量化投资和AI研究都需要数学、计算机背景的研究人员,这使得量化机构进入大模型领域时有一定的基础。

从量化投资到开源大模型,这条路径并不突兀。

量化机构本身就拥有大规模算力集群和海量数据处理能力,这与大模型训练的需求高度契合。更重要的是,量化投资和AI研究在人才结构上有很大重叠,都需要数学、计算机、物理背景的研究型人才。

因此从发展角度看,IQuest-Coder-V1更像是九坤在AI方面的自然延伸,并非简单跟风。

02

但不可否认的是,IQuest和DeepSeek,两者有着惊人的相似性。

它们都来自中国量化基金,都展示了在资源受限情况下通过工程创新实现技术突破的能力。但仔细观察会发现,两者选择了完全相反的方向。

DeepSeek追求的是“广度”。从DeepSeek-V3到R1,梁文锋团队的目标是打造通用对话能力,要做中国的GPT。

它要回答各种领域的问题,要能写诗、讲故事、分析时事、解决数学题。这是一个横向扩张的路径,覆盖尽可能多的应用场景。

IQuest-Coder-V1追求的是“精度”。它专注在代码这个垂直领域,在SWE-Bench这样的专业测试上做到极致。它不关心能不能写诗,只关心能不能像真正的程序员一样理解需求、设计系统、解决bug。

有意思的是,就在IQuest-Coder-V1发布的同一天,DeepSeek团队也有新动作。

包括创始人梁文锋在内的19位研究者发布了关于mHC(manifold-constrained hyperconnection,流形约束超连接)架构的论文。这篇论文解决的是超连接网络在大规模训练中的不稳定性问题。

虽然DeepSeek团队在研究工作上保持一定的更新频率,然而在产品方面,他们却显得有些落后,至今仍然没有拿出R2和V4。

2025年,AI领域的竞争焦点是对话能力和推理能力,各家比的是谁能更好地回答问题,谁的推理过程更清晰。到了2026年,这个焦点已经转向Agent能力,比的是AI能否自主完成复杂的多步骤任务。

Agent能力的核心是“执行”,而不仅仅是“理解”和“回答”。

就拿代码举例,一个对话型AI可以告诉你如何修复代码中的bug,但Agent能直接帮你改好代码、运行测试、提交修改。这是完全不同的能力层级。

DeepSeek团队在研究层面确实很活跃,不断发表论文推进底层技术。可一旦落实到产品就会发现,DeepSeek仍然主要是一个对话型AI。用户提问,它给答案,这是它的主要使用场景。

DeepSeek目前还没有推出真正的Agent产品,没有像IQuest-Coder那样能自主完成整个软件开发流程的能力。

诚然,DeepSeek在Alpha Arena这样的AI炒币/炒股比赛中表现很亮眼,证明了量化基金训练出的模型“真的懂市场”,能读懂K线、解析新闻、做出交易决策。

而量化投资的本质是用算法理解市场规律,寻找价格波动中的模式。进一步说明DeepSeek具有“理解复杂系统”的能力。

但需要指出的是,即使在金融市场表现出色,这种能力仍停留在“理解”和“分析”层面。DeepSeek可以分析市场、给出建议,但它作为产品还没有发展出完整的自主交易能力。

从炒股到写代码,幻方和九坤的AI都在展示同一种倾向,就是更强的执行导向。这或许能解释为什么量化基金能在AI领域做出成果,因为他们的基因就是“让算法自主决策”,而不是“让算法回答问题”。

现在关于AI的竞争不只是比谁的论文更多,更重要的是落地,是谁能把技术转化成用户可以直接使用的工具。

市场已经等了太久,梁文锋该发新产品了。

03

IQuest-Coder-V1对标的是Claude Opus 4.5。这个定位很明确,81.4%对80.9%的benchmark数据也确实亮眼。

再加上Anthropic对华态度的强硬,也让人们对Quest-Coder-V1投入了更多的希望。但“取代Claude Opus 4.5”这个问题需要更冷静的分析。

Claude Opus 4.5的优势不只在模型能力,更在于完整的产品生态。它有原生的VS Code扩展,有Claude Code这样面向终端的交互式开发工具,支持MCP协议的工具生态,有企业级的安全合规标准,还有无数真实项目打磨出的用户体验。这些都不是一个刚发布的模型能够在短期内复制的。

更重要的是用户习惯。Claude发布得早,程序员群体已经习惯了它的“工作方式”,知道什么时候该信任它,什么时候该介入,如何高效协作。

这种使用习惯的养成需要时间,需要在无数次试错中建立起来。一个新模型即使benchmark数据更好,也需要相当长的时间来培养用户信任。

benchmark和实际应用之间确实存在差距。

虽说SWE-Bench Verified测试的是在真实代码仓库中解决issue的能力,这比简单的代码补全要复杂得多。然而即使在这样的测试中表现出色,也不等于在日常开发中就能无缝替代人类程序员。

实际工作中的需求往往是模糊的,在产品经理与开发者的沟通过程中,需求往往会改变很多,而这些都是benchmark上没有的。

不过IQuest-Coder-V1的机遇在于另一些维度。它是开源的,这意味着企业可以自己部署,可以根据需要调整和优化,不需要担心数据被第三方服务商获取。对于金融、医疗、国防等对数据安全有严格要求的行业,这是实实在在的价值。

这种开源代码大模型的体验,完全区别于Claude用户。Claude的用户更多是习惯了云服务、愿意为便利性付费、对数据隐私没有极端要求的开发者。IQuest-Coder-V1的潜在用户应该是需要数据自主可控的企业、想要深度定制的技术团队、或者就是喜欢折腾开源工具的开发者。

就比如做像九坤和幻方这样做量化的,他们的算法就是企业的命脉,不可能上传到公有云。

当然,开源也有开源的问题。没有专门的产品团队来打磨用户体验,没有客服来解决使用中的问题,遇到bug只能自己想办法或者等社区修复。这些都是开源模型相比商业产品的劣势。

有一种观点认为,像是IQuest-Coder-V1这样带有一定agent功能的代码大模型,可能是通向通用agent以及AGI的第一步。

这个观点的逻辑在于,代码是结构化的、逻辑清晰的任务,相比其他开放性任务更容易验证对错。测试通过与否,这种二元反馈为agent提供了明确的学习信号。

更重要的是,编程任务本身需要的能力是通用agent所需的核心能力。

从SWE-Bench这样的benchmark来看,它测试的不只是代码生成,而是理解需求、规划步骤、调试错误、迭代改进等能力。这个过程和解决其他复杂任务的模式是相通的。

代码环境提供了一个相对可控的训练场,一旦在这里证明了它的Agent能力,扩展到其他领域的技术路径就会更清晰。

所以,九坤可能也在下一盘大棋。

标签: 代码 模型 coder ai agent iquest 能力 架构 用户 开发者

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。