当前位置: 首页 » 资讯 » 新科技 » 正文

DeepSeek又出手了?一个神秘的AI模型引起全球开发者热议

IP属地 中国·北京 编辑:陈丽 金融投+ 时间:2026-03-18 16:13:43

一个拥有万亿参数的神秘免费AI模型突然上线,关于DeepSeek V4将发布的猜测再一次涌现。

据路透社3月18日报道,一款名为“Hunter Alpha”的AI模型近日在开发者平台OpenRouter匿名上线,引发全球开发者社区关注。该模型未标注开发者身份,但观察其性能参数与时间节点,市场猜测这可能是DeepSeek在正式发布前对其下一代系统进行的秘密测试。

Hunter Alpha于3月11日以“隐身模型”形式发布,且目前向开发者提供免费访问。测试显示,该系统具备1万亿参数规模和高达100万token的上下文窗口。

在测试中,该模型自称“主要以中文训练的中国AI模型”,知识截止时间为2025年5月,这一点与DeepSeek现有模型一致。但当被问及开发者时,其回应:“我只知道自己的名字、参数规模和上下文长度。”

OpenRouter平台未披露模型来源,DeepSeek亦未回应置评请求。

性能参数触发市场敏感点

Hunter Alpha的核心指标迅速成为讨论焦点。

其参数规模达到1万亿级别,属于当前最前沿模型梯队。同时,该系统宣称拥有高达100万token的上下文窗口,远高于多数商业模型,意味着可处理更长文本与复杂任务。

构建AI代理系统的工程师Nabil Haouam表示:“Hunter Alpha的100万token上下文与推理能力相结合,且免费访问,这一组合非常引人注目。”

凭借高性能与零成本的优势,Hunter Alpha在开发者中迅速普及。据OpenRouter统计,截至周日,该模型已处理超过1600亿个token。

数据截止期与推理风格指向DeepSeek

将Hunter Alpha与DeepSeek联系起来的线索,主要来自其底层数据特征和运行逻辑。

在媒体测试中,该聊天机器人自称是“主要用中文训练的中国AI模型”,并透露其训练数据截至2025年5月。这一时间节点与DeepSeek自家聊天机器人报告的知识截止点完全一致。

当被问及开发者身份时,该系统拒绝回答。聊天机器人回应称:“我只知道我的名字、参数规模和上下文窗口长度。”

在技术层面,部分开发者认为模型的运行方式暴露了其“血统”。在模型发布后对其进行分析的AI工程师Daniel Dewhurst表示:“思维链模式可能是最强烈的信号。推理风格很难掩饰,往往反映了模型的训练方式。”

Daniel Dewhurst补充称,Hunter Alpha的规模和记忆容量,也与今年早些时候流传的DeepSeek V4规格预期相符。据多家媒体曾报道,DeepSeek的下一代V4模型最早可能在4月发布。

匿名发布:行业默认的“灰度测试”机制

在AI行业,通过匿名发布模型来获取真实反馈已成为一种标准做法。OpenRouter等平台允许开发者通过单一接口向数十个AI模型发送查询,使其成为新系统理想的测试场。

Hunter Alpha的个人资料页上的一则通知印证了这一点。通知称,该模型的所有提示和完成内容“均由提供商记录,并可能用于改进模型”。

这种做法在业内并不罕见,例如今年2月,一个名为Pony Alpha的匿名模型出现在OpenRouter上,五天后中国公司Zhipu AI确认这是其GLM-5系统的一部分。

尽管有诸多相似之处,部分开发者仍对Hunter Alpha就是DeepSeek V4的结论持谨慎态度。运行独立AI基准测试的Umur Ozkul表示:“我的分析表明Hunter Alpha可能不是DeepSeek V4。”他指出,与DeepSeek现有系统相比,该模型在token相关行为和架构模式上存在差异。

不过,Umur Ozkul也承认,考虑到发布时机和所宣传的功能,市场将该模型与DeepSeek联系起来的猜测是完全可以理解的。

标签: 模型 开发者 规模 系统 参数 全球 数据 热议 市场 聊天 风格 模式 提供商 高性能 成本 中国 平台 逻辑 特征 性能参数 截止期 节点 代理 机器人 行业 结论 长度 灰度 态度 机制 架构

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新