当前位置：首页 » 资讯 » 新科技 » 正文

DeepSeek新模型MODEL1曝光

IP属地中国·北京 编辑：沈瑾瑜 TechWeb 时间：2026-01-21 10:11:57

1月21日消息，DeepSeek的下一代旗舰模型疑似提前曝光。在其官方GitHub代码库的更新中，一个名为“MODEL1”的新模型名称在多个技术文件中频繁出现，引发了人工智能社区的广泛关注。
根据对代码库的深入挖掘，“MODEL1”的踪迹横跨了114个文件，共计被提及28次。尤为关键的是，它在代码逻辑中与当前已发布的“V32”（即DeepSeek-V3.2模型）并列出现，表明它并非现有模型的简单迭代，而极有可能是一个独立的新模型序列。
技术分析显示，MODEL1与V3.2在底层架构上存在显著差异。代码对比指出，二者在KV（键值）缓存布局、稀疏性处理方式以及FP8精度解码等核心模块上采用了不同的实现方案。特别是在内存优化方面，MODEL1显示出多处针对性改进，这通常意味着它在处理效率或支持更长上下文方面可能有新的设计目标。
此前有消息称DeepSeek计划在2026年春节前后发布其下一代重量级模型。因为，不少行业分析人士认为，此次MODEL1在开源代码中意外现身，就如同之前DeepSeek发布的优化残差链接“mHC”和AI记忆模块“Engram”两篇论文中提到的新技术一样，很可能正是为这次发布进行的技术准备。
目前，DeepSeek官方尚未对此事发表任何公开评论。所有信息均来源于对公开代码的非官方分析，模型的具体技术细节、性能指标及正式名称仍需等待官方的最终揭晓。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

腾讯副总裁谈“龙虾”：大幅提振B端AI意愿

AI重塑教学，算力赋能育才！华为探寻教育数智化转型新路径

鲲鹏+凌川科技SL200，用极致算力为互联网视频产业带来质变

华为云发布FlexNPU，打造弹性伸缩的“算力金箍棒”

资本与技术的双重博弈：OpenAI天量融资的启示与思考

华为天才少年为何纷纷转战机器人赛道？

全站最新

腾讯副总裁谈“龙虾”：大幅提振B端AI意愿

AI重塑教学，算力赋能育才！华为探寻教育数智化转型新路径

鲲鹏+凌川科技SL200，用极致算力为互联网视频产业带来质变

华为云发布FlexNPU，打造弹性伸缩的“算力金箍棒”

热门推荐

Patagonia关联公司曾因虚假宣传被罚

皖能电力旗下新能创业投资公司增资至78.2亿增幅约104%

连云港安防产业专项母基金成立出资额10亿

鞠婧祎名下关联2家企业

华为发起维权诉讼索赔百万

歌尔股份旗下潍坊电子公司增资至约18.7亿

张小帆卸任东风特种商用车公司董事长

男子坠亡涉事俱乐部事发时刚成立2个月

鞠婧祎涨粉14万

卜凡团博关联公司成立不足一年

灵心巧手增资至9.2亿

东方电气集团国际合作公司增资至10亿增幅约31%

天津脑机接口产业集团登记成立注册资本10亿

鞠婧祎回应税务情况当日涨粉3万

中国农机加速迈向全球市场，现存农业机械相关企业超286万家