当前位置：首页 » 资讯 » 新科技 » 正文

腾讯混元团队发布高性能推理模型混元T1正式版

IP属地中国·北京 编辑：任飞扬中关村在线 时间：2025-03-22 17:01:41

2025-03-22 01:42:32 作者：
3月21日消息，腾讯混元团队正式发布了自主研发的深度推理模型——混元T1正式版。据官方介绍，这款模型具备快速响应、擅长处理超长文本的特点，是腾讯自主研发的高性能推理模型。
混元T1通过大规模强化学习技术，结合数学、逻辑推理、科学知识以及代码优化等专项训练，显著提升了其推理能力。在展示推理模型基础能力的多个基准测试中，例如大型语言模型评估数据集MMLU-PRO中，混元T1获得了87.2分，表现仅次于某知名模型o1。此外，在Ceval、AIME、Zebra Logic等一系列中英文知识和竞赛级数学、逻辑推理的公开基准测试中，混元T1的表现也达到了行业领先水平。
混元T1在多种对齐任务、指令跟随任务以及工具使用任务中表现出极高的适应性。官方表示，混元T1正式版延续了混元Turbo S的创新架构，采用了Hybrid-Mamba-Transformer融合模式。这是业内首次将混合Mamba架构成功应用于超大型推理模型。这一架构不仅降低了传统Transformer结构的计算复杂度，还减少了KV-Cache的内存占用，从而大幅降低了模型训练与推理的成本。
同时，混元T1在超长文本推理领域展现了独特的优势。凭借强大的长文捕捉能力，混元T1能够有效解决长文本推理过程中常见的上下文丢失及长距离信息依赖问题。混合Mamba架构经过专项优化，采用高效的计算方式，在确保长文本信息捕捉能力的同时，大幅降低了资源消耗。在激活参数量相近的情况下，解码速度提升至原来的两倍。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

腾讯副总裁谈“龙虾”：大幅提振B端AI意愿

AI重塑教学，算力赋能育才！华为探寻教育数智化转型新路径

鲲鹏+凌川科技SL200，用极致算力为互联网视频产业带来质变

华为云发布FlexNPU，打造弹性伸缩的“算力金箍棒”

资本与技术的双重博弈：OpenAI天量融资的启示与思考

华为天才少年为何纷纷转战机器人赛道？

全站最新

腾讯副总裁谈“龙虾”：大幅提振B端AI意愿

AI重塑教学，算力赋能育才！华为探寻教育数智化转型新路径

鲲鹏+凌川科技SL200，用极致算力为互联网视频产业带来质变

华为云发布FlexNPU，打造弹性伸缩的“算力金箍棒”

热门推荐

Patagonia关联公司曾因虚假宣传被罚

皖能电力旗下新能创业投资公司增资至78.2亿增幅约104%

连云港安防产业专项母基金成立出资额10亿

鞠婧祎名下关联2家企业

华为发起维权诉讼索赔百万

歌尔股份旗下潍坊电子公司增资至约18.7亿

张小帆卸任东风特种商用车公司董事长

男子坠亡涉事俱乐部事发时刚成立2个月

鞠婧祎涨粉14万

卜凡团博关联公司成立不足一年

灵心巧手增资至9.2亿

东方电气集团国际合作公司增资至10亿增幅约31%

天津脑机接口产业集团登记成立注册资本10亿

鞠婧祎回应税务情况当日涨粉3万

中国农机加速迈向全球市场，现存农业机械相关企业超286万家