12月30日,腾讯官方宣布开源其混元翻译模型1.5版本,包含Tencent-HY-MT1.5-1.8B和Tencent-HY-MT1.5-7B两款模型,支持33种国际语言互译及5种民汉/方言翻译,覆盖捷克语、马拉地语、爱沙尼亚语、冰岛语等小语种。两个模型已在腾讯混元官网、GitHub及HuggingFace平台上线,供开发者免费下载使用。

其中,HY-MT1.5-1.8B专为手机等消费级设备优化,经量化后仅需1GB内存即可实现端侧离线实时翻译,在参数量极小的情况下,翻译效果已超过多数主流商用翻译API。实测显示,该模型处理50个tokens平均耗时仅0.18秒,显著快于其他商用模型约0.4秒的响应时间。在FLORES-200、WMT25及民汉翻译测试集中,其表现达到Gemini-3.0-Pro闭源模型90%的水平,部分场景下差距微小,远超同类开源与商用方案。

HY-MT1.5-7B则为此前WMT25比赛30项冠军模型的升级版,重点提升翻译准确率,有效减少译文夹带注释或语种混杂问题。两款模型可协同部署,实现端云结合,提升整体翻译一致性与稳定性。

实用性方面,新模型支持术语库自定义、上下文长文本理解及带格式文本翻译。用户可导入医学、法律、金融等行业术语表,确保专业词汇准确;模型还能基于前文语境优化后续翻译,适用于会议记录、小说章节等长内容;同时保留原始排版格式,提升网页、文档等结构化内容的翻译可用性。

技术上,1.8B模型通过On-Policy Distillation策略,由7B大模型作为教师实时引导训练,避免死记硬背,显著提升小模型泛化能力。目前,该系列模型已在腾讯会议、企业微信、QQ浏览器等内部产品中落地,并兼容Arm、高通、Intel、沐曦等主流硬件平台。





京公网安备 11011402013531号