封面新闻记者 欧阳宏宇
和外国人用各自的母语通话,你会有哪些办法?是使用翻译软件逐字逐句翻译,或是选择繁琐的同声传译APP,还是选择价格昂贵的人工翻译服务。如今,在AI大模型的赋能下,普通电话也实现同声传译。
记者7月11日获悉,全球首个基于大模型的电话同传服务技术在成都举行的2025中国移动产业投资生态合作伙伴大会上公布。据介绍,该项技术由中国自主研发,将实时语音通话与同传大模型深度融合,可实现中英双语即时互译,打破跨国电话沟通的语言壁垒。目前,这一技术服务已进入筹备阶段,即将正式上线。
所谓电话同传服务,就是在通话过程中智能接收双方语音流,实现中文与英文秒级双向互译。通过这一技术,用户只需一键开启同传功能,即可实时收听通话原声与高质量译文。
据介绍,这项技术基于讯飞星火同传大模型研发。其技术原理是,基于混音技术,系统可以模拟人类译员思维链路,实时进行意群理解切分、上下文精准选词及碎片化信息重组,再通过流式语音合成技术实现韵律衔接与语速自适应调节,形成“听-理解-译-说”的流畅闭环。这样做可以实现原声与译文的并存,翻译内容与原声仅几秒延迟,音量经过智能优化后,也确保了通话体验清晰自然。
在此之前,通话同传技术主要局限于特定的终端和软件上。用户如果要在手机上和外国人用各自的母语通话,首先需要使用译妙蛙翻译官、PolyPal等APP,并通过这些软件与对方通话才能实现同声传译。此外,部分AI眼镜也在AI大模型的赋能下实现了特定场景的同声传译能力,比如INAIR此前发布的INAIR 2 AR空间计算机,就可以实现实时中英文语音翻译。但由于应用场景的限制,使得这些方式距离真正的电话同传还有一定的差距。
在全球维度下,海外通讯巨头已经在电话同传赛道布局。比如,三星电子就在去年发布的新机型中内置“通话实时翻译”功能,可实现打电话过程中对不同语言进行同声传译。苹果也正和谷歌讨论合作,在未来的iPhone 系列新机中集成其Gemini AI服务,以布局AI翻译赛道。
目光聚焦于电话同传场景中,由中国自主研发电话同传服务将在对外高频国际交流场景中发挥重要价值。业内人士分析称,如跨国旅游、跨境客服,国际贸易合作等领域,助力组织或个人降低沟通成本,提升信息传递效率,减少因语言误解导致的效率损耗与沟通风险。通过技术创新,电话通传服务将推动跨国沟通从“低效翻译辅助”向“无障碍实时交互”升级,降低全球协作成本,为各行业全球化布局提供关键支撑。