日前,微软于发布Live Interpreter API,该API将实时多语言翻译能力引入Azure Speech Translation。用户无需设置输入语言,即可实现流畅的跨语言沟通。该功能支持76种语言和143个地区,具备自动识别语言、低延迟、接近人工口译的实时效果,还能保留说话者的风格和语气。目前该API已开放公测。
Live Interpreter API可用于多语言呼叫中心、在线会议、课堂教学、社交电商直播等场景。软件开发者可以借此取消语言切换菜单,让对话过程中自由切换语言。其中的个人语音功能能够完整保留原说话者的语调和节奏,让翻译后的声音听起来更自然,并提供企业级的隐私和同意控制。
微软官方新闻稿提到,公司已与安克创新合作展示实际应用。安克创新表示:“我们很高兴能与微软合作,展示AI与日常科技结合的可能性。借助Live Interpreter,我们为全球用户带来更智能、直观且沉浸的视听体验。”微软还提供了快速入门指南,方便开发者集成该功能。普通用户无需直接操作API,就能通过接入该能力的应用或网站体验跨语言交流。