通义千问Qwen3-TTS迎来升级:支持多音色、多语种和多方言
豆包发布语音识别模型2.0,支持多模态视觉识别和13种海外语种识别
千问App上线Wan 2.5和Qwen-Image:支持对口型、对话修图
京东数字人直播免费向所有商家开放,可7×24小时不间断带货
新加坡国家AI计划放弃Meta模型,转向阿里千问
腾讯混元OCR模型宣布开源:参数量1B 支持14种小语种翻译
千问App上线实时翻译功能:覆盖全球超98%人口常用语种
超越英伟达、谷歌!腾讯KaLM-Embedding开源模型斩获MTEB多语言榜单全球第一
Hunyuan-MT-7B于9月1日开源,是一个能力全面的轻量级翻译模型。
同时开源的还有一个翻译集成模型 Hunyuan-MT-Chimera-7B (奇美拉),是业界首个翻译集成模型,它能够根据原文和多个翻译模型给出的不同内容,再生成一个更优的翻译结果,不仅原生支持Hunyua…
腾讯混元开源轻量级翻译模型:支持5种汉语言与方言互译
该模型采用了一种创新且通用的方法,能够兼容自回归架构,实现对语音时长及情感的精准控制。他们独创性地结合了语音时长匹配、原声翻译标准与UP主独特风格,构建了多目标奖励模型,并采用对抗式强化学习训练,推动模型不断…
为攻克「AI原声翻译功能」中的核心挑战——尤其在游戏、二次元等专名梗点密集领域——实现原风格精准保留与语音时长完美对应,B站技术团队基于大语言模型(LLM)构建翻译引擎,独创性基于语音时长匹配、原声翻译标准…
作为2025世界人工智能大会技术方向的议题之一,昨天在沪举办的“科大讯飞高级别高水平多语言基座大模型国际学术研讨会”,汇聚了来自亚洲、欧洲近20个国家和地区约30位人工智能领域的产学研各界代表,10位来自中…
阶跃Step 3把推理效率卷到DeepSeek的3倍,还拉来了国产芯片半壁江山
马蜂窝“AI路书”向用户开放 多语种实时翻译等工具上线
11/24 16:08
11/24 16:07
10/31 16:58
10/31 16:56