FunAudio-ASR使用了数千万小时的音频数据,融合了大语言模型的语义理解能力,从而提升语音识别的上下文一致性与跨语言切换能力。 有监督预训练则在编码器-解码器架构(AED)下进行,使编码器能够从大规模…
FunAudio-ASR使用了数千万小时的音频数据,融合了大语言模型的语义理解能力,从而提升语音识别的上下文一致性与跨语言切换能力。智东西在实测中体验了FunAudio-ASR在嘈杂场景的识别能力。 有监…
编程能力大幅提升,OpenAI发布gpt-5-codex新模型
马斯克宣布,旗下大模型平台xAI开源其去年最佳模型Grok-2.5,并且在6个月内开源旗舰模型Grok 3。 此外,财大气粗的马斯克对Grok-2.5的投入也相当大,使用了他当时最强的训练平台Colossus…
文心大模型4.5是百度首个原生多模态大模型,多项测试表现优于GPT4.5
11/24 16:08
11/24 16:07
10/31 16:58
10/31 16:56