当前位置：首页 » 资讯 » 新科技 » 正文

微软正式发布 GPT-realtime 模型，主打更逼真语音与多模态输入

IP属地中国·北京 编辑：沈如风 Chinaz 时间：2025-09-05 10:27:02

微软正式宣布，其最新的语音转语音（S2S）模型 GPT-realtime 已在 Azure AI Foundry 平台上正式发布。这款新模型将微软在语音技术方面的多项改进整合到一个统一的产品中，其核心优势聚焦于自然的语言处理、卓越的音频质量以及更精准的指令跟随能力。
开发者现在可以通过全新的 Real-time API 访问 GPT-realtime。该模型旨在提供更自然、富有表现力的语音输出和更高质量的音频体验。作为此次发布的一部分，微软还推出了两种全新的语音选项——Marin 和 Cedar，旨在为用户带来逼真且清晰的语音合成效果。
微软在公告中强调了新模型的几项关键改进，包括增强的功能调用能力、更高的指令执行准确性，以及创新的图像输入支持。这项新功能允许用户在语音对话中加入图像并进行讨论，从而实现多模态交互，而无需依赖视频流。
除了技术层面的升级，微软还对定价模型进行了调整。与之前的 gpt-4o-realtime 预览版本相比，正式版的 gpt-realtime 价格降低了20%，成本将依据每百万代币（token）的使用量进行计算。
此次发布标志着微软正致力于为广大开发者和企业扩展其实时 AI 能力。通过将富有表现力的语音合成、高质量音频和多模态输入相结合，GPT-realtime 有望为从高级客户支持系统到创新的辅助功能工具等广泛的应用场景提供强大的技术支持。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

“上海哪家小程序开发公司靠谱”16年的项目经理告诉您选外包商

融智聚力丨中建材信息亮相华为中国合作伙伴大会2026 获“杰出总经销商奖”

林俊旸从阿里离职后首发长文：复盘千问路线受阻，断言AI演进全面转向智能体

前腾讯科学家打造工业AI细分龙头，思谋科技冲刺IPO，3年累亏22亿

Meta大办“AI培训周”，鼓励员工爱用、多用智能体办公

CNFinBench公布大语言模型综合得分：中国平安金融大模型荣登第一名

全站最新

“上海哪家小程序开发公司靠谱”16年的项目经理告诉您选外包商

融智聚力丨中建材信息亮相华为中国合作伙伴大会2026 获“杰出总经销商奖”

林俊旸从阿里离职后首发长文：复盘千问路线受阻，断言AI演进全面转向智能体

前腾讯科学家打造工业AI细分龙头，思谋科技冲刺IPO，3年累亏22亿

热门推荐

“上海哪家小程序开发公司靠谱”16年的项目经理告诉您选外包商

融智聚力丨中建材信息亮相华为中国合作伙伴大会2026 获“杰出总经销商奖”

林俊旸从阿里离职后首发长文：复盘千问路线受阻，断言AI演进全面转向智能体

前腾讯科学家打造工业AI细分龙头，思谋科技冲刺IPO，3年累亏22亿

Meta大办“AI培训周”，鼓励员工爱用、多用智能体办公

CNFinBench公布大语言模型综合得分：中国平安金融大模型荣登第一名

AI流量增速超人类8倍！流量“倒挂”前夜：AI智能体正掏空互联网的旧金矿

落地超40个场景化应用，京东AI采购管家为4万企业装上“智慧大脑”

从爆款到弃子：OpenAI为何砍掉视频生成应用Sora？

为全球科技繁荣发展贡献中国方案

定位导航定时领域十大前沿问题正式发布『航天视窗』（1545）

当AI大幅度降低参与门槛，这届上海青少年科创大赛更看重“提出好问题”

Meta开源全新AI模型TRIBE v2，精准预测人类大脑多模态反应

入驻美国 TikTok，娱乐直播公会开启全球化布局第一站

国家互联网信息办公室开展2025年国家信息化发展情况网络问卷调查