当前位置: 首页 » 资讯 » 新科技 » 正文

ElevenLabs CEO预言:AI语音模型将走向“商品化”,公司押注“模型+应用”双轮驱动

IP属地 中国·北京 编辑:沈瑾瑜 Chinaz 时间:2025-10-30 10:10:57

在TechCrunch Disrupt2025大会上,AI语音巨头ElevenLabs联合创始人兼CEO马蒂·斯塔尼斯泽夫斯基(Mati Staniszewski)做出一项惊人判断:AI语音模型将在未来两三年内走向“商品化”——尽管短期内仍是核心竞争力,但长期来看,模型之间的性能差异将逐渐缩小,尤其在主流语言和通用音色上。

图源备注:图片由AI生成,图片授权服务商Midjourney

短期靠模型,长期靠产品

面对“既然模型终将同质化,为何还要重投入研发”的质疑,Staniszewski坦言:“今天,模型仍是最大的技术壁垒。如果AI语音听起来不自然、不流畅,用户体验就无从谈起。”他指出,ElevenLabs过去在模型架构上的突破(如情感表达、多语言韵律建模)是其当前领先的关键。

但公司早已布局后模型时代。Staniszewski强调,ElevenLabs的长期战略并非仅做“模型供应商”,而是打造“AI+产品”的完整体验——正如苹果通过软硬件协同定义智能手机,ElevenLabs希望以自研模型为引擎,驱动高价值应用场景落地,从而构建真正护城河。

多模态融合成下一战场

展望未来1-2年,Staniszewski预测,单一模态的语音模型将加速向多模态融合演进。“你将同时生成音频与视频,或在对话中实时联动大语言模型与语音引擎。”他以Google最新发布的Veo3视频生成模型为例,说明跨模态协同正成为技术新前沿。

为此,ElevenLabs正积极寻求与第三方模型和开源社区合作,探索将其顶尖音频能力嵌入更广泛的AI生态。例如,将ElevenLabs的语音合成与视觉生成、LLM推理深度耦合,打造沉浸式虚拟人、智能客服或互动娱乐体验。

商品化≠无价值,而是价值重心转移

Staniszewski并不认为模型商品化意味着行业衰退,而是价值重心从底层技术转向应用创新。他解释:“未来,企业会根据具体场景选择不同模型——客服用一个,游戏配音用另一个,教育讲解再用一个。可靠性、可扩展性和场景适配性,比单纯的‘音质最好’更重要。”

因此,ElevenLabs正同步强化其API平台、开发者工具链与行业解决方案,确保客户不仅能获得高质量语音,更能快速集成到真实业务流中。

结语:做AI时代的“声音基础设施”

在语音AI从“炫技”走向“实用”的拐点,ElevenLabs的选择清晰而务实:短期死磕模型,长期深耕产品。当行业共识逐渐指向“模型即服务”(Model-as-a-Commodity),真正的赢家或许不是参数最多的公司,而是最懂用户、最能将AI无缝嵌入人类交互场景的那一个。

正如Staniszewski所言:“最好的用例,诞生于产品与AI的魔法结合。”而ElevenLabs,正试图成为这场魔法的首席炼金术士。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。