当前位置: 首页 » 资讯 » 新科技 » 正文

4款豆包大模型上新!成本锐减,火山引擎进入AI落地深水区

IP属地 中国·北京 雷科技 时间:2025-10-16 20:12:50

说实话,五年前字节跳动官宣成立火山引擎时,我确实是属于看不懂的那一个。

在我印象里,当时云计算的牌桌上早已坐满了阿里、腾讯、华为这些巨头,战局胶着,利润微薄。字节跳动凭借抖音和头条手握着巨大的流量和现金流,为什么要一头扎进这片吃力不讨好的红海里?

这个问题,不仅是我,当时身边的许多同行都感到困惑。

然而,最近几年,这个问题的答案开始变得异常清晰。

尤其是在ChatGPT点燃了大模型的战火之后,云计算市场被重新激活,阿里云、火山引擎、百度智能云纷纷加大投入,让整个中国AI云市场的话语权争夺变得日益激烈,这一点从国际数据公司IDC的多份调研报告中可以看出端倪。

根据IDC 9月19日公布的报告,目前火山引擎在大模型公有云服务市场(即MaaS市场)位居国内第一,2025上半年市场份额49.2%,俨然接近半壁江山。



(图源:火山引擎)

然而在日新月异的AI行业,这样的优势显然不足以掉以轻心。10月16日,2025 火山引擎 FORCE link AI创新巡展 武汉站正式拉开帷幕。在这场与NVIDIA联合举办的盛会上,火山引擎用一系列发布,诠释了“模型升级创新驱动”的真谛。

雷科技受邀参加此次巡展,想知道火山引擎要折腾些什么新东西吗?跟着我来就行了。

四大模型上新,成本进一步下降

在火山引擎总裁谭待看来,目前全球AI大模型正在三个方向上快速发展

一是深度思考模型正与多模态理解能力融合,二是视频、图像、语音模型逐步实现生产级水平,三是企业级复杂Agent正在走向成熟,为企业激发新的生产力潜能。



(图源:雷科技)

然而,在服务的过程中,火山引擎发现,开启深度思考模式下,模型效果确实提升了,但也会提高模型延迟和使用成本,这导致实际应用中深度思考的使用占比仅有18%。

针对这一痛点,豆包大模型1.6正式提供 Minimal、Low、Medium、High四种思考长度,平衡企业在不同场景下对模型效果、时延、成本的不同需求,并进一步提升了思考效率,这也让豆包1.6成为国内首个原生支持“分档调节思考长度”的模型。



(图源:雷科技)

不仅如此,为进一步满足企业的多样化需求,火山引擎正式推出豆包大模型1.6 lite,号称性能超越豆包大模型1.5 pro,同时价格上,在使用量最大的0-32k输入区间里,综合使用成本较豆包1.5 pro降低53.3%,推理速度更快、更具性价比。



(图源:雷科技)

只能说,价格控制这块,火山引擎确实是行家中的行家。

对了,在今天大会上,火山引擎正式发布豆包语音合成模型2.0、豆包声音复刻模型2.0,它们都具备更强的情感表现力、更精准的指令遵循能力。

最重要的是,还能准确朗读复杂公式。



(图源:雷科技)

事实上,在教育场景中,复杂公式和符号的朗读一直是业界难题,目前市面上的语音大模型朗读准确率普遍低于50%,而豆包新发布的两大语音模型进行了针对性优化,目前在小学至高中阶段全学科的复杂公式朗读中,准确率可达90%。

听着蜡笔小新抑扬顿挫地读出这样一段复杂且冗长的化学公式时,我承认,我真的偷笑了。

全新的语音模型还能搭配图像模型来使用,快速创造出各种有声绘本,对即梦未来的发展也会有所加持。

正所谓,要“有好模型”,才能“做好应用”。

在小雷看来,好应用的底层必须由好模型来支持。而一个好模型,既要能精准捕捉用户需求,又得具备稳定的响应能力,更要做到出色的成本控制。

这样,才能让用户感受到“用得顺、靠得住、敢去用”。

智能路由加持,应用开发更省心

现在有了“好模型”,那么问题自然落到了如何“做好应用”上。

在很多企业看来,如今市面上的模型越来越多,哪怕只看豆包大模型家族,也有不下十来款产品。面对具体需求时,如何选择模型最有性价比?

为了解决这个问题,火山引擎在今天正式发布智能模型路由(Smart Model Router),这也是国内AI云行业首个针对模型智能选择的解决方案。



(图源:雷科技)

这玩意的功能很好理解,就是能够根据用户的实际需求自动选择不同的模型运行任务。

用户可以在火山方舟上选择“智能模型路由”功能,从“平衡模式”、“效果优先模式”和“成本优先模式”三种方案进行选择,智能路由会针对任务请求自动选择最合适的模型,达到效果与成本的最优解。

在会后进行的群访中,谭待表示,在部分场景中,小模型效果其实是优于大模型的(如简单客服问题用Flash模型,复杂问题用大尺寸模型)。开启智能路由后,无论是效果还是成本,都会比直接使用对应模型得到显著优化,他们希望借此降低企业技术门槛,实现“效果+成本双优”。

另一个比较有趣的更新,则是VideoPilot工具。



(图源:雷科技)

借助这个工具,你可以深入理解参考视频,自动生成对应的prompt,让你更方便地进行视频创作,甚至还能支持语言反馈,在原视频基础上实现多轮交互式优化。

当然了,这种逆推prompt的方式,在AI玩家里早已不是什么秘密。

就拿我自己为例吧,可能是因为用多了的原因,我现在养成了看到场景、镜头、拍摄手法独特的写真都保存一下的习惯,需要创作时只要一句简单的:

“分析可用于生成这种图片的连贯prompt,忽略角色本身外观/穿着特征,注重画面构成、角色动作、环境描写和镜头角度,最多200字。”

如此一来,豆包就能自动生成用于制作同类型图片的prompt,而VideoPilot则是把这种能力扩充到了视频上,让用户可以快速、精准地完成对既有内容/目标内容的模仿和扩展。

对于视频生成而言,拥有这样的功能确实是省心省力不少。

在今天上午的群访最后,谭待也表达了这样一个观点:生成类模型(生图、生视频)将会成为短期增长的核心趋势之一,而展望未来的话,Coding领域有望爆发。

归根结底,还是当前国内受模型能力限制尚未完全释放,未来潜力较大。

总结

从会场出来,武汉的风吹在脸上,我脑子里乱糟糟的,但又有一条线索越来越清晰。

今天的发布会,表面上看是发了新模型、新工具,但骨子里,我感觉字节跳动或者说火山引擎,其实是在简化着AI时代的“游戏规则”。



(图源:雷科技)

过去,大家比的是谁的“大脑”更聪明,参数更多,跑分更高,是一场军备竞赛。但火山引擎今天似乎在说:光有大脑没用,能动手、会干活、听指挥,还不贵,能踏踏实实地去为企业创造价值,这才是王道。

正如巡展的“城市计划”所展示的,从厦门的持续运营方案,到武汉的智能路由进化,火山引擎正一步一个脚印,将其在字节跳动内部海量业务中锤炼出的AI能力,系统性地开放给千行百业。

在AI浪潮席卷全球的今天,许多企业依然在“如何用上AI”的门前徘徊。

现如今,在模型全面升级、技术门槛有效降低的情况下,为了加强市场的竞争力,企业将更勇敢地迈出转型的步伐,加速推进AI能力和自家业务的融合。

当大模型真正成为企业生产力的一部分,一场真正的效率革命,才算刚刚开始。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新