当前位置：首页 » 资讯 » 新零售 » 正文

腾讯云TencentOS Server AI，助力荣耀打造高性能AI底座

IP属地中国·北京 编辑：沈瑾瑜砍柴网 时间：2025-06-09 19:03:27

随着生成式AI技术的爆发式增长，AI大模型开始渗透至手机领域，一线厂商已经把AI应用集成到各自最新的产品中，并且在以惊人的速度迭代。为了进一步提升大模型部署的效能，荣耀基于应用腾讯云TencentOS Server AI中提供的TACO-LLM加速模块部署DeepSeek-R1等开源大模型，并应用荣耀企业内部等场景，稳定性、可靠性、推理性能均大幅提升。
在推理平台场景中，荣耀侧重关注框架效能、稳定性、运行状态监控及应急预案等特性。使用TACO-LLM进行推理任务后，在DeepSeek-R1 满血版场景下，相对于荣耀原始线上业务性能，TTFT（首Token 延迟）P95 的响应时间最高降低6.25倍，吞吐提升2倍，端到端延迟降低100%。在社区最新版本sglang场景下，TTFT P95的响应时间最高降低12.5倍。
腾讯云TACO-LLM之所以能够对荣耀业务的性能提升如此明显，主要的得益于多种投机采样技术核心能力：大语言模型的自回归解码属性无法充分利用GPU的算力，计算效率不高，解码成本高昂。而TACO-LLM通过投机采样的方式，从根本上解决了计算密度的问题，让真正部署的大模型实现“并行”解码，从而大幅提高解码效率。
荣耀大数据平台部相关负责人表示：“荣耀使用腾讯云 TACO-LLM 打造高性能的AI底座，部署稳定可靠，提升了性能加速体验。”
TencentOS Server AI加速版中提供的TACO-LLM加速模块，针对企业级AI模型私有化部署挑战，对大语言模型业务进行了专门的内核运行优化，用于提高大语言模型的推理效能，提供兼顾高吞吐和低延时的优化方案，能够“无缝”整合到现有的大模型部署方案中。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

放弃吧！“高速全面取消收费”根本没戏，免费只会更痛苦

八部门：进一步加大力度促进汽车消费促进汽车梯次消费、更新消费

新车难用满十年：技术短板、消费文化与行业策略如何共同“缩短”寿命

山东青岛：“微醺巴士”开拓文旅消费新场景

牛市就到这了？

拉布布暑期降温，中国潮玩出海弯道超车，谁是下一个顶流IP

全站最新

游戏直播不太行了，但虎牙突然又行了？

紧盯三个关键领域，强化人工智能科技伦理治理

不拼流量拼品质电商发展新规出炉

虎嗅【作·嗅之星】周榜第307～308期

热门推荐

放弃吧！“高速全面取消收费”根本没戏，免费只会更痛苦

八部门：进一步加大力度促进汽车消费促进汽车梯次消费、更新消费

新车难用满十年：技术短板、消费文化与行业策略如何共同“缩短”寿命

山东青岛：“微醺巴士”开拓文旅消费新场景

牛市就到这了？

拉布布暑期降温，中国潮玩出海弯道超车，谁是下一个顶流IP

南城香创始人汪国玉：平台消费券激发消费热情，门店收入利润均提升

通信企业：“推销热售后冷”消磨用户信任

盛银消金 25% 股权再被冻结！新董事长年初刚上任

伊利出席第八届中澳工商界首席执行官圆桌会助力中澳经贸合作提速升级

商查平台企业信息查询新范式：水滴信用企业查询MCP

从“闪购”到“观望”：Prime Day被拉长的背后，是消费者与平台的“双重博弈”

澎湃漫评｜通信企业为何“推销热售后冷”

“电商西进”助力豫企破浪：一枚鱼油的3000公里“暖心”之旅

京东外卖取消超时免单，改为“准时宝”服务