![]()
智东西
作者 陈骏达
编辑 云鹏
智东西10月26日报道,生成式AI技术正在加速渗透至搜索、推荐和广告领域,昨日,快手在一场技术沙龙活动中全方位解读了生成式技术在快手推荐系统、电商搜索、广告出价场景中的实践与应用。
这场技术沙龙集齐了快手在推荐、搜索、广告三大领域(简称“搜推广”)的四位负责人,以及来自中国人民大学、香港城市大学的学术专家,共同探讨生成式框架在搜推广领域的潜力。
快手已经将生成式技术全面运用于搜推广系统。推荐系统方面,快手的OneRec实现了从传统判别式到生成式的全面跃迁,具备推理与思考能力,已在主站、电商、极速版等场景落地;短视频推荐排序框架通过端到端多目标融合与对比学习,实现了用户体验的智能自进化。
搜索领域的OneSearch以生成式大模型取代“召回—粗排—精排”架构,显著提升CTR、CVR和订单量;广告出价环节则引入生成式强化学习,通过GAVE与CBD范式实现高效、低延迟、全空间优化的自动出价。
圆桌对话环节中,来自学术界的徐君教授与赵翔宇副教授认为,生成式范式虽面临挑战,但其“将搜索与推荐从行为预测转向意图理解”的根本性创新,正在改变整个行业的技术逻辑。
徐君指出,“伪范式”的批评并不成立,因为快手等公司已在真实商业场景中验证了其价值。赵翔宇补充道,大模型凭借自回归学习能力与内置世界知识,能够更精准地理解复杂行为序列,为搜索、推荐和广告建立了新的理论基础。
在关于成本与收益的辩论中,快手推荐大模型资深算法专家王诗瑶提出:“不能用昨天的尺子量今天的模型。”她认为计算成本持续下降、算法回报却呈几何级增长,关键不是算得起,而是配得上算力。
快手商业化算法部负责人蔡庆芃则强调,大模型基础建设是一次性成本,而收益是持续累积的,只要ROI为正,就值得投入。快手货架电商搜索与推荐算法负责人杨一帆进一步强调,这个账其实能算清楚,机器成本会下降,算法收益会增长,核心是技术团队要有长期视角——“要想着撬动新的收益,而不是只压缩成本。”
一、快手搜推广技术探索全揭秘,生成式方案展现潜力
快手在推荐、搜索、广告领域的四位专家分享了快手在相关领域的最新技术进展。
1、OneRec:如何重构推荐系统的智能边界与效率标准?
快手推荐大模型资深算法专家王诗瑶认为,大模型的兴起让推荐系统从传统的判别式范式迈向生成式范式,为突破传统推荐的智能天花板提供了可能。
快手在生成式推荐方面的重要探索为OneRec,其演进分为三阶段。oneRec V1首次实现端到端生成式推荐,用单一模型直接生成待推荐内容的对应token,突破传统多级判别结构。oneRec V2则针对算力在Encoder和Decoder侧的不均衡分布进行了优化,提出Lazy Decoder Only架构,并采用强化学习,最终大幅提升计算效率与可扩展性.
最新的oneRec Think则将用户行为日志视为新模态,与语言模型对齐,让推荐系统具备推理与思考能力,能够解释用户偏好并生成更具洞察力的推荐。
![]()
目前,OneRec已在快手主站、极速版及电商等多场景落地,带来显著的业务提升。王诗瑶称,团队将继续探索生成式推荐与大模型的融合,推动推荐系统向更智能、更通用的方向演进。
2、下一代推荐排序:快手短视频端到端多目标融合框架详解
快手短视频推荐算法链路机制策略技术负责人徐晓晓分享了团队近半年打磨的成果——端到端动目标排序机制框架。这是快手近两年在用户体验提升最显著的推荐系统项目之一。
该方案以模型化替代传统的人工设计融合公式,实现了推荐排序机制的端到端智能优化。通过聚焦“四大挑战”:候选间比较关系、用户满意度定义、模型可解释性及离在线一致性,团队构建了系统性解决方案。
比较关系建模方面,该方案以请求为单位组织候选样本,引入位置特征与Transformer结构,捕捉候选间相对关系。满意度定义上,他们提出了“相对优势满意对度与“多维满意度代理”,结合自进化的个性化动态权重实现多目标平衡。
![]()
为增强可解释性,该团队引入反事实样本生成与对比学习,保障模型输出与输入特征单调性。同时,为了优化离在线一致性,他们定义了“互动效率”指标,消除观看时长混淆,实现离线与线上指标统一。
落地结果显示,模型在多个链路中显著提升用户体验,特别是在快手极速版中,停留时长提升约2%,7日留存提升超3‰。项目标志着推荐机制从规则驱动迈向智能自进化的新阶段。
3、让搜索“一步到位”,快手端到端生成式搜索框架OneSearch
快手货架电商搜索与推荐算法负责人杨一帆介绍了业界首个电商搜索端到端生成式框架OneSearch,该框架以生成式大模型全面取代传统“召回—粗排—精排”架构,提升搜索系统的相关性与个性化体验。
该框架的核心创新体现在三个方面:首先,关键词增强层次量化编码通过结合RQ与OPQ的五层层次编码机制,为每个商品生成语义丰富的“智能身份证”,精准提取核心属性并区分细微差异,有效解决了商品标题堆砌关键词、属性混乱等问题。
其次,多视角用户行为建模将用户的短期搜索与点击行为显式注入模型,同时隐式融合长期购买偏好,构建具有语义理解能力的用户标识(UID),实现对用户即时意图与稳定兴趣的精准捕捉。
最后,偏好感知奖励系统(PARS)结合多阶段监督微调与强化学习,对齐线上精排分布,并基于真实用户交互数据优化排序逻辑,从而捕捉更细粒度的偏好信号。
实验结果显示,OneSearch在CTR、CVR、订单量等核心指标上均显著提升,订单量提高3.22%、成本降低75%,在冷启动和长尾查询场景中表现尤为突出,标志着生成式搜索在工业级电商领域的成功落地。
![]()
4、生成式强化学习在广告自动出价场景的技术实践
快手商业化算法部负责人蔡庆芃介绍,快手广告出价技术经历了三次演进:从基于反馈调节的PID控制,到具备预测能力的MPC模型预测控制,再到多步决策优化的强化学习出价。
针对传统强化学习在序列信息利用和探索效率上的不足,快手提出新一代生成式强化学习出价范式,融合生成模型与强化学习优势。
为解决对高质量数据的依赖,快手推出了GAVE方法(Generative Auto-bidding with Value-Guided Exploration),通过Reture-To-Go模块和价值引导探索机制,最终实现更好的出价;CBD方法(Causal auto-Bidding via Diffusion completer-aligner)则在生成时利用trajectory-level aligner更新序列,对齐优化目标。
![]()
实验表明,该范式提升了广告转化与成本控制效果,推理延迟仅为毫秒级,可稳定在线应用。
二、六位专家激辩,生成式框架是未来还是伪范式?
在圆桌对话环节,中国人民大学高瓴人工智能学院教授徐君、香港城市大学副教授赵翔宇、快手推荐大模型资深算法专家王诗瑶、快手货架电商搜索与推荐算法负责人杨一帆、快手商业化算法部负责人蔡庆芃就生成式框架在搜推广领域的潜力展开讨论,快手推荐模型部排序模型技术负责人唐睿明担任主持人。
唐睿明称,当前业内的一大讨论是,在搜推广系统,生成式框架到底是不是伪范式,有没有取代传统级联架构的潜力?
徐君认为,“伪范式”的批评过于严重,因为快手等公司已经在大规模商业应用中看到了实际效果。生成式框架解决了传统级联架构的问题,如错误传递等。
此外,生成式框架将过去搜索与大模型之间“若即若离”的关系转变为紧密捆绑,从而能更好地利用大模型的前沿技术。
虽然技术的迭代速度在不断加快,一项技术的生命周期从几十年缩短十几年,再到几年,但只要技术有用,就值得拥抱和尝试。
赵翔宇认为,生成式范式的根本性创新在于,它将推荐系统的核心任务从传统的行为相关性预测,转变为了对用户意图的深度理解和推理。大模型凭借其自回归的学习能力和内置的世界知识,能够更精准地解读用户复杂的行为序列,从而为搜索、推荐和广告建立了一个全新的、更为强大的理论基础和实现模式。
而在工业界,现实情况则更为多元。尽管像快手这样的先行者已经通过一个模型的统一范式取得了显著收益,证明了其解决传统级联架构中目标不对齐、误差累积和资源利用率低等问题的巨大潜力,但许多公司因现状所限,短期内更可能将生成式推荐作为现有成熟体系的一种补充或增强。毕竟,传统的级联模式在低时延、高并发的场景下已经高度优化且稳定。
同时,生成式框架当前仍面临即生成效率问题。值得欣喜的是,业界和学界已经涌现出许多工作来攻克这一难题。
王诗瑶认为,生成式推荐可能是未来,也可能只是通向更好技术的中间形态。如果未来出现更具优势的新技术,她会毫不犹豫地拥抱变化。但此刻,生成式就是最值得用好的技术。
她举例说,如今的推荐系统多是“瀑布式”的,被动展示内容,而未来可能进入对话式推荐场景,用户会多轮表达意图,这些意图可能相互关联、甚至矛盾。面对这种复杂输入,传统系统靠规则拼接是“技术的倒退”,而生成式模型能更自然地理解并生成结果。
她还提到,类似的技术演进已在其他领域出现,例如特斯拉用端到端模型替代了数十万行手写代码,正是数据与模型驱动的胜利。王诗瑶认为,现在正是用好生成式技术的时刻。
杨一帆从搜索视角出发,认为生成式不是终局,但无疑是一次值得兴奋的变革。他指出,在搜索中,对意图理解、检索空间与推理能力的要求更高,而生成式模型改变了传统“筛选优化”的逻辑,转向“智能生成”。
同时,生成式范式能更自然地与当下大模型的发展结合,引入推理、知识等能力。最后他强调,技术变革也会带来产品形态的革新,如对话式搜索等新交互方式,未来的搜索推荐可能由此形成新的循环。
蔡庆芃从广告角度出发,认为生成式架构的最大优势是“全空间优化”。传统多阶段模型目标不一致、数据分散,优化上限受限。端到端生成能在完整空间中找到最优的广告投放策略。
他提到,生成式方法与强化学习结合的潜力巨大,能更好地定义状态、动作、奖励,推动真正意义上的业务价值优化。过去广告系统的割裂让强化学习难以落地,而生成式范式能解决这个问题,让广告优化不再局限于局部模块。
三、生成式范式经济账怎么算,工业界、学术界究竟需要何种人才?
在关于成本与收益的讨论中,王诗瑶提出:“不能用昨天的尺子量今天的模型。”她认为算法同学往往被“算力固定”的假设束缚,但事实上计算成本持续下降,而收入增长潜力巨大。哪怕在高毛利要求下,公司也完全有能力承载更大的模型规模。她鼓励技术人员更多去思考如何开发配得上算力的好技术,而不是过早自限。
杨一帆补充说,这个账是能算清楚的。机器成本会随时间下降,工程优化会不断提升。关键是技术团队要保持长期视角,通过算法创新撬动新的收益,而不是只想着压缩成本。
蔡庆芃则认为,大模型的基础建设是一次性成本,而收入增长是持续累积的。只要ROI为正,成本问题就不是阻碍。此外,他还强调,通过蒸馏等手段完全可以在保持收益的前提下用更小模型上线。
谈到研究方向时,赵翔宇提到两个重点:一是构建更通用的词表,将语义、交互、地理等多模态信息融合进来;二是设计新的词表评估体系,让token层的质量与推荐效果形成可解释的闭环。
杨一帆则希望探索更统一的多模态编码,使不同物料(商品、视频、直播)在同一空间中建模,同时提升模型的推理能力,从而催生新的交互形态。
蔡庆芃关注广告出价与推荐中的生成机制,他认为广告决策是连续的,需要新的生成结构,并对“非自回归”生成方式非常感兴趣——人类思考不是逐字生成,而是从核心意图出发再补全细节。他还提到,可以通过推理能力更好地理解用户心理,预测他们真正的兴趣。
在对未来1到3年的展望中,徐君认为,未来搜索、推荐和广告不再是分离的模块,而会统一为“个人信息助手”的形态。届时,用户无需再区分搜推广,系统将直接呈现他们真正想要的内容。
他还预测,下一代系统会从“语义匹配”升级到“语用理解”,真正理解用户行为背后的动机,实现从工具到智能助手的演进。
蔡庆芃则认为,未来的最大机会不在于对现有模块进行小修小改,而是用生成式技术重塑广告系统,不只是提升ROI,而是重新定义广告体系。此外,Agent在广告场景的应用,有望实现从素材生产到预算投放实现全链路智能化。
王诗瑶进一步畅想,未来推荐也许由“个人助理”主导,这个助理深知用户的偏好、经历与购买记录,能主动生成最契合的内容。同时,她提到视频内容可能被“实时生成”,用户不再被动浏览,而是看到“为我生成”的动态视频世界。
最后在关于“学生培养与人才选择”的话题中,赵翔宇认为,当下的学生需要具备纵向的算法深度与横向的大模型工程能力。既要深入理解传统搜推体系(协同过滤、矩阵分解、强化学习等),也要掌握大模型的全流程技术(微调、特征工程、prompt设计等)。他强调,最有价值的科研往往来源于真实问题,希望学生能在实习或合作中找到能落地的研究方向。
徐君补充说,基础仍然是关键,特别是数学与逻辑的严谨性。学生要在“顶天立地”至少找到一个抓手,要么做理论深度的研究,要么能解决真实产业问题。他还提醒,科研的意义不应被论文数量绑架,而应关注实际价值。
杨一帆从企业角度指出,工业界看重的是业务理解力和快速学习力。搜推是高度业务驱动的领域,技术人员必须能抽象业务问题并将其转化为模型。他建议学生保持好奇心和学习热情,因为技术迭代太快,只有持续学习,才能不被时代落下。
此外,他也希望学生在学习前沿技术时,不应只停留在当下的应用层面,而应当了解技术发展的历史与脉络。如今很多“AI原生代”同学直接接触的是Transformer、大模型等最新成果,却不了解这些技术从早期模型一路演进的过程。他建议学生应多学习计算机与人工智能技术史,理解技术的迭代逻辑和背后的思想脉络。
结语:生成式技术改变搜推广
从端到端的推荐系统,到具备推理能力的搜索引擎,再到更为智能的广告出价系统,生成式技术正在改变搜推广的底层逻辑。
正如多位嘉宾所言,生成式不是终点,而是通往更智能系统的起点。未来,快手在该领域的探索,值得持续关注。
![]()





京公网安备 11011402013531号