机器之心原创
作者:张倩
在小红书上,一群热爱技术的年轻人,搞了一场为期五个多月的大型「团建」。
「感谢大佬带飞!」「用上您的方法之后猛猛上分!」「大佬一己之力把整个排行榜洗了!」
![]()
![]()
说实话,这些年看过不少大赛,但公开讨论这么热烈、选手之间氛围这么融洽的,真的少见。
初赛到复赛,选手们一直在分享。成功的经验要讲,踩过的坑也不藏着掖着。
![]()
刚入门的小白说,看完大佬们的帖子,终于知道怎么下手了;而那些分享的大佬呢,也坦言自己是「抛砖引玉」,评论区里常常能捡到新灵感。
这哪是比赛?分明是一群人组队上分。什么「文人相轻」、「零和博弈」…… 在「一起变强」的快乐面前,通通靠边站。
那么问题来了:到底是什么样的比赛,让这群年轻人这么上头?比赛最后是个什么结果?以下是我们在决赛现场 get 到的情况。
一场比赛
折射出推荐系统的下一次范式迁移
简单来说,这是一场广告算法大赛,目的是让模型学会「预测用户下一刻可能感兴趣的广告」,比谁「猜」用户兴趣猜得准
这个问题被优化得越好,广告系统就越能把不相关的内容过滤掉,让用户看到的更多是有用的信息,而不是被打扰。因此,主办方腾讯广告对这个问题非常重视,设置了 360 万元的奖金池,冠军队伍甚至可以独享 200 万
![]()
在技术路线上,这类问题的解决一直依赖「判别式方法」,即通过分析用户过去的行为记录,区分用户喜欢的内容和不喜欢的内容,以此来学到「拥有特征 A、B、C 的用户,通常会喜欢拥有特征 X、Y、Z 的物品」。这其中的核心逻辑是「匹配」,就像在一个固定的商品架子上选东西。
但是,这类方法有个问题:在遇到新用户或新物品时,它就不知道怎么办了,这就是业内俗称的「冷启动」问题
为了解决这类问题,业内不少团队都在探索新的范式,最近几年已经在语言、视觉等领域 work 的生成式方法自然成了首选。
和判别式方法在已知数据范围内做精准判断不同,生成式方法可以通过学习所有实体的本质特征,建立一个可推理的语义世界。当新实体出现时,它能够通过「理解」其本质并将其纳入这个世界,从而实现强大的泛化能力。
这么说可能有点抽象,我们来举个例子:平台上突然上架了一款全新的跑鞋,按照传统判别式方法,由于没有人浏览、点击或购买过,它几乎是「隐形」的,系统很难判断谁会喜欢它,只能等真实用户来互动。
但生成式方法不一样:它可以从商品的图文、材质描述、功能卖点等多模态信息里,直接读懂这双鞋的大致属性,并把它放进整个语义世界中,找到它最接近的邻居,比如它和哪类跑鞋相似、哪些用户的偏好向量与之接近。于是,即便没有任何历史行为,它也能把这双鞋推荐给可能会喜欢它的人。
这种从「记答案」到依靠多模态信息进行「独立思考」的过渡是当前生成式推荐算法追求的方向,也构成了本次腾讯广告算法大赛的赛题——全模态生成式推荐
![]()
在比赛中,选手拿到的是经过脱敏处理的用户全模态历史行为数据,包含文本、视觉、协同行为等,然后基于这些数据去做预测。
![]()
很多选手反映,这并不是一个简单的赛题。首先,「生成式广告推荐」其实是这两三年才冒出来的新方向,外面能参考的资料并不多,很多思路都得自己摸着石头过河。其次,大赛给到的是真实业务里脱敏后的多模态数据,既有推荐系统的协同特征,也有文本、图像、语音、视频的embedding特征,还夹着各种缺失、噪声。换句话说,选手面对的不是「干净的小白鼠数据」,而是现实世界里那种又乱又杂的情况,非常接近实战,难度一下子就上来了。
正因为赛题又新又真,所以特别考验大家的探索精神。很多问题光靠一个人啃不动,必须几个人一起琢磨、互相碰撞,才能把路走通。也正因如此,我们才看到了前面提到的热烈的讨论、空前的思路接力。
技术与人才的双重跃迁
年轻一代已走在前沿
整个算法大赛从 6 月份开始启动,历时 5 个多月,共有 8000 多人报名,2800 多支队伍参与比拼,可以说是一场竞争非常激烈的技术马拉松。
冠军团队 Echoch 和亚军团队 leejt 都提到,这几乎是他们参加过的数据规模最大的一场比赛。比赛中拿到的数据集(复赛达到千万量级)与以往学术场景的小数据集完全不同,既需要做模态的融合处理,又需要应对数据中存在的大量缺失值。整个比赛打完之后,就像在公司实习了几个月一样。
![]()
冠军团队 Echoch。成员来自华中科技大学、北京大学、中国科学技术大学。
![]()
亚军团队 leejt。成员来自中山大学。
当然,就像 Echoch 所说,数据多也意味着他们可以在比赛中训练出足够大的模型,从而验证哪些方法具有可扩展性,这在实际业务中非常重要。而且,他们还不用操心算力问题,因为这次腾讯的 Angel 机器学习平台提供了足够的算力和训练推理平台支持。有了这些支持,选手们的方案就有了一个足够真实的实验场。
在决赛答辩那两天,腾讯公司副总裁蒋杰在现场仔细听了选手们的解决方案。
「今年,我注意到一个特别惊喜的变化:现在的学生对大模型的理解,以及他们做出来的东西,已经和工业界的实际工作非常接近了。以前几届的作品往往只能在一台机器上跑,现在基本都能直接拿来做分布式部署。他们不像我们当年读书的时候,出来以后啥也不会,要跟一个导师学半年。」蒋杰在采访中欣慰地说。
![]()
腾讯公司副总裁蒋杰。
蒋杰的说法并不夸张。我们在现场看到,选手们的方案确实非常有创新性。比如在模型结构上,大家并没有拘泥于某一种套路,而是大胆尝试了不同的生成式框架,甚至去琢磨如何重新组织 token,让模型更好地理解用户的行为序列;在多模态的处理上,有的队伍专门研究怎么把各种模态的 embedding 对齐,让文本、图像、行为信号能够「听得懂彼此」,也有人尝试用更细致的空间对齐方法,让协同信息真正用起来;而在工程层面,不少队伍则把压箱底的本事都掏了出来,从训练加速到推理优化,再到显存的极限压缩,都做得非常极致。
在此过程中,选手们成功地把很多之前只在大语言模型、多模态模型领域尝试过的方法用在了广告推荐领域,并且取得了很好的效果,这填补了广告推荐与其他领域之间的 gap。
选手们这种对于新论文、新方法的消化、运用能力也让蒋杰非常兴奋,直言他们的知识体系和腾讯内部的算法工程师「完全接轨」「没有代差」,有些方面甚至还「更有创新性」
当然,大赛竞争如此激烈,大部分选手是没有走到决赛的。但很多同学坦言,他们在比赛中同样经历了诸多激励人心的时刻。
要知道,很多人在报名之前是没有接触过广告推荐算法的,更没挑战过业界难题。然而,通过阅读其他选手在小红书上分享的解决方案,他们一步步摸清了门道,并跟着策略上分。有位同学回忆,一位「大佬」始终与他保持私信交流,共同研讨如何改进流行性采样策略。他们花了一两天时间反复尝试,最终获得了千分之五、六的收益提升——那种感觉依然「很爽」。
更重要的是,这样的时刻让他们真切地看到:自己的能力并非固化不变,那些原本未曾设想的道路,其实也可以勇敢尝试。赛后,不止一位同学表示,自己今后还会参赛,这种越挫越勇的精神令人动容。这,或许才是大赛最重要的意义。
比赛结束
托举才刚开始
一场大赛,把这么多聪明的头脑聚在一起,共同把一件难事往前推,本身就已经足够振奋人心。
![]()
但决赛并不是终点。蒋杰在采访中明确表示,这次在大赛中表现突出的选手,将被纳入腾讯的「青云计划」。这是面向顶尖学生的人才通道,能够让他们直接接触最好的导师、资源和算力平台。换句话说,优秀的年轻人不会因为一场比赛而散场,而是会继续被托举、被加速。
这种对年轻人才的重视,来自蒋杰对科技行业长期的观察:无论国内还是国外,能够在前沿赛道上跑出来的团队,无一不是依靠「矩阵式」的人才积累。一批人长期深耕不同模块,彼此补位,形成合力,才有了今天 AI 领域的集中爆发。从这些案例可以看出,真正决定上限的,是人才的厚度和代际传承。而这一点,在大赛中其实已经出现了苗头:年轻一代具备很强的科研与工程能力,开源文化也在他们身上延续得很好
我们希望让年轻人更快地成长,不是坐扶梯,而是坐直梯的速度往上走…… 有足够的人才,才能做出更有价值的事情,这是必然的。」蒋杰说这话时语气非常坚定。
从这次大赛,我们不仅看到优秀选手的涌现,也看到了国内科技企业在培养顶尖人才方面的投入和决心。这些积极的信号,让我们有理由对中国 AI 的下一程抱持真正的期待。





京公网安备 11011402013531号