五金直落!国乒队创造新历史,包揽了今年奥运会乒乓球项目里全部五枚金牌,实现了团体项目五连冠。
在过去的周末,两场团体决赛都打得惊心动魄。男队和女队,都遭遇了 开局不利的情况。樊振东与瑞典选手打得一度胶着,直到决胜局终于重启成功。陈梦王曼昱组合、孙颖莎都在开局失分的情况下,稳住心态,一分一分赢回来,为团队取得大比分优势,弥补了去年东京奥运会的遗憾。
尽管国乒队的实力有目共睹,但中国队的每一位选手都没有放松过。今年碰上的瑞典队和日本队,都不是可以轻敌的对象。某种程度上说,这也是国乒队「养狼计划」的成功。
自从 2009 年提出养狼计划以来,国乒在推动乒乓球运动的全球发展上出了不少力。在东京奥运会之前,中国国乒教练组曾在队内封闭集训的时候邀请多位外协选手一起练习,包括德国的奥恰洛夫,以及日本的伊藤美诚以及张本智和。
虽然张本智和这次颗粒无收,甚至在赛后一度崩溃到跪地不起……
要不然,也可以尝试一些新鲜的训练方法,比如和机器人练球?
周三,Deepmind 发布了最新的论文预印本,标题高调地写到:实现人类水平的竞技乒乓球机器人。第一作者 David B. D’Ambrosio,从 2019 年起就以乒乓球作为切入点研究运动机器人,连续几年都盯着这个项目。
机器人怎么练球?
想要教会机器人打乒乓球,有两种方式。一个是让它在虚拟环境里,先自己摸索,看看哪些动作它能完成的不错。
另一个则是可以让它模仿人类,收集大量的人类打球的影像,这也是人练球时的方式。不过,就像我们看了无数场国乒队打球,也未必学得会一样,让机器人以这样的方式学打球,也很耗时。
Deepmind 这次把两种训练方式结合起来,首先让机器人看一些人类打球的视频,这样它就知道怎么入手开始学习。然后,让机器人在虚拟环境里练习一阵子,再送去跟人类对打,以搜集更多来自真实世界的动作数据。
在进一步了解他们独特的训练方式之前,还是先看一下训练成果吧。Deepmind 招募了 29 位球手,来跟机器人打练习赛,包括了初学者、中级、高级和高级+。
在目前释出的比赛录像里,机器人和几位球手之间的切磋非常有看头——不仅是技术层面的,也有观赏层面的。
比如 21 号这位大爷,看着像是那种在公园或者广场上会碰到的野球王,架势很足。
没打好的时候还会懊恼。
每个选手要跟机器人打三轮,在第一轮的时候,人类选手都 不太适应对面是个动来动去的机器人,导致第一局经常失分。
从视频里我们没办法判断选手的水平到底是哪个级别,只能从发球、回球的架势上看。像 28 号这位,好像就很厉害的样子。
基本上到了第二局,人类已经适应机器人了,得分会更猛——但这时恰恰是机器人记录和学习的好时机。
这种实时收集并快速适应的能力,是这次更新的重点。即便在面对专业教练的时候,机器人也很快就可以调整好状态,打出路线灵活多变的回球。
不得不说,个别人类选手,菜就算了,还多少有点轻敌——说的就是你 33 号选手!
没接到还要对机器人做鬼脸,怎么了,没想到对面会有这么刁钻的角度吗(手动狗头)
虽然论文上说,机器人会实时收集记录对手的表现,并针对对方的打法特点,调整自己的应对策略。但是从几个录像里看,它比较偏好往左侧边线压,而且经常打出压线球。
跟 35 号球手的对拉,有点子精彩,连出几个大角度的侧拉,而且机器人体现出一种循序渐进:从中线一点点拉开角度,挥臂时的弧线有模有样,时机到了的时候甚至会突然改变角度。
后面的裁判完全看进去了,连连拍手。
综合来看,机器人的赢率在 45%,但是细分之后来看,面对初学者时机器人的胜率已经去到 100%,中级球手是 55%,很惊人了。
混合训练出奇迹
对机器人来说,乒乓球这样运动,既需要灵活快速的运动,又需要高层次的战略决策。
下棋是计算、推理和布局。而乒乓打球,不仅需要这些,还要能把脑中的布局,用身体动作实现出来,同时对局势有判断,对下一步的行动有所预估。
去年,David B. D’Ambrosio 团队主要攻克的就是高速运动中的学习。机械臂的设计当时已经基本成形:两个机器人相辅相成:龙门架能够快速移动很长的距离,将手臂操纵到合适的位置,进行微调并用手臂以受控的方式击球。
因此这一次的发布中,算法和训练方法成了最令人瞩目的部分。一方面 Deepmind 设计了分层策略架构,建立技能库和对应的技能描述符,技能又进一步切分为低级技能和高级策略,战术和战略互相匹配,完成技能输出。
另一方面,使用了混合训练方法。使用仿真和强化学习来训练通用机器人控制器存在许多挑战,其中就包括模拟与真实的差距。光在模拟环境里打,能够起到的学习效果有限。而单一的模仿,效率又不高。
还记得前两天 Andrej Karpathy 发的推文吗?他说基于人类反馈的强化学习,只能勉强称得上是强化学习,因为它受限于奖励模型的准确性和泛化能力。如果奖励模型不能很好地捕捉任务的所有方面,智能体可能无法学习到最优的策略。
可以说,Deepmind 的混合训练方法,在思路上有所调整,和真人线下对打,反而是对它虚拟练习的补充。
野王打不了职业
横扫初级,硬控中级,Deepmind 的机器人难道又要重现当年 AlphaGo 的盛况?
别忘了,在高级选手那里, 机器人占不到一点便宜。对战稍微有点水平的球手,胜率直接跌到0。
职业比赛里,运动员的移动半径可以非—常—大。
比如著名的乒乓球表演艺术家许昕。
打球打到出画
你的反手我的反手好像不一样
以及国乒队随时随地带来的超绝对拉。
王楚钦vs樊振东
马龙 2016 里约奥运会名场面
想要拉出这种逆天场面,是机械臂暂时无法做到的,不仅是要移动的远,还要移动的灵活,能从场边两个箭步又能冲回台前。
更不用多说的,是那些精妙的招式。
作为包揽最多奥运金牌的中国乒乓球队,人才济济,而且各有各的风格特点。
马龙技术全面,同时格外擅长弧圈球,加上正手时速度极快,对面根本反应不过来。樊振东的正手攻击力度大、速度快,极具穿透力和变化性,这使得他的正手成为了他最致命的武器之一 。
女队里,陈梦有一个外号:「陈大山,打不穿」,意在她的脚踏实地,稳扎稳打。孙颖莎则细腻又犀利,变线迅速,攻防转换非常灵活。王曼昱大开大合,球风有男队的凶猛。
我们对奥运、竞技赛事的沉浸与兴奋,正是来源于这些千变万化又精彩绝伦的技术风格。
再一次祝贺中国乒乓球队实现项目金牌包揽,以及整个中国队以 91 块奖牌的境外最好成绩收官巴黎奥运,洛杉矶再见!