当前位置: 首页 » 资讯 » 新科技 » 正文

倪光南:发展“AI+机器人”,向新质生产力加速跃迁

IP属地 中国·北京 环球网资讯 时间:2025-11-05 08:11:33

环球时报

当前,人工智能(AI)已经成为助推世界科技和产业蓬勃发展的强大引擎。习近平总书记指出:“以人工智能引领科研范式变革,加速各领域科技创新突破。”党的二十届四中全会提出,加快高水平科技自立自强,引领发展新质生产力。在这一目标的指引下,我国正在深入实施“人工智能+”行动。机器人产业作为一个新兴产业、未来产业,要顺势而为,聚焦提升生产力,通过AI+赋能,使机器人产业向新质生产力加速跃迁,成为“AI+机器人产业”,为国民经济、为人民的生产生活,创造更大的经济效益和社会效益。

发展机器人产业并不是要替代人类

我们要明白,机器人是拓展人类的能力完成任务,而不是替代人类。

人类大脑的起源和演化经历了漫长而复杂曲折的过程。今天作为智人的我们,其繁盛兴起得益于偶然性和在自然环境中的适应性。我们的祖先克服了其他类人物种没能克服的困难,那时地球上的智人既不是最强壮的,不是行动最迅捷的,也不是数量最多的(蚂蚁和磷虾的数量要比人类多得多)。应当说,是庞大和复杂的大脑使我们有能力去适应和影响这个星球。

大脑是目前宇宙中最复杂的物质集合,其进化让人类成为生物界中的最高级动物。meta首席科学家、图灵奖的获得者杨乐昆教授在一次报告中提到,“一个典型的大语言模型大约是10的14次方字节信息量的基础上训练出来的,这几乎是互联网上所有公开文本的总和。一个人要花几十万年才能读完这些材料,这是海量的信息。”但大模型仅仅依赖文本训练是不够的,我们还要继续探究经过数亿年进化的大脑的奥秘。生成式AI的出现预示着未来深层经济结构的重塑,当我们谋划发展机器人产业时,应当深刻地思考人和机器人之间的关系和变革,包括对知识工作的重新定义和劳动力结构的重塑,而不是简单地以机器人大规模替代人类。为此,要聚焦提升生产力,通过AI+赋能,使机器人产业向新质生产力加速跃迁,让机器人作为人类能力的扩展去高效完成任务,机器人带来的将不是岗位的终结,而是工作任务的重构。

我们要研究不同工业化时期制造业的变化和机器人的定位。在不同工业化时期,对制造业而言工厂的定位是在变化的。德国提出了工业化4.0(即第四次工业革命),中国则处于从传统工业化发展到新型工业化的阶段。随着人工智能引领的科技变革的推进,中国大多数企业将从自动化发展到智能化,生产模式将从刚性化、标准化,发展到柔性化、定制化兼备。

机器人将从过去自动化工具逐渐过渡到“AI+机器人”;机器人的控制者从过去的实时操作系统发展到“AI+机器人”智能系统;自动化机器人交互用按钮、键盘、鼠标、屏幕,“AI+机器人”可增加语音交互等;自动化机器人用人工编程,“AI+机器人”依赖大模型;自动化机器人在固定工位工作,“AI+机器人”是多工位自主移动工作;自动化机器人需要提前部署、调整、编程,“AI+机器人”将实现即插即用;自动化机器人是人机分工、难以互动,“AI+机器人”是人机协同、取长补短。总之,“AI+机器人”是今后机器人的发展方向,机器人的形状会多样化,也许会根据场景需求以最经济合理的方式完成具体任务。

机器人要用起来必须注重三大核心智能协同

从现有产业现状着眼,中国机器人产业发展的关键是提升机器人智能等级。机器人的控制需要从过去“机器人操作系统”,发展到“机器人智能系统”。一般认为,三大核心能力支撑着机器人智能系统:一是“眼睛”即机器人环境感知能力;二是“行动”即运动控制能力;三是“大脑”即交互决策能力。三者互相融合而又相对独立,协同构成一个机器人智能系统。目前我国机器人产业对运动控制(“行动”)的投入较大,而对环境感知(“眼”)和交互决策(“脑”)的投入不足,迫切需要提升。

大语言模型构成了“机器人之脑”。机器人智能系统以“脑”为核心,基于大语言模型的“脑”推进了从“机器人操作系统” 到“机器人智能系统”的技术架构性变革。大语言模型带来的是效率提高和工作流程的再设计,在大模型加持下,机器人能自主实施知识积累、接受指令、动作实施、人机交互等等。大模型将提供相应的工作流程,引导机器人完成各种任务。

AI+空间计算作为“机器人之眼”,开启机器人认识世界的新范式。根据生物智能进化原理,眼睛是生物进化中智能的起点。机器人智能系统要突出“眼”的作用,以AI+空间计算作为机器人眼睛的支撑是适合的,能以“类人眼”方式采用普通单目摄像头+神经网络学习,预先对环境进行学习训练,提升对物理世界的感知和理解,并具有自适应和持续学习能力,实现机器人睁开眼睛看世界,具有好用、易用、实用等特点。

空间计算作为一种面向三维世界的计算模式,正在重塑人类、机器和世界的交互方式,是推动机器人落地的关键核心技术之一。历史上人机交互范式经历了从电报、文字到语音、图形、视频等的发展,当前我们正从二维向三维新的交互范式转变,空间计算是引领这种交互范式变革的重要技术支撑。空间计算是对物理世界的“重构”,生成式AI并不能替代。今天生成式大语言模型的发展很快,但并不能覆盖我们世界的全部。来自物理世界的数据复杂、模态多样,目前大模型还不能轻易解析出视频、动作、物理规则等等。

AI+空间计算的融合创新,有望打破物理世界和数字世界的界限,引领我们进入新的信息时代,是支撑低空经济、机器人等产业发展的关键技术。它与传统机器视觉的不同在于:它是采用AI+空间计算重构物理世界,而后者往往是基于多种物理硬件的叠加去看世界。

开源AGIROS支撑“机器人行动”,有助于机器人产业生态建设。AGIROS是由中国科学院软件所支持、拟定为标准的开源机器人操作系统。其开源社区由中国科学院软件所倡议发起,旨在通过凝聚机器人产学研用各方力量,全面推进智能机器人领域的开源开放、协同创新,为智能机器人产业夯实基础。迄今为止,已有大批机器人领域的产学研用等单位和广大开发者加入这一社区。

我们相信,借助开源的力量,AGIROS将大大增强AI+机器人的“脑、眼、行动”协同系统的竞争力,在全球机器人业界引领潮流,成为传统机器人跃升为AI+机器人的主要推动力量。

构建“基于RISC-V架构的AI+机器人”生态系统

历史上,信息技术领域出现过一些规模庞大的生态系统,如“Wintel”“AA”,正在兴起的还有“RV+OSS”,包括“RV+OpenHarmony”“RV+openKylin”等等,这些都是面向人类的信息技术生态。未来面向“AI+机器人”可能也会形成类似的生态系统,例如本文讨论的“基于RISC-V架构的AI+机器人” 那样的生态系统(即RV芯片+脑、眼、行动智能系统)。

我们希望中国机器人业界为这个生态作出更大贡献,大家共同努力构建一个人机共融的世界,让机器人成为我们能力的扩展,帮助人类实现所向往的美好生活。让我们帮助机器人构建一个属于它的智能系统,来看见世界、理解世界、行动于世界。(作者是中国工程院院士)

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。