当前位置: 首页 » 资讯 » 新科技 » 正文

具身智能奇点时刻来临?业内专家:技术尚未收敛,后端场景有先发优势

IP属地 中国·北京 编辑:杨凌霄 证券时报 时间:2025-08-05 20:25:54

以“创业投资开启AI技术与应用共振周期”为主题的启明创投·创业与投资论坛近日在沪举行。在“具身智能的奇点时刻”专题对话环节,多名业内专家一致认为,具身智能已站在奇点到来的早期窗口。当前,具身智能技术虽未完全收敛,但已处于快速发展阶段。

启明创投主管合伙人周志峰表示,具身智能机器人将率先在拣选、搬运、组装等场景实现规模化部署,积累大量机器人第一视角数据与带触觉的操作数据,构建“模型—本体—场景数据”的闭环飞轮。这一飞轮将驱动模型能力迭代,最终推动通用机器人迈向大规模落地。

站在具身智能奇点的“前夜”,原力灵机联合创始人兼首席执行官、旷视科技联合创始人唐文斌表示,投身具身智能行业最大的信心,来自于看到大模型领域链式推理(CoT)与智能体(Agent)能力的巨大潜力。唐文斌认为,机器人从专用走向通用有两个必要条件,一个是对物理世界的精确感知能力,一个是对复杂任务的规划和推理能力。

具身智能来到发展的关键阶段

从进厂拧螺丝,到便利店递可乐,具身智能作为人工智能与机器人技术融合的前沿领域,目前已来到技术突破与产业培育的关键阶段。

“具身智能技术过去两年的发展速度,已超越此前多年积累,进入‘越跑越快’阶段。”它石智航创始人兼首席执行官陈亦伦表示,一方面,业内对端到端技术的信息倍增,操作领域实验室样机能力显著提升;另一方面,多模态大模型发展潜力十足,视觉、语言等模态的进步尚未触顶,数据驱动能力持续增强。从硬件成熟度上来看,高自由度终端(如灵巧手)和接近量产的形态加速落地。

唐文斌表示,具身智能的发展动力主要来自大模型在链式推理(CoT)与智能体(Agent)上的能力达到一定的临界值。

“通用机器人的出现,需同时满足两项必要条件:其一,对物理世界的高精度多模态感知。这也是我们过去创业十多年以来一直在做的事情,如今无论是小模型还是大模型,我们的多模感知能力已经做到了行业领先水平,并且还在不断提升。”唐文斌说,“其二,复杂的规划与推理能力,我们希望机器人能够像人一样实现敏捷的决策、结合多模态的感知实现对复杂问题的推理。两者结合方可推动机器人迈向通用化,而当前Agent与CoT的进展,正使这一技术朝着可行的方向发展”。

技术尚未收敛 增长空间可观

尽管发展速度极快、宏观方向趋同,但具身智能技术尚未收敛。业内普遍认为,下一阶段需通过量产落地验证技术路线,加速标准制定与生态协作,推动分化领域逐步收敛。这一发展现状也为创新企业提供了定义技术范式的战略窗口期。

唐文斌认为,当前具身智能的技术路线尚未收敛,算法框架、数据来源、硬件形态与稳定性以及场景落地的先后顺序仍处于开放探索阶段。

“虽然业内正逐步形成‘端到端、纯数据驱动、采用类VLA(视觉—语言—动作)框架’的共识,并普遍认同多模态信息(视觉、触觉、力觉、深度等)需统一纳入大模型,但终极模型架构尚无定论。”唐文斌提到,现有VLA多为单帧模型,缺乏原生记忆机制,难以完成需要状态累积的任务(如连续添加调料)。此外,“大小脑模型”将高频执行与低频决策人为拆分,虽为当下工程实践,但并非终极形态;未来仍需探索单一模型如何以动态、柔性的频率进行实时思考与决策。

“整体上看,技术框架仍面临大量未解问题,而开放的不确定性正是推动行业持续创新的关键动力。”唐文斌说。

据陈亦伦介绍,在具身智能领域,业界已在宏观层面形成高度共识,例如,数据被视为核心驱动力,模型最终部署形态大概率采用端到端架构等。不过,在具体实践中,各个团队的路径差异明显。“宏观共识、微观多元”成为行业现状。

例如,数据获取方面,有人主张大规模部署真机采集,有人倾向高比例仿真生成;算法层面,即便认同VLA的任务定义,网络架构仍存分歧——是否采用单一大网络、是否加入隐变量层、强化学习的选择及世界模型必要性等问题仍在探索。硬件层面同样多元,通用机器人形态分为双足与轮式两大类,双足方案又存在直驱关节与复杂传动机构等不同设计。

后端场景有先发优势

在实验室场景下,机器人已具备“十八般武艺”,复刻了人类诸多技术和劳动。然而,在商业化应用中,机器人实际落地或遵循严谨的先后顺序。

唐文斌认为,机器人的规模化应用大概率将从工业、物流等领域的后端场景起步。这类场景因规模大、劳动力密集,能产生更大价值。之后,具身智能逐步向商用场景拓展,最终走向民用。

“机器人能否落地的关键在于两点:一是真正解决问题(能用、好用),二是经济模型成立。”唐文斌说。

从技术与市场的结合角度,唐文斌还提出了三个关键标准:其一,坚持技术发展的正向梯度,即不过早将技术形态固化于特定垂直场景,避免牺牲泛化性,而是沿着技术演进的正确路径推进,保持模型在通用能力上的迭代空间。其二,注重技术可达性,选择容错率较高、对操作时间容忍度更强的场景,逐步从90%向95%、100%优化。其三,场景需具备规模与强需求。

陈亦伦则遵循高价值、有规模、有难度的“黄金三角”逻辑筛选机器人应用场景。他表示,公司会选择用户非常在意的真实需求、存在较大市场空间且上一代机器人技术难以解决的问题,最终实现通用机器人的AGI终极目标。

7月下旬,上海发放了新一批智能网联汽车示范运营牌照。8月以来,全无人驾驶的出租车在上海市区开展日常运营。在技术底座上,无人驾驶和机器人共享“感知—决策—执行”技术栈与产业链资源,有望形成“车—机共生”生态。未来,两大领域将从协同研发走向规模化发展。

陈亦伦表示,具身智能和自动驾驶在任务场景和底层技术上同宗同源,模型技术可以复用,工程能力可以迁移,自动驾驶行业的经验与认知也能帮助具身智能领域的探索与落地。

责编:岳亚楠

校对:陶谦

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。