据悉,DeepMind首席执行官德米斯·哈萨比斯在播客节目《Release Notes》中分享了公司最新的技术突破与战略布局。哈萨比斯指出,从游戏AI如AlphaGo到现在的Deep Think,展现了从单一领域到通用AI的演进路径,思考和规划能力是AGI的必经之路。DeepMind的终极目标是推出融合语言、多媒体、物理推理与生成能力的全能模型Omni Model。
Genie 3展示了AI对物理世界的理解能力,能生成具有一致性的虚拟世界,这对AGI理解和操作物理世界至关重要。然而,当前AI系统在某些方面表现惊人,但在简单任务上可能失败,缺乏一致性是距离AGI的关键差距。哈萨比斯还提到,未来的通用系统必须学会理解用户的真实意图,并将其转化为可优化的奖励函数,这涉及元认知或“元强化学习”的研究。
此外,哈萨比斯认为工具使用是AI系统最重要的能力之一,思考型系统的核心在于能在思考过程中主动调用工具。未来,Genie、Veo、Gemini等模型将逐渐走向融合,形成全能模型Omni Model,这才是AGI应具备的综合能力。