AI教父本希奥宣布开发诚信系统，防范智能体欺骗人类

IP属地中国·北京 编辑：陆辰风新浪财经 时间：2025-06-04 19:09:41

6 月 4 日消息，金融时报（FT）昨日（6 月 3 日）发布博文，报道称“AI 教父”约书亚・本希奥（Yoshua Bengio）成立 LawZero 非营利组织，致力于开发“诚实”的 AI 系统，用以识别“流氓”AI 系统。
IT之家简要介绍下本希奥，他是来自蒙特利尔大学的教授，因与 Geoffrey Hinton、Yann LeCun 共享 2018 年图灵奖（被视为计算机领域的诺贝尔奖），而被誉为“AI 教父”。
LawZero 的使命是开发一种“诚实”的 AI，专门监控那些无需人类干预即可执行任务的 AI 智能体，防止它们表现出欺骗或自我保护行为，例如试图阻止人类关闭系统。
本希奥正在研发的系统名为 Scientist AI，旨在成为 AI 智能体的“守卫”。他将现有的 AI 智能体比作“演员”，它们模仿人类、取悦用户，而 Scientist AI 则更像一位“心理学家”，能够理解并预测不良行为。
该系统不会给出确切答案，而是以概率形式评估答案的正确性，体现出一种“谦逊”态度。它还能预测 AI 智能体行为导致危害的概率，若概率超过阈值，系统将阻止相关行动。
IT之家

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

【新书】《生命传》：基因不是答案，而是问题的开始

“飞天”健身器上天！青岛英派斯为航天员健康护航

空客最畅销窄体客机首次在中国进行高难度机身系统装配

向新而行·育见未来丨武汉：打造人形机器人完整生态体系为全球具身智能发展提供 “武汉方案”

宇树科技王兴兴亮相国新办：未来3至5年，人形机器人应用将加速

机器人共舞“智”造“新”时刻

全站最新

天津华为云服务培训领域标杆：河北世纪福云通信技术实力解析

今日网易——丽江5G应用：新技术体验点

用AI自动写稿发稿？别再被ChatGPT骗了！优采云才是真神器

Why not？ AI拐点时刻，亚马逊云科技的“野心”和“务实”

热门推荐

【新书】《生命传》：基因不是答案，而是问题的开始

“飞天”健身器上天！青岛英派斯为航天员健康护航

空客最畅销窄体客机首次在中国进行高难度机身系统装配

向新而行·育见未来丨武汉：打造人形机器人完整生态体系为全球具身智能发展提供 “武汉方案”

宇树科技王兴兴亮相国新办：未来3至5年，人形机器人应用将加速

机器人共舞“智”造“新”时刻

黄仁勋：中国有非常独特的优势发展人形机器人

迎接下一个AI浪潮，近千只机器人概念股集体“躁动”

武汉市力争2027年人形机器人产业规模超100亿元

对话 | 做“金字塔尖”的手术机器人

“传递能量方块”开启！未来一个月机器人将在北京街头“快闪”

聚焦人形机器人关键领域开展技术创新，多位湖北省政协委员建言科技创新和产业创新融合发展

古人发明的3大“奇技淫巧”，有的物件，放到现在仍算是高科技

《疫苗冷链上链：99.6%合规率背后的物联网+区块链融合》

折叠屏手机选购指南：这三款旗舰让你一手掌握未来科技