当前位置: 首页 » 资讯 » 科技探索 » 正文

AI教父本希奥宣布开发诚信系统,防范智能体欺骗人类

IP属地 中国·北京 编辑:陆辰风 新浪财经 时间:2025-06-04 19:09:41

6 月 4 日消息,金融时报(FT)昨日(6 月 3 日)发布博文,报道称“AI 教父”约书亚・本希奥(Yoshua Bengio)成立 LawZero 非营利组织,致力于开发“诚实”的 AI 系统,用以识别“流氓”AI 系统。

IT之家简要介绍下本希奥,他是来自蒙特利尔大学的教授,因与 Geoffrey Hinton、Yann LeCun 共享 2018 年图灵奖(被视为计算机领域的诺贝尔奖),而被誉为“AI 教父”。

LawZero 的使命是开发一种“诚实”的 AI,专门监控那些无需人类干预即可执行任务的 AI 智能体,防止它们表现出欺骗或自我保护行为,例如试图阻止人类关闭系统。

本希奥正在研发的系统名为 Scientist AI,旨在成为 AI 智能体的“守卫”。他将现有的 AI 智能体比作“演员”,它们模仿人类、取悦用户,而 Scientist AI 则更像一位“心理学家”,能够理解并预测不良行为。

该系统不会给出确切答案,而是以概率形式评估答案的正确性,体现出一种“谦逊”态度。它还能预测 AI 智能体行为导致危害的概率,若概率超过阈值,系统将阻止相关行动。

IT之家

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。