IT之家 7月18日消息,OpenAI今日凌晨宣布将在ChatGPT中推出一款通用型AI智能体,该公司表示该智能体可以帮助用户完成各种基于计算机的任务。
OpenAI介绍称,该智能体可以自动生成可编辑的演示文稿和幻灯片、查看用户的日历来简要介绍即将到来的客户会议、计划并购买制作家庭早餐的食材,以及运行代码等。
该工具名为ChatGPT agent,结合了OpenAI之前多种智能体工具的功能,包括Operator点击网站的能力,以及Deep Research从数十个网站中综合信息生成简洁研究报告的能力。OpenAI表示用户只需通过自然语言提示ChatGPT即可与该智能体进行交互。
为了开发这个新工具,OpenAI将其背后的Operator和Deep Research团队合并为一个统一的团队。外媒The Verge报道称,这个新团队由产品和研究部门共20~35人组成。
OpenAI今日起将向Pro、Plus和Team计划的订阅用户推出ChatGPT智能体,今年夏末向ChatGPT企业和教育用户开放。要激活该工具,用户可以在ChatGPT的工具下拉菜单中选择“智能体模式(agent mode)”。
OpenAI表示ChatGPT智能体比其之前的任何产品都要强大得多,可以访问ChatGPT连接器,允许用户连接像Gmail和GitHub这样的应用,智能体可以根据用户的提示找到相关信息。此外,OpenAI表示ChatGPT智能体可以访问终端,并可以使用API来访问某些应用。
根据OpenAI的说法,ChatGPT智能体的底层模型在多个基准测试中提供了最先进的性能。ChatGPT智能体模型在Humanity's Last Exam(pass@1)中得分率为41.6%,这是一项由数千个问题组成的、涵盖超过一百个学科的困难测试。这个分数大约是OpenAI o3和o4-mini得分的两倍。
在已知最难的数学基准测试之一FrontierMath中,OpenAI表示,当ChatGPT智能体可以访问工具(IT之家注:如用于代码执行的终端)时,其得分为27.4%,之前的最佳分数来自o4-mini(得分仅为 6.3%)。