智东西
作者 程茜
编辑 云鹏
OpenAI的AI浏览器终于来了!
智东西10月22日消息,今天凌晨,OpenAI发布自家首款内置ChatGPT的浏览器ChatGPT Atlas。这也意味着,OpenAI正式向谷歌在浏览器领域的霸主地位发起挑战。
先来看Atlas的核心功能:内置ChatGPT,可在网页窗口任意位置调用完成任务;拥有浏览器记忆,可以记住曾访问网站的上下文;通过Agent模式执行工作,现在更擅长在用户浏览网页时研究和分析、自动化任务以及计划活动或预约。
再来看谁可以用:目前,Atlas已经向macOS的免费、Plus、Pro、Go订阅用户开放下载,Windows、iOS和安卓用户体验稍后开放。Atlas中的Agent模式仅向Plus、Pro和Business用户提供了预览版。
智东西下载初步体验了Atlas后发现,其基本的操作模式与谷歌等浏览器类似,相当于将ChatGPT直接嵌入浏览器,且从功能来看Atlas与其他AI浏览器并没有较大差距,或许还需要体验一段时间,当其拥有更多浏览器记忆,才能有更多差异化的用户体验。
OpenAI联合创始人兼CEO萨姆·阿尔特曼(Sam Altman)称,“我们认为AI代表了重新思考浏览器功能的难得机会。”OpenAI将ChatGPT视为Atlas跳动的心脏。ChatGPT可以帮助用户采取行动,如预订航班、编辑文档等,此外用户可以在设置中查看和管理浏览器的记忆,以及打开隐身窗口。
这场直播阿尔特曼还邀请了多位OpenAI员工,包括从事训练后研究的威尔・埃尔斯沃思(Will Ellsworth)、ChatGPT搜索功能的产品负责人亚当・弗赖伊(Adam Fry)、曾参与开发谷歌浏览器(Google Chrome)和火狐浏览器(Mozilla Firefox)的深员工本・古杰(Ben Goodger)、界面设计师瑞安·奥鲁克(Ryan O’Rouke)、曾任职于苹果公司的贾斯汀・拉辛(Justin Rushing),以及普拉纳夫・维什努(Pranav Vishnu)。
不知这场发布结束后,OpenAI这些员工会不会又被挖走……
▲上图从左至右:Ryan O’Rouke、Ben Goodger、Adam Fry,下图从左至右:Pranav Vishnu、Justin Rushing、Will Ellsworth(上下图最右侧均为Sam Altman)
Atlas还支持安装谷歌扩展程序,也有网友称,这只是ChatGPT+各种谷歌浏览器标签的组合。
也有AI浏览器的用户发声,称Atlas遇到了其之前在使用Perplexity推出的Comet浏览器时遇到的相同问题。在计算和总结大数据或单击复杂SaaS中的按钮时出现问题, 例如他们甚至都无法填写时间表,这令人失望,希望等待几个季度让这些系统变得更好。
Perplexity本月早些时候免费推出了Comet浏览器,谷歌今年9月在自家谷歌浏览器中嵌入了Gemini模型。伴随OpenAI正式入局,AI浏览器之战再度升温。
下载地址:chatgpt.com/atlas
一、登录即可导入其他浏览器数据,设置默认浏览器领7天会员
Atlas的入门很简单:用户打开Atlas,登录自己此前的ChatGPT账号然后即可选择从其他浏览器倒入历史数据,不过目前只有谷歌和Safari浏览器可选。
值得一提的是,现在将Atlas设置为默认浏览器,用户还可以获得限时7天的Atlas消息发送、文件上传、数据分析以及图片生成功能的扩展限额。
Atlas的提问方式主要有以下几种:在Atlas的搜索框中直接提问;输入链接基于整篇网页内容提问;使用光标选中部分文字进行内容编辑。
智东西在Atlas中打开OpenAI的发布链接,然后要求其“用通俗易懂的语言逐步解析这篇帖子”,就可以得到右侧的结果,其按照Atlas是什么、有什么好处、安全性等结构进行了梳理。
智东西用光标选中文章中的某个部分并提问,Atlas会根据上下文做出回应。
此外,ChatGPT可以记住用户探索过的内容并建议下一步该做什么,如返回此前打开的页面、深入挖掘主题、提出相关想法还是自动执行日常任务。
AI Agent功能可以在Atlas中以更快速度和原生方式运行,目前这一功能仅向Plus、Pro和Business用户提供了预览版,
如用户计划晚宴时将食谱交给ChatGPT,它就可以它找到一家杂货店,将所有食材添加到购物车中,然后订购到家。
在工作中,ChatGPT可以帮助用户打开并阅读过去的团队文档,进行新的研究,并将见解汇编成团队简报。
当用户提出问题时,ChatGPT可能会询问是否应该开始打开选项卡并单击浏览器以完成任务,用户也可以选择Agent模式按钮来启动ChatGPT。
二、浏览器记忆是用户私有内容,为Agent功能添加多重安全保障
在安全与隐私保护方面,用户可以控制ChatGPT在自己浏览时可以看到和记住的内容,包括清除特定页面、清除整个浏览历史记录或打开隐身窗口以暂时注销ChatGPT。
如果用户打开浏览器记忆,ChatGPT会记住其浏览内容中的关键细节,以改进聊天响应并提供更智能的建议,例如根据用户最近的活动创建待办事项列表或根据您查看过的产品继续研究节日礼物。
但这些记忆是用户ChatGPT帐户的私有内容由用户控制。用户可以在设置中查看、存档并清除浏览历史记录。即使浏览器内存处于打开状态,用户也可以使用地址栏中的切换开关来决定ChatGPT可以或不能看到哪些网站。当可见性关闭时,ChatGPT无法查看页面内容,并且不会从中创建任何记忆。
对于Agent模式,OpenAI提到,他们优先考虑了安全性并添加保护措施,以应对在代表用户采取行动时访问登录站点和浏览历史记录可能带来的新风险,包括:
Agent无法在浏览器中运行代码、下载文件或安装扩展;
Agent无法访问用户计算机或文件系统上的其他应用程序;
Agent将暂停以确保用户正在观察它在特定的例如金融机构等敏感站点上采取行动;
可以在注销模式下使用Agent,限制其对敏感数据的访问以及像用户在网站上一样执行操作的风险。
此外,Agent还容易受到隐藏的恶意指令影响,这些指令可能隐藏在网页或电子邮件等地方,目的是这些指令覆盖ChatGPT Agent的预期行为。基于此,OpenAI也提到,随着AI Agent越来越受欢迎,其保护措施可能不会组织出现的每一次攻击。因此,用户在决定向Agent提供哪些信息时应加以权衡,并采取措施尽量减少风险。
结语:AI浏览器之战升温
OpenAI提到,他们将继续改进Atlas,其路线图包括多配置文件支持、改进的开发者工具以及Apps SDK,帮助开发者提高其应用在Atlas中的可发现性,网站所有者还可以添加ARIA标签,以改进ChatGPT Agent在Atlas中为其网站工作的方式。
AI浏览器之战已经打响,OpenAI早在去年7月就宣布了其搜索引擎的原型SearchGPT,再到如今Atlas正式发布。
此前,Perplexity推出了Comet浏览器 ,这是一种AI驱动的解决方案可以简化人们浏览网页和完成任务的方式,其可以扫描用户打开的所有选项卡、总结视频、整理电子邮件收件箱,甚至在亚马逊上进行购买;上个月,谷歌宣布更深入地将Gemini AI助手嵌入到谷歌浏览器中,并计划在未来几个月内允许谷歌浏览器中的 Gemini能够代表用户完成杂货店购买、安排约会、预订等。
不过目前看来,各家AI浏览器的功能没有较大差别,下一步如何在体验上拉开差异化吸引用户或许是竞争的关键。