当前位置: 首页 » 资讯 » 新零售 » 正文

GPT-5今夏突袭?奥特曼首次大谈GPT-5、AGI

IP属地 中国·北京 编辑:孙明 AIGC开放社区 时间:2025-06-19 06:50:41

今天凌晨,OpenAI发布了其联合创始人兼首席执行官Sam Altman的40分钟深度专访。

本次访谈技术干货很足,Altman谈到了大家非常关心的核心产品GPT-5,大概率会在今年夏天发布,但也会因为命名、安全测试、功能迭代等原因延长产品时间。也谈到了高性能的o3模型以及智能体Deep Research,这些产品对实现AGI的重要性。

此外,Altman还提到了OpenAI的其他创新产品,包括Sora、DALL-E 3、ChatGPT Junior以及5000亿美元投资项目“星际之门”。基本上OpenAI所有重要产品、现阶段规划和未来发展都出现在了本次访谈中。

自动播放

如果大家想听GPT-5内容,可以跳转到10:30;星际之门项目在23:20。

为了不影响大家的判断力和观感,「」没有添加字幕,英语好的小伙伴可以直接看视频。但会在下面放出本次专访的主要内容用来参考。

主持人:欢迎收听 OpenAI 播客。我是主持人 Andrew Mayne。我在 OpenAI 工作了好几年,先是作为应用团队的工程师,后来成为科学传播者。之后,我开始与公司和个人合作,研究如何将人工智能融入生活。通过这个播客,我们有机会与 OpenAI 的工作人员交流,了解幕后的故事,或许还能窥探到未来的方向。

我的第一位嘉宾是 Sam Altman,OpenAI 的首席执行官兼联合创始人。我们将深入了解 Stargate 项目,探讨他如何作为家长使用 ChatGPT,还能知道 GPT-5 何时发布。

Sam Altman:每年都会越来越多人认为我们已经接近通用人工智能(AGI)。人们对硬件和软件的需求正在迅速变化。但如果人们知道更多计算能力能带来什么,他们就会想要更多、更多的计算能力。

主持人:我的一个朋友刚当了新手爸妈,他经常用 ChatGPT 来提问,觉得它是个很好的资源。你也是新手爸爸,ChatGPT 在这方面帮了你多少忙呢?

Sam Altman:帮了很多忙。当然,人们在没有 ChatGPT 的情况下也能照顾好婴儿,但我真不知道自己是怎么做到的。在最初的几周,我几乎一直在用它。现在我更多地用它来询问孩子的发展阶段之类的问题。

主持人:我听说你在思考孩子未来如何使用人工智能,还说你很希望大家都多生孩子?

Sam Altman:我认为这是个好迹象。我的孩子可能永远不会比人工智能更聪明,但他们会长大,会比我们成长得更有能力,能做我们无法想象的事情,并且会非常擅长使用人工智能。我更多地思考他们会拥有什么,而不是会失去什么。

主持人:我看到社交媒体上有人提到,他厌倦了和孩子谈论托马斯小火车,于是把 ChatGPT 设置成语音模式,结果孩子在上面玩了一个小时。

Sam Altman:孩子们很喜欢 ChatGPT 的语音模式。不过,我猜这也不全是好事。人们可能会发展出一些有问题的、甚至是非常有问题的拟社会关系,社会将不得不找出新的规范来应对,但好处将是巨大的。总体来说,社会通常擅长找到方法来缓解负面影响。

主持人:我们看到一些有趣的数据表明,在课堂上,如果在老师的引导和好的课程设计下使用 ChatGPT,效果很好;但如果学生单独使用它来完成作业,可能就会像试图用谷歌搜索一样,只是重复同样的事情。

Sam Altman:我也是那种大家担心会依赖谷歌搜索的孩子,但事实证明,孩子们在学校适应得很快。所以,我认为我们会解决这些问题。

主持人:你认为五年后,ChatGPT 还会是主流产品吗?

Sam Altman:五年后,ChatGPT可能会变成一个完全不同的东西。从某种意义上说,它不会是现在的 ChatGPT,但它可能还会叫 ChatGPT。

主持人:那你能给我们讲讲你对 AGI 的定义吗?

Sam Altman:如果让我或任何人五年前定义 AGI,基于软件的认知能力,我认为当时的定义现在已经被超越了。这些模型现在就很聪明,而且会越来越聪明,越来越强大。每年都会有更多人认为我们已经达到了AGI,尽管定义会不断扩展和变得更加雄心勃勃,但人们仍然会同意我们已经接近了。

主持人:那你觉得要达到你所说的“超级智能”需要什么?

Sam Altman:如果有一个系统能够自主发现新的科学知识,或者极大地增强人们使用工具来发现新科学的能力,那对我来说几乎可以定义为超级智能,这也将是世界上的一个美好事物。

主持人:你有没有看到过类似这样的迹象,让你觉得我们可能已经接近了?

Sam Altman:没有到可以说我们已经完全搞清楚的地步,但我对探索的方向越来越有信心。比如,现在人们用 AI 系统写代码,程序员因此变得更高效,研究人员也是如此。这虽然不是在做新的科学发现,但确实让科学家们能够更快地完成工作。我们还没有找到那种可以自己去做科学的算法,但我们正在取得很好的进展,进步的速度仍然令人印象深刻。

主持人:我注意到最近 OpenAI 在 Operator 中引入了 o3 模型,我感觉有了很大的改进。

Sam Altman:是的,o3的确好多了。很多人告诉我,他们看到 Operator 使用o3 时,感觉 AI 像是在比较自然地使用电脑,虽然还不完美,但已经很接近 AGI 了。不过,我并没有被它震撼到那种程度,尽管它确实令人印象深刻。

主持人:对我来说,Deep Research 是一个很像 AGI 的应用场景。当我让它去研究一个我感兴趣的话题时,它从互联网上获取数据,跟随线索,就像我自己会做的那样,但做得更好。

Sam Altman:我最近遇到一个人,他是个自学成才的人,对学习有着强烈的兴趣,他用 Deep Research 来生成任何他好奇的话题的报告,然后快速消化这些报告,知道接下来该问什么问题。

主持人:我也有类似的经历。我用它来获取一些信息,然后它会生成音频文件,方便我随时听。说到这个,你觉得 GPT-5 什么时候会发布呢?

Sam Altman:可能是在今年夏天的某个时候。不过,我们还在讨论,对于新模型,我们是应该简单地提升版本号,还是像 GPT-4 那样,不断优化和改进。

主持人:我记得当时发布 GPT-4 的时候,我不得不在它和 3.5 之间做比较,而 3.5 也在不断改进。所以,我很好奇,GPT-5 会不会只是 GPT-4 的一个更好的版本?

Sam Altman:不一定。我们可能会继续迭代 GPT-4.5,或者在某个时候直接叫它 GPT-5。以前,我们会训练一个模型并发布,然后再训练一个新的大模型。现在,系统变得更加复杂,我们可以持续地对它们进行后训练以改进它们。我们还没有决定如何处理这个问题,但我觉得我们需要找到一个比 GPT-4 更好的方法。

主持人:是的,即使你技术很好,也很难理解这些版本的区别。比如,我该用 o4-mini 还是 o3?

Sam Altman:我认为这是一个范式转变的结果。我们正处于这种转变的末期,但我可以想象,未来可能会出现新的范式,我们可能又需要重新划分模型树。

主持人:那你觉得未来会不会出现更复杂的命名方式?

Sam Altman:我希望不会。我期待着 GPT-5 和 GPT-6 的到来,这样人们使用起来会更简单,不用再纠结于 o4-mini-high 或 o3 这样的版本。

主持人:我用 o4-mini-high 来编程,用 o3 来进行对话。我觉得,让这些模型变得更强大的一个因素是它们的集成,比如记忆功能。记忆功能从一开始很简单,现在变得越来越复杂。

Sam Altman:记忆功能可能是我最喜欢的 ChatGPT 最新功能。第一次和像 GPT-3 这样的模型交流时,感觉是个很大的突破。现在,计算机似乎对我有了很多上下文的了解。如果我用很少的字提问,它就能根据我生活的其他部分,相当自信地理解我的意图,有时甚至比我想象的还要好。这是一个令人惊讶的提升,我听到很多人也有同样的感受。

主持人:这确实很酷。而且,你可以选择关闭这个功能,这也很重要。不过,纽约时报最近在与 OpenAI 的诉讼中,要求法院命令 OpenAI 保留 ChatGPT 用户记录超过常规的 30 天期限。Brad Lightcap 也写信回应了这件事。你能解释一下 OpenAI 的立场吗?

Sam Altman:我们会坚决反对这一要求。我认为纽约时报提出这样的要求是不合理的。他们声称自己重视用户隐私,但这种做法却完全相反。我希望这件事能成为社会认识到隐私重要性的契机。隐私应该是使用人工智能的核心原则。像纽约时报这样的公司不能要求 AI 提供商侵犯用户隐私。我希望这件事能加速社会关于隐私和人工智能的讨论,我希望结果是,我们非常重视隐私。人们现在正在与 ChatGPT 进行非常私密的对话,ChatGPT 将成为非常敏感的信息来源,我们需要一个能够反映这一点的框架。

主持人:这引发了另一个问题,很多人在使用 ChatGPT 或对其持怀疑态度时会问,OpenAI 现在可以访问这些数据,一方面是对训练数据的使用,OpenAI 已经明确表示了何时会使用以及何时不会使用。另一方面,比如广告等。OpenAI对此的态度是什么?你们会如何处理这种责任?

Sam Altman:我们目前还没有推出任何广告产品。我不是完全反对广告,比如 Instagram 上的广告我觉得还不错,我也从上面买了很多东西。但我认为,如果要推出广告,需要非常谨慎地处理,以确保不会损害用户体验。

主持人:是的,我希望能找到一个解决方案。我很希望可以通过 ChatGPT 或一个很好的聊天机器人来完成所有购物,很多时候我觉得自己并没有做出最明智的决策。不过,这确实是一个很难解决的问题。

Sam Altman:是的,这确实很难。不过,如果能找到一种清晰且符合用户利益的方式来实现,那将是非常好的。比如,我们可以明确表示不会修改来自语言模型的输出流,但如果用户点击了其中的内容,我们可以从中获得一些交易收入,这对每个人来说都是公平的。也许可以在语言模型输出流之外展示广告,但我们需要确保这些广告对用户真正有用,并且不会干扰语言模型的输出。

主持人:是的,这确实是一个挑战。不过,我很喜欢苹果的模式。作为苹果用户,我知道我为手机支付了很多钱,但他们不会在设备中塞满各种东西。

Sam Altman:是的,苹果在这方面确实做得很好。他们没有像其他公司那样过度依赖广告收入。不过,谷歌搜索曾经是一个非常棒的产品,虽然现在可能有些不如从前,但曾经有一段时间,尽管有很多广告,它仍然是互联网上最好的产品之一。我尊重谷歌所做的很多事情,但显然也存在一些问题。

主持人:是的。我想,谷歌是一个广告技术公司,他们的激励机制与用户利益并不完全一致。而苹果的模式则更注重用户体验,虽然他们也尝试过其他,但似乎并不成功,这也表明他们并不太热衷于广告业务。

Sam Altman:是的,苹果在这方面确实不太积极。不过,我们确实需要在广告和用户体验之间找到一个平衡。无论我们做什么,都需要非常透明和清晰地向用户说明。

主持人:是的,我们需要关注这些问题。说到用户体验,你如何看待人工智能与人类的互动?比如,OpenAI 对人工智能的“人格”有什么看法?

Sam Altman:社交媒体时代的一个大错误是,信息流算法对社会和个人用户产生了一些意想不到的负面影响。虽然它们在某种程度上满足了用户当时的需求,比如让用户在网站上停留更长时间,但这与用户的长期利益并不一致。我认为,人工智能也会带来类似的问题,比如,用户可能希望模型在某个特定问题上给出更令人愉悦的回答,但从长远来看,这可能并不是最有益的。

主持人:是的,我注意到 DALL-E 3 似乎在技术上很有能力,但它的图像风格似乎都趋于一致,这可能是由于用户在比较两个选项时更倾向于选择某种风格,从而导致了这种现象。

Sam Altman:我不确定DALL-E 3 的情况是否如此,但我认为这是一个很好的例子。我们需要在用户体验和长期利益之间找到平衡。

主持人:是的,新的图像模型已经取得了很大的进步,我很好奇它未来会发展到什么程度。说到计算能力,这是目前每个人面临的最大问题。我们听说了 Stargate (星际之门)项目,这个名字听起来很酷,但很多人对它的价格标签感到震惊,投资了5000 亿美元。

Sam Altman:其实,Stargate的概念很简单。它是一个努力筹集资金并建造大量计算能力的项目。目前,我们没有足够的计算能力来满足人们的需求。但如果人们知道更多计算能力能带来什么,他们就会想要更多、更多的计算能力。目前,我们能为世界提供的服务与我们如果有 10 倍甚至 100 倍计算能力时能提供的服务之间存在巨大差距。

主持人:这是一个全球性的巨大项目。我们之前提到,阿联酋是其中一个合作伙伴,你们正在与世界各地的政府合作。有人在社交媒体上问我,5000亿美元,你们有钱吗?

Sam Altman:我们目前没有这么多钱存在银行里,但我们将在未来几年内逐步投入。除非出现什么问题,比如我们无法建造这些计算机,否则我相信人们会履行承诺。

主持人:是的,这是一个巨大的项目。我最近去参观了我们在阿比林的第一个建设地点,那将占 Stargate 初始承诺的 5000 亿美元的约 10%。看到成千上万的人在那里施工,看到 GPU 被安装在机房里,整个系统的复杂性和建设速度都令人惊叹。

Sam Altman:是的,这确实令人印象深刻。我之前知道一个吉瓦级站点是什么样子,但真正看到它被建造出来,看到这么多人在忙碌,看到这些 GPU 被安装进去,让我深刻感受到整个系统的复杂性。当你在手机上输入问题并得到ChatGPT 的回答时,你可能已经不再觉得这有什么特别的了。

但在过去几百年间,无数人为了取得这些艰难的科学成果、建立工程和公司、构建复杂的供应链,重新配置世界,才让我们能够拥有这样的技术。

主持人:我听说了一个关于 Stargate 项目开发过程中的幕后故事,特别是与阿联酋的国际合作,还有马斯克试图破坏这件事。你听说了什么?

Sam Altman:我之前曾公开表示,我不认为马斯克会在政府中滥用权力来不正当竞争。但我很遗憾地说,我错了。我通常不喜欢出错,但这次我更觉得这对国家来说是很不幸的。我很感激政府坚持做正确的事情,抵制这种行为。

主持人:是的,我认为现在的情况已经改变了。就像 Greg Brockman 说的,过去人们认为谁先到达终点谁就是赢家,游戏就结束了。但现在我们意识到,还有很多优秀的 AI 实验室,比如 Anthropic 正在开发很棒的工具,谷歌也在迎头赶上。这不再是一个人独占鳌头的局面。

Sam Altman:我同意。我发现人工智能的发现与晶体管的发现有很多相似之处。许多公司将在其基础上构建伟大的产品,最终它将渗透到几乎所有产品中。但你不会一直想着使用晶体管。我认为许多公司将基于这一伟大的科学发现建立成功的业务。我希望埃隆能少一些零和思维。

主持人:我认为如果从整体来看,这个“蛋糕”会变得越来越大。我最近参加了一个能源会议,人们谈到了能源生产和超大规模扩展的问题。这让我想到了能源需求的问题。我知道对于 Grok 3 来说,他们甚至不得不在停车场放置发电机来训练那个模型。问题是,能源将从哪里来?

Sam Altman:我认为能源将来自各个方面。目前,我们使用的是各种能源的组合,包括天然气、太阳能、核能等。最终,我对先进的核裂变和核聚变技术感到非常兴奋,但目前,我们还在使用各种能源的组合。

主持人:各种能源都有。我听说在阿尔伯塔省等地,他们有大量能源,但没有足够的需求。现在,这已经成为一个全球性的图景,我之前甚至没有想过这个问题。

Sam Altman:传统上,将能源在全球范围内运输是非常困难的。但如果你将能源转化为智能,然后通过互联网传输智能,那就容易多了。所以,你可以在很多地方放置大型训练中心或大型推理集群,然后通过互联网传输输出结果。

主持人:我参加过一个活动,有人提到詹姆斯韦伯太空望远镜。他们即将获得大量数据,但他们没有足够的科学家来处理这些数据。我们面前已经有了关于宇宙的答案,但却面临着一个大数据问题。

Sam Altman:我总是开玩笑说,当我们有足够的钱时,OpenAI 应该建造一个巨大的粒子加速器,一劳永逸地解决高能物理问题。那将是一件非常壮观而美好的事情。但我想知道,如果一个非常聪明的人工智能只用现有的数据,不用更大的粒子加速器,是否能够解决这些问题?这并非不可能。

主持人:我记得在 20 世纪 90 年代初,有人发现了一种类似 Ozempic 的药物,并将其展示给一家制药公司,但公司拒绝了。这种药物最终改变了慢性肥胖患者的生活。我想,还有许多类似的例子,我们可能已经拥有一些已知的药物,它们可以以其他方式重新使用,或者通过一些小的修改,我们就能得到一些伟大的东西。我很高兴听到科学家们正在使用当前一代的模型进行这类工作。

Sam Altman:是的,我认为我们可能会发现很多这样的例子。也许我们已经拥有一些已知的药物,它们可以以其他方式重新使用,或者通过一些小的修改,我们就能得到一些伟大的东西。我很高兴听到科学家们正在使用当前一代的模型进行这类工作。

主持人:所以,我认为下一代模型需要能够理解物理、化学等领域的模型。Sora 是这方面的尝试吗?

Sam Altman:Sora可以理解牛顿物理学,但我不确定它是否能帮助我们发现新的化学或新的理论物理学。但我乐观地认为,我们用于推理模型的技术将帮助我们很多。

主持人:好的,那推理模型和我问 GPT-4.1 问题有什么区别?

Sam Altman:GPT 模型可以进行一些推理。事实上,GPT 模型早期让人们兴奋的一件事是,你可以告诉模型“让我们一步一步思考”,它会输出逐步思考的文本并得到更好的答案,这本身就很神奇。推理模型只是将这种能力进一步扩展。

主持人:所以,当它能够分解问题时,它可以在每个步骤上花费更多时间。

Sam Altman:当你问我一个问题时,如果问题很简单,我可能会立刻反射性地回答。但如果问题很难,我可能会在脑海中思考,我的内心独白会说:“我可以这样做,也可以那样做,或者也许这样会更清楚。” 我可能会回溯并重新思考我的步骤。然后,当我完成思考后,我会用英语整理出一些要点,然后用英语回答你。

主持人:我发现了一个有趣的现象。当我使用应用程序时,如果我问一个 Deep Research 问题,然后把手机锁屏,它仍然会显示“正在处理和思考”。我听说另一家公司提到,他们的模型会花费 15 分钟甚至 30 分钟来思考一个问题,这是一个很好的衡量标准,但关键是要给出正确的答案。

Sam Altman:我发现人们愿意为了一个很好的答案等待很长时间,这让我感到惊讶。我的本能告诉我,即时响应才是最重要的,用户不喜欢等待。但对于那些需要解决的难题,如果能得到一个很好的答案,人们其实很愿意等待。

主持人:我们有这么多工具,这么多可能性。到目前为止,我一直在用手机。现在,OpenAI 宣布你们正在开发硬件。我看到你和乔纳森伊夫(Jony Ive)的视频,你们已经合作了几年。当然,我可以问你这个问题:你现在身上有这个设备吗?

Sam Altman:没有,我身上没有。这还需要一段时间。我们试图做一些非常高质量的东西,而高质量的东西不会很快出现。但计算机、软件和硬件,我们目前所理解的计算机,都是为一个没有人工智能的世界设计的。现在,我们处于一个完全不同的世界,你对硬件和软件的需求正在迅速变化。你可能希望它更了解你的环境,更了解你生活的上下文,你可能希望以一种不同于打字和看屏幕的方式与它互动。我们已经探索了很长时间,我们有一些非常令人兴奋的想法。我认为人们需要时间来适应在这样一个世界中使用计算机,因为这太不一样了。

主持人:我认为手机如此普及的一个原因是,我可以公开地查看屏幕,也可以私下里打电话交谈。我认为新设备面临的挑战之一是,如何弥合我们在公共场合和私人场合使用设备之间的差距。

Sam Altman:手机确实是令人难以置信的东西,它们有很多优点。你可以想象有一种新设备,你可以在任何地方使用,但有些事情我在公共场合和私人场合会有所不同。比如,在家里,我有一个很棒的音响系统,但当我外出时,我会用 AirPods,这对我来说并不麻烦。

主持人:它们确实有不同的使用场景,但通用性很重要。

Sam Altman:我同意。如果人们真的信任人工智能,让它了解你生活的所有上下文,并在你的问题上做出好的判断,你可以让它坐在会议中,听完整个会议,知道它可以与谁分享什么,什么不能与任何人分享,以及你的偏好是什么。然后你问它一个问题,你可以信任它去与正确的人进行后续交流,并为你完成任务。你可以想象一种完全不同的使用计算机的方式,以实现你想要做的事情。

主持人:所以,我们与 ChatGPT 的互动方式也在某种程度上影响了设备的设计。

Sam Altman:是的,也可以这么说。我们与 ChatGPT 的互动方式也受到了上一代设备的影响。我认为这是一个共同进化的过程,但我希望如此。手机的普及是因为你可以随时随地使用它,无论是在公共场合还是私人场合。

主持人:它确实很方便。那么,你认为如果给一个 25 岁的年轻人提建议,你会说什么?

Sam Altman:最明显的建议可能是,学会使用人工智能工具。有趣的是,世界从告诉平均 20 岁或 25 岁的年轻人“去学编程”,迅速转变为“编程不重要,学会使用人工智能工具”。我不知道接下来会是什么,但肯定会有下一个阶段。

不过,这是一个很好的战术性建议。在更广泛的层面上,我认为像韧性、适应能力、创造力、弄清楚别人想要什么等技能,这些技能其实都是可以学会的。虽然不像“去练习使用 ChatGPT”那么简单,但这是可行的。我认为这些技能在未来几十年里会带来很大的回报。

主持人:那对于 45 岁的人呢?你是不是也会说,现在就学会在你的工作中使用它?

Sam Altman:我认为这是很好的建议。无论你的年龄多大,都应该学会在你的工作中使用人工智能工具。

主持人:我看到很多人在网上说,“他们已经这么厉害了,为什么还在招聘人呢?”我会回答说,因为计算机不能做一切事情。他们不会做一切事情。

Sam Altman:是的,更长的答案是,会有更多人,但他们每个人都能做比 AGI 时代之前更多、更有影响力的事情。

本文素材来源OpenAI,如有侵权请联系删除

标签: 主持人 用户 模型 问题 人工智能 人们 公司 社会 能源 孩子 项目 产品 工具 计算能力 英语 事情 技术 科学 广告 新手 系统 谷歌 模式 利益 东西 大家 学会 体验 世界 韦伯 核心 话题

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。