8月5日,自媒体“爱科技”发文称,关于GPT-5的最新爆料显示其核心升级集中在多模态、软件工程和AI智能体领域。GPT-5实现了“完整的多模态”能力,可处理图文、音视频等多种信息流,有望在发布后登顶多数评测榜单。在软件工程方面,GPT-5能深入复杂企业级代码库进行修改和维护,且在产出高质量代码时未增加更多计算资源消耗。此外,GPT-5的推理能力增强,使其能更好地理解和执行复杂多步骤指令,向自主完成任务的AI智能体迈进。为解决推理模型评估难题,OpenAI开发了“通用验证器”技术,用于检查和评估主模型的回答质量,即使在没有标准答案的场景下也能发挥作用。
GPT-5的发布备受关注,但其发布时间仍不确定。尽管2023年末就有消息称OpenAI可能在2024年春季或夏季发布GPT-5,但到了2025年,发布时间传闻更加密集。六月份,OpenAI CEO Sam Altman表示GPT-5可能在今年夏天发布;七月份,有媒体称OpenAI为应对欧盟AI监管法律生效,将在七月底发布GPT-5,但随后又有消息称计划在八月初推出。近日,Perplexity、Cursor、Microsoft Copilot等平台上开始出现GPT-5的踪迹,但具体发布时间仍未明确。预计GPT-5将提供多个版本,包括推理整合版、迷你版和纳米版,其中纳米版仅通过API提供。
在研发历程中,OpenAI面临诸多挑战。从2020年GPT-3到2023年GPT-4,OpenAI一直遵循“缩放定律”,但这一策略在逻辑、数学等需要严谨推理的领域逐渐失效。内部代号为“Orion”的项目未能实现预期性能飞跃,最终以GPT-4.5的名义发布。与此同时,OpenAI在推理领域取得突破,Q技术让模型能够解决数学竞赛难题,催生了专注于推理的o系列模型。然而,当研究人员试图将强大的o3模型转化为聊天版本时,其性能出现严重退化。
CEO Sam Altman近期在播客节目中分享了GPT-5解答难题的经历,称自己“感觉相对于AI毫无用处”。此外,他还分享了与GPT-5的聊天截图,推荐了《万神殿Pantheon》和《Devs》两部电视剧。尽管OpenAI在营销方面表现出色,但在Anthropic、Google、meta、xAI等强大对手的竞争下,GPT-5的发布对OpenAI至关重要,不仅要赢回在特定领域失去的阵地,更要证明其有能力引领AI走向更自主、更通用的未来。