在万众瞩目中,OpenAI终于揭晓了其年度重头戏——GPT-5,这一新一代旗舰人工智能模型的发布标志着AI技术的新飞跃。美东时间8月7日,OpenAI CEO Sam Altman亲自站台,向全球宣布了这一历史性的突破。
GPT-5不仅是OpenAI首个集推理能力与快速响应于一体的“一体化”AI系统,更是OpenAI在通往通用人工智能(AGI)道路上迈出的关键一步。Altman在发布会上难掩激动之情,称赞GPT-5为“世界上最好的模型”,相较于前代产品,这是一次“重大升级”。
据OpenAI介绍,GPT-5在多项基准测试中展现出了卓越的性能,特别是在编程、数学和健康领域。在SWE-bench Verified代码测试中,GPT-5以74.9%的准确率略胜一筹,超越了近期发布的Anthropic Claude Opus 4.1。GPT-5在幻觉问题上的改善尤为显著,错误信息率降至4.8%,远低于GPT-4o的20.6%。
从发布日起,GPT-5即向所有ChatGPT的免费用户和订阅Plus、Pro、Team的付费用户开放,作为默认模型使用,并将在一周内登陆Enterprise和Edu付费方案。值得注意的是,GPT-5免费版和付费版的区别在于使用量,Plus用户享有更高限额,而Pro用户则可无限使用并获得增强版GPT-5 Pro。对于免费用户而言,完整的推理功能可能需要数日才能全面上线,一旦达到用量限制,将被切换至更小的GPT-5 mini模型。
GPT-5的推出,无疑为OpenAI赢得了业界的广泛赞誉。其编程能力尤为突出,能够仅凭一个提示就创建出美观响应式的网站、应用程序和游戏。在SWE-bench Verified测试中,GPT-5的首次尝试准确率高达74.9%,远超同类模型。GPT-5在创意写作和健康咨询领域也实现了显著提升,能够处理复杂的写作任务,更积极地标记潜在健康问题,帮助用户解析医疗结果。
为了进一步提升GPT-5的可靠性和实用性,OpenAI还为其引入了一种新的安全训练形式——安全补全。这种训练方式旨在教模型在安全范围内尽可能给出最有帮助的答案,同时以透明的方式拒绝无法完成的任务,并提供安全的替代方案。这一创新不仅减少了无根据的断言,还增强了模型对模糊意图的鲁棒性。
GPT-5还推出了四种可选的ChatGPT聊天预设性格,包括愤世嫉俗者、机器人、倾听者和书呆子,用户可根据个人喜好随时调整,以匹配与ChatGPT的沟通风格。这一创新不仅丰富了用户的交互体验,还提升了模型的指令执行能力。
Altman在发布会上对GPT-5给予了高度评价,甚至不惜用“踩”GPT-4来抬高GPT-5。他表示,在尝试过用回GPT-4后,效果相当糟糕。GPT-5的统一系统架构和实时路由器使其能够根据对话类型、复杂性和工具需求自动决定响应方式,消除了用户选择合适设置的需要,使ChatGPT更易于使用。
微软也迅速响应,宣布将GPT-5整合到其广泛的产品线中,包括Microsoft 365 Copilot、GitHub Copilot和Azure AI Foundry等平台。这一举措将使微软的企业和消费者用户能够立即体验到GPT-5的高级推理能力和编程优势。