当前位置: 首页 » 资讯 » 新科技 » 正文

GPT-5王座难坐稳,OpenAI想靠价格赢过一切

IP属地 中国·北京 编辑:赵静 光锥智能 时间:2025-08-08 22:02:59
博士竞争也很激烈!!

光锥智能 魏琳华

从2023年底OpenAI CEO Sam Altman第一次提到GPT-5,到今天模型的正式发布,时间过去了一年半。

如今,人们仍然熬夜围观OpenAI的发布会,但彻夜讨论的呼声中少了惊呼,多了质疑。

值得欣慰的是,从模型性能上来说,OpenAI成功扳回了之前下滑的口碑。在发布会上拿出的GPT-5,依然做到了多方面能力SOTA,更是靠GPT-5直言世界最强编程模型,狙击Claude的领先地位。

但绕不开的一些固有印象是,OpenAI拉开同行的差距,远远不及GPT-3、GPT-4的断崖式领先。

OpenAI的同行者也虎视眈眈。不说Anthropic本周官宣要在当月发布大版本更新的模型,马斯克更是刷屏一晚,强调自家模型Grok-4在部分测试上已经超过了OpenAI的新模型。

OpenAI又能在这个新王座上坐多久?Altman不语,只是一味地讲起了大模型便宜落地的故事。

盯上最强代码模型GPT-5全面升级

刷新的性能分数、极高的性价比、针对性优化的幻觉问题和超长上下文,方方面面的优化,都是为了让GPT-5成为一个更适合干活的大模型。

首先在架构上,GPT-5是一个统一架构版本的模型,由三个部分组成:一个基础模型、一个具有深度推理能力的GPT-5 thinking模型,加上一个实时路由器。

这样设计的好处是,实时路由器能根据对话类型、问题复杂性、工具需求以及用户意图快速决定使用哪个模型。比如当用户的提示词包括帮我认真思考一下这类话术,它就会调用深度推理模型。

在发布会前一天就大肆预热的Altman,就在X上发图暗示GPT-5的性能优势,在发布会上,他也强调了对GPT-5的信心。

发布会现场,OpenAI通过一些案例具体展示了OpenAI的编程能力,比如让它做一个阐释伯努利效应的网页,在两分钟内,GPT-5跑出了400行代码,做了一个支持调整参数的网页版本。

除了这种面向C端用户体验的案例,在B端实际使用上,OpenAI也面向开发者演示了GPT-5写代码落地的能力,GPT-5不再埋头写代码,而是把开箱可用的落地能力夯实了。比如,GPT-5在后台写代码并自行优化迭代之后,按照需求开发了一个财务信息看板,UI做得也足够漂亮。

不过,OpenAI的翻车变成了第一个出圈的讨论。在发布会演示的现场,OpenAI上来就犯了一个非常严重和低级的错误:在现场展示的图表中,数字大小和柱状图显示的关系甚至都匹配不上,69.1和30.8的柱图高度一模一样,52.8甚至比69.1更大......

除了上述优化外,GPT-5还在模型的超长上下文理解、幻觉问题等方面做调整,一切的努力都是为了让这个模型能够更好地落地。

根据OpenAI给出的数据,GPT-5在上下文理解上的处理效果不仅有所提升,并且在文本更长的阶段(比如输入在128-256k长度),可以从图示看到,GPT-5理解能力下降的速度显著低于其他模型。再有,GPT-5还显著降低了幻觉问题,其事实错误率比GPT-4o降低了45%,这对于模型应用在法律、医疗等要求精准的行业算是利好。

极低的价格,也是OpenAI愿意限量免费开放给所有用户使用的底气。目前,免费用户也可以体验到GPT-5,不过区别于付费用户的不限量开放,前者会在用到一定额度后自动切换为GPT-5-mini模型使用。

此外,针对开发者使用的不同需求,GPT-5还在API 中引入了新功能,通过控制冗余量(verbosity)的方式,分为低中高三档,帮助开发者控制AI生成内容的长短。

难坐稳的SOTA但价格或许能赢过一切

GPT-5固然在多项能力上刷新了SOTA纪录,但这种领先优势,不再是需要长期追赶的鸿沟。

先从本次OpenAI最先喊出的最强编程模型来说,领先于Claude Opus 4.1仅0.4%的优势,很有可能在本月被Anthropic赶超。

从去年挖角OpenAI成员,再到部分能力超过OpenAI旗舰模型。Anthropic正处在像之前OpenAI狙击Google新模型的阶段,紧紧追着OpenAI的步伐。

本月,在OpenAI发布两个开源模型的当天,Anthropic早其十几分钟,发布了小更新版本Claude 4.1。特别是在这家公司还预告了大幅度更新模型即将在本月发布的情况下,0.4%的微弱差距,很难让人对OpenAI保持乐观。

微弱的优势同样造成了评测口碑的两极分化。即使OpenAI喊出了最佳编程模型的地位,但在用户使用体验的阶段,OpenAI还没有形成一边倒的优势。

有用户表示,对比GPT-5和Claude,后者跑出的各个案例都明显优于前者,在UI和前端效果上更佳;也有用户认为,用GPT-5跑出来的代码效果更精细。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。