当前位置：首页 » 资讯 » 新科技 » 正文

Meta策略转向后首个模型发布部分指标超GPT-5.4

IP属地中国·北京 编辑：顾青青第一财经 时间：2026-04-10 04:11:07

[ 无论如何，这场剧烈的AI策略转向后，Muse Spark成为meta拿出的第一个果实。此前meta的Llama系列模型开源，而Muse Spark为闭源模型，新模型的推出也被外界视为meta从开源到闭源的转向。 ]
当地时间4月8日，meta发布多模态推理模型Muse Spark，标志着meta AI策略转型后的阶段性成果。
“这是meta Superintelligence Labs（超级智能实验室）开发的首款Muse模型，也是我们从零开始对AI业务全面改造后的首个产品。为了支持进一步扩展，从研究到模型训练、基础设施建设，我们正对整个技术栈进行战略投资。”meta在一篇文章中介绍。
从模型表现看，meta介绍，Muse Spark在多模态感知、推理、健康和代理（agentic）任务方面的表现具有竞争力。例如，在多模态基准测试CharXiv Reasoning中，Muse Spark思考模式得分为86.4，超过GPT-5.4的82.8和Gemini 3.1 Pro High的80.2，但在其他多个多模态基准测试中，其得分低于Gemini 3.1 Pro High。
在多项与推理能力相关的基准测试中，Muse Spark思考模式的部分得分超过Grok 4.2，但得分均低于Gemini 3.1 Pro High和GPT-5.4。与代理能力相关，Muse Spark思考模式DeepSearchQA测试得分74.8，超过Gemini 3.1 Pro High的69.7和GPT-5.4的73.6，在GDPval-AA Elo测试中的得分超过Gemini 3.1 Pro High和Grok 4.2，但在SWE-Bench Verified等四项基准测试中的得分接近或低于Opus 4.6、Gemini 3.1 Pro High和GPT-5.4。
从基准测试结果看，Muse Spark思考模式并未全面赶超谷歌和OpenAI的前沿模型，但在部分测试中的表现能与当前第一梯队的模型“掰手腕”。能力更强的将是尚未上线的沉思模式。meta透露，Muse Spark沉思模式在无工具Humanity’s Last Exam（人类终极考试）和FrontierScience Research（前沿科学研究）中得分超过Gemini 3.1和GPT-5.4 Pro。
去年meta的AI策略经历了转向。先是去年4月Llama 4被质疑训练测试集作弊、实际性能不及预期，meta首席人工智能科学家杨立昆（Yann LeCun）又被质疑反对主流LLM路线、导致meta在AI竞争中落后。多重刺激下，meta对AI团队进行了重组。去年6月，meta以近150亿美元的价格注资AI初创公司Scale AI，Scale AI创始人亚历山大·王（Alexandr Wang）加入meta，担任超级智能实验室负责人，meta CEO扎克伯格随即开启AI人才争夺战，为超级智能实验室招揽人才。去年底，在meta战略转型中，杨立昆宣布离职。
AI战略的剧烈变动不仅涉及组织变动和人才流动，也涉及AI发展的方向。据杨立昆离职后透露，meta管理层执着于稳妥、已被验证的方案，将重点放在大语言模型开发上，而不认可一些新颖的创意。
无论如何，这场剧烈的AI策略转向后，Muse Spark成为meta拿出的第一个果实。此前meta的Llama系列模型开源，而Muse Spark为闭源模型，新模型的推出也被外界视为meta从开源到闭源的转向。美股4月8日收盘，meta股价上涨6.5%。
不仅在模型策略上进行了转向，meta在AI基础设施投入方面也有大动作。meta是AI基础设施投入最激进的美国科技公司之一，meta此前预告，2026年资本开支可能相比上一年翻一倍，预计在1150亿美元至1350亿美元之间。
不过，大模型竞争也趋于激烈，市场预计4月可能还会有多个新模型上线，meta仍面临竞争对手的挑战。
虽然Muse Spark部分基准测试得分超过Anthropic的Opus 4.6，但Anthropic近期也取得新进展，该公司近日称未发布的前沿模型Mythos Preview编码能力达到了新的水准，有望重塑网络安全领域。近日还有未经证实的市场传言称，OpenAI的GPT-6可能在4月推出。4月8日，DeepSeek也低调更新了对话界面，新增“快速模式”和“专家模式”选项，被解读为可能是V4版本上线的前奏。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

阿里CEO吴泳铭发内部信：组织架构调整

谷歌CEO最新访谈：中国模型“很优秀”，2027年将成行业拐点

只对受邀企业开放：OpenAI拟效仿Anthropic 限制前沿模型发布

手握“通云哥”的阿里，正在复刻谷歌AI路线图

阿里百度腾讯集体加入AI算力涨价潮，云计算终结20年降价史

谷歌CEO最新访谈：中国模型“很优秀”，2027年将成行业拐点

全站最新

阿里CEO吴泳铭发内部信：组织架构调整

谷歌CEO最新访谈：中国模型“很优秀”，2027年将成行业拐点

只对受邀企业开放：OpenAI拟效仿Anthropic 限制前沿模型发布

手握“通云哥”的阿里，正在复刻谷歌AI路线图

热门推荐

阿里CEO吴泳铭发内部信：组织架构调整

字节上线原生全双工语音大模型Seeduplex

谷歌CEO最新访谈：中国模型“很优秀”，2027年将成行业拐点

据报阿里发布并开源超越Seedance 2.0的视频生成模型

OpenAI据悉预计今年广告收入达25亿美元 2030年冲击1000亿美元

只对受邀企业开放：OpenAI拟效仿Anthropic 限制前沿模型发布

异构系统实现大模型推理加速与成本优化能力提升

Meta策略转向后首个模型发布部分指标超GPT-5.4

手握“通云哥”的阿里，正在复刻谷歌AI路线图

阿里百度腾讯集体加入AI算力涨价潮，云计算终结20年降价史

谷歌CEO最新访谈：中国模型“很优秀”，2027年将成行业拐点

智元机器人发布GO-2具身基座大模型

阿里AI组织再调整：通义升为事业部，李飞飞任阿里云CTO

Meta杀回大模型主桌！扎克伯格打响AI翻身仗？

华为云将于6月举办创想者大会将重磅发布AI全系产品

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

首页

新科技

新金融

新零售

智能车

房地产

科技探索

人物资讯

网络游戏

人工智能

专题

Meta策略转向后首个模型发布部分指标超GPT-5.4

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

Meta策略转向后首个模型发布 部分指标超GPT-5.4

同类资讯

Meta策略转向后首个模型发布部分指标超GPT-5.4