当前位置: 首页 » 资讯 » 新科技 » 正文

文心大模型X1.1深度思考模型上线!事实性、指令遵循等能力获大幅提升

IP属地 中国·北京 编辑:赵云飞 ITBEAR 时间:2025-09-10 02:18:36

由深度学习技术及应用国家工程研究中心主办、百度飞桨与文心大模型联合承办的WAVE SUMMIT深度学习开发者大会在北京召开。会上,百度发布文心大模型X1.1版本,同步公开飞桨框架v3.2、ERNIEKit开发套件及FastDeploy部署套件等系列技术成果,并启动多项生态合作计划。

百度首席技术官王海峰现场宣布,基于文心大模型4.5升级的X1.1深度思考模型正式上线。该模型采用迭代式混合强化学习框架,通过自蒸馏数据训练提升整体性能,事实性准确率提升34.8%,指令遵循能力提高12.5%,智能体交互效率增长9.6%。在权威基准测试中,X1.1多项指标超越DeepSeek R1-0528,与GPT-5、Gemini 2.5 Pro持平。目前,个人用户可通过文心一言官网、文小言APP体验,企业客户可登陆百度智能云千帆平台调用。

在应用生态建设方面,百度联合中国老龄事业发展基金会推出“AI助老公益计划”,上线“AI助老智能体”。用户通过百度搜索或小度智能健康屏即可获取服务,助力老年群体跨越数字鸿沟。同时,中国科技馆与百度共建的“科技馆智能体矩阵”正式发布,联动全国28家科技馆及340名开发者,推动科普资源智能化整合。

百度集团副总裁吴甜展示文心大模型X1.1的实际应用场景。在复杂写作任务中,模型可结合内化知识与联网搜索,生成结构清晰、逻辑严谨的内容;面对共享单车平台的多维问题,模型能根据用户等级、问题类型及情绪状态,自主规划流程并调用工具完成服务。基于该模型开发的剧本驱动多模协同数字人技术,实现语言、声音与形象的同步协调,在直播场景中表现超越真人。此前,罗永浩数字人直播首秀即创下行业GMV纪录,部分品类带货量超过真人主播。

技术架构层面,飞桨框架v3.2实现三大核心升级:计算优化提升训练效率,在ERNIE-4.5-300B-A47B模型上预训练MFU达47%;强化类CUDA芯片适配,算子内核复用率最高达92%;兼容Safetensors权重及生态加速库,降低部署成本。同步开源的ERNIE-4.5-21B-A3B-Thinking思考模型,在内容创作、逻辑推理等任务中表现突出。ERNIEKit开发套件支持4张GPU即可调优300B参数模型,开源的GraphNet计算图数据集填补AI编译器测试基准空白。

针对科研领域,PaddleCFD与PaddleMaterials两大科学计算套件可提升流体力学与材料科学研发效率。FastDeploy部署套件通过模型压缩与协同优化,使ERNIE-4.5-300B-A47B模型在50ms时延下实现输入57K tokens/秒、输出29K tokens/秒的性能。

开发者生态方面,文心快码升级至3.5S版本,强化多智能体协同能力。新版本支持动态生成多个智能体自主协作,基于Rules与MCP构建统一经验库,实现团队知识传承。数据显示,该工具已服务超1000万开发者,百度内部45%的新增代码由AI生成,头部用户AI代码占比超75%。

文心数据生态推出“文心导师·星耀计划”,汇聚48%的十年以上行业专家与41%的专业技术人员,通过知识传授与质量评定指导模型优化。中国科技馆与百度同步启动“未来之翼科普共创计划”,助力全国科普服务体系升级。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。