当前位置：首页 » 资讯 » 新科技 » 正文

百度最新开源一款轻量化模型适用于学术科研等长文本推理场景

IP属地中国·北京 编辑：任飞扬上海证券报 时间：2025-09-09 18:06:56

在9月9日举行的WAVE SUMMIT深度学习开发者大会2025现场，百度正式开源最新的思考ERNIE-4.5-21B-A3B-Thinking。据悉，该模型不仅在逻辑推理、数学、科学，代码与文本生成等需要人类专家的任务上实现了显著提升，还具备高效的工具调用能力，能够支持复杂任务的自动化处理。
上证报中国证券网讯（记者刘暄）在9月9日举行的WAVE SUMMIT深度学习开发者大会2025现场，百度正式开源最新的思考ERNIE-4.5-21B-A3B-Thinking。据悉，该模型不仅在逻辑推理、数学、科学，代码与文本生成等需要人类专家的任务上实现了显著提升，还具备高效的工具调用能力，能够支持复杂任务的自动化处理。
据介绍，ERNIE-4.5-21B-A3B-Thinking采用了混合专家（MoE）架构，总参数规模达210亿，每个token激活 30 亿参数，通过指令微调及强化学习训练。ERNIE-4.5-21B-A3B-Thinking是在ERNIE-4.5-21B-A3B 基础上训练的深度思考模型，该模型支持128 的上下文窗口，适用于需要长上下文的复杂推理任务。
此外，ERNIE-4.5-21B-A3B-Thinking 模型以Apache License 2.0协议开源，允许商业使用。该模型已在HuggingFace、星河社区等主流开源社区同步发布，FastDeploy、 vLLM、Transformers 等开源工具已经实现了对该模型的支持，可以直接加载模型并使用。
公开资料显示，今年6月30日，百度正式开源文心大模型4.5系列模型，涵盖47B、3B激活参数的混合专家（MoE）模型，与0.3B参数的稠密型模型等10款模型，并实现预训练权重和推理代码的完全开源。目前，文心开源系列模型已在行业中得到广泛应用。
当日，百度还正式发布文心大模型X1.1深度思考模型，该模型在事实性、指令遵循、智能体等能力上均有大幅提升。目前，用户可以在文心一言官网、文小言APP使用文心大模型X1.1。文心大模型X1.1已正式上线百度智能云千帆平台，对企业客户及开发者全面开放使用。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

岚图汽车卢放：智驾不要纠结于数字，整车综合能力才是关键

三一重卡梁林河：纯电动重卡渗透率今年可能突破50%

森林里的“创业绿洲”：张江打造全球数字游民OPC新高地

Linux定了！AI生成代码能用，责任这么算

MiniMax，深夜官宣！

郑丽文现身小米汽车工厂参访，分享体验感受：只有一个字，赞！雷军亲自接见，并赠送郑丽文一部小米手机

全站最新

岚图汽车卢放：智驾不要纠结于数字，整车综合能力才是关键

三一重卡梁林河：纯电动重卡渗透率今年可能突破50%

森林里的“创业绿洲”：张江打造全球数字游民OPC新高地

Linux定了！AI生成代码能用，责任这么算

热门推荐

北大联合智源发布SpikePingpong算法，率先在智元灵犀X2上完成部署

岚图汽车卢放：智驾不要纠结于数字，整车综合能力才是关键

三一重卡梁林河：纯电动重卡渗透率今年可能突破50%

摩尔线程：MTT S5000完成MiniMax M2.7大模型适配

森林里的“创业绿洲”：张江打造全球数字游民OPC新高地

Linux定了！AI生成代码能用，责任这么算

MiniMax，深夜官宣！

股价站上16年来新高诺基亚巨头回归

郑丽文现身小米汽车工厂参访，分享体验感受：只有一个字，赞！雷军亲自接见，并赠送郑丽文一部小米手机

光谷智能传感技术创新研究院揭牌，多家上市公司参与共建

回归商业本质筑牢技术主权：爱芯元智以开放生态定义智驾普惠方案

靳玉志：L3是迈向完全自动驾驶必经之路｜快讯

靳玉志：L3是迈向完全自动驾驶必经之路｜快讯

3月销量出炉，广汽丰田三月三冠

麦肯锡：90%的被调研企业启动AI转型，仅10%实现规模化应用

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

首页

新科技

新金融

新零售

智能车

房地产

科技探索

人物资讯

网络游戏

人工智能

专题

百度最新开源一款轻量化模型适用于学术科研等长文本推理场景

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

百度最新开源一款轻量化模型 适用于学术科研等长文本推理场景

同类资讯

百度最新开源一款轻量化模型适用于学术科研等长文本推理场景