“AI+科学”正在重塑科研底层逻辑、倍增科研效率、促进学科融合、加速科学发现。然而,当前各学科应用人工智能技术构建的领域专用智能系统仍面临数据孤岛、专业推理能力不足和研发生态封闭三大挑战,大多只能充当科研助手角色。如何让通用科学基础大模型与领域专用模型有机结合,构建体系性支撑平台,使AI真正成为科研伙伴呢?本期大模型进展专栏“明星产品介绍”栏目将介绍中国科学院在2025世界人工智能大上发布的“磐石·科学基础大模型”。
7月26日下午,在2025世界人工智能大会期间举办的“人工智能赋能生命科学论坛”上,中国科学院自动化研究所副所长曾大军重磅发布了由中国科学院联合团队研发的“磐石·科学基础大模型”,目标为各领域的科技创新打造“坚如磐石”的智能支撑。
集结优势资源 打造科学研究“操作系统”
为推动“AI+科学”向平台化、体系化的新范式加速转型,中国科学院积极谋划布局,充分发挥自身优势,依托完整的自然科学学科体系、全栈式人工智能创新链、重大科学设施及丰富的科学数据资源,集结中国科学院下属12家研究单位,共同组建联合研发团队,致力于研发服务科研的基座大模型。
“磐石·科学基础大模型”是采用专业科学知识和数据进行训练、服务于科学任务的智能底座。该模型实现了对波、谱、场等多种科学模态数据的深入理解,具备科学文献萃取融合、科学知识表征推理和科学工具编排规划等核心能力,是“AI+科学”的“操作系统”。
在核心架构设计方面,“磐石·科学基础大模型”采用异构混合专家架构,在国产开源大模型基础上,面向科学领域进行深度定制,集成了自主研发的一系列面向共性科学数据模态的专用模型,并融合了AlphaFold、MatterGen等领域专业模型的能力。
融汇多学科知识 构建智能求解体系
在科学能力方面,“磐石·科学基础大模型”依托中国科学院科学数据中心体系,已打通90PB科学数据,其中70%由重大科学基础设施源头生产。此外,该大模型覆盖了250万条高质量科学推理数据和50万条高难度学科退火数据。目前,“磐石·科学基础大模型”已系统掌握数、理、化、天、地、生六大学科核心定理、定律与专业知识,支持跨学科工具的自主规划、按需调用,并针对关键共性科学计算问题构建了智能求解器,可实现对数据和模型等各类资源的管理,以及对计算仿真等各类工具的调度,让科研人员在科研各环节轻松调用模型,实现人工智能在科学研究中的无感嵌入。
具体测评中,在基础学科知识掌握方面,“磐石·科学基础大模型”在国际通用数据集上达到数学、物理、化学、材料、生物各学科门类当前最佳性能,优于业界旗舰模型;在专业工具调用和科学推理方面,“磐石·科学基础大模型”在通用人工智能助手测试基准(GAIA)、事实性问答数据集(SimpleQA)等国际权威测试中名列前茅;在人类终极考试(HLE)中表现优异。
双核智能体协同 全面提升科研效能
基于“磐石·科学基础大模型”,研发团队还开发了两个核心科学智能体——“磐石·文献罗盘”和“磐石·工具调度台”,全方位提升科研效率。
“磐石·文献罗盘”已接入1.7亿篇科技文献与实时开源科技信息,能够深度理解包含公式与图表的科学数据,为科研人员提供精读文章、撰写综述、评估科研选题与技术路径等全方位支持。在其支持下,以往需要3至5天才能完成的文献调研工作可缩短至20分钟。
多领域深度应用 展现强大科研潜力
目前,“磐石·科学基础大模型”已经在多个学科领域展现出强大的应用潜力和实用价值。
在生命科学领域,科研团队基于“磐石·科学基础大模型”构建了X-Cell数字细胞大模型,实现了从基因序列和中心法则到细胞表型的整体建模,推动数字细胞实现靶点发现全流程自动化,为生命科学研究提供了全新范式。
在高能物理领域,北京正负电子对撞机的研究人员依托“磐石·工具调度台”,实现了粒子物理研究任务的自动分解、研究工具高效规划和分析程序自动生成,有效提升了粒子模拟速度与重建效率。
在力学研究领域,“磐石·科学基础大模型”发挥其强大的科学数据理解和预测能力,高效计算高铁模型在多种流体环境下的表面压力场,为高铁构型设计提供了数据支持。
此外,“磐石·科学基础大模型”还在化学合成实验效率提升、分子结构预测准确性改善、天文观测智能化资源调度与分析等方面发挥着重要作用。
构建开放生态 引领科研范式变革
“‘AI+科学’的目标是科研、基础是模型、关键是应用,‘磐石’的发展逻辑是模型应用与科研创新相互迭代提升。”曾大军表示,“‘磐石’已初步具备科学知识全能手、文献超级分析师、专业问题精算家的能力,并逐步成为科研攻关的参谋和指挥员”。在服务真实科学需求的过程中,“磐石·科学基础大模型”将持续迭代,不断提升实用性与可靠性,为推动科学研究向更高水平发展贡献力量。
曾大军在现场宣布,中国科学院自动化研究所已联合40余家科研院所、高等院校及企业合作伙伴共同启动“科学基础大模型生态联盟”计划,并积极推动国产算力适配,着力构建开源开放、自主可控的“AI+科学”新生态,旨在为全球学术共同体贡献中国方案,赋能科研范式重塑,开启科学研究的无限可能。
大模型进展专栏由CICC大模型与决策智能专委会主办,欢迎投稿。
联系方式:lmdi123@163.com。
文字:鲁宁、董晓芙、王汀
编辑:范长俊,张钊、梁星星
审核:张国华