当前位置: 首页 » 资讯 » 新科技 » 正文

瞭望 | AI4S重塑科研未来

IP属地 中国·北京 新华社 时间:2025-12-08 18:16:04

  在积极利用AI提升知识积累效率的同时,我们需审慎思考,如何确保科学成果的质量与深度不被速度稀释,并将最终的解释权、决策权等“认知主动权”牢牢掌握在人类自己手中

  文 |《瞭望》新闻周刊记者 钱沛杉

  11月27日晚,DeepSeek发布其最新数学模型DeepSeekMath-V2,以自验证方式突破了目前AI在深度推理方面的局限,展现了强大的定理推理能力。DeepSeek方面表示,Math-V2让大模型在数学领域不再只是“做题家”,而有可能依靠自身全面、严谨的数学推理能力对科学研究产生深远影响。

  将AI引入科学研究并非全新事物。在国内,2018年,中国科学院院士、北京大学国际机器学习研究中心主任鄂维南率先引入AI4S(人工智能驱动科学研究)概念,认为传统科研模式效率较低、学科间壁垒较高,AI可以实现跨学科融合,加速突破。

  特别是,当传统物理模型在极端复杂的系统前束手无策时,数据驱动范式可以跳过对微观机制的繁琐推演,利用算法直接从海量数据中寻找规律、构建“隐性”模型,为应对气候变化等紧迫挑战,提供可行路径。

  这种模式已影响渗透到科学研究的多个环节,在多个领域催生重大突破,实现科研效率的指数级提升。

  在生命科学领域,去年获诺贝尔化学奖的“阿尔法折叠2”AI模型(Alpha Fold2)将蛋白质结构预测周期从数十年缩短至数天,解决了领域内长期困扰的折叠难题;在材料科学领域,科研人员利用AI模拟不同元素组合的性能,缩短新材料设计周期;在环境科学领域,AI实现多模态数据的自动对齐与分析,为森林火灾的预防、监测与生态恢复等提供了更准、更快的解决方案……

  一系列显著成果,“刺激”多国加速布局发展AI4S:2024年以来,美国通过行政令、政策文件及专项报告系统性提升AI4S战略地位;欧盟自2022年起开始布局科学AI发展,2025年加快进度,发布“人工智能大陆行动计划”,持续布局欧洲科学AI战略;建设科学AI在线服务平台AI-on-Demand并推动成立AI科学专家组。

  我国同样高度重视AI4S发展,从国家部委到地方政府层面积极应对,陆续推出支持政策。国家层面,2023年科技部会同国家自然科学基金委启动“人工智能赋能科学研究”专项部署工作后,今年8月国务院印发《关于深入实施“人工智能+”行动的意见》,第一项重点行动即“人工智能+”科学技术,要求加快探索人工智能驱动的新型科研范式,加速“从0到1”重大科学发现进程。《中共中央关于制定国民经济和社会发展第十五个五年规划的建议》也提出,以人工智能引领科研范式变革。

  地方层面,今年7月上海、北京均出台了支持AI4S发展的专项计划,推出了科学智能“百团百项”工程和《加快人工智能赋能科学研究高质量发展行动计划(2025—2027年)》等举措。

  政策层面的高度重视支持推动了该领域的快速发展,但与此同时,AI预测成果无法快速转化为实际生产力、数据孤岛问题仍存、复合型人才缺口较大等情况仍存。

  学界与业界呼吁,构建包含复合型人才培养体系、多领域协作的开放平台等在内的新型科研生态,并恪守科学伦理,坚持以人为本、科技向善。


在浙江乌镇举办的 2025 年世界互联网大会“互联网之光”博览会现场,一家企业工作人员展示人形机器人同步模仿精细动作(2025 年 11 月 6 日摄) 黄宗治摄 / 本刊

  AI挑战科学研究“游戏规则”

  过去,科学家们主要通过理论推导、实验观察和计算机模拟来探索世界。如今,AI4S带来了科学研究的另一种可能,即从海量数据中寻找规律。

  “海洋科学作为一门实验科学,其经典理论框架已趋于完善。当前学科的一个重要发展方向是追求更高分辨率的观测,旨在通过精细化的尺度研究来突破传统大尺度理论的瓶颈。”中国海洋大学物理海洋教育部重点实验室教授陈显尧介绍。

  以预测厄尔尼诺-南方涛动(ENSO)现象为例,受系统混沌性和大气海洋耦合过程季节变化等因素影响,ENSO在春季的预测准确度明显低于其他季节,成为气候预测中的一大难点。2019年,科学家运用机器学习模型突破了这一难题,将可预测时间长度延长数月,并为解释其物理过程提供了新思路。

  “AI并非拥有了超乎人类的知识,而是关注到了被人类研究者因先验知识和经验而忽视的物理过程。这些过程虽被观测记录,但传统上被视为‘噪音’而非关键因子。AI的无偏见学习揭示了这些次要因素在长期预测中的决定性作用。”陈显尧认为,AI的引入绝非简单的工具性应用,而是推动动力学理论与观测数据的有机融合。它突破人类思维的可能局限,帮助科学家发现新的科学联系,推动理论创新。

  这一模式挑战了传统科学研究的“游戏规则”,在学界引发诸多争议。“经典科学范式是‘自上而下’的,数据驱动范式是‘自下而上’的。”受访者说,在经典科学范式概念下的科学发现,目标是“理解因果”优先,而AI4S的目标则是“实现预测”优先,两者标准存在根本性差异。

  标准的调整引发科研体系形态变化——

  科研基础设施上,AI4S的根基从传统的精密仪器,转向了以大型计算中心、专用算法库和高质量数据库为核心的新型基础设施。这源于其对海量数据和强大算力的根本依赖。

  科研人才角色上,一些科学家的工作重心发生转变。过去科研中软件是被动工具,而生成式AI和强化学习模型,更像是能自主设计实验、提出假设的“能动伙伴”。科学家的核心任务从“如何操作”转变为“如何定义问题、评估结果和引导方向”,形成“人机混合智能”协同探索模式。

  科研组织方式上,受上述变动影响,科研活动从传统PI制(课题组长负责制)的“小作坊”模式,向跨学科、平台化、网络化的大团队协作转型。

  多位学者认为,AI4S不是对传统科研范式的替代,而是深度融合。中国工程院院士孙凝晖认为,AI4S的终极目标不是替代科学家,而是通过工具进化赋能人类认知进化,“正如望远镜扩展了人类的视野,显微镜打开了微观世界的大门,AI正在成为人类探索未知的‘第三只眼睛’”。

  克服现实推进阻碍

  中国科学院高能物理研究所研发的Dr.Sai多智能体协同系统,实现高能物理分析全流程自动化,并成功复现四夸克粒子发现过程;北京大学开发的DeepFlameRocket火箭燃烧智能仿真软件,实现对火箭发动机的全流程数值模拟……

  如果将2024年称为AI4S的发展元年,2025年,AI4S从概念验证和工具普及进入深度融合和规模化应用的发展阶段,在基础设施构建、平台工具研发、交叉学科应用等方面取得进展。

  受访者认为,当前,AI4S不再仅局限于个别案例,而是渗透影响到了各个基础学科和工业研发的毛细血管中,科学发现进入人机协同、加速创新时代。但作为新生事物,在现实推进过程中,仍面临几方面阻碍。

  打通数据孤岛。高质量AI-Ready的科学数据稀缺是我国AI4S发展的核心挑战。据了解,AI-Ready数据集是指经过系统化处理、标注和结构化的数据集合,专为人工智能模型的训练和评估设计。这类数据集通常具备高质量、标准化格式和清晰的标注,能够显著降低数据预处理的门槛,帮助研究人员和开发者快速投入模型开发。

  北京大学深圳研究生院副院长、科学智能学院执行院长田永鸿认为,海量、高质量的科学数据是AI4S发展的基础,但此类数据仍严重短缺。

  一方面,高质量数据集的获取成本高昂。在生命科学领域,有业内人士统计,仅单一类别的蛋白质结构实验数据,采集成本就超过8万元,训练AI模型通常需要百万量级的样本,其成本远超普通科研团队承受范围。

  另一方面,数据标注环节存在突出瓶颈。以冷冻电镜图像为例,其标注工作需依赖结构生物学家或电镜专家等专业人员,耗时较长。业内人士透露,国内某生物物理研究机构曾组织20名博士,全职工作6个月,才完成1万张图像标注。这种高度依赖专业人力的标注模式,在效率和规模上难以满足AI训练需求,成为制约AI科研应用的关键因素之一。

  此外,AI4S领域数据共享存在制约。田永鸿介绍,科研活动长期以课题组或机构为单位开展,数据分散在不同实验室、机构、个人的电脑中,形成“数据孤岛”。数据所有权、知识产权以及科研竞争关系等因素,阻碍了科学数据的开放共享。

  例如,生命健康领域的医疗数据因隐私保护限制,科研可用率较低;材料科学领域数据“碎片化和孤岛化”现象严重,数据规模小,共享机制不完善。

  一位长期从事科学数据管理的专家表示:“数据质量直接决定AI模型的可靠性。如果没有足够多、足够好的数据,再先进的算法也是无源之水。”

  人类验证能力成瓶颈。工业和信息化部原副部长王江平在相关论坛发言中表示,“AI一天的预测成果,人类需要十年验证”的现象在AI4S领域普遍存在,“AI科学发现能力指数级增长,人类的实验验证和产业化应用能力仍在线性爬坡,这种巨大的能力鸿沟导致海量AI预测成果如同洪水被堵,淤积在实验室无法转化为实际生产力。”

  王江平分析,造成“堰塞湖”现象的主要原因一是标准缺失,AI预测结果缺乏统一评估体系;二是验证瓶颈,自动化实验能力不足,“预测—验证”链条不畅;三是政策约束,伦理审查严、审批周期长,加之投资风险高,抑制了企业投入意愿。

  田永鸿认为,这一现象属于长期待解决的难题,有望通过AI计算设计实验方案,自动化平台执行并反馈结果,形成“设计—执行—验证”的循环,缩小科研与产业化的鸿沟。

  复合型人才短缺。AI4S及更广泛的人工智能所需的复合型人才短缺,是当前我国科技产业发展面临的核心挑战之一。

  金融机构高盛在《全球人工智能产业布局》报告中预测,到2030年,中国人工智能产业的人才缺口将超过500万;麦肯锡报告中提到的数字同样不容乐观:到2030年,中国的AI人才供应仅市场需求的1/3。

  复合型人才缺口体现在数量上,也在质量上。田永鸿说,传统人工智能人才培养侧重于编程、数学和计算机基础,而科学智能要求学生不仅掌握AI技术,还须具备扎实的数理基础与特定学科知识,包括物理、化学、生物等,“这意味着学生需要同时理解科学问题的本质和AI的求解方法,是典型的多学科深度交叉领域”。这种人才标准的升级,加剧了复合型人才的紧缺状况。

  构建科研新生态

  AI4S带来的挑战,是“游戏规则”变换在撞击现有体系时产生的结构性张力。

  应对这些挑战,有学者认为,需在现有科研组织方式上,构建面向人工智能时代的新型科研生态。这包括培养既懂AI又懂专业的复合型人才,推动数据开放共享以破解“数据孤岛”,并建立适应人机协同的科研评价与伦理治理体系。

  构建复合型人才培养体系。转变传统的“专门人才”培养模式,积极构建面向AI4S的复合型人才培养体系。一方面重视培养具备深厚AI技术理论基础和实践应用能力的专业人才;另一方面完善交叉学科人才培养体系,促进科研人员跨学科学习。

  北京大学深圳研究生院聚焦AI4S人才短板,设立科学智能学院,推行“双导师制”。

  田永鸿介绍,“双导师制”是由一位科学导师与一位AI导师共同指导学生,科学导师负责把握重要科学问题方向,AI导师则设计技术路线。双导师从一开始即共担责任,解决合作意愿与知识产权分配问题。同时,学院设立专门的交叉学科学位评定分会,从制度上保障跨学科论文的评审质量,使学生归属清晰、评价有据。

  “这一模式将交叉人才培养从过去的零散合作转变为系统化、制度化的体系,为复合型创新人才的成长提供了坚实基础。”田永鸿说。

  陈显尧认为,人才培养的关键,在于引导学生从传统的理论思维范式,转向并掌握一种与AI相结合的思维方式,“我们正处在实践的初级阶段,有效的方法是让学生从解决具体科学问题入手,在实践中亲眼见证这种新方法的可行性,从而逐步建立新的科研思维路径。”

  平台建设向平台模式转变。传统的个体科学家或单一研究团队开展科学研究的“作坊模式”已不能适应AI4S的研究方式,“平台模式”能够整合来自不同领域的多元主体,形成研究网络。培育AI4S创新联合体,促进数学、计算机科学、建模仿真与各学科的协作,是打造世界领先创新集群的关键。

  国内高校和研究机构已布局多家AI4S研发平台。如,中国科学院建立ScienceOne基于科学基础大模型的智能科研平台;北京科学智能研究院研发的“玻尔科研空间站”AI科研平台集成“读文献—做计算—做实验—多学科协同”等功能等。

  但AI4S领域的共性技术平台建设仍侧重于基础支撑层,成果仍以个别研发案例为主,缺少针对半导体、新能源、新材料等细分场景下单一类别的专业支撑平台。

  对此,受访者建议,应面向重点应用领域,构建一批AI4S共性技术研发平台,依托云厂商,以及医药健康、新材料、工业等重点领域优势企业,协同高校院所、科研机构和创新企业组建各领域创新联合体,探索通过成立合资公司、共建干湿闭环实验室、搭建高能级创新平台等,加速科技工程创新突破。

  推动科研数据共享。田永鸿认为,数据共享是释放AI4S潜力的基础,须加快打破“数据孤岛”,推动科研数据的有效整合与开放共享。

  受访者建议,加速推进AI4S关键领域“科研数据可信空间”建设,促进医药健康、新材料、工业等领域的高质量科学数据和合成数据资源的集中,加强科学数据的标准化建设,创新数据资源共享的技术和制度,引导数据的可信流通和交易。

  田永鸿建议加强数据、工具、人才、模型四要素的协同进化——数据需要标准化工具加工,通过人才训练模型,模型再反哺数据更新。“未来,我们希望能集研发数据采集、模型训练、科学发现与实验验证闭环融合,成为全流程智能化实验设施与设备,打造覆盖主要研究机构、科学设施和实验室的数智云化协同科学研究平台网,让科学家远程调用资源,最大化发挥数据价值。”田永鸿说。

  推动科学伦理治理。在伦理治理方面,需要从科学共同体自治走向社会共治。AI4S带来算法不透明性、算法歧视、数据隐私问题以及结果的不可解释性等伦理挑战。需强化AI4S的科技伦理治理研究,加强科技伦理宣传与教育,建立健全AI4S的社会共治体系和机制。

  受访者表示,当前阶段,AI的主要作用是加速科学发现,其优势是在现有范式下进行高效预测与计算。但真正颠覆性的科研突破,仍依赖人类独有的科学直觉、对复杂事实的深刻辨析,以及融入了情境与文化背景的宏观判断。

  在积极利用AI提升知识积累效率的同时,我们需审慎思考,如何确保科学成果的质量与深度不被速度稀释,并将最终的解释权、决策权等“认知主动权”牢牢掌握在人类自己手中。■

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。