当前位置: 首页 » 资讯 » 新科技 » 正文

科学家打造化学数字孪生AI平台,能模拟同步辐射等高级表征仪器

IP属地 中国·北京 编辑:江紫萱 DeepTech深科技 时间:2025-08-31 00:25:41

钱锦目前在美国劳伦斯伯克利国家实验室担任职业轨道科学家,主要研究方向是计算化学。她本科毕业于美国莱斯大学,之后在美国加州理工学院获得博士学位,并在劳伦斯伯克利国家实验室从事博士后研究。

她一直对“模型与现实”之间的关系具有浓厚兴趣。正如爱因斯坦所言,“模型应尽可能简洁,但不应简化过度”,这一观点代表了理论化学中追求简洁模型的传统理念。然而,钱锦常常反思:我们是否能够推动模型进一步逼近现实?正如当今视频游戏和 Pixar 电影在构建虚拟世界时不断追求更高的真实感,化学研究是否也可以实现类似的突破?

近期,钱锦与团队正将这一想法转变为现实,通过基于物理的、AI 加速的方法,实现了对化学反应过程的动态模拟和实时反馈。基于这一方法,他们开发了首个化学科学领域的数字孪生平台(DTCS,Digital Twin for Chemical Science)。它可对高级表征仪器进行模拟,不仅能实时解析数据,还能动态调整实验策略,从而显著提高研究效率和科学发现的确定性。


图丨钱锦(钱锦)

在化学实验里,研究人员通常最希望了解的问题是:化学反应到底是怎么一步一步发生的?哪一步快,哪一步慢?哪些反应会被“卡住”,哪些会畅通无阻?

这些问题的背后是一张“化学反应网络”(CRN,Chemical Reaction Network),可以把它想象成一张地图,其中反应物为起点,生成物为终点,之间存在诸多可能路径——有些如同高速公路,有些则似乡间小路。

在以往的研究中,一般通过大量实验来摸索这张地图——这种方式不仅又慢又贵,还常常带有研究人员的“主观偏好(human bias)”。比如,研究人员可能会倾向于测试自己“觉得重要”的条件,而忽略那些可能真正关键但不直观的探索。

DTCS 的作用类似于化学实验室中的“自动驾驶导航系统”。它首先提供一张理论预测的“反应地图”,进而根据实时实验数据不断调整路径规划,帮助研究人员选择最快、最接近的反应路线。

具体而言,DTCS 通过构建 CRN,模拟化学物种之间的反应路径与动力学参数,从而预测在特定实验条件下的化学反应结果。该平台的创新性主要体现在三个方面:

·实时性(Real-time solution),即在实验过程中提供即时反馈,而非事后总结;

·机理导向(Mechanistic insight),强调在反应网络层面理解与预测机制,而非简单进行数据拟合;

·自我进化(Dynamic evolution),能够随着实验的持续开展不断优化自身模型,逐渐成为科学家的智能科研伙伴。

所谓“数字孪生”,在此指的是“实验的真实世界”与“理论的虚拟世界”的深度融合。以往这两个维度往往相互隔离,而 DTCS 实现了它们之间的双向实时交互,犹如一对双胞胎真正开始倾听彼此:实验向理论传递“观测到什么”,理论则反馈“还需要什么”,从而解决了长期以来实验与理论脱节的问题。

DTCS 不仅是一种工具,更是一位能够持续学习、不断进化的“合作伙伴”。其独特之处在于,随着实验—理论交互次数的增加,平台对反应网络的理解愈发精准,实验效率也因此持续提高。

该平台在催化、电池、金属腐蚀、芯片制造等界面化学研究中显示出广泛的应用潜力。它能够帮助研究人员在原子尺度观察反应动态过程,理解活性位点、电子转移机制以及界面反应速率,进而指导材料设计与实验优化。

据了解,该团队已拥有面向工业应用的软件许可证(software license),可授权企业用户使用 DTCS 平台进行应用研究。钱锦对 DeepTech 表示,在工业场景中,DTCS 最容易落地的应用可能是催化剂开发、电池界面、芯片制造等方向。

与传统的机器学习方法不同,DTCS 不需要企业用户事先积累海量实验数据,只需拥有一定的计算资源和实时实验观测能力,即便在实验与计算资源有限的情况下,该平台依然能够加速反应机理探索、优化材料与界面设计,从而缩短研发周期,提高整体科研效率。

近日,相关论文以《化学科学中的数字孪生:以 Ag(111)表面的水相互作用为例的案例研究》(Digital Twin for Chemical Sciences: A Case Study to Characterize Water Interactions on Ag(111)Surface)为题发表在Nature Computational Science[1]。劳伦斯伯克利国家实验室钱锦是第一作者兼共同通讯作者,伊桑·J·克鲁姆林(Ethan J. Crumlin)教授担任通讯作者。


图丨相关论文(Nature Computational Science)



创建更真实、更可交互的理论世界,让实验和理论能够“真正对话”

同步辐射是一种非常宝贵的科研仪器资源,它就像是一个“超级显微镜”,能够在原子尺度揭示材料结构和反应过程的精细信息。但它的代价也很高,不仅运行经费巨大,而且时间非常有限。一旦机会来了,科研人员需要“争分夺秒”地采集数据。然而问题在于,在实验现场往往并没有足够的时间和预算去“海量扫图”,更难以拍摄成百上千张谱图后再作细致分析。


图丨钱锦(左一)与课题组成员(钱锦)

早在 2019 年,在劳伦斯伯克利国家实验室进行博后研究的钱锦在与其导师克鲁姆林教授的合作中完成了初步的概念验证,证明基于 CRN 可以对谱学观测进行预测。随着她于 2021 年成为独立课题组长(PI),并逐步组建了一支涵盖计算机方向的学生、实验学家和理论化学家的跨学科团队,她意识到亟需开发一套更智能的“实验导航系统”(navigator),以从根本上解决实验与理论长期存在的“不同步”问题。

在传统科研范式下,理论通常滞后于实验:实验和数据先行积累,理论则后续跟进解释——这种“事后诸葛亮”式的分析不仅耗时,还常常错过实验过程中本可即时挖掘的关键现象。


(Nature Computational Science)

相比之下,DTCS 能够提供“边走边算、边算边改”的实时(real-time)解决方案,在实验进行中即时生成反馈,指导科学家动态调整实验方向。“这种实时能力本身就是一种革命性的改变,DTCS 使科研人员能够最大限度地提升稀缺资源的使用价值。”钱锦表示。

此外,DTCS 所提供的并非简单的数据拟合,而是真正面向反应网络的机理洞察。以往虽有一些平台尝试实时数据处理,但多依赖于统计拟合或黑箱算法,结果往往止步于“曲线匹配”,虽可在一定程度上解释实验现象,却无法真正揭示反应机制。这类方法给出的更多是“经验性结论”,而非一张可指引未来探索的“化学地图”。


(Nature Computational Science)

DTCS 通过结合“地图”(理论预测)与“实时路况”(实验观测)协同工作,具体包括两种模式:

·正向预测模式(Forward solver):输入理论计算出的化学反应网络后,DTCS 就会预测出这张网络对应的“光谱长什么样”(备注:光谱是实验的主要观测方式)。然后它把这个预测光谱和真实实验测到的光谱进行对比,如果发现不一致,就会提醒:“你的地图画错了,请校准你的理论。”

·反向解析模式(Inverse solver):输入实时观测到的实验光谱,DTCS 会反过来帮助推算最可能的反应路径。如果它发现有几条路线都可行,而现有数据还不足以分辨,它就会建议:“这里有疑点,请去这个区域再多采几张谱。”

两种模式交替运行,经过多轮迭代,实验与理论逐渐趋于一致,最终使研究人员获得准确可靠的反应路径,无需事后补救性补测大量数据。钱锦回顾道:“我们首次在复杂界面体系中借助 DTCS 成功预测光谱并经实验验证,那一刻仿佛打通了虚拟世界与真实世界的大门。”



用两种优化算法进行“智能猜测”

DTCS 直接在“化学反应网络”的层面开展工作:既能够从理论出发推导反应网络,进而生成预测光谱与实验数据进行比对(forward solver);也能够基于实验采集的光谱反向推断最可能的反应路径(inverse solver)。钱锦指出,通过这一方式所获得的并非仅仅是拟合良好的曲线,而是对反应机理的深入认知。

正是基于这些特点,DTCS 能够帮助科学家应对诸多以往“难以触及”的挑战:例如如何在有限实验时间内做出最优决策,如何在庞大数据与复杂机理间建立清晰的因果关联,以及如何最大限度减少研究者主观偏见和经验主义对实验设计的限制等等。

值得关注的是,DTCS 通过物理建模与 AI 算法,成功模拟了先进表征仪器的工作流程。其在 DTCS 的反向解析模式中,研究团队采用了一种“算-测-再算”的迭代流程,通过仪器功能(instrumentation function)量化理论预测与实验观测之间的差距。重要的是,每一次迭代都不是基于“盲猜”,而是依据当前差距作出智能化的下一步决策。


(Nature Computational Science)

在迭代过程中,Basin Hopping 和 Gaussian Process 两种算法发挥了互补的作用:Basin Hopping擅长从复杂势能面中逃离局部极小,寻找潜在的全局最优解。它帮助研究人员在广阔的解空间中高效地探索,避免困在“局部正确但全局错误”的陷阱;Gaussian Process则擅长对预测结果进行不确定性量化——在给定实验-理论差距的情况下,它能识别出哪里值得更深入计算或测量,从而有策略地指导下一步实验或计算的方向。

在实验部分,研究人员以 Ag(111)表面吸附水分子为例,首先基于理论和合理猜想构建了水分子、氧原子等含氧物质在表面的可能吸附和重排路径网络,相当于给实验画了一张“初步地图”;随后,在同步辐射站采集 O1s 光谱(氧元素 K-edge),为 DTCS 提供实时“路况”(观测数据)。

DTCS 首先通过正向预测模式识别出理论预测与实验光谱之间的差异,继而启动反向解析模式进行迭代优化:Basin Hopping 在复杂反应能量面上搜寻全局最优路径,Gaussian Process 对候选路径进行不确定性评估,从而指导下一步实验重点区域,同时利用仪器功能持续量化理论与实验间的差距,确保每一轮迭代均为“有方向的智能猜测”,而非随机尝试。


(Nature Computational Science)

经历多轮迭代后,DTCS 成功识别出不同含氧物种(包括水分子和氧原子)的稳定吸附构型及其对应的光谱特征,最终实现了理论预测与实验观测的高度一致。

这一案例不仅验证了 DTCS 平台在复杂界面体系中的实用性,也体现了它在有限实验资源下优化实验设计、揭示反应机理的能力,使平台成为探索更复杂化学体系的可靠工具。此外,尽管 Ag/H₂O 系统看似简单,但其研究结果对理解金属腐蚀、电池界面行为及催化反应等领域具有基础科学意义。

“科幻小说《雪崩》描绘了虚拟世界的无限可能,而我们的目标则是构建一个不仅高度逼真、更能切实改善科学研究方式的数字孪生系统——帮助科研人员更深入地理解化学反应、优化实验流程,并最终启发新的科学发现。”钱锦表示。

需要指出的是,尽管 DTCS 在 Ag/H₂O 系统中表现出良好的适用性,但该平台当前还存在一定局限性,如处理动态表面重构、多参考态反应、手性路径等复杂情形的能力相对有限。在未来的研究中,钱锦计划带领团队通过机器学习势函数(MLIP,machine learning interatomic potentials)加速理论计算,并开发多模态光谱输出功能,让平台能够处理更多类型的实验数据,从而通过持续提升智能化水平,更好地服务于科研和工业应用。

参考资料:

Qian, J., Jana, A., Menon, S. et al. Digital Twin for ChemicalScience: a case study on water interactions on the Ag(111) surface.Nature Computational Science(2025). https://doi.org/10.1038/s43588-025-00857-y

运营/排版:何晨龙

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。