近日,师从新晋诺贝尔化学奖得主奥马尔·亚吉(Omar M. Yaghi)、目前在美国加州大学伯克利分校读博的荣自超,带领一个跨国际的研究团队,打造出名为AIRES (algorithmic iterative reticular synthesis)的机器学习指导的高通量实验平台,在寻找一种名为沸石咪唑酯框架(ZIF)材料的晶体时,效率比随机探索的方法提高了一倍,并将已知的单连接体锌基 ZIF 材料库直接扩大三分之一,打破了领域内长达十年的停滞。
![]()
(https://doi.org/10.1038/s44160-025-00939-9)
研究中,荣自超首先使用 8 种已报道的 ZIF 连接体分子与锌离子反应,进行了共计 2688 次结晶实验。其中,反应条件(包括温度,浓度,比例)从一个预先定义的反应空间中均匀采样,借此建立了一个包含成功与失败数据的初始知识库。
![]()
(https://doi.org/10.1038/s44160-025-00939-9)
然后,他挑选了 48 种全新的、从未被做成 ZIF 单晶的连接体分子作为探索目标:
在 AIRES 组中,机器学习模型指导实验进程,仅用了大约 700 次实验就找到了 48 种新连接体中仅有的 10 种可形成 ZIF 单晶的连接体所对应的结晶条件。该效率比随机探索组提高了一倍。后者开展的是完全依靠运气的盲目尝试,结果需要大约 1,400 次实验才能达成同样的目标。
这一对比不仅说明了 AIRES 拥有较高的效率,也表明在沸石咪唑酯框架这一看似已经被高度探索的化学空间里,依然隐藏着许多等待发现的惊喜。在材料发现这一更宏观的领域中,通过 AIRES 加速发现的新框架材料,可以帮助我们从空气中收集饮用水、高效捕获导致气候变暖的二氧化碳,甚至用于制造更加清洁的能源。
荣自超告诉 DeepTech:“选择 ZIFs 的原因主要有两点:首先其结晶窗口较小,这意味着随机尝试的效率低,需要花费大量资源才能找到正确的结晶条件。而且,这一化学空间除了生成 ZIF 外,还可能出现金属有机配合物分子等其他副产物晶体。其次,对于不同的有机连接体,其成功的 ZIF 结晶条件和最终生成的 ZIF 晶体结构呈现出较强的多样性,仅凭人的直觉很难捕捉不同反应体系之间的关联。因此,这对我们验证 AIRES 平台的有效性是一个很好的挑战。”
![]()
(荣自超)
AIRES 的五个组成部分
AIRES 具备发现-学习-再发现的智能循环,由五个部分组成。
![]()
(https://doi.org/10.1038/s44160-025-00939-9)
第一是自动化合成部分:这一部分主要包含一个液体分配机器人。它像一位精确的化学厨师,可以按照指令在不同的小型反应容器中将金属盐、有机连接体和溶剂以不同的比例混合,,然后送入恒温烘箱“烹饪”。
第二是图像识别部分:反应结束之后,高清自动光学显微镜会给每个反应拍照。一个训练好的神经网络模型会迅速地扫描这些照片,判断里面是否长出合格的晶体。模型的识别依赖晶体的几何形状、颜色均匀度等特征,具有很高的晶体召回率,能够帮助人们省去大量查看图片的辛苦工作,尤其是在绝大多数结果都是失败反应的情况下,并能不遗漏包含合格晶体的照片。
第三是单晶 X 射线衍射:被上一步相中的候选晶体,会被送到衍射仪下进行最终裁决。只有这里才能给出原子级别的精确结构,从而据此来判断是否是想要的新型 ZIF 材料。
第四是数据库管理:这一部分负责将已经尝试过的反应信息(包括反应物,反应条件,反应结果)进行归纳整理。为了更好地定量不同连接体对反应结果的影响,团队通过量子化学手段设计了与实际结晶物理化学过程息息相关的描述符。
第五是算法决策:这也是 AIRES 的灵魂。在它的内部运行着机器学习模型(比如随机森林),这个模型可以从之前所有成功和失败的数据中学习,并能试图找出什么样的连接体分子特征和什么样的反应条件搭配,更有可能长出晶体。
AIRES 的目标非常明确,那就是最大化地发现新晶体的数量。因此,算法总是最优先建议实验模块去尝试那个预测成功率最高的实验。为避免重复尝试一些高度相似的成功结晶条件,一旦某个连接体成功生成了一个 ZIF 晶体,算法会及时将宝贵的实验资源用于探索其他尚未成功的连接体。
为了让 AIRES 每次能够执行更多的批量实验,团队还设计了更高级的批量选择算法。它不会简单地选择前 N 个最有可能的候选,而是会考虑候选反应们的条件结晶概率,基于此计算一批实验整体能够带来多少新的发现期望值,从而更高效地利用每次实验机会。
![]()
(https://doi.org/10.1038/s44160-025-00939-9)
什么是网格材料?为什么我们需要它们?
前面提到荣自超是亚吉的学生,亚吉课题组主要以研究网格材料而出名。以大家都熟悉的乐高积木为例,使用不同的形状和颜色的积木,可以搭建出城堡、飞船或者任何其他能够想象出来的结构。荣自超和他所在团队也在做类似的事情,但是他们使用的是原子级别和分子级别的积木。
他们使用金属原子比如锌作为连接点,使用有机分子作为“棍棒”,把它们按照精确的、重复的图案连接起来,形成一种名为金属有机框架的晶体材料。前面提到的沸石咪唑酯框架材料,便是这种材料的其中一类。
这些材料内部充满了纳米级别的孔道和通道,就像是一个结构极其精密的蜂巢,正是这些孔洞让它们拥有了以下能力:
首先,它们可以作为吸附器,可以像海绵吸水一样,有选择性地抓住空气中的水分子以用于干旱地区收集水资源,或者可以锁住工业废气中的二氧化碳以用于减缓全球变暖。
其次,它们可以作为分子筛,其所拥有的不同大小的孔洞可以只让特定的气体或液体分子通过,从而用于分离混合物,比如提纯天然气等。
再次,它们可以作为微型反应器,它们的孔洞可以作为“房间”,让化学反应在里面更高效、更清洁地警醒。
然而,要想真正让这些能力发挥作用,就必须得到高质量的晶体。这能保证框架材料内部孔结构的一致性和有序性。另一方面,通过单晶 X 射线衍射,我们能解析材料内部每个原子的精确位置,也就是给晶体拍摄一张原子级别的三维高清照片,以便能够理解它的结构,以及精准预测和设计它的性能。
发现 10 种连接体,生成 7 种不同拓扑结构
通过 AIRES 发现的 10 种连接体,生成了 11 种全新的晶体,归属于 7 种不同的拓扑结构。有些新连接体在不同于已有文献的溶剂中,形成了经典的方钠石型和方沸石型结构。
![]()
(https://doi.org/10.1038/s44160-025-00939-9)
同时,更多的连接体带来了全新的结构。例如,在由 5-溴咪唑形成的 ZIF-A6 之中,展现出一种前所未有的双层结构,两层金属节点被连接体进行了共价桥联,而这在 ZIF 化学中也是一个全新的拓扑结构。
特别值得一提的是,5-溴咪唑和 4-氰基咪唑这两种新的连接体分别形成了 crb 和 DFT 拓扑结构。而在过去,它们被认为只能由最简单的、没有任何取代基的咪唑连接体形成。现在,带有单个取代基的连接体也能搭建出这些结构,这刷新了人们对于 ZIF 结构设计的认知。
不仅如此,复杂的配位化学反应还带来了意外收获。即 AIRES 还发现了四种连接体,它们没有形成预期的三维 ZIF,而是形成了层状 ZIF。在这些结构中,溶剂分子等配角与连接体这一主角,针对金属的配位点形成了竞争,从而形成了二维层状结构,这说明 AIRES 的机器学习模型捕捉到了配位化学的一些基本规律。
参考资料:
相关论文 https://doi.org/10.1038/s44160-025-00939-9
运营/排版:何晨龙





京公网安备 11011402013531号