当前位置: 首页 » 资讯 » 新科技 » 正文

上交团队研发 CGformer:驱动新一代材料研发“加速器”

IP属地 中国·北京 编辑:朱天宇 DeepTech深科技 时间:2025-09-06 20:19:55

传统材料研发往往需要数年甚至数十年的“试错”实验,成本高昂且效率低下。如今,人工智能正在改变这一局面,它强大的计算和筛选能力,有望将研发周期从“年”缩短至“天”。然而,在实际应用中,现有的 AI 模型却普遍存在一个根本性缺陷——“近视”。

为了攻克这一难题,上海交通大学人工智能与微结构实验室(AIMS-Lab)李金金教授团队开发了一种名为 CGformer 的全新 AI 材料设计算法。该算法从根本上革新了 AI 模型处理晶体结构信息的方式,显著提升了新材料性能预测的精准度。

日前,相关成果以《CGformer:基于全局注意力机制增强的晶体图 Transformer 网络用于材料性能预测》(CGformer: Transformer-enhanced crystal graph network with global attention for material property prediction)为题发表于Matter

“我们开发这个新算法,是为了解决现有 AI 在设计新材料时的一个根本性缺陷——‘近视’问题,”李金金向 DeepTech 解释道。她将当时主流的 AI 材料设计模型,如应用广泛的晶体图神经网络(CGCNN, Crystal Graph Convolutional Neural Network),比作一个脸贴在巨画上的人,“只能一小块一小块地看,无法退后一步看到整幅画的全貌。”


(上海交通大学人工智能与微结构实验室)

具体来说,CGCNN 这类模型的核心工作方式是让每个原子与其紧邻的几个原子“对话”,信息只能在局部邻居之间传递。然而,材料的许多关键宏观性能,例如电池中离子的传输效率,恰恰是由原子之间长距离、全局性的相互作用决定的。如果 AI 模型是个“近视眼”,它就无法捕捉这些决定性的全局信息,做出的性能预测精度自然会大打折扣,甚至可能导致研发方向的错误。

CGformer 的诞生,源于一个明确的需求和一个前沿的工具。需求端是团队深刻认识到晶体图网络的“近视”缺陷是制约其发展的核心瓶颈;而在工具端,他们看到了在自然语言处理等领域大放异彩的 Transformer 架构。Transformer 的核心优势在于其“全局注意力”(Global Attention)机制,能够高效处理长程依赖关系,这与材料科学中需要解决的长程原子相互作用问题不谋而合。


图丨工作流程图(Matter)

“我们将这种先进的全局注意力范式,创造性地引入到晶体结构预测中,与 CGCNN 所代表的晶体图表征方法进行深度融合,”李金金说。CGformer 由此诞生,它在晶体结构内部建立了一个“全息通讯网络”,允许图中的每一个原子在一步之内,直接与所有其他任何一个原子进行信息交互,无论它们之间相隔多远。这就好比把“邻里间的窃窃私语”升级成了“覆盖全场的同步广播”。

不过,将两种看似不同领域的 AI 技术结合起来并不简单。最大的技术挑战在于如何让 Transformer 的注意力机制“理解”晶体结构的物理信息。一个普通的图结构没有三维空间和化学键这些物理概念。

为了解决这个挑战,团队独创性地设计并集成了多种物理编码,包括告诉模型原子间真实空间位置和距离关系的“空间编码”,让模型理解每个原子在整个晶体拓扑结构中重要性的“中心性编码”,以及将化学键类型、长度等特征纳入计算的“边编码”。通过这次深度改造和创新,CGformer 既保留了晶体图在描述材料结构上的物理直观性,又通过全局注意力机制,具备了前所未有的全局信息处理能力。


图丨 CGformer 架构示意图(Matter)

为了验证新算法的实际性能,团队选择了一个极具挑战性的研究体系——高熵材料。所谓“高熵”材料,是在同一个晶体位置上同时引入多种(通常为四种或更多)不同元素,进行“鸡尾酒式”混合掺杂的材料设计策略。这种多元素混合极大地增加了材料内部的“混乱度”(即构型熵),但这种高度的无序状态,反而可能带来更稳定的结构和更优异的性能。

选择高熵材料,李金金解释说,这既是因为其复杂的结构和性能高度依赖全局作用,是检验 CGformer“全局视野”能力的终极考场;也是因为这类材料的有效数据极其稀缺,可以严苛地检验算法在小样本条件下的学习能力。更重要的是,高熵材料在固态电解质等储能领域展现出巨大应用潜力,一旦突破将价值重大。

在高熵钠离子固态电解质(HE-NSEs, High-entropy Na-ion Solid-state Electrolytes)的研究中,CGformer 展现出了卓越的性能。与 CGCNN 相比,CGformer 在预测精度上实现了 25% 的平均绝对误差(MAE, Mean Absolute Error)降低。更重要的是,研究团队利用 CGformer 从一个包含 148,995 个潜在候选材料的巨大化学空间中,成功筛选出 18 种最有应用前景的材料。


图丨 CGformer 与 CGCNN 效果对比图(Matter)

团队通过严格的筛选流程最终将化学空间缩小到近千个相对稳定的结构。之后,利用无监督分层聚类方法,这些结构被分为 20 个小组,其中一组因包含最高比例的低离子迁移能垒结构而被确定为重点研究对象。

实验结果证明了 CGformer 的出色能力。研究团队成功合成了 6 种由 CGformer 预测出的顶级候选材料,并通过 X 射线衍射、扫描电镜能谱分析和阻抗谱等技术手段进行了全面表征。结果显示,所有材料均形成了预期的单相 NASICON 结构,其室温下的钠离子电导率达到了 0.093 至 0.256mS/cm 的范围,性能显著优于未经过高熵设计的对照样品。


图丨所选 HE-NSEs 的实验验证(Matter)

在看到这个结果时,整个团队都相当振奋,“当计算模型告诉你这 6 种材料最好,而你最终在实验中证实了这一点时,这种从数字世界到物理世界的完美闭环,是对我们工作最大的肯定”,李金金表示。

而这项成果的意义不仅在于找到了几种新材料,更重要的是,团队建立了一个可扩展、可迁移的框架,让材料发现的过程变得更快、更高效、更系统化。在产业应用方面,这个平台最直接的价值就是成为新一代材料研发的“加速器”,用于快速筛选下一代固态电解质、高性能正负极材料,其可迁移性还意味着能够应用到热电材料、光催化剂等其他先进功能材料的探索。

放眼全球,“AI+材料”正成为驱动下一代技术变革乃至产业革命的核心引擎之一,并已成为全球科技竞争的前沿阵地。

而在这场竞争中,中国正处在一个高速发展和奋起直追的阶段。李金金以团队的工作为例,指出中国的研究力量正致力于从根源上进行算法创新,去解决材料科学中的基础性、瓶颈性问题。“这代表了我们在这一交叉领域,正从‘应用’走向‘创造’,致力于掌握核心能力。”

当然,她也坦言,在通用数据库建设、软件生态成熟度等方面仍面临挑战,但这些差距正在快速缩小。更重要的是,像 CGformer 这样的研究,正是中国为解决全球性共同挑战所贡献的“中国方案”。通过持续的源头创新,中国有能力在这个决定未来的赛道上,扮演越来越重要的角色。

参考资料:

1.https://www.cell.com/matter/abstract/S2590-2385(25)00423-0

运营/排版:何晨龙

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。