
作者 | 论文团队
编辑丨ScienceAI
过去几年,谷歌、微软等公司陆续展示了生成式人工智能在材料科学中的潜力。不同于传统「先提出材料、再逐个测试」的方式,人工智能可以从目标性能出发,反向生成可能满足条件的新材料,从而大幅加快材料发现过程。
不过,对于一些数据极度稀缺、结构约束又非常严格的材料体系,现有生成式人工智能往往难以真正发挥作用。二维有机 — 无机杂化钙钛矿就是一个典型例子。
这类材料被广泛认为是下一代太阳能电池的重要候选体系之一。其中,二维 DJ 相钙钛矿因其特殊的结构稳定性和光电性能受到关注。然而,目前已知可用于二维 DJ 相钙钛矿的有机分子只有几十种,如果不加结构约束,小有机分子的潜在化学空间可达 约 10^60 量级;而二维 DJ 相钙钛矿对有机间隔阳离子的结构要求又非常严格,使得这一体系既「空间巨大」,又「可行区域狭窄」。
如何在如此庞大、却又高度受限的化学空间中高效寻找可行材料,一直是「人工智能赋能科学发现」面临的重要挑战。
近期,来自香港理工大学、新南威尔士大学等机构的吴韬、殷骏等团队在《Science Advances》发表了一项人工智能辅助反向设计研究,尝试为这一问题提供新的解决思路。

研究团队提出了一种面向二维 DJ 相钙钛矿的分子指纹框架。该框架能够将有机分子编码为一种可逆的数字指纹,使人工智能可以在严格结构约束下,更高效地搜索潜在可行材料。
与传统分子嵌入表示不同,这一分子指纹不仅可以作为人工智能模型的输入,还能够重新映射回真实的有机分子结构。换句话说,人工智能不再只是「理解」材料结构,而是开始具备从目标性质出发、反向生成有机分子的能力。
值得注意的是,这项研究并不是简单套用大模型「凭空生成分子」,而是通过将化学知识编码进可逆分子指纹,让 AI 在严格受限的结构空间中进行目标驱动搜索。

图一:面向目标能级与制备可行性的二维 DJ 相钙钛矿人工智能辅助反向设计流程。
整个分子指纹由 12 个描述符构成,用于刻画芳香环数量、连接链长度、铵基位置、杂原子取代以及侧链结构等关键分子特征。这些描述符既保留了二维钙钛矿所需的重要结构信息,也让庞大的化学空间探索变得更加可控。

图二:二维 DJ 相钙钛矿有机间隔阳离子的可逆分子指纹表示方法。
基于这一理论框架,研究团队从仅有的 21 个已知 DJ 相有机分子出发,通过分子结构变形不断扩展化学空间,最终创建出一个包含近 500 万个假象有机分子的候选空间。

图三:高通量数据生成与能级排列分析。
在获得百万级候选分子空间后,研究人员进一步结合高通量第一性原理计算与可解释机器学习,对候选材料的能级排列进行预测和筛选。

图四:机器学习模型性能与分子结构特征影响分析。
其中,可解释机器学习不仅用于提高筛选效率,也帮助研究人员理解哪些分子结构特征会显著影响 HOMO 和 LUMO 能级,从而为后续分子设计提供更清晰的结构 — 性能关联。
不过,对于材料发现而言,找到「理论上性能合适」的分子还远远不够。为了避免人工智能只给出「理论上可能、实验上很难实现」的候选分子,研究团队进一步引入了制备可行性筛选。该步骤不仅关注有机分子本身是否容易合成,也评估其是否有可能形成稳定的二维 DJ 相钙钛矿结构。

图五:面向二维 DJ 相钙钛矿制备可行性的两步筛选流程。
最终,人工智能从海量候选中锁定了 56 个具有目标能级匹配关系的潜在分子候选。其中包括此前较少被系统研究的 Type Ib、Type IIa 和 Type IIb 能级结构,为二维钙钛矿材料设计提供了新的候选方向。

图六:反向设计得到的 Type Ib、Type IIa 和 Type IIb 能级排列二维 DJ 相钙钛矿候选材料。
相比传统「暴力筛选」模式,这种反向设计流程更像是一种「目标驱动搜索」。研究者不再需要先提出分子,再逐一测试其性能;而是可以先定义目标能级、目标能带排列和目标功能,再由人工智能反向寻找最可能满足条件的分子结构。
这项工作回应了人工智能辅助材料发现中的一个关键难题:在数据稀缺、结构约束严格的材料体系中,如何让模型真正参与到材料设计过程,而不仅仅是进行性质预测。通过构建可逆分子指纹,该研究在人工智能与材料科学之间搭建了一座新的桥梁。
除了太阳能电池,这一框架未来还有望进一步扩展到有机半导体、金属有机框架材料、杂化材料以及分子电子学等更广泛的材料体系中。
上一篇:赛帕斯汽车申请二维码校验管理专利,解决了重复赋码的问题
下一篇:没有了