天天看點

有效識别 63 萬個三維空間構型,清華大學牽頭釋出 Uni-MOF 模型

作者:HyperAI超神經

工業世界裡,高純氣體被廣泛應用于半導體制造、光纖生産、科學研究、醫療健康、環保能源等諸多領域。例如,半導體行業,高純氣體是晶片制造的關鍵原材料,直接影響着內建電路的性能和良率。

制備高純氣體的關鍵挑戰便是氣體分離,常見的氣體分離方法有深冷法(精餾原理)、吸附法(分子極性)、膜法(膜過濾)等。其中,金屬有機架構 (MOFs) 由于具有高度有序的孔結構和可調節的孔徑大小,在氣體吸附存儲與分離方面展現出巨大的應用潛力。相關人士預測,MOFs 對 21 世紀的重要性可能與塑膠對 20 世紀的重要性一樣。

然而準确預測 MOFs 吸附能力仍面臨諸多挑戰,針對這一問題,清華大學化工系盧滇楠教授團隊,聯合美國加州大學河濱分校吳建中教授和北京科學智能研究院高志鋒研究員,近日在 nature communications 釋出了題為「A comprehensive transformer-based approach for high-accuracy gas adsorption predictions in metal-organic frameworks」的最新論文。

本研究提出一種三維 MOF 材料吸附行為預測的機器學習模型 Uni-MOF,用于預測各類工況下納米多孔材料對各類氣體的吸附性能,這是材料科學領域在機器學習技術應用方面的重大突破。

研究亮點:

* Uni-MOF 架構是一種多功能解決方案,可用于在不同條件下預測 MOF 的氣體吸附能力

* Uni-MOF 不僅可以通過預訓練識别和恢複納米多孔材料的三維結構,還進一步考慮了溫度、壓力和不同氣體分子等操作條件,這使得其既适用于科學研究又适用于實際應用

* 通過利用其他氣體的吸附資料,Uni-MOF 準确預測了未知氣體的吸附性能

有效識别 63 萬個三維空間構型,清華大學牽頭釋出 Uni-MOF 模型

論文位址:

https://www.nature.com/articles/s41467-024-46276-x

關注公衆号,背景回複「吸附」擷取完整 PDF

資料集:現有資料庫 + 程式生成資料

本研究中,用于預訓練的 MOF/COF 結構主要來源于兩方面——從目前可用的資料庫中收集,或使用相應的程式生成。

目前存在大量的 MOF/COF 資料庫,包括計算合成的 hMOFs50 資料庫,基于拓撲結構的晶體構造程式 (ToBaCCo) MOFs,以及實驗級别的 CoRE(計算就緒實驗)MOFs51,CoRE COFs52 和 CCDC(劍橋晶體學資料中心)等。

此外,線上內建資料庫 MOFXDB 中提供了超過 168,000 個 MOF/COF 結構。除了在材料庫中探索納米多孔材料外,研究人員還使用了 ToBaCCo.3.0 程式,生成了超過 306,773 個 MOF 結構。

對于下遊任務,即 MOFs 對氣體的吸附吸收,研究人員從 MOFXDB 等線上來源收集資料,形成了超過 240 萬個 hMOFs 對五種氣體 (CO2、N2、CH4、Kr、Xe) 在 273/298 K 和 0.01–10 Pa 條件下的吸附資料集,以及超過 46 萬個 CoRE MOFs 對兩種氣體 (Ar、N2) 在 77/87 K 和 1–105 Pa 條件下的吸附資料集。

此外,研究人員還使用 RASPA54 軟體進行了 Grand Canonical Monte Carlo (GCMC) 53 模拟,産生了另外超 9.9 萬個氣體吸附吸收資料集,其中 5 萬個初始化循環和額外的 5 萬個循環用于吸附容量樣本。收集的吸附資料是在 150–300 K 和 1 Pa–3 bar 範圍内獲得的,考慮了 7 種氣體分子 (CH4、CO2、Ar、Kr、Xe、O2、He)。

模型架構:預訓練+多任務預測微調

Uni-MOF 架構包括對三維納米孔晶體的預訓練和在下遊應用中進行多任務預測的微調。

有效識别 63 萬個三維空間構型,清華大學牽頭釋出 Uni-MOF 模型

Uni-MOF 架構示意概覽

在模型的預訓練階段,研究人員實施了兩類任務以提升模型性能。

第一類任務為預測被遮蔽原子的類型,即識别并預測在分子結構中被掩蓋部分的原子種類。第二類任務為執行噪聲下的三維坐标恢複任務,具體操作為在 15% 的原子坐标上引入範圍在 [-1Å,+1Å] 之間的均勻噪聲,進而基于這些受損坐标來計算空間位置編碼。

這兩類任務旨在增進模型對資料的抗幹擾能力,進而在面對後續的預測任務時,提供更加精準的性能。

在微調階段,研究人員使用了約 3 百萬個标記資料點,涵蓋了 MOFs 和 COFs 在各種吸附條件下的情況,進而實作了吸附容量的準确預測。

通過跨系統目标資料的多樣資料庫,經過微調的 Uni-MOF 能夠預測 MOFs 在任意狀态下的多系統吸附性能,包括不同的氣體、溫度和壓力。是以,Uni-MOF 是一個統一且易于使用的架構,可用于預測 MOF 吸附劑的吸附性能。

研究結果:Uni-MOF 架構在材料科學領域具有廣泛應用

首先,研究人員驗證了 Uni-MOF 的預測能力。

預測結果表明,當應用于具有充足資料和相對集中操作狀态的資料庫時,如 hMOF_MOFX_DB 和 CoRE_MOFX_DB,Uni-MOF 表現出非常高的穩健性,其 R² 值分别為 0.98 和 0.92。在分布廣泛的資料集 CoRE_MAP 上,Uni-MOF 的預測精度達到 0.83,仍然可以實作出色的預測準确度,展示了其良好的泛化能力。

有效識别 63 萬個三維空間構型,清華大學牽頭釋出 Uni-MOF 模型

Uni-MOF 在大規模資料庫中的整體性能

其次,研究人員将 Uni-MOF 的預測結果與實驗收集結果進行了比較。

研究人員發現,Uni-MOF 架構僅基于低壓條件下的預測吸附容量,就能夠準确篩選出高性能吸附劑。值得注意的是,其在低壓條件下的許多預測值與實驗值存在顯著偏差,特别是在 Mg-dobdc 和 MOF-5 的情況下。但即便如此,在諸多材料之中,Uni-MOF 架構的預測準确度依然名列前茅,這使得其适用于解決工程挑戰。

有效識别 63 萬個三維空間構型,清華大學牽頭釋出 Uni-MOF 模型

基于低壓預測和高壓實驗值的吸附等溫線 每條曲線表示 Langmuir 拟合

第三,研究人員驗證了 Uni-MOF 在跨系統特性方面的預測能力。

試驗結果顯示,Uni-MOF 在預測未知氣體的吸附能力方面表現出了魯棒性,對氪實作了 0.85 的高預測精度 (R²),對所有未知氣體的預測精度均高于 0.35。與單一系統任務相比,Uni-MOF 架構在跨系統資料集上表現出了優越的性能,并且可以準确預測未知氣體的吸附性能,顯示出其強大的預測能力和普适性。

有效識别 63 萬個三維空間構型,清華大學牽頭釋出 Uni-MOF 模型

Uni-MOF 跨系統預測案例

另外,為評估該模型在結構識别方面的能力,研究人員以 hMOF-5004238 為例分析了材料結構内部的原子間互相作用力,證明 Uni-MOF 在識别超過 63 萬個三維空間構型及其原子間連接配接關系上的有效性,突顯了該模型的通用性和廣闊的應用前景。

總而言之,Uni-MOF 架構是 MOF 材料的多功能預測平台,作為 MOFs 的氣體吸附預測器,它在預測各種操作條件下的氣體吸附中表現出高精度,并在材料科學領域具有廣泛的應用。更重要的是,Uni-MOF 在材料科學領域的機器學習技術應用方面取得了重大突破。

發現—設計—優化,AI 全面加速材料科學

材料科學是一門關乎發現、設計和制造新材料的重要學科,其在各個領域都具有極其重要的作用。從醫療保健到能源儲存,從環境保護到資訊技術,材料科學的發展對于解決當今社會面臨的各種挑戰至關重要。

随着技術的不斷進步,我們正處于一個材料科學革命的時代,新材料的湧現為人類提供了解決問題的新途徑和新工具。随着對材料特性和結構的深入了解,我們有望創造出更輕、更堅固、更節能的材料。

人工智能技術可以加速新材料發現、提升材料性能、降低研發成本,近年來在材料科學領域呈現出巨大的應用潛力。

* 材料發現與設計:

人工智能技術可以通過高效的資料挖掘和模式識别,加速新材料的發現和設計過程。例如,利用機器學習算法可以對大量已知材料的結構和性能進行分析,進而預測出具有特定性能的新材料。這種方法可以大大縮短材料篩選的時間,并降低試驗成本。

2023 年 11 月底,Google DeepMind 在 Nature 雜志發表了論文稱,開發了用于材料科學的人工智能強化學習模型 Graph Networks for Materials Exploration (GNoME),并通過該模型和高通量第一性原理計算,尋找到了 38 萬餘個熱力學穩定的晶體材料,相當于「人類科學家近 800 年的知識積累」,極大加快了發現新材料的研究速度。

(點選檢視詳細報道:DeepMind 釋出 GNoME,利用深度學習預測 220 萬種新晶體)

* 材料性能預測:

人工智能技術可以建立高效的預測模型,用于預測材料的性能和行為。這些模型可以基于大量的實驗資料或模拟結果進行訓練,進而提供對材料性能的準确預測。例如,利用機器學習算法可以預測材料的力學性能、熱學性質和電子結構等,為材料設計和應用提供重要參考。

* 材料優化和設計:

人工智能技術可以通過對材料結構和性能進行智能優化,提高材料的性能和穩定性。例如,利用強化學習算法可以在材料制備過程中實作自動優化,進而實作材料性能的最大化。

* 材料工藝控制與監測:

人工智能技術可以用于優化材料制備過程,并實作對材料生産過程的智能監測和控制。例如,利用機器學習算法可以分析材料制備過程中的各種參數和條件,優化工藝流程,提高生産效率和材料品質。同時,人工智能技術還可以實作對材料生産過程的實時監測和預警,幫助提前發現和解決潛在問題,降低生産風險。

人工智能技術在材料科學領域的應用已經取得了一系列重要進展,為材料的發現、設計、優化和制備提供了新的思路和方法。未來,科學家們可以利用AI技術更好地預測材料的性能、模拟分子的結構、優化材料的設計、探索材料的性質等等……進而持續推動材料科學領域的進步和創新。

參考資料:

1.https://www.nature.com/articles/s41467-024-46276-x#Sec11

2.https://www.sohu.com/a/753459278_661314

3.https://www.tsinghua.edu.cn/info/1175/110086.htm

繼續閱讀