天天看點

基于量子化學計算和機器學習,從頭開始建立肉眼可檢測的熒光分子

編輯 | 蘿蔔皮

設計熒光分子需要考慮多種互相關聯的分子特性,而不是與分子結構直接相關的特性,例如分子的光吸收。

在這項研究中,RIKEN 進階智能項目研究中心和東京大學等機構的研究人員合作,使用從頭分子生成器(DNMG)與量子化學計算(QC)相結合來開發熒光分子,這些分子在各個學科中都引起了廣泛關注。使用大規模并行計算(1024 核,5 天),DNMG 産生了 3643 個候選分子。

研究人員選擇了一個未報道的分子和七個報道的分子并合成了它們。光緻發光光譜測量表明,DNMG 可以以 75% 的準确度(n = 6/8)成功設計熒光分子,并産生一種未報告的分子,該分子發出肉眼可檢測到的熒光。

該研究以「De novo creation of a naked eye–detectable fluorescent molecule based on quantum chemical computation and machine learning」為題,于 2022 年 3 月 9 日釋出在《Science Advances》。

基于量子化學計算和機器學習,從頭開始建立肉眼可檢測的熒光分子

簡介

熒光化合物作為可見光發射體在多個學科的應用中非常重要,包括有機發光二極管、傳感器和生物成像。盡管已經為這些和其他應用開發了許多熒光分子,但不斷需要新的分子來解決目前材料在功能、可持續性和低成本方面的缺點。即使是化學結構的細微變化也可能導緻重大改進。

熒光是一種受量子力學支配的光化學性質。然而,盡管熒光研究的曆史悠久,但沒有明确的指導方針來制造熒光分子,就像制造吸光分子一樣。

分子熒光發射的簡化實體化學機制如下圖所示。最初,研究人員認為分子處于單線态(S)狀态;在 S最小值時,它吸收光并轉變為單線态第一激發态(S1)。S1激發分子在 S1狀态下弛豫到最小值并回到 S狀态,将 S1和 S狀态之間的能量差作為光(熒光)發射。激發的分子應該在 S1狀态下移動到最小值,以便在不失活的情況下發光。

一些因素,包括與氧分子的反應、分子碰撞、分子内/分子間電子轉移和聚集,可能會在分子在激發狀态下運動時使其失活;這導緻很難将熒光與分子結構相關聯。是以,自動化熒光分子設計将是有幫助的。

基于量子化學計算和機器學習,從頭開始建立肉眼可檢測的熒光分子

圖示:熒光分子的單線态基(S0)态和單線态第一激發(S1)态的 PES 示意圖。(來源:論文)

近期,基于機器學習(ML)的從頭分子生成器(DNMG)已被開發用于設計具有簡單和可預測值的分子,例如配置設定系數(logP)的對數,可以從分子的組成部分估計。

将 DNMG 與經典模拟相結合,成功地生成了具有改進的多功能性和實用性的分子。例如,DNMG 和對接模拟的結合可用于設計生物活性分子;這是通過有機合成研究的。結合分子動力學或預測模型,DNMG 還可以指導功能聚合物的合成。

在之前的研究中,研究人員将量子化學計算(QC)與 DNMG(稱為 ChemTS)相結合,它(原則上)可以從頭設計以量子力學(QM)特性為特征的功能分子。是以,ChemTS 與 QC 相結合被應用于設計可以吸收具有所需波長的光的分子。在 86 個設計和生成的分子中,選擇了 6 個未包含在訓練資料集中的已知分子進行紫外-可見 (UV-vis) 吸收測量。結果與發生器的目标波長一緻。

此外,DNMG 增加了發現新分子的可能性,因為與傳統的高通量 QM 和使用 ML 模型篩選相比,DNMG 的搜尋區域在資料集中不受限制。研究人員還使用 QC 對 ChemTS 産生的分子進行了官能團富集分析,以最大化電子增益能量,并發現了駐極體文獻中未包含的重要官能團。

基于量子化學計算和機器學習,從頭開始建立肉眼可檢測的熒光分子

圖示:在 B3LYP/3-21G* 水準上,生成分子的 S1 狀态吸收和熒光的 OS 分布曲線。(來源:論文)

雖然相對簡單的特性,如光吸收和電子增益能量,可以直接與分子結構相關,但複雜的現象,如僅由特定分子表現出的熒光,難度要大得多。

在熒光的情況下,有必要考慮多種性質,這些性質錯綜複雜地交織在一起。這使得很難為分子結構的設計建立直覺的指導方針。為了設計實用的化合物,控制目标分子特性的複雜機制必須适當地數字化以用于 DNMG。此外,必須考慮計算成本随着探索化學空間的機制複雜性的增加而增加。

基于量子化學計算和機器學習,從頭開始建立肉眼可檢測的熒光分子

圖示:使用 ChemTS 設計的未報告的熒光分子。(來源:論文)

在這項研究中,該團隊設計了具有大規模并行化 ChemTS 版本的熒光分子。該程式包使用 QC 将熒光機制的最低要求數字化。有幾個基于電子結構理論的使用者友好軟體包可用于分子和材料的 QC。

為了平衡可靠性與計算成本,研究人員使用密度泛函理論 (DFT) (29) 來評估勢能面 (PES)。為了解決廣泛探索化學空間的計算成本,用基于虛拟損失的概念對 ChemTS 進行大規模并行化;使用 1024 個核,生成了 3643 個分子。

為了驗證,他們合成了一種未報告的化合物和幾種已報告的化合物。六種化合物,包括一種未報道的化合物,如預期的那樣發出熒光。未報道的分子可通過市售試劑之間的偶聯合成,具有意想不到的特性,盡管它由常見的片段[香豆素、吡啶和吡唑并嘧啶]組成。這表明大規模并行 DNMG 有可能引發分子設計的範式轉變。

基于量子化學計算和機器學習,從頭開始建立肉眼可檢測的熒光分子

圖示:PC的光緻過程。(來源:論文)

讨論

幾十年來,QC 在化學和材料科學中發揮了重要作用。在此期間,計算機輔助分子設計已被用于藥物發現。然而,QC 隻專注于對實驗結果的分析和推測;很少考慮諸如預測各種現象和設計材料之類的創造性工作。

ML 算法最近在化學和材料科學中的應用,代表了計算機輔助化學和材料科學的一個積極轉折點。為了自動設計對有機電子有用的分子,将 QC 與 DNMG 相結合至關重要,因為在此類應用中,量子力學不容忽視。然而,基于 QC 的 DNMG 的價值必須先得到證明,然後才能在實踐中采用。

在這項研究中,研究人員使用 DNMG 來建立具有目前無法輕易預測的特性的分子:熒光。他們使用 DFT 設計了熒光化合物,這是一種固有的量子力學方法。盡管衆所周知,分子受量子力學規則的支配,但僅憑 QC 很難從頭建立一個新分子。盡管熒光分子具有簡單的 PES,但它們很難從第一原理設計,因為它們的多樣性使得熒光與分子結構的關聯變得非常困難。

基于量子化學計算和機器學習,從頭開始建立肉眼可檢測的熒光分子

圖示:PC的光化學性質。(來源:論文)

然而,生成器處理了這種多樣性,并成功地從頭開始設計了熒光分子。基于 QC 的大量從頭計算需要大量并行計算(1024 核,5 天);盡管如此,生成器還是成功地産生了 3643 個候選分子。發生器産生吸收長波長光的分子,以類似于專業人士的方式控制分子的共轭長度;然而,它無法找到分子的熒光波長/強度與共轭長度/芳環數之間的明确相關性。這表明從頭設計熒光分子的困難。

研究人員根據可合成性和可見熒光标準,選擇了七種已知化合物進行驗證和一種候選化合物進行進一步研究。實驗驗證表明,DNMG 成功設計了 75%(八分之六)的熒光化合物。PC 的熒光(肉眼可見)證明了 DNMG 的創新潛力。

在設計 PC 時,生成器在香豆素中引入了一個不熟悉的基團吡唑并嘧啶;這種連接配接引起了高空間排斥,但仍導緻 OS 增加。

普通化學家很難想出一種通過增加片段之間的空間排斥來增強熒光及其強度的方法。這說明生成器是一種可以超越專業知識或直覺的工具。DNMG 有可能引發分子設計的範式轉變。

雖然這項工作中合成的分子的熒光旨在通過肉眼檢測,但通過消除對原子類型的限制并延長設計時間,将産生更多有趣的分子。

此外,通過包括分子的光誘導動力學,可以實作更好的分子設計。通過進一步開發 QC,可以設計出更複雜的功能分子。

是以,具有大規模并行計算的生成器将能夠建立具有多樣化和有趣功能的複雜分子,可能導緻非常複雜的合成路線,這将增加最近開發的基于 ML 的規劃逆合成路線的要求。

開源位址:

https://github.com/tsudalab/GaussianRunPack

https://github.com/tsudalab/FL_ChemTS

論文連結:https://www.science.org/doi/10.1126/sciadv.abj3906

人工智能×[ 生物 神經科學 數學 實體 材料 ]

「ScienceAI」關注人工智能與其他前沿技術及基礎科學的交叉研究與融合發展。

歡迎關注标星,并點選右下角點贊和在看。

繼續閱讀