AlphaFold2立功！清華團隊用深度學習增強新冠抗體，創AI裡程碑

新智元報道

編輯：桃子拉燕時光

【新智元導讀】AlphaFold 2的問世可謂是生物學界海嘯級地震，讓蛋白質結構預測走上另一個新階段。同時，AlphaFold的開創性方法也對其他研究産生深遠的影響。這不，清華和MIT研究團隊在最新研究中就用上了它。

2020年末，DeepMind開發的第二代深度學習神經網絡AlphaFold 2的問世震驚了結構生物學界。

AlphaFold解決了困擾科學家幾十年的蛋白質折疊問題。

最近的研究表明，AlphaFold開創的方法正在向更廣泛的生物學界蔓延。

在《美國國家科學院院刊》上發表的一篇論文Deep learning guided optimization of human antibody against SARS-CoV-2 variants with broad neutralization。

論文中，科學家描述了修改一種已知的COVID-19抗體的方式，以提高其對多種疾病變體的療效。

科學家們寫道，「我們可以使抗體寬度以及sars-cov-2變體 (包括 Delta) 的效力提高10到600倍」。他們甚至發現了該方法可以對抗奧密克戎（Omicron）變體迹象的希冀。

深度學習增強新冠抗體

這項研究是由清華大學、伊利諾伊大學厄巴納-香槟分校和麻省理工學院的研究人員共同完成，他們利用深度學習進行研究有兩個重要的原因。

一個是擴大所謂的搜尋空間，即修改抗體的一組潛在解決方案。現有的方法，例如随機突變，雖然很有價值，但費時費力。

使用深度學習是一種自動化的方法，進而加快工作速度。

其次，像随機突變這樣的方法可以在帶來好處的同時帶走抗體好的那一部分，結果可能不是最理想的。

通過使用深度學習的方法，作者希望擴充功效的同時保留已經取得的成果。

圖嵌入注意程式，用于查找對預測結合親和力具有重要意義的殘基對

他們的方法采用了AlphaFold2的基本技術: 一個圖形網絡，以及一種稱為注意力機制的變量處理方法

圖形網絡是指一些事物的集合可以根據它們之間的關系進行評估，比如社交網絡中的人。

AlphaFold 2利用蛋白質的資訊建構了一個不同氨基酸之間距離的圖表。然後通過注意力機制操縱這些圖，計算每個氨基酸與另一個氨基酸的關系。

Shan和他的同僚采取了同樣的方法，他們把這種方法應用到病毒的氨基酸、抗原以及抗體的氨基酸上。

他們将所謂的野生型與兩者的突變形式進行比較，以确定抗體與抗原的結合如何随着野生型和突變型之間的氨基酸對的變化而變化。

為了訓練一個深度神經網絡實作這一點，他們設定了一個目标。在機器學習領域被稱作目标函數，該函數正是神經網絡要複制的目标。

在這一例中，目标函數是自由能量的變化，即蛋白質中的能量從野生型變到突變型，由希臘字母delta-delta、G和ΔΔG。

給定一個目标自由能，神經網絡可以可靠地預測哪一組氨基酸配對的變化和目标自由能的變化最相符。

Shan和他的同僚表示，為了評估變異對蛋白質複合體的效果，我們首先通過重新包裝突變周圍的側鍊，預測了蛋白質複合體的結構，之後解碼了野生型和突變型複合體，并利用該網絡來獲得野生型和突變型複合體的嵌入。

之後，通過額外的神經網絡層和兩部分嵌入的比較來預測突變的影響（用ΔΔG衡量）。

雖然Shan和他的團隊提到了AlphaFold2，他們也使用了AlphaFold2所使用的方法，但他們沒用DeepMind的代碼。

麻省理工學院的Bonnie Berger是該研究的聯合作者，他表示，「關于ΔΔG預測器的研究完全是從零開始的。」

因為ΔΔG預測器和AlphaFold2都是開源的，每個人都可以親自去體驗，去看看二者的比較。ΔΔG預測器的代碼在GitHub，AlphaFold2的代碼在它自己的網站。

在訓練神經網絡預測重要的抗體和抗原之後，作者們從新型冠狀病毒的α、β和γ版本中找到抗體已經成功的證據，并據此開始進行反向工作。

他們使用這些資料來預測哪些突變的抗體能夠延長療效。

作者表示，我們的辦法生成了一個用電腦模拟的抗體CDR的突變庫，通過訓練幾何中立網絡進行排序。這樣不僅能提高抗體和Delta RBD的結合，還能維持抗體和其它所關注變體的RBD的結合。

CDR，全稱為互補性決定區，是和抗原結合的一部分或是抗體。RBD，全稱為受體結合區，是病毒上的重要靶點。

研究人員得到了雙重、三重，甚至四重的變異抗體。他們在實驗室裡用合成的病毒來測試這些抗體。他們發現，随着突變的合成，降低抗原濃度的效果越來越強。

他們得出結論，認為存在一種物質能更好的讓突變抗體和病毒相結合。

他們寫道，「有三到四次突變的抗體HX001-020、HX001-033和HX001-034也比有兩次突變的HX001-034要強。親合力的提高可能會讓這些抗體的中和活性在遇到非典或新冠的野生病毒或變體病毒時增加。」

有一個引人深思的發現是，一個突變的抗體能夠避免病毒的突變，其目的是提高效率。在一份結構分析中，他們發現原始抗體的一部分和抗原的一個特定部分擦肩而過，二者互相排斥。

這是因為抗體的粒子R103和抗原的粒子R436都有非常長的側鍊，并且都攜帶正電子，這兩種粒子之間的親和性會産生一種強大的推力，這股力量會削弱抗體和抗原之間的結合度。

科學家們替換普通的抗體粒子之後，就觀察不到R346和Delta RBD的直接作用了。該因素也許能解釋針對Delta變體的中和效果為什麼能夠大大改善。

作者們在研究的抗體正好是由Shan和他的同僚們去年引入的。這一事實讓整個研究變得更加有趣。

名叫P36-5D2的抗體是從一名患過新冠病毒的康複患者的血清中提取出來的。Shan和他的團隊通過動物模型研究，發現這種抗體是一種适用面廣、有效、具有保護性的抗體。

是以，這項新研究标志着人工智能領域的一個裡程碑。即借助電腦，把傳統的生物産品進行改進，進而擴充傳統的生物安全實驗室治療傳染性疾病的辦法。

AlphaFold足以改變人類？

2021年年底，人工智能預測蛋白質結構AlphaFold被評Science評為2021十大科學突破之首。

人工智能正在催生新的科研範式，AI for Science已經成為許多科學家的共識。

長期以來，蛋白質都是生命科學工作者研究的重點。

因為蛋白質是生命活動的主要承擔者，甚至毫不誇張的說，沒有蛋白質就沒有生命。

而其中，蛋白質的結構更是衆多生命科學工作者研究的熱點，畢竟其主要功能是由結構決定的。

2020年，AlphaFold2的問世成為生物學界海嘯級的地震。

緊接着DeepMind開源了AlphaFold2，并能夠預測出98.5%的蛋白質結構，讓學術圈再次沸騰。

不僅如此，研究人員還将其做成了資料集，将其免費開放。

對蛋白質進行系統深入的研究，能讓人類從更深層次诠釋生命體的構成和運作變化規律，進而全面揭示生命運作、發展的機制，激發生物科學、藥物研發、合成生物學方面的發展。

另一方面，将人工智能方法應用到蛋白質預測，可以讓科研人員從中得到許多借鑒，站在神經網絡與深度學習的技術巨人的肩膀上，推動生物界的發展與研究。

「AI+生物」團隊強強聯合

可以說，清華這個「AI+生物」的打造，是目前新冠中和抗體研究打造的最佳團隊。

它充分利用了清華大學的校内科研資源優勢，聯合清華大學醫學院與清華大學智能産業研究院（AIR），進行強強聯合，「AI+生物」集中攻關。

張林琦教授，來自清華大學醫學院，是該研究的領銜人物之一。

此前，張林琦教授一直緻力于挖掘新冠免疫保護機制，開創藥物和疫苗研發。

據清華大學醫學院官網介紹，張林琦教授于1992年獲得英國愛丁堡大學分子病毒學博士學位，之後在美國紐約大學和洛克菲勒大學擔任助理教授和副教授，2007年全職任教于清華大學，現為清華大學醫學院長聘教授，北京協和醫學院兼職教授，博士生導師，清華大學艾滋病綜合研究中心主任。

張林琦教授是首位中國籍非洲科學院院士，于2016年當選。

2014年非洲爆發了大規模的埃博拉病毒，作為國内外傳染病研究專家，張林琦教授帶着一名研究人員的初心和使命，緻力于病毒研究。

然而，新冠病毒的肆虐遠比我們想象地要猖狂！

面對這樣的困境，研究人員毫不畏縮，大膽嘗試，将計算機科學前沿成果與研究方法運用到傳統生物研究上。

彭健，清華大學智能産業研究院進階通路教授，同樣是該研究的領銜人物之一。

彭健博士的主要研究領域為資訊學，他從生物化學領域找到了學科交叉點，在生物資訊學、化學資訊學和機器學習方面，包括蛋白質結構預測技術的關鍵測試（CASP），及轉化醫學和藥物基因組學的DREAM 挑戰等，取得了備受矚目的成就。

清華AIR引領人工智能賦能生命科學，這是吸引彭健博士加入清華大學智能産業研究院的重要原因

此前，彭健于2013年獲芝加哥大學豐田技術學院計算機科學博士，接着，在MIT計算機科學與人工智能實驗室從事博士後研究，然後，擔任美國伊利諾伊大學厄巴納-香槟分校計算機科學系副教授。

彭健說：「交叉學科人才的培養尤其重要」！這不，加入不到1年時間，就已開花結果。

參考資料：

https://www.med.tsinghua.edu.cn/info/1049/3926.htm

https://air.tsinghua.edu.cn/info/1001/1005.htm

https://www.zdnet.com/article/mit-and-tsinghua-scholars-use-deepminds-alphafold-approach-to-boost-covid-19-antibodies/

AlphaFold2立功！清華團隊用深度學習增強新冠抗體，創AI裡程碑

繼續閱讀

《我是領袖》AI人工智能探索未來

抓住人工智能這個“牛鼻子”，加快培育發展新質生産力

觀點｜人工智能時代博物館如何緻力于教育和研究

人工智能發展如何影響勞動力就業

2024 年十大人工智能晶片制造公司

人工智能的原理是什麼？

馬斯克：給我特斯拉25%股份，否則剝離人工智能和機器人技術

中科彙聯2024第五屆科創彙聯人工智能發展高峰論壇在京圓滿落幕

科技巨頭積極布局AI領域！微軟将召開年度開發者大會，或透露人工智能PC計劃

醫學人工智能向“新”而行

李開複：預測到2027年人工智能将取代50%的工作

美國家标準與技術研究所啟動“人工智能風險和影響評估”計劃

中美十字路口下，人工智能的“加速追趕”與“何時暫停”｜BEYOND Expo 2024

數字法治｜劉憲權：生成式人工智能的發展與刑事責任能力的生成

當基礎教育擁抱人工智能

AI 人工智能與殘障人士