天天看點

AI可以改寫基因組嗎?首次由AI從頭設計的基因編輯器成功編輯DNA

作者:ScienceAI
AI可以改寫基因組嗎?首次由AI從頭設計的基因編輯器成功編輯DNA

編輯 | 凱霞

生成式 AI 可以對話、寫詩、畫圖、做視訊、作曲、寫代碼......

那麼,AI 可以改寫人類基因組嗎?

現在,新的 AI 技術正在為可編輯 DNA 的微觀生物機制繪制藍圖,這預示着未來科學家将以更高的精度和速度對抗疾病。

近日,美國 AI 蛋白質設計初創公司 Profluence 推出了 OpenCRISPRTM 計劃,釋出了世界上第一個開源的 AI 生成的基因編輯器。

Profluence 展示了通過 AI 從頭開始設計的可定制基因編輯器,對人類基因組的首次成功精确編輯。

該技術基于驅動 ChatGPT 的相同方法。正如 ChatGPT 通過分析維基百科文章、書籍和聊天記錄來學習生成語言一樣,Profluent 的技術在分析大量生物資料,包括科學家已經用來編輯人類 DNA 的微觀機制,然後建立了新的基因編輯器。

相關研究以「Design of highly functional genome editors by modeling the universe of CRISPR-Cas sequences」為題,于 2024 年 4 月 22 日釋出在預印平台 bioRxiv 上。

AI可以改寫基因組嗎?首次由AI從頭設計的基因編輯器成功編輯DNA

論文連結:https://doi.org/10.1101/2024.04.22.590591

OpenCRISPR-1 是一款 AI 建立的基因編輯器,由類似 Cas9 的蛋白質和引導 RNA 組成,完全使用 Profluence 的大語言模型 (LLM) 開發。

通過 OpenCRISPR 的訓練過程,該公司的 AI 從大規模序列和生物背景中學習,生成數百萬種自然界中不存在的多種 CRISPR 類蛋白質,進而以指數方式擴充了幾乎所有已知的 CRISPR 家族。

AI可以改寫基因組嗎?首次由AI從頭設計的基因編輯器成功編輯DNA

OpenCRISPR-1 的結構分析。

為了實作技術民主化,Profluence 推出了 OpenCRISPR-1 作為初始開源版本,使 AI 設計的基因編輯器可以免費獲得倫理研究和商業用途的許可。

Profluence 聯合創始人兼首席執行官 Ali Madani 表示:

「嘗試用 AI 設計的生物系統編輯人類 DNA 是一項科學登月計劃。我們的成功預示着未來,AI 可以精确設計所需的内容,來創造一系列定制的疾病療法。為了刺激基因編輯領域的創新和民主化,以推動未來向前發展,我們正在開源該計劃的産品。」

探索全部蛋白序列變異,AI 隻需幾小時

到目前為止,蛋白質工程界通常依靠基于發現的方法來從自然界複制功能性蛋白質,或通過稱為定向進化的過程進行疊代修改。許多轉化蛋白都是偶然發現的。

CRISPR-Cas9 基因編輯系統的核心組成部分是 Cas9 蛋白,它是一種 RNA 引導的核酸酶,可以搜尋人類基因組中的全部 30 億個核苷酸,并僅在一個特定位點進行切割。

這種核酸酶與單向導 RNA(sgRNA)結合在一起,sgRNA 由一個支架組成,它在結構上與蛋白質互相作用,間隔序列可以被程式設計為靶向基因組中的任何位置。

AI可以改寫基因組嗎?首次由AI從頭設計的基因編輯器成功編輯DNA

CRISPR-Cas 圖譜的形成。

鑒于大多數 Cas9 蛋白的長度超過 1000 個氨基酸,總體設計空間包含 20^1000 個可能的序列,這比可觀測宇宙中的原子數量多幾個數量級。然而,由于這些蛋白質必須以精确的順序協調許多互相作用才能實作精确切割,是以即使是單個錯誤的突變也可以完全破壞蛋白質功能。

通過實驗探索所有可能的序列變異需要很多很多的時間,但在幾個小時内,AI 系統就可以在這個搜尋空間中導航進而發現功能性基因編輯器。

語言模型生成多種 CRISPR-Cas 蛋白

生成蛋白質語言模型通常是在涵蓋廣泛功能的大型、多樣化的天然蛋白質序列資料集上進行預訓練的。它們可以生成反映天然蛋白質特性的真實蛋白質序列。然而,對于特定的應用,例如新型基因編輯器的生成,我們需要引導生成特定的感興趣的蛋白質家族。

為此,Profluence 的研究團隊進行了詳盡的資料挖掘,來建構迄今為止最廣泛的 CRISPR 系統資料集。将此資源稱為 CRISPR-Cas Atlas。

總而言之,研究發現了 510 萬個 CRISPR-Cas 蛋白,将這些系統的已知自然多樣性總體擴充了 2.7 倍,特别是 Cas9 擴充了 4.1 倍。

為了生成新型 CRISPR-Cas 蛋白質,研究人員在 CRISPR-Cas Atlas 上訓練了蛋白質語言模型。從這個模型中生成了 400 萬個序列,并使用生物資訊學技術去除簡并序列并鑒定每個生成的蛋白質屬于哪個 CRISPR-Cas 家族。與 CRISPR-Cas Atlas 中發現的天然蛋白質相比,這組過濾後的生成序列的多樣性擴大了 4.8 倍。

AI可以改寫基因組嗎?首次由AI從頭設計的基因編輯器成功編輯DNA

通過蛋白質簇的數量來衡量,生成的序列極大地擴充了 CRISPR 相關蛋白質家族的多樣性。

生成的基因編輯器在人類細胞中發揮作用

研究人員進一步将注意力集中在 CRISPR-Cas9 系統上,并根據 CRISPR-Cas 圖譜中的 238,917 個 Cas9 蛋白訓練了蛋白質語言模型。

鑒于 SpCas9 的廣泛采用和臨床成功,使用模型來生成可與 SpCas9 互操作的 Cas9 類蛋白。換句話說,它們結合基因組的相同部分(PAM)并與相同的 sgRNA 相容;是以,它們可用于相同的應用程式。

然後,從這些生成的序列中選擇了 48 個,用于對人類細胞進行嚴格的功能表征。OpenCRISPR-1 在靶标位點上的活性與 SpCas9 相當(OpenCRISPR-1 的編輯為 55.7%,SpCas9 的編輯為 48.3%),但令人驚訝的是,脫靶位點的編輯減少了 95%(OpenCRISPR-1 的編輯率為 0.32%,而 SpCas9 的編輯率為 6.1%)。

此外,OpenCRISPR-1 是一種高度新穎的蛋白質:它距離 SpCas9 有 403 個突變,距離 CRISPR-Cas 圖譜中的任何天然蛋白質有 182 個突變。

AI可以改寫基因組嗎?首次由AI從頭設計的基因編輯器成功編輯DNA

多種生成的核酸酶(綠色),包括 OpenCRISPR-1(深綠色),具有與 SpCas9(藍色)相當或更高的在靶活性,但脫靶活性低得多。

接下來,研究證明,當與脫氨酶配對時,OpenCRISPR-1 和 SpCas9 在精确編輯靶标基因組中的單個堿基時具有相似的活性和特異性。此外,能夠通過使用另一個經過 Profluence 訓練的蛋白質語言模型生成的脫氨酶來保持堿基編輯活性,同時提高特異性。

AI可以改寫基因組嗎?首次由AI從頭設計的基因編輯器成功編輯DNA

當使用 ABE8.20(一種高活性工程脫氨酶)以及研究所學生成的脫氨酶 PF-DEAM-1 和 PF-DEAM-2 進行堿基編輯時,OpenCRISPR-1 的功能與 SpCas9 非常相似。

最後,為了進一步優化生成的核酸酶的活性,研究人員還訓練了一個模型來為任何給定的 Cas9 類蛋白生成相容的 sgRNA。與 SpCas9 的 sgRNA 相比,這些生成的 sgRNA 可以提高所測試的 5 種蛋白質中的 4 種生成的核酸酶的活性。

AI可以改寫基因組嗎?首次由AI從頭設計的基因編輯器成功編輯DNA

對于測試的 5 種生成的核酸酶中的 4 種,使用模型生成的 sgRNA 提高了編輯效率。

OpenCRISPR-1 隻是冰山一角

研究展示了世界上首次使用基因編輯系統成功編輯人類基因組,其中每個元件都完全由 AI 設計。

此外,平台能夠随意生成更多的基因編輯系統;OpenCRISPR-1 隻是冰山一角。

團隊公開釋出了 OpenCRISPR-1,促進在研究和商業應用中廣泛、合乎道德的使用。在向更廣泛的社群提供這種分子的過程中,研究人員希望降低基于 CRISPR 的技術的治療、農業和科學應用的成本和進入門檻。

Profluence 副總裁兼基因編輯主管 Peter Cameron 表示:「這是一個分水嶺,也是我們希望在着手建構下一代基因藥物時疊代過程的開始。我們鼓勵基因編輯社群對 OpenCRISPR-1 進行壓力測試。如果有可以針對特定應用進行改進的特定功能,我們想知道,并可以合作優化這些特性。」

參考内容:

https://twitter.com/thisismadani/status/1782510590839406904

https://www.nytimes.com/2024/04/22/technology/generative-ai-gene-editing-crispr.html

https://www.profluent.bio/blog/editing-the-human-genome-with-ai

https://www.businesswire.com/news/home/20240422399482/en/Profluent-Successfully-Edits-Human-Genome-with-OpenCRISPR-1-the-World%E2%80%99s-First-AI-Created-and-Open-Source-Gene-EditorProfluence

繼續閱讀