天天看點

Nature Methods | 蛋白、RNA、DNA及其複合物結構的比對算法US-align

作者:生信寶典

生物大分子的三維結構的比對算法在結構生物學和生物資訊學中有着廣泛的應用,包括結構分類、功能注釋、藥物發現和蛋白設計。密歇根大學張陽課題組多年來開發了多款高效準确的結構比對算法,包括用于蛋白比對的TM-align、用于RNA比對的RNA-align、用于蛋白複合物結構比對的MM-align等。無論是課題組開發的TM-align、RNA-align和MM-align,還是其它組開發的結構比對程式,都隻是對特定的分子類型和特定的結構比對任務進行優化。這不但要求使用者同時安裝和使用多款不同的程式,也使得不同類型的大分子及其複合物之間的結構與功能比對變得困難。

針對上述這些問題,2022年8月29日,密歇根大學張陽課題組張成辛博士等在Nature Methods上發表了文章US-align: Universal Structure Alignment of Proteins, Nucleic Acids and Macromolecular Complexes,開發了新一代比對算法US-align。

Nature Methods | 蛋白、RNA、DNA及其複合物結構的比對算法US-align

US-align是第一款同時提供蛋白、RNA、DNA的單體及其複合物的兩兩比對以及多重比對的程式(圖1),并且所有比對功能都統一使用的TM-score作為打分函數。US-align高度優化的C++代碼使其在比其它在特定的結構比對任務上優化的程式的速度提高了數倍,并有更準确的結構比對結果。其中,蛋白與核酸的單鍊比對基本上分别沿用TM-align與RNA-align算法,多重比對借鑒mTM-align算法并新增RNA多重比對功能,而複合物結構比對算法則是完全從頭開發,在準确性和速度上都超越舊版的MM-align(圖2)。

Nature Methods | 蛋白、RNA、DNA及其複合物結構的比對算法US-align

圖1. US-align所包含的結構比對功能。a, 單鍊結構的兩兩比對。b, 複合物結構的兩兩比對。c, 多重結構比對。d, 基于模闆的分子對接。

Nature Methods | 蛋白、RNA、DNA及其複合物結構的比對算法US-align

圖2. US-align與已有的複合物結構比對算法(MM-align和MICAN)在a, TM-score、b, RMSD、c, 覆寫率和d, 運作時間四方面的比較。e, US-align、f, MM-align與g, MICAN對兩個八聚體複合物比對的結果,兩個複合物PDB編号4JHM和4IAJ,分别由半透明卡通和實線彩帶表示,不同顔色表示不同鍊。

US-align是開源程式(https://github.com/pylelab/USalign),提供網頁伺服器以及單機版指令行程式下載下傳,在Windows、Linux和Mac OS作業系統下都能流暢運作(圖3)。新一版的US-align2的開發正在進行,将在保留所有舊版功能的基礎上,添加非序列比對(Non-Sequential Alignment)等功能。

Nature Methods | 蛋白、RNA、DNA及其複合物結構的比對算法US-align

圖3. US-align網頁版(https://zhanggroup.org/US-align/)的多重結構比對結果。

原文連結:

https://doi.org/10.1038/s41592-022-01585-1