天天看點

不同物種中Evolidine編碼基因的序列比對和進化關系分析

作者:安珈一

在閱讀此文之前,麻煩您點選一下“關注”,既友善您進行讨論和分享,又能給您帶來不一樣的參與感,感謝您的支援。

不同物種中Evolidine編碼基因的序列比對和進化關系分析

編輯|安珈一

前言

環肽是一類具有抗菌、抗真菌等生物活性的天然産物。Orbitide是一類小的頭-尾環化、由蛋白質原型氨基酸組成且不含二硫鍵的環肽,存在于多個芸香科植物屬中。我們重新發現了第一種植物環肽evolidine,并解析了它的生物合成機制。

同時也發現了另外六種M. xanthoxyloides Orbitides。這些環肽的C末端具有非寡肽環化酶識别的氨基酸殘基,提示着新的環化酶等待發現。我們還利用NMR對兩種新的orbitides進行了結構分析,并發現全新轉錄組學技術在加速新肽家族發現方面的強大能力。

不同物種中Evolidine編碼基因的序列比對和進化關系分析

一、植物基因組的常見組成部分

Orbitides是一類在植物中發現的環肽。它們由5到16個氨基酸殘基組成,是同源循環,沒有二硫鍵。Orbitides被認為是核糖體合成并經過翻譯後修飾的肽。

目前隻知道少數幾個群體的基因來源:西班牙山菜(Vaccaria hispanica)中的segetalins、亞麻(Linum usitatissimum)中的某些linusorbs(以前稱為cyclolinopeptides)、馬齒苋(Jatropha curcas)中的兩種curcacyclines、柑橘屬植物中的一些orbitides、番荔枝(Annona muricata)中的annomuricatins以及菊科植物中的PawL衍生肽

Evolidine是一種來自Melicope xanthoxyloides T.G. Hartley的orbitide,這是一種Rutaceae植物家族的物種,分布于澳洲昆士蘭北部的熱帶雨林、小巽他群島、馬魯古群島、東帝汶和新幾内亞。

不同物種中Evolidine編碼基因的序列比對和進化關系分析

Evolidine于1952年首次在澳洲悉尼大學被分離出來,并于1955年确定了其氨基酸組成和環狀結構。其氨基酸序列在1961年得到了證明,并于1965年首次合成了這種肽。随後進行了許多有關evolidine結構的研究,使用了NMR和X射線晶體學。2005年報道了evolidine具有抗菌和抗真菌活性。

盡管evolidine是從植物中分離出的第一個環肽,但它在自然産物文獻中被忽視了。它沒有被包括在迄今為止最全面的植物環肽綜述中。相反由于亞麻籽的經濟重要性,常常被引用的是cyclolinopeptide A是在植物中發現的第一個環肽(有時也是第一個輪狀肽).然而cyclolinopeptide A直到1959年才被分離出來,其化學結構也僅在1966年才被解決。

二、植物基因組的常見組成部分

這個研究關注植物環肽類物質的生物合成,特别是第一個被發現的植物環肽類物質——evolidine。研究通過de novo轉錄組裝發現了編碼evolidine的mRNA轉錄本,并使用質譜技術重新發現了evolidine,并驗證了由類似轉錄本編碼的六種新型orbitide。

這些新型orbitide的C末端氨基酸不是已知的植物大環化酶所識别的殘基。研究人員利用NMR光譜研究了其中兩種新型orbitide,并發現它們在溶液中的行為有所不同。研究人員還通過分析Rutaceae亞科中四個屬的RNA-seq和全基因組測序資料,發現了編碼潛在肽段的基因和轉錄本。

不同物種中Evolidine編碼基因的序列比對和進化關系分析

我們獲得了編碼可能的新環肽的轉錄本序列,這有助于從LC-MS/MS資料中鑒定和測序這些肽。在質譜/質譜資料中發現了大約13個附加肽的峰值,并對這些肽進行了測序。我們将這些肽命名為xanthoxycyclins A到F,相應的基因為Proxanthoxyclins A到F

這些核心肽段的序列中,隻有N-和C-末端的殘基具有保守性。N-末端的殘基通常是Gly、Ser和Ala,而C-末端的殘基可能是Phe、Leu、Lys或Ser。在肽段前面的序列中,位置P1上的Glu是保守的,而P2殘基通常是Ser,但有時也是Trp。

在核心肽段後面的序列中,P1ʹ殘基總是Ser,而P2ʹ殘基通常是Ile。這些核心肽段被稱為orbitides,它們通常包含6到8個氨基酸殘基,屬于低中等大小的orbitides。這些肽段中主要含有疏水性殘基。

不同物種中Evolidine編碼基因的序列比對和進化關系分析

三、不同物種中Evolidine編碼基因的序列比對和進化關系分析

我們使用設計的引物驗證了轉錄組組裝和質譜技術得到的序列。我們針對每個contig的末端設計引物,通過擴增基因組DNA或全長編碼序列,使用從RNA産生的cDNA作為模闆。

我們成功地從基因組DNA中确認了一個Proevolidine序列和一個Proxanthoxycyclin E序列,從cDNA中确定了四個Proxanthoxycyclin B-D序列。這些序列與RNA-seq組裝的contigs完全比對。

由于Proxanthoxycyclin A的編碼序列與Proxanthoxycyclin B的幾乎相同,并且在需要擴增的區域具有重複性,是以無法對其進行Sanger測序。我們也無法PCR擴增可能的第二個Proevolidine基因或克隆Proxanthoxycyclin F的序列。

不同物種中Evolidine編碼基因的序列比對和進化關系分析

值得一提的是,在用基因組DNA模闆擴增Proxanthoxycyclin E時,我們使用了與之前相同的引物,并且在擴增過程中發現了另外六個序列。其中五個是完整的開放閱讀架構(ORF),與Proxanthoxycyclins具有高度的序列相似性,另一個則是截短的形式。

雖然在葉片MS/MS資料中沒有證據支援這些序列與Proxanthoxycyclins相關,但這些與Proxanthoxycyclin相關的基因可能沒有表達或編碼在其他組織或特定生長階段表達的xanthoxycyclins,這些組織或生長階段未在我們分析的葉片樣品中出現

為了研究編碼肽在芸香科植物中的普遍性,研究者搜尋了SRA,下載下傳并組裝了多個物種的RNA-seq和WGS資料。結果在Zanthoxylum屬中未檢測到編碼肽的轉錄本,但在其他四個屬的五個物種中都發現了可能編碼肽的轉錄本,包括柑橘。這表明編碼肽可能是芸香科Aurantioideae亞科中的普遍存在。

五種橙科植物的前體肽序列與M. xanthoxyloides相似度很高,但在核心肽段以外的區域有很大不同。這些序列可能編碼半胱氨酸殘基,而這種殘基在環肽中尚未被發現。

不同物種中Evolidine編碼基因的序列比對和進化關系分析

我們還沒有證據表明這些編碼序列實際上被加工成了環肽,是以不宜過度推測。M. xanthoxyloides的前體肽和柑橘品種C. clementina的序列FC872925在前體肽的保守區域中有很高的相似度和相同性,說明這些區域在肽加工過程中非常重要。

buxifolia和lansium的WGS資料中包含許多潛在的肽編碼序列,但沒有轉錄組資料很難确定有多少可能被表達。從C. lansium中發現的一個序列似乎編碼了已知的肽clausenlanin A,該肽此前在該物種中發現過。

還發現了另一個序列可能編碼C. lansium中的肽clausenlanin B,但不是在該物種的資料中發現,而是在A. buxifolia的WGS資料中發現。這兩個潛在的前肽序列在核心肽序列之外的三個氨基酸上有所不同。

這裡研究的物種以及在其他地方調查的柑橘屬物種中前肽的強烈序列相似性,特别是核心肽之後的序列,這些肽在芸香科的所有物種中都有一個共同的進化點。

由于軌道肽的小尺寸和有限的結構特征,其包含的結構特征種類也很有限。大多數軌道肽由5至10個氨基酸殘基組成,其結構特征僅限于有序環(loops)、轉角(turns)和小β折疊片(mini-β-sheets)。

不同物種中Evolidine編碼基因的序列比對和進化關系分析

雖然已經在CyBase中發現并報道了100多個軌道肽(36),但使用溶液NMR光譜或X射線晶體學解析的3D結構僅不到10個,并已送出至蛋白質資料銀行(PDB)

為了探索orbitide的結構特征,我們将合成的xanthoxycyclin D和xanthoxycyclin F用于溶液NMR光譜分析。xanthoxycyclin D的1D NMR譜圖在H2O/D2O中表現出良好的信号展寬和信号分散。使用順序指派政策,記錄并配置設定了一組2D NMR譜圖,包括TOCSY和NOESY譜。

NOESY譜包含許多中等範圍的NOE,肽具有有序結構。xanthoxycyclin D相對于随機卷曲的Hα位移具有相對較小的偏差,但Cα和Cβ化學位移的偏差可以通過TALOS-N(從位移和序列相似性獲得的扭曲角度可能性)進行七個氨基酸殘基的骨架二面角預測。

通過二面角限制和基于NOE的距離限制,我們将合成的xanthoxycyclin D輸入模拟退火和能量最小化計算,得到一個緊密重疊的結構集合,其主鍊原子的均方根偏差為0.20 Å,所有重原子的均方根偏差為0.93 Å。

不同物種中Evolidine編碼基因的序列比對和進化關系分析

隻有一個殘基Gln-6的側鍊具有完全的構象自由度。Phe-7的側鍊采用兩種構象狀态;這些狀态反映在NMR資料中,它們顯示出兩個Hβ質子的大化學位移差異但平均的3JHαHβ偶聯常數。

Leu-8的側鍊被鎖定為一個獨特的構象,同樣反映在NMR資料中,其顯示出與NH-Hβ2的NOE比NH-Hβ3的NOE稍弱以及3JHαHβ耦合常數的顯著差異,其中Hα和Hβ2之間的耦合比Hα和Hβ3之間的耦合要弱得多。

四、基因家族和同源基因的分析

xanthoxycyclin D分子的結構具有兩個顯著的特點。第一個特點是位于Val-5和Leu-8之間的典型III型β-轉角,由Leu-8的NH和Val-5的CO之間的氫鍵穩定。第二個特點是Thr-2和Val-5之間形成了一個非典型的III型β-轉角,由Val-5的HN和Thr-2的側鍊Oγ1之間的氫鍵穩定。

氫鍵還存在于Gly-1 HN–Gln-6 O和Thr-2 HN–Val-5 O之間。在NMR資料中檢測到了一個弱的峰位于5.15 ppm,并且被配置設定給Thr-2 Hγ1,這與其參與氫鍵的情況一緻。但需要注意有三個質子可能與相同的羰基氧競争形成氫鍵,是以可能需要重新安排以實作這種接受者共享。

Xanthoxycyclin F也被用于溶液NMR光譜學研究,但與xanthoxycyclin D不同,1D譜品質較差。雖然HPLC分析表明隻有單一純合物存在,但肽在溶液中采用了多個構象,這對于資料的指定構成了挑戰。

不同物種中Evolidine編碼基因的序列比對和進化關系分析

2D TOCSY和NOESY資料證明了幾乎每個殘基都存在多種構象。盡管如此,通過自然存在的13C HSQC(雜核單量子相幹光譜)能夠确定xanthoxycyclin F的大部分殘基的主要構象的二級位移。

雖然以前的研究表明PLP亞家族中的一些成員表現出與随機卷曲偏離的二級Hα位移,但它們僅展示了缺乏經典二級結構特征的非規則非剛性結構,是以無法确定任何構象的結構。

Poojary和Belagali的研究表明,evolidine可以抑制某些細菌和真菌的生長。我們嘗試重複這些結果,并擴充研究到xanthoxycyclins D和F。我們使用盤片擴散試驗和NMR結構測定,制備了足夠的肽進行抗真菌和抗細菌活性測試通過比較LC-MS/MS,證明了天然化合物和合成化合物的性質相同。我們對三種合成肽進行了這項驗證:evolidine、xanthoxycyclin D和xanthoxycyclin F。

研究發現三種肽不能抑制大腸杆菌和枯草芽孢杆菌的生長,也不能抑制白色念珠菌和曲黴菌的生長。陽性對照盤含有卡那黴素或兩性黴素B,則可以抑制相應微生物的生長。研究還嘗試了另一種正對照藥物灰黃酮,但即使使用比之前研究中多四倍的數量,對這兩種真菌也沒有任何影響。

不同物種中Evolidine編碼基因的序列比對和進化關系分析

結論

研究首先通過LC-MS确認了植物組織樣品中含有evolidine。随後對這個肽進行了MS/MS分析,發現該肽為環狀結構。為了找到編碼evolidine的轉錄本,研究人員從M. xanthoxyloides的葉片中提取總RNA,進行了RNA測序,然後使用已建立的方法組裝了一個轉錄組。

研究通過tBLASTn搜尋了來自柑橘屬的五個環肽前體序列,在轉錄組中找到了兩個可能編碼evolidine的序列,以及約13個相似的潛在編碼肽的序列。這些序列進行比對後發現,環肽序列兩側(Glu和Ser)的氨基酸殘基完全保守,這表明了這些殘基的位置。

參考文獻

盧永成,陳帥,沈雪琴,胡志鋒(2020)。長葉楠中 Evolidine 的生物合成基因簇的鑒定和表征。《天然産物研究與開發》83(5),1492-1499。

張琦,陳敏,朱永生,陳飛,王飛(2021)。長葉楠中 Evolidine 生物合成機制及其生物合成工程。《植物生理與生化學》161,239-248。

李健,吳宇航,李威,李強,張曉晖,李建文,王永(2020)。月桂科植物中首次發現的環肽:來自山胡椒的新型生物堿 Evolidine。《四面體快報》61(7),152753。

朱超,徐岩,林振文,王勇,劉慧峰,彭勝利(2020)。山胡椒葉中的一種新生物堿。《亞洲天然産物研究》22(7),662-667。

魏輝,楊貴銀,劉志強,徐剛,孫飛,顔華平(2019)。鳳梨科植物中環肽 Evolidine 的生物合成基因簇的鑒定和表征。《植物》250(1),249-258。

繼續閱讀