<h1>背景知識</h1>
本文主要是通過絡新婦蛛基因組研究(Nephila clavipes)重點關注蜘蛛絲蛋白基因多樣性和複雜的表達模式,以期通過這兩方面研究揭示蜘蛛絲多樣性的原因。
蜘蛛經過3.8億年以上的進化,已經形成46000多個種,它們多樣的蜘蛛絲可以用于捕食獵物和繁殖,蜘蛛絲比鋼鐵更堅實比凱夫拉(Kevlar)更有韌性,但是比這兩種材料都更輕盈,蜘蛛絲還有伸展性、導電、阻止細菌生長和人體免疫系統排斥性不明顯等特征,是以由蜘蛛絲制成的新型材料将為醫用和工業領域創新帶來巨大潛力,為了更好的利用這些屬性,我們必須了解蜘蛛絲的遺傳基礎、功能多樣性和産生機理。
一隻圓蛛科雌性蜘蛛可以産生多達7種形态各異的蜘蛛絲腺體,每種腺體因為特有的基因表達,能産生生物特性各不相同的蜘蛛絲,圓蛛科雌性蜘蛛可産生以下七種蜘蛛絲:
1、主要壺腹狀絲,有強大的抗張力,在織網中作為牽引繩;
2、次要壺腹狀絲,用于搭網過程中形成無彈性的臨時螺旋;
3、水泥粘合劑類的梨狀絲,把和纖維其他基底物結合到一起;
4、葡萄串絲用于隔離存儲的食物和卵囊;5、管裝和圓柱形絲用于形成卵囊堅硬的外表層;
6、鞭狀絲有超強的擴張性,用于捕獲獵物;
7、粘性類絲用于捕食獵物。有些蜘蛛隻有部分類型蛛絲,也有些産生其他類型的蛛絲,如篩孔狀絲。每種蜘蛛擁有自己特有的一系列腺體,産生不同的蛛絲來适應特有的需求。
蜘蛛絲主要由蜘蛛絲蛋白組成,蜘蛛絲蛋白有保守的N端和C端domain,二者在重複的motifs兩側,motifs的組成和數量賦予蛛絲特異的實體特性,盡管圓蛛科蛛絲研究了數十年,但是對圓蛛科的蜘蛛絲蛋白資訊依然不完整。
(為什麼選擇這個材料)已測序的天鵝絨蜘蛛隻産生19種蜘蛛絲蛋白,且缺少鞭狀絲和聚合絲,使得研究同一物種内的絲蛋白序列多樣性受限,恰恰相反的是,雌性金圓蛛科蜘蛛使用了全部七種絲腺,第一種被鑒定的蜘蛛絲蛋白是從N. clavipes鑒定到的,這個物種後期用于研究絲基因、結構多樣性和基因家族進化曆史,但是基因組一直沒有被破譯。
<h1>組裝結果</h1>
N. clavipes基因組大小預計3.45Gb,55%的重複序列比例,組裝出2.44Gb基因組(contig N50= 8.1kb,scaffold N50 =62.9KB),通過illumina測序平台測序,整體98.5X覆寫度,組裝水準實在太一般。

<h1>研究的科學問題</h1>
1、 金蛛總科絲蛋白彙總
通過比對基因組、轉錄組和基因模型獲得N. clavipes的28個候選絲蛋白基因,通過片段PCR和三代測序重建和确定絲蛋白基因位置,28個絲蛋白基因中有27個編碼C末端和編碼N末端的序列定位在同一個scaffold上,同時獲得了20個絲蛋白全長序列,但是發現三個類絲蛋白基因的部分序列,說明還存在其他的絲蛋白基因有待鑒定。
為了把檢測到的28個候選絲蛋白對應到7大類絲蛋白中,我們通過比對保守的C末端和N末端以及motif,發現這些絲蛋白分别歸屬七大類中的一類,但是也有一些類别(minor ampullate, flagelliform, and aggregate)中也發現了一些新的成員,同時在N. clavipes中發現了七個新的絲蛋白不屬于7大類中的任何一類,說明這個分類還有待完善。
N. clavipesd 的20個全長絲蛋白在編碼氨基酸的長度上差異很多,從407到5939不等,而且本次研究通過大片段PCR發現MiSp類絲蛋白的新型---MiSP-c和MiSp-d,長度比以前更長;本次組裝顯示鞭狀類型的絲蛋白基因中發現了多外顯子可變剪切,這點跟之前的研究很一緻。另外,N. clavipes的絲蛋白富含谷氨酸、丙氨酸和絲氨酸殘基,這點跟基因組上其他基因相比尤為異常。
為了收錄N. clavipes的絲蛋白的重複序列,通過計算和标記motif,觀測到了394個特有的motif變體,除了之前報道的motifs,發現了數百個新的motif變體還有一些之前已經歸類的motif 的新變體,20個全長絲蛋白基因中重複motif結構跨越編碼區域的50%-96%,這些重複結構的複雜性和多樣性比之前報道都更大。為了更好的研究這種複雜的多樣性,通過同源性把特有的motif結構劃分為49個分類,一個由GXGGX、GPGGY和聚丙氨酸相關motifs變體組成的類群和新型類似聚丙氨酸motifs變體聚到了一起,新型的DTXSYXTGEY類motif是出現頻率最高的motif,累積出現了554次,其他出現頻率比較高的motif包括:(i) GPGTTPGTI, (ii)multi TTX, (iii) multi GL, (iv) multi SQ/XQQ (v) non-alaninehomopolymer runs。MaSp-g在20個motifs群組 中含有73種特有的motif變體,是N. clavipesd種最多的一個絲蛋白,AgSp-d擁有最長的重複motifs,MaSp-f, MaSp-g和MiSp-c則是有最大的差異,49種motif中有20種。
在N. clavipesd的絲蛋白基因中能找到49個motif group中46個(260個motif variants),更奇妙的是絲蛋白基因分組之間,在260個motif variants中有204共享motif。共享motif是絲蛋白基因的流行特點,其中MaSp-g擁有最大數量的貢獻motif。
作者還發現了重複motifs中的二階重複結構,把在絲蛋白基因中連續出現2到 4次唯一motif variants的區段定義為cassette,20個全長絲蛋白中找到了506個不同類型的cassette,它們跨越了25-95%的motif區域,共出現了1440次,半數高頻出現的cassette的是同一個 motifs group中motif variants的串聯重複,然而其他的cassette是不同motif的集合。探究cassette在絲蛋白基因間的共享程度,95%的都是某些基因特有的,與motif廣泛共享不同,cassette主要在 minor ampullate 和 major ampullate 兩個類别間有共享,這些觀察表表明,絲蛋白基因之間有共享的motifs,但是這些motif組成了各自的cassette,進而産生不同的基因功能,進一步導緻了各不相同蜘蛛絲實體特性。
2、 不同組織中絲蛋白基因表達研究
之前研究已經表明絲蛋白表達不是腺體專一性的,為弄清楚絲蛋白的基因表達模式,作者在3隻成年雌性蜘蛛的不同腺體中對28個絲蛋白進行qPCR定量,發現在同一個絲腺體中的轉錄本分屬于不同的絲蛋白類,正如前面描述的一樣,有絲蛋白基因在它相應的形态學腺體中表達量最高,但是也有一些基因并不是在相應的腺體中表達量最高,有些在所有腺體中有表達,有一點值得注意,絲蛋白命名是根據它首次在哪個腺體中克隆得到并不代表表達的專一性,研究發現管狀絲蛋白在多個腺體中都有表達,且并不是在管狀腺中表達量最高,有可能是取材的雌性個體不處于産生卵殼蛋白的階段。多個腺體中的絲蛋白基因表達展現出腺體專一性,這也表明了它們的作用,研究中發現一些未知的絲蛋白基因表達模式跟已知基因相同,可以依此假設這些基因的功能。
普遍認為絲蛋白基因隻在絲腺中表達,但是新的FLAG-b并不是這樣,這個基因在毒腺中表達量最高,RNA-seq結果中也有支援這一現象的發現,PR-1(一種已知的毒液素)和FLAG-a(一種已知的鞭狀絲蛋白)在确定的組織中表達,以他們為對照對FLAG-b基因的表達量進行标準化,發現它在毒腺中的表達量是絲腺中的1000到5000倍。
3、極端的絲蛋白多樣性和進化起源
絲蛋白基因的多外顯子現象引起可變剪切是絲蛋白多樣性的猜想,盡管之前并沒有實驗驗證可變型,作者發現FLAG-b的可變reads支援它分為 兩個類型:主要的全長isoform和缺少第二個外顯子的次要類型,考慮到全長isoform中第二個外顯子用于編碼C末端domain促使FLAG-b更傾向于 産生第二種類型。
為了鑒定非絲蛋白基因在産生絲方面的潛力,通過轉錄組資料在絲腺中高表達或者特異性表達的基因摘選出649個候選基因,183個與已知的絲腺蛋白轉錄本高度同源,這些候選基因中包括酶,如激酶、蛋白酶、脫氫酶和乙酰基轉移酶等,大部分都在真核生物的分析系統中,作者期望找到一些基因轉錄把液體絲轉為固态絲的蛋白,例如維持ph梯度的酶,可以産生離子輔助維持PH梯度的候選基因包括3個碳脫水酶直系同源基因、4個甲狀腺過氧化物酶旁系同源基因和5個絨毛膜過氧物酶旁系同源基因。
作者發現了兩種導緻絲蛋白位點多樣性的兩種進化機制,一種是tandem-duplication事件,第二種是絲蛋白基因在C末端和N末端的domain區域有高于基因2倍以上的序列多态性,這是絲蛋白位點長期受到平衡選擇的證據。
讨論總結
1、通過基因組測序鑒定了28個絲蛋白,代表了金蛛總科的全部絲蛋白分類,發現了8種新的絲蛋白并提供大量新重複序列。
2、通過RNA-seq揭示絲蛋白基因在腺體中的表達模式,部分絲蛋白基因專一性在某腺體中表達,也有些絲蛋白在各個腺體中均有轉錄,部分絲蛋白表達并不是在相應命名的腺體中表達量最高。
3、串聯基因duplication和高水準的多态性表明絲蛋白是自然選擇的結果,用于保持多樣性。
4、在不同絲蛋白class内部和不同class之間有66%的重複motif variants是共享的,但是95%的cassette專屬于某一類絲蛋白,共享的motifs組成不同cassette,然後組成更長的重複序列,進而形成不同絲蛋白class特有的實體特性。
小編感言
我們在完成基因組測序時,可以不必借助大規模的樣本研究,容易造成廣而不精。可以重點關注本種特有的一部分基因以及功能,着重展開研究,把實驗做精細,資料挖掘更深入,這樣也會有不錯的産出。
參考文獻:
Babb P L, Lahens N F, Correa-Garhwal S M, et al. The Nephila clavipes genome highlights the diversity of spider silk genes and their complex expression[J]. Nature Genetics, 2017.