天天看點

新型算法可确定基因組突變位點

導讀:冷泉港實驗室的研究團隊設計了一種全新的方法來分析基因組序列——scalpel,通過複雜的算法精确定位插入或缺失突變的基因組位點,此方法可用于患有孤獨症、強迫症以及妥瑞士綜合症的病人。相關研究成果發表于8月18日的nature methods上。

人類基因組包含有30億個堿基,很難想象插入或移除一個dna堿基會對身體健康産生多大的影響。而實際上,這種插入或删除确實會戲劇性地改變生物功能,甚至造成諸如孤獨症或癌症等多種疾病。但是,想要察覺這些突變是十分困難的。最近,冷泉港實驗室(cshl)的一個研究團隊設計了一種全新的方法來分析基因組序列,精确定位插入或缺失突變的基因組位點,此方法可用于患有孤獨症、強迫症以及妥瑞士綜合症的病人。

人類基因組中的“字母”包含了蛋白質資訊,三個“字母”構成一個“單詞”——三聯體密碼子,通過密碼子進行翻譯。衆多單詞再組裝成一個句子,即成為一個特殊的蛋白質。在此過程中,如果有一個字母意外插入或删除,那麼三聯體密碼子則會移位,導緻後續的所有序列全部改變,這種移碼突變将會造成蛋白質錯誤翻譯。丢失單個蛋白質也會對細胞造成毀滅性的影響,例如功能紊亂,甚至是一些嚴重疾病。

dna的插入和删除使得基因組的長度和序列千變萬化,每個突變的波及範圍從一個至上千個dna堿基不等,并且這些突變也可以是重複的。盡管現如今基因組測序技術已經有了突破性進展,然而突變的多樣性仍然使得确定突變位點充滿挑戰。

cshl的科學家們,包括助理教授mike schatz,、gholson lyon、ivan iossifov和教授michael wigler,設計了一個發掘現存基因組資料集以尋找突變位點的方法。這一方法稱作scalpel,它是從集合所給基因組區域的所有序列開始。scalpel,包含了一個計算機公式或者說算法,然後為所給區域建立一個新的序列,這就像拼湊謎語的破碎片段一樣。

定量生物學家schatz說到:“這些突變就像基因組中的精細切口,在這些切口處dna插入或者删除,scalpel為我們提供了一種放大鏡頭,使得我們能夠精确定位切口的位置。”這些資訊對于了解疾病相關突變是十分關鍵的。8月18日的nature methods上發表了這一研究,研究團隊利用scalped方法對患者樣品進行了突變檢索。cshl的一位研究人員lyon,也是一位職業精神病醫師,他和他的團隊對一位患有嚴重妥瑞士綜合症和強迫症的患者基因組進行分析,确定并證明了超過一千個突變位點,進而展示了此種方法的精準度。

cshl團隊展示了一種類似的分析方法用于檢索孤獨症相關突變。他們建立了一個包含有593個家庭的資料集,這些家庭中都是隻有一個孤獨症患兒,而其他家庭成員均正常。研究人員發現593個家庭中具有總數達到330萬個的突變位點,且大多數都為相對無害的。但是,仍有幾十個突變是明顯具有孤獨症特異性的。schatz說:“所有這些都增進了我們對于自發突變導緻孤獨症的了解和認識。”

然而,此工具應該獲得更加廣泛的應用。“我們正在和植物學家、癌症生物學專家以及其他專家學者進行合作,尋找突變位點”,chatz說,“這個工具十分強大,我們正試圖揭示生命樹中,基因組新片段的影響。”

原文釋出時間為:2014-08-20

本文來自雲栖社群合作夥伴“大資料文摘”,了解相關資訊可以關注“bigdatadigest”微信公衆号

繼續閱讀