天天看點

表觀基因組關聯研究開放平台EWAS Open Platform釋出

作者:中科院之聲

近日,由中國科學院北京基因組研究所(國家生物資訊中心)國家基因組科學資料中心(NGDC)開發的表觀基因組關聯研究資源開放平台EWAS Open Platform上線。相關研究成果以EWAS Open Platform: integrated data, knowledge and toolkit for epigenome-wide association study為題在Nucleic Acids Research上線上發表。

随着表觀基因組關聯研究(EWAS)的爆炸式增長,出現了大量EWAS學術論文,積累了海量EWAS相關資料。對這些資料進行标準化整合,并從已發表論文中提取和挖掘表觀關聯知識,對于系統的表征和研究不同實驗條件下的甲基化狀态、探索與各種性狀相關的表觀遺傳分子機制具有重要意義。NGDC在2019年和2020年先後開發了基于高品質的人工審編EWAS知識庫(EWAS Atlas)和存儲了海量标準化DNA甲基化晶片資料的EWAS資料庫(EWAS Data Hub)。

為了提供從資料浏覽與下載下傳、線上分析與可視化到知識解釋與驗證的全面系統的資源和服務,NGDC研究團隊在不斷整合和更新中心已有EWAS資源基礎上,建構了表觀組關聯研究資源開放平台(EWAS Open Platform)。EWAS Open Platform包括标準化的資料資訊庫 (EWAS Data Hub)、人工資訊提取的知識庫(EWAS Atlas)和表觀-特征關聯線上工具(EWAS Toolkit) 三部分。EWAS Data Hub整合了115852個樣本的DNA甲基化晶片資料和對應的中繼資料,并統一采用GMQN方法進行标準化。同時,EWAS Data Hub利用海量高品質DNA甲基化晶片資料和标準化中繼資料的優勢,為485512個探針和36397個基因提供了一系列重要的評估值(包括組織特異性、年齡相關性、性别差異和種族特異性)和不同背景下的參考DNA甲基化圖譜;EWAS Atlas共整合了910篇文獻中報道的617018個高品質的甲基化與表型關聯,涉及618種表型和3385個隊列;EWAS Toolkit利用EWAS Atlas和EWAS Data Hub提供的高品質的甲基化與表型關聯知識和标準化的DNA甲基化晶片資料,為使用者提供多種線上分析和可視化工具,包括富集分析、注釋、知識圖譜可視化等。

該研究得到了中科院戰略性先導科技專項、國家重點研發計劃、中科院關鍵技術人才等項目資助。

表觀基因組關聯研究開放平台EWAS Open Platform釋出

EWAS Open Platform資料處理流程示意圖

來源:中國科學院北京基因組研究所

繼續閱讀