天天看點

NGBI 基因資料庫介紹

作者:FlowHub

NCBI基因資料庫是一種将基因相關資訊集中到單個記錄中的資源。許多不同類型的基因特異性資料與記錄相關聯,包括序列登記、命名法、基因組位置群組織、出版物、基因産物及其屬性、表達、互相作用、途徑、同源性、變異及其表型後果以及與資料庫的有用連結NCBI内部和外部。

Gene 的内容來自自動資料流和NCBI從業人員的管理。起點通常是從公開的、帶注釋的基因組序列中提取基因特異性資訊。根據每個合作資料庫提供的資訊,該基因被配置設定一個類别,例如蛋白質編碼RNA、非編碼RNA、假基因、核糖體RNA 或未知。

NCBI 參考序列資料庫或RefSeq資料庫是一個全面、內建、非備援、注釋良好的參考序列集,包括基因組、轉錄本和蛋白質。

RefSeq

與評論文章類似,RefSeq是在給定時間跨多個來源整合的資訊綜合。RefSeqs為将序列資料與遺傳和功能資訊結合起來奠定了基礎。它們的生成是為了提供多種用途的參考标準,從基因組注釋到報告醫療記錄中序列變異的位置。

GeneRIF

基因參考功能資料庫(GenRIF資料庫),是關于基因功能的簡短說明。GeneRIF提供了一種簡單的機制,允許科學家添加基因資料庫中描述的基因的功能注釋。每個GeneRIF 都有一個指向科學出版物的PubMed ID 的指針,該出版物為GeneRIF 的聲明提供證據。

OMIM

線上孟德爾遺傳人類資料庫(OMIM),是一個不斷更新的人類基因和遺傳疾病和性狀目錄,特别關注基因-表型關系。

NGBI 基因資料庫介紹

NCBI 基因資料庫是一個重要的資源,因為它将每個基因的資訊集中在一個地方,并提供到其他NCBI 和相關資料庫的連結。此介紹包括對PubMed 資料庫連結的關注。使用任何NCBI 界面的下拉菜單通路Gene。

NGBI 基因資料庫介紹

我們看看CFTR,與囊性纖維化相關的基因。目前,有近3060個個體基因記錄引用了CFTR,其中353個來自人類。盡管這些記錄是按與搜尋詞的相關性排序的,但要確定擁有正确的遺傳記錄,請使用基因的官方符号搜尋資料庫。

NGBI 基因資料庫介紹

在這96條記錄中,第一個是人類基因。由于該記錄非常大,請注意右側的目錄以及相關國家醫學圖書館資料庫和其他遺傳資源的附加連結。

NGBI 基因資料庫介紹

第一個摘要部分以人類基因組組織基因命名委員會的公共資料庫中定義的官方符号和基因全名開頭。然而,正如您從“alsoknowas”清單中看到的那樣,并不是每個人都在他們的出版物中使用過該官方符号。該基因編碼一種蛋白質,摘要包括有關該蛋白質如何發揮作用以及基因突變的潛在問題的資訊。RefSeq狀态為“已稽核”。是以,在此記錄中,CFTR基因序列是一個帶注釋的參考序列,由NCBI 從業人員策劃,具有唯一辨別符,可作為醫學、功能和比較研究的基線。

NGBI 基因資料庫介紹

基因組背景描述了基因所在的位置。在這種情況下,該基因位于7 号染色體的q(或長臂)區域31.2。有關染色體映射方式的資訊,請參閱Clare O’Connor的文章。GenomeReference Consortium 于2014 年12 月向GenBank 送出了最新的人類參考基因組組裝。由于新資料和更正改變了CFTR在染色體上的位置,Gene包括目前和過去組裝的資訊以幫助研究人員。請注意,在目前組裝中,CFTR基因在7 号染色體上的第117.4百萬個堿基對之後開始。該圖顯示了讀取基因的方向。請記住,可以從任一方向讀取雙螺旋結構,并且慣例規定染色體的短臂在頂部或左側。然後,CFTR向右讀取,但附近的CTTNBP2 基因向左側或染色體的短臂讀取。

NGBI 基因資料庫介紹

下一部分提供了一種基因浏覽器,它提供了大量的資訊。單擊代表基因的綠線。現在您可以看到綠色的基因資訊、藍色的轉錄信使RNA資訊以及紅色的翻譯蛋白質資訊。多條藍線和紅線代表剪接變體,這些變體可以産生不同的信使RNA。

NGBI 基因資料庫介紹
NGBI 基因資料庫介紹

經實驗驗證的轉錄本以N 開頭,而以X 開頭的變體代表預測的mRNA轉錄本或轉錄的蛋白質。現在讓我們跳到基因上的特定位置117610510,并放大。請注意,較大的條代表外顯子,較小的條代表内含子。當基因的變異具有臨床意義時,研究人員的一個重要概念是臨床變異。顔色越深,變異越緻病或緻命。請注意,這個特殊的變體rs1800111有一個與之關聯的PubMed 引用。浏覽器中的附加資訊包括基因序列:SNP,單核苷酸多态性,或個體之間的差異;以及關于外顯子和内含子的資訊;所有這些都帶有相關資料庫的連結。

NGBI 基因資料庫介紹

下一部分,參考書目,不需要介紹。這些是精選的PubMed 引文,重點關注人類CFTR基因。有關其他物種中相似基因的引用,同系物,請單擊最後一個連結。如果您需要針對某個基因的特定功能的引文,GeneRIFs中的GeneReferences Into Function部分會很有幫助。一句話取自标題或摘要,簡明地描述了該文章中基因的一個或多個功能。這些連結将帶您進入PubMed,就像PubMed 引用可以帶您回到Gene一樣。

NGBI 基因資料庫介紹
NGBI 基因資料庫介紹

我們将在以後的文章中介紹基因記錄中的大量附加資訊,包括表型、變異和途徑、連結到讨論這些互相作用的PubMed引文的互相作用、蛋白質資訊、參考和相關序列以及資源連結。我們想強調基因本體論部分,該部分總結了該基因已知的功能、過程群組件,并提供了PubMed引用。本體論是對存在的事物的研究,基因本體論是描述基因産物特征的術語的受控詞彙,并被編譯在基因本體論注釋資料庫中。

NGBI 基因資料庫介紹
NGBI 基因資料庫介紹

基因資料庫提供了一個一站式節點來檢索與感興趣的基因相關的所有資訊。如果向下滾動到mRNA 序列部分,您還可以從主要存儲DNA 和mRNA 序列資訊的Genbank 資料庫通路基因序列。

NGBI 基因資料庫介紹
NGBI 基因資料庫介紹

繼續閱讀