天天看點

爆肝整理惡性良性腫瘤生信資料庫(收藏貼一)

今天小編為大家分享的是全網最全的惡性良性腫瘤生信分析的資料庫合集!

小編為大家爆肝整理了近百個資料庫!共分10大類。今天小編先為大家分享前5類。

在整理的過程中,小編發現一些雖然是以前經常被大家推薦使用的資料庫,但卻已不再維護了,早已不能正常使用了,這種資料庫小編也已經貼心的幫大家過濾掉了。那就快來看看有沒有你需要的吧!

資料庫分類

  1. 綜合性惡性良性腫瘤資料庫
  2. 惡性良性腫瘤轉錄組資料庫
  3. 基因組資料庫
  4. 遺傳變異資料庫
  5. DNA甲基化資料庫
  6. 蛋白組資料庫
  7. 惡性良性腫瘤驅動基因資料庫
  8. 具體癌種或疾病資料庫
  9. 藥物與癌細胞系相關資料庫
  10. 通路pathway資料庫

資料庫清單

01

綜合性惡性良性腫瘤資料庫

TCGA(The cancer genome atlas):https://portal.gdc.cancer.gov/

TCGA(The cancer genome atlas,癌症基因組圖譜)由 National Cancer Institute(NCI,美國國家癌症研究所) 和 National Human Genome Research Institute(NHGRI,美國國家人類基因組研究所)于 2006 年聯合啟動的項目, TCGA對超過20,000例原發性癌症進行了分子特征分析,并同時存儲了33種癌型配對的正常樣本。

爆肝整理惡性良性腫瘤生信資料庫(收藏貼一)

ICGC:(International Cancer Genome Consortium):https://dcc.icgc.org/

ICGC全稱是International Cancer Genome Consortium。ICGC資料包括50種不同癌症類型/亞型的惡性良性腫瘤中的基因組異常(體細胞突變,基因異常表達,表觀遺傳修飾)資料,也包括TCGA中的資料。

COSMIC:https://cancer.sanger.ac.uk/cosmic/

COSMIC收錄在癌症中體細胞突變的資料,是世界上最大和最全面的癌症突變資源,用于探索人類癌症中體細胞突變的影響。它主要提供惡性良性腫瘤細胞基因組中的CNA、甲基化、基因融合、SNP及基因表達等資料。

爆肝整理惡性良性腫瘤生信資料庫(收藏貼一)

cBioPortal:https://www.cbioportal.org/

cBioPortal的資料來源于TCGA, ICGC, GEO等資料庫,整合的基因組資料類型包括體細胞突變、DNA拷貝數改變(CNAs)、mRNA和miRNA表達量、DNA甲基化,以及臨床資料等。cBioPortal可以通過可視化的形式展示癌症樣本的基因組資料。

爆肝整理惡性良性腫瘤生信資料庫(收藏貼一)

UCSC Cancer Genomics Browser:http://genome.ucsc.edu/

通過促進整合,互動和多功能顯示,全面分析癌症基因組和臨床資料,該資料庫顯示全基因組和實驗測量的個體和群體樣本的基因組熱圖。

爆肝整理惡性良性腫瘤生信資料庫(收藏貼一)

canEvolve:http://www.canevolve.org/

canEvolve功能旨在滿足癌症研究人員最頻繁的分析需求,以産生新的假設。canEvolve存儲多種癌症類型的microRNA (miRNA)、蛋白表達譜、拷貝數改變以及蛋白-蛋白互相作用資訊。canEvolve可以對惡性良性腫瘤基因組資料進行綜合分析和網絡分析,并對結果進行查詢。

CGWB(Cancer Genome Workbench )

https://www.g6g-softwaredirectory.com/bio/genomics/genetic-analysis/20773-CGWB.php

Cancer Genome Workbench (CGWB)是一個基于網絡的工具,內建并顯示多個項目生成的體細胞突變、拷貝數改變、基因表達和甲基化資料的全基因組集合。

02

惡性良性腫瘤轉錄組資料庫

Oncomine:https://www.oncomine.org/

Oncomine收錄了715套資料集包括86733個樣本,資料庫需要注冊使用,可以對表達資料進行簡單的處理分析,計算基因表達特征、以及聚類基因集子產品,并自動從資料中進行生物學功能分析。

爆肝整理惡性良性腫瘤生信資料庫(收藏貼一)

GEO(Gene Expression Omnibus):https://www.ncbi.nlm.nih.gov/gds

GEO(Gene Expression Omnibus database)是由NCBI負責維護的一個資料庫,收集整理各種表達晶片資料,但是後來也加入了甲基化晶片,lncRNA,miRNA,CNV晶片等各種晶片,甚至高通量測序資料。

ArrayExpress:https://www.ebi.ac.uk/arrayexpress/

ArrayExpress功能基因組學資料檔案存儲了高通量功能基因組學實驗資料,并提供這些資料供研究團體重用。ArrayExpress 是歐洲生物資訊協會(EMBL-EBI)下屬的功能基因組資料庫。

爆肝整理惡性良性腫瘤生信資料庫(收藏貼一)

ChiTaRS:http://chitars.md.biu.ac.il/

ChiTaRS收錄了111,582嵌合轉錄本,種類分别為人類,小鼠,果蠅,大鼠,斑馬魚,牛,豬和酵母。目前更新到5.0版本,并擴充了實驗資料證據,并包括了同一基因的反義嵌合轉錄本,通過RT-PCR、qPCR、rna測序和質譜多肽實驗證明。

miRCancer:http://mircancer.ecu.edu/

miRCancer提供了各種人類癌症中microRNA (miRNA)表達譜的全面收集,這些表達譜自動從PubMed發表的文獻中提取。它利用文本挖掘技術進行資訊收集。自動提取後手動修改,精度100%。使用者可以在miRCancer搜尋頁面通過miRNA和癌症名稱進行搜尋。

爆肝整理惡性良性腫瘤生信資料庫(收藏貼一)

OncomiRDB:http://www.oncomir.org/

OncomiRDB是收錄癌症中miRNA失調的資料庫。利用來自癌症基因組圖譜的miRNA-seq、RNA-seq和臨床資料,系統地進行了統計分析,以确定在不同癌型中與惡性良性腫瘤發展和進展相關的失調的mirna。

爆肝整理惡性良性腫瘤生信資料庫(收藏貼一)

UALCAN:http://ualcan.path.uab.edu/index.html

UALCAN是一個全面的、使用者友好的、互動式的癌症組學資料分析網絡資源。UALCAN可以通路公開癌症組學資料(TCGA, MET500和CPTAC), 允許使用者識别生物标志物或潛在感興趣的基因,為編碼蛋白質的表達譜和患者生存資訊,miRNA-coding和lncRNA-coding基因提供圖形界面,評估表觀遺傳調控基因表達的啟動子甲基化,執行pan-cancer基因表達分析。

爆肝整理惡性良性腫瘤生信資料庫(收藏貼一)

CRN(Cancer RNA-Seq Nexus):http://syslab4.nchu.edu.tw/

CRN有一個使用者友好的網頁界面,旨在促進癌症研究和個性化醫療。它是一個直覺的資料探索的開放資源,提供編碼-轉錄本/lncRNA表達譜,支援研究人員在癌症研究和個性化醫學中産生新的假設。

爆肝整理惡性良性腫瘤生信資料庫(收藏貼一)

03

惡性良性腫瘤基因組資料庫

ArrayMap:https://arraymap.progenetix.org/

ArrayMap是一個參考基因資料庫和生物資訊學資源,針對人類癌症的拷貝數分析資料。ArrayMap資料庫為高分辨率oncogenomic CNA資料的meta分析和系統級資料內建提供了入口點。使用者分析感興趣的基因或基因組片段上的CNA;還可以比較兩個樣本之間的CNA的差異。

爆肝整理惡性良性腫瘤生信資料庫(收藏貼一)

BioMuta:https://hive.biochemistry.gwu.edu/biomuta/norecord

BioMuta是一個單核苷酸變異(SNV)和疾病關聯資料庫,其中變異被映射到基因組和RefSeq核苷酸輸入,并通過UniProtKB/Swiss-Prot位置坐标進行統一。目前版本的BioMuta隻包含與癌症相關的非同義單核苷酸變異(nsSNVs)。

Cancer Hotspots:https://www.cancerhotspots.org/#/home

Cancer Hotspots資料庫由Memorial Sloan Kettering癌症中心的Kravis分子惡性良性腫瘤學中心維護的惡性良性腫瘤熱點突變資料庫。Cancer Hotspots分析了24592例癌症,包括10336例測序的晚期疾病患者,确定了1165個具有統計學意義的熱點突變。

爆肝整理惡性良性腫瘤生信資料庫(收藏貼一)

Mitelman Database:https://mitelmandatabase.isb-cgc.org/

Mitelman癌症染色體畸變和基因融合資料庫中的資訊涉及細胞遺傳學變化及其基因組,特别是基因融合,以惡性良性腫瘤特征為基礎的個案或關聯。所有的資料都是由Felix Mitelman與Bertil Johansson和Fredrik Mertens合作從文獻中手工挑選出來的。

SomamiR:http://compbio.uthsc.edu/SomamiR/

SomamiR是一個microrna (miRNA)的癌體細胞突變及其靶點的資料庫,該資料庫收錄了miRNA與競争性内源性rna (ceRNA)之間的互相作用,包括mrna、環狀rna (circRNA)和長非編碼rna (lncRNA)。最近的更新擴大了資料庫的範圍,将影響miRNAs與兩類非編碼rna (circRNAs和lncRNAs)之間互相作用的體細胞突變納入其中。

爆肝整理惡性良性腫瘤生信資料庫(收藏貼一)

CGP (The Cancer Genome Project):https://cancer.sanger.ac.uk/cosmic

由Sanger 研究所發起的一個項目,收錄體細胞突變和惡性良性腫瘤發生有關的基因,CGP的資料也會在COSMIC資料庫更新。

04

遺傳變異資料庫

ClinVar:https://www.ncbi.nlm.nih.gov/clinvar/

ClinVar是NCBI主辦的與疾病相關的人類基因組變異資料庫。它整合了dbSNP、dbVar、Pubmed、OMIM等多個資料庫在遺傳變異和臨床表型方面的資料資訊,形成一個标準的、可信的遺傳變異-臨床相關的資料庫。ClinVar同時支援線上和下載下傳到本地兩種形式。

爆肝整理惡性良性腫瘤生信資料庫(收藏貼一)

dbVar:http://www.ncbi.nlm.nih.gov/dbvar

dbVar是NCBI的基因組結構變異資料庫——它包含插入、删除、複制、反轉、多核苷酸替換、可移動的元素插入、易位和複雜的染色體重排。

DECIPHER:https://decipher.sanger.ac.uk/

DECIPHER被用來儲存遺傳變異與相關的表型資料庫。資料庫包含37753名患者的資料,他們已經同意進行廣泛的資料共享。

DGV (Database of Genomic Variants):http://dgv.tcag.ca/dgv/app/home

DGV是一個可公開擷取的、對照個體基因組中發現的結構變異(SV)的綜合資料庫。基因組變異體資料庫的目的是提供人類基因組結構變異的全面總結。資料庫将結構變化定義為包含大于50bp的DNA片段的基因組改變。資料庫的内容僅代表健康對照樣本中确定的結構變異。

DGVa(The Database of Genomic Variants archive):http://www.ebi.ac.uk/dgva

DGVa是EBI旗下一個提供所有物種中公開可用的基因組結構變異體的存檔、附加和分布的知識庫。

爆肝整理惡性良性腫瘤生信資料庫(收藏貼一)

EGA:(European Genome-phenome Archive):https://ega-archive.org/

EGA是ELIXIR的一部分,它存儲了來自生物醫學研究項目的所有類型的個人可識别的遺傳和表型資料。

爆肝整理惡性良性腫瘤生信資料庫(收藏貼一)

gnomAD:https://gnomad.broadinstitute.org/

gnomAD是一個由國際研究人員聯盟開發的資料庫,其目标是聚合和協調來自各種大規模測序項目的外顯子組和基因組測序資料,并為科學界提供彙總資料。本網站提供的v2資料集(GRCh37/hg19)涵蓋了125,748個外顯子組序列和15,708個全基因組序列,這些序列來自于不相關的個體,是各種疾病特異性和人群遺傳研究的一部分。

HMGD : http://www.hgmd.cf.ac.uk/ac/index.php

HGMD,全稱Human Gene Mutation Database, 存儲了人類疾病相關的突變資訊,是一個全面的基因生殖系突變的資料庫,這些突變是人類遺傳性疾病的基礎,或與人類遺傳性疾病相關。

MoKCa:Mutations, Oncogenes, Knowledge & Cancer

http://strubiol.icr.ac.uk/extra/mokca/

MOKCa資料庫(突變,緻癌基因,知識和癌症)已經發展到從結構上和功能上注釋,并在可能的情況下預測突變與癌症相關的表型。

RefSeqGene:https://www.ncbi.nlm.nih.gov/refseq/rsg/

RefSeqGene定義了基因組序列,用于作為特征明确的基因的參考标準,是基因座參考基因組(LRG)項目的一部分。

爆肝整理惡性良性腫瘤生信資料庫(收藏貼一)

HRC:http://www.haplotype-reference-consortium.org/

The Haplotype Reference Consortium 整合了來自多個項目的資料,建構了一個包含3千多萬個SNP位點,以及64976個單倍型的背景參考。HRC将通過将多個隊列的測序資料結合在一起,建立一個大型的人類單倍型參考背景。

dbSNP:https://www.ncbi.nlm.nih.gov/SNP/

dbSNP是由國家生物技術資訊中心(NCBI)與國家人類基因組研究所(NHGRI)合作開發和托管的不同物種内部和跨物種的遺傳變異的免費公共檔案。

HGVS:http://www.hgvs.org/

該資料庫旨在促進發現和表征基因組變異,包括人口分布和表型關聯。促進收集、記錄基因組變異資訊和相關的臨床變異。努力培育必要的方法論和資訊學的發展。

05

惡性良性腫瘤DNA甲基化資料庫

MethHC:http://methhc.mbc.nctu.edu.tw

MethHC是一個基于web的資料庫,專注于人類疾病的DNA甲基化。從TCGA (the Cancer Genome Atlas)中整合DNA甲基化、基因表達、microRNA甲基化、microRNA表達、甲基化與基因表達的相關性等資料。

爆肝整理惡性良性腫瘤生信資料庫(收藏貼一)

MethyCancer:http://methycancer.psych.ac.cn/

MethyCancer旨在研究DNA甲基化、基因表達與癌症的互相作用。它既有來自公共資源的高度整合的DNA甲基化、癌症相關基因、突變和癌症資訊,也有來自大規模測序的CpG島(CGI)克隆。MethyCancer分析和介紹了不同資料類型之間的互相連接配接。搜尋工具和圖形化的甲基視圖被開發來幫助使用者通路所有的資料和資料連接配接,并在基因組學和遺傳學資料的背景下檢視DNA甲基化。

MethDB:http://www.methdb.net/

該資料庫是最早期的甲基化資料庫之一,目的是為科學界提供存儲DNA甲基化資料的資源,并使這些資料随時可供公衆使用。該資料庫的未來發展将集中于環境對DNA甲基化的影響。

NGSmethDB:http://www.methdb.net/

NGSmethDB存儲了由亞硫酸氫鹽測序(WGBS)技術獲得的短讀資料集生成的全基因組甲基化組的資料。

PubMeth:http://www.pubmeth.org/

PubMeth 收集和整理了文獻中與癌症相關的甲基化資料,并進行了人工校對和注釋,提供了一個高品質的癌症相關的發生了甲基化基因的資料庫。這個資料庫隻提供線上檢索功能,并不開放下載下傳。也可以送出自己的資料。

爆肝整理惡性良性腫瘤生信資料庫(收藏貼一)

SurvivalMeth:http://bio-bigdata.hrbmu.edu.cn/survivalmeth

SurvivalMeth是哈爾濱醫科大學李霞教授團隊開發的,2020年8月11日發表在Briefings in Bioinformatics上。SurvivalMeth可以識别預後相關 DNA methylation-related functional elements (DMFEs) ,資料庫中記錄了多種DMFEs,包括309,465個CpG島相關元件,104,748個轉錄相關元件,77,634個重複元件,以及細胞類型特異性的1,689,653個超級增強子(SE)和1,304,902個CTCF結合區進行分析。

MethDB資料庫: http://www.methdb.de

全稱DNA Methylation database,該資料庫包含了多種組織多種表型的甲基化模式、甲基化譜和總甲基化内容資料。大約14%的資料沒有在其他地方公布。這些資料可以直接檢索。并且有線上送出工具,允許科研人員直接将新資料輸入到MethDB。

爆肝整理惡性良性腫瘤生信資料庫(收藏貼一)

DiseaseMeth2: http://bioinfo.hrbmu.edu.cn/diseasemeth

DiseaseMeth是人類疾病甲基化資料庫。該資料庫着重于有效收集和統計分析來自各種疾病的DNA甲基化資料。收集了32701個甲基化譜,涉及到88種疾病,甲基化相關的疾病基因關系對有679602個。DiseaseMeth支援包括基因ID和基因名稱在内的多種搜尋方式。DiseaseMeth提供了基于疾病和正常樣品的橫向整合的甲基化資料集。這些資料可以被用來深入識别差異的甲基化基因,并調查研究基因與疾病之間的關系。

MethSurv:https://biit.cs.ut.ee/methsurv/

TCGA資料庫中收錄的主要是450K晶片的資料,也有一些早期27K晶片的資料。本文所述的MethSurv就是基于TCGA資料集中的450K資料建構的可視化分析工具。MethSurv适用于沒有特定生物資訊學技能(不熟悉程式設計分析)的研究人員和臨床醫生,主要用于探索與癌症患者生存相關的甲基化生物标記物。

MethBank:http://bigd.big.ac.cn/methbank

MethBank(The Methylation Bank)是一個集合了多個物種高品質DNA甲基化譜的可視化互動浏覽工具。它由中國科學院研發,2014年釋出1.0版本,3.0版本添加更多物種的甲基化資料、增強資料注釋功能、資料可視化呈現更加友好,用于資料表示、搜尋和可視化。MethBank 3.0大規模內建了高品質的甲基化組資料,包括34個來自大量人類樣本的一緻參考甲基化組,336個來自不同發育階段和/或5種植物組織的單堿基分解甲基體,以及18個來自兩個動物不同發育階段的配子和早期胚胎的單堿基分解甲基體。此外,它還能夠系統地識别與年齡密切相關的甲基化位點、具有恒定甲基化水準的位點。MethBank提供了線上估計人類甲基化年齡和分别識别不同甲基化啟動子的工具。

Lnc2Meth:http://www.bio-bigdata.com/Lnc2Meth/

Lnc2Meth是由哈爾濱醫科大學李霞課題組開發,是lncRNA與DNA甲基化調控關聯資料庫,是基于已有發表文獻結果,對其中涉及到在特定研究疾病中的lncRNA及其甲基化結果進行了整理歸納。使用資料庫時可檢索的資訊主要有兩個,一個是lncRNA,一個是某個疾病。對于每一個lncRNA會提供DNA甲基化區域,類型和調控機制,是否在文獻報道中有作為診斷分子,發表文獻資訊等都有整理。對于某種疾病,顯示疾病相關的lncRNA。

爆肝整理惡性良性腫瘤生信資料庫(收藏貼一)

MEXPRESS: https://mexpress.be/

MEXPRESS是一個可視化TCGA的DNA甲基化,表達和臨床資料,以及它們之間的工具。http://cancergenome.nih.gov/abouttcga/policies/publicationguidelines是使用指南。

爆肝整理惡性良性腫瘤生信資料庫(收藏貼一)

表觀組關聯分析(Epigenome-wide Association Study,EWAS)

網址:https://bigd.big.ac.cn/ewas/datahub/index

EWAS Data Hub由中國科學院開發,整合了來自GEO、TCGA、ArrayExpress和ENCODE資料庫的共計75,344個樣本的DNA甲基化晶片資料和對應的中繼資料,并采用了有效的歸一化方法來消除不同資料集的批次效應。EWAS Data Hub利用海量高品質DNA甲基化資料和标準化中繼資料的優勢,為485,512個探針和36,397個基因提供了一系列重要的評估值(包括組織特異性、年齡相關性、性别差異和種族特異性)和不同背景下的參考DNA甲基化圖譜,涉及81種組織/細胞類型(包含25個腦部和25種血細胞類型),67種疾病(包括39種癌症),不同年齡、性别、種族和BMI。同時,EWAS Data Hub 還提供了高效的查詢方式:(1)通過年齡,疾病等資訊快速查詢感興趣樣本的資料和中繼資料,并能打包下載下傳。(2)通過基因ID、探針号等資訊浏覽該探針/基因在不同背景下的參考DNA甲基化圖譜。

爆肝整理惡性良性腫瘤生信資料庫(收藏貼一)

IHEC Data Portal:https://epigenomesportal.ca/ihec/

網站提供來自七個國際聯盟——ENCODE、NIH Roadmap、CEEHRC、Blueprint、DEEP、AMED-CREST和KNIH——的資料,包括來自600多個不同組織的7000多個表觀基因組參考資料集。使用者可以選擇和浏覽各種資料集。還可以依靠相關工具來比較所選的資料集。資料也可以下載下傳,但原始資料需要資料通路請求。同時,使用者可以共享他們選擇的資料集。

爆肝整理惡性良性腫瘤生信資料庫(收藏貼一)

Blueprint Data Analysis Portal:http://blueprint-data.bsc.es

Blueprint Data Analysis Portal用于分析來自Blueprint Consortium的資料。該聯盟生成了造血細胞譜系的參考表觀基因組,其資料集包括ChIP-seq、DNAsel-seq、全基因組重亞硫酸鹽測序和RNA-seq資料,涵蓋了60多種細胞類型。在該門戶網站中,研究人員使用表觀基因組學比較網絡基礎設施(epigenomics comparative cyber-infrastructure,EPICO)平台,該平台包括五個部分:資料模型;資料驗證和加載程式;空資料庫,用于存儲來自資料驗證和加載程式的資料和中繼資料;應用程式界面(API);以及資料分析門戶網站。除了EPICO外,這種方法還需要存儲空間來建立資料庫,擷取原始資料的連接配接,以及接收查詢和發送結果的子產品。該門戶網站允許幾乎沒有生物資訊學背景的使用者,可視化和比較感興趣血細胞類型的表觀基因組和轉錄組資料。

eFORGE:http://eforge.cs.ucl.ac.uk/

eFORGE允許使用者從表觀基因組關聯分析(EWAS)中篩選資料,發現與疾病相關的細胞類型。eFORGE可以估計哪些差異甲基化位點在某些組織或細胞中可能是起作用的。它是通過分析一組差異甲基化位點和DNase I超敏位點參考圖譜之間的重疊來實作的。這些參考集包括來自各種組織,原代細胞類型和來自ENCODE、Roadmap Epigenomics和Blueprint consortia的細胞系的454個樣品。

爆肝整理惡性良性腫瘤生信資料庫(收藏貼一)

iMETHYL:http://imethyl.iwate-megabank.org/index.html

iMETHYL提供了大約100名受試者的CD4+ t淋巴細胞、單核細胞和中性粒細胞的全DNA甲基化(約2400萬個常染色體CpG位點)、全基因組(約900萬個單核苷酸變異)和全轉錄組(> 14000個基因)資料。這些資料來自亞硫酸氫鹽全基因組測序、全基因組測序和全轉錄組測序,使iMETHYL成為一個全面的資料庫。iMETHYL整合了SNP, DNA甲基化和RNA表達譜的資料,并進行了兩兩之間的關聯分

在STATISTICS頁面,提供了兩個基本資訊。三種組學資料的分布。可以看到志願者的性别,年齡的基本情況,以及DNA甲基化,基因表達和SNV的彙總資訊。

爆肝整理惡性良性腫瘤生信資料庫(收藏貼一)

HeteroMeth:http://qianlab.genetics.ac.cn/HeteroMeth

是由中國科學院開發的首個DNA甲基化異質性資料庫,用于檢索、浏覽、可視化和下載下傳多個物種、突變體、發育階段群組織的DNA甲基化異質性資料庫HeteroMeth。

爆肝整理惡性良性腫瘤生信資料庫(收藏貼一)

Whistle:http://180.208.58.19/whistle/index.html

WHITSLE實作對轉錄組m6A RNA甲基化位點預測。通過把測序資料和機器學習的整合來尋找m6A調控的位點。隻需要輸入想要檢索的基因即可,如果我們想要看某一個功能收到m6A甲基化的影響也是可以通過輸入功能的名字來檢視的。

爆肝整理惡性良性腫瘤生信資料庫(收藏貼一)

RMBase v2.0:http://rna.sysu.edu.cn/rmbase/

RMBase v2.0是由中山大學研發的,整合了表觀轉錄組測序資料的綜合資料庫,用于探索RNA的轉錄後修飾及其與miRNA結合事件、疾病相關的單核苷酸多态性(SNPs)和RNA結合蛋白(RBPs)的關系。RMBase 2.0擴充了約600個資料集和約1 397 000個修改位點,這些修改位點來自13個物種的47個研究,與上一個版本相比,擴充了大約10倍。它包含大約373000個N6-methyladenosines (m6A),大約5400個N1-methyladenosines (m1A),大約9600個pseudouridine(Ψ)修飾,大約1000個5-methylcytosine (m5C)修飾,大約5100個2’-O-methylations(2'-O-Me),約2800個其他類型的修飾。此外,還建構了一個名為“Motif”的新子產品,該子產品提供了修飾motifs的可視化logos和位置權重矩陣(PWMs)。還建構了一個新的子產品“modRBP”來研究RNA修飾和RBPs之間的關系。此外,開發了一種新的基于網絡的工具,名為“modMetagene”,用于沿着轉錄模型繪制RNA修飾的元基因。這個資料庫将幫助研究人員研究RNA修飾的潛在功能和機制。

爆肝整理惡性良性腫瘤生信資料庫(收藏貼一)

MeT-DB V2.0:http://www.xjtlu.edu.cn/metdb2

這個資料庫收集了8個m6A相關調控因子(FTO, KIAA1429, METTL14, METTL3, WTAP, HNRNPC, YTHDC1, YTHDF1)的 ParCLIP-seq 和 MeRIP-seq 資料來建構的,通過相關的測序資料,我們可以檢視具體的調控位置。還提供了和其他類似 miRNA 資料庫以及剪切因子資料庫交叉分析的結果。

爆肝整理惡性良性腫瘤生信資料庫(收藏貼一)

REPIC:https://repicmod.uchicago.edu/repic

REPIC (RNA EPItranscriptome Collection)資料庫是20年4月新發的資料庫,對于測序資料的納入的比較多。記錄了從公開的m6A-seq和MeRIP-seq資料調用的大約1000萬個峰值。這些資料來自49項研究的672份樣本,涵蓋了11個生物體的61個細胞系或組織。REPIC允許使用者通過特定的細胞系或組織類型查詢m6A修飾位點。此外,它整合了來自ENCODE項目的1418個組蛋白ChIP-seq和118個DNA -seq資料的m6A/MeRIP-seq資料,呈現了一個完整的m6A甲基化位點圖譜。

爆肝整理惡性良性腫瘤生信資料庫(收藏貼一)

m6A2Target:http://m6a2target.canceromics.org/#/

m6A2Target是一個完整的 m6A修飾的writers, erasers 和readers (WERs)靶基因的資料庫。它将低通量實驗驗證的高機密性靶标與高通量測序(如CLIP-Seq、RIP-seq和ChIP-seq)顯示的證據結合或從m6A應答擾動和随後的高通量測序(如RNA-Seq、m6A-Seq和Ribo-Seq)推斷的潛在靶标整合在一起。

爆肝整理惡性良性腫瘤生信資料庫(收藏貼一)

小編有話說

今天給大家分享的資料庫共有5大類,資料庫的功能可能有重疊,大家可以慢慢探索發展!

小編最後再給大家分享一個驚喜資料庫——Database Commons。

爆肝整理惡性良性腫瘤生信資料庫(收藏貼一)

資料庫網站:https://bigd.big.ac.cn/databasecommons/

搜尋具體的資料庫之後,會有具體的網址和分類,頁面下方也有資料庫的原始文獻,并且會對具體的分類按照引用量對資料庫進行排行,友善大家檢視。

爆肝整理惡性良性腫瘤生信資料庫(收藏貼一)

Database Commons為使用者提供了一個全面的公共可用的生物資料庫集合,共有5121個資料庫,包括不同的資料類型和跨越不同的生物。大家可以根據自己的需求自行搜尋。

END