天天看點

ArrayExpress數庫簡介

和GEO資料庫類似,ArrayExpress是屬于EBI旗下的公共資料庫,用于存放晶片和高通量測序的相關資料,網址如下

​​https://www.ebi.ac.uk/arrayexpress/​​

資料來源于下圖所示的兩個部分

ArrayExpress數庫簡介

第一部分是由科研工作者送出的資料,第二部分是從GEO資料庫自動導入的資料,在該資料庫中,資料以實驗experiments為機關,每個實驗對應一個唯一的編号,如下圖所示

ArrayExpress數庫簡介

第一列的​

​Accession​

​​代表每個實驗設計對應的編号,​

​Assays​

​​表示該實驗對應的樣本總數,​

​Raw​

​代表原始資料。目前版本資料量如下

ArrayExpress數庫簡介

通過該資料庫,我們可以

  1. 檢索資料,根據關鍵字,編号等查找感興趣的資料集
  2. 下載下傳資料,基于公共資料進行分析挖掘
  3. 送出資料,上傳自己的資料到該資料庫中

點選每個實驗編号,可以顯示詳細資訊,示意如下

ArrayExpress數庫簡介

紅框标記的部分是通常會關注的3個部分,第一部分展示該實驗包含的樣本的詳細資訊,點選之後可以檢視樣本相關的metadata, 示意如下

ArrayExpress數庫簡介

第二部分用于下載下傳資料,第三部分用于将該結果導入到其他軟體,比如GenomeSpace中進行分析和檢視。

除了下載下傳和分析公共資料集,也可以上傳自己的資料到該資料庫。除了宏基因組/宏轉錄組, 轉錄組組裝的相關結果資料,其他絕大部分資料都是可以上傳到該資料庫的,比如SNP分型,基因表達譜,chip_seq, atac_seq, 甲基化測序等結果都可以。