和GEO資料庫類似,ArrayExpress是屬于EBI旗下的公共資料庫,用于存放晶片和高通量測序的相關資料,網址如下
https://www.ebi.ac.uk/arrayexpress/
資料來源于下圖所示的兩個部分
![](https://img.laitimes.com/img/_0nNw4CM6IyYiwiM6ICdiwiI0gTMx81dsQWZ4lmZf1GLlpXazVmcvwFciV2dsQXYtJ3bm9CX9s2RkBnVHFmb1clWvB3MaVnRtp1XlBXe0xCMy81dvRWYoNHLwEzX5xCMx8FesU2cfdGLwMzX0xiRGZkRGZ0Xy9GbvNGLpZTY1EmMZVDUSFTU4VFRR9Fd4VGdsYTMfVmepNHLrJXYtJXZ0F2dvwVZnFWbp1zczV2YvJHctM3cv1Ce-cGcq5SO0YzM3ETYxMDZ5ETMmJWYyYzX1IjMxETM3EzLcZDMyIDMy8CXn9Gbi9CXzV2Zh1WavwVbvNmLvR3YxUjLyM3Lc9CX6MHc0RHaiojIsJye.jpg)
第一部分是由科研工作者送出的資料,第二部分是從GEO資料庫自動導入的資料,在該資料庫中,資料以實驗experiments為機關,每個實驗對應一個唯一的編号,如下圖所示
第一列的
Accession
代表每個實驗設計對應的編号,
Assays
表示該實驗對應的樣本總數,
Raw
代表原始資料。目前版本資料量如下
通過該資料庫,我們可以
- 檢索資料,根據關鍵字,編号等查找感興趣的資料集
- 下載下傳資料,基于公共資料進行分析挖掘
- 送出資料,上傳自己的資料到該資料庫中
點選每個實驗編号,可以顯示詳細資訊,示意如下
紅框标記的部分是通常會關注的3個部分,第一部分展示該實驗包含的樣本的詳細資訊,點選之後可以檢視樣本相關的metadata, 示意如下
第二部分用于下載下傳資料,第三部分用于将該結果導入到其他軟體,比如GenomeSpace中進行分析和檢視。
除了下載下傳和分析公共資料集,也可以上傳自己的資料到該資料庫。除了宏基因組/宏轉錄組, 轉錄組組裝的相關結果資料,其他絕大部分資料都是可以上傳到該資料庫的,比如SNP分型,基因表達譜,chip_seq, atac_seq, 甲基化測序等結果都可以。