天天看点

GEO数据库使用之数据集下载

作者:云生信学生物信息学

GEO数据库使用之数据集下载

原创 小果 生信果

GEO数据库使用之数据集下载

在GEO数据库检索到我们需要的某个疾病的数据集时,往往需要去下载这些数据集,在这里用了三种方法来下载数 据。这里我们以GSE70493为数据为例进行下载

一、网页直接下载

1、首先登录到GEO数据库首页(Home - GEO - NCBI (nih.gov) ),然后再搜索框输入GSE70493,进行数据检索, 检索结果如下:

GEO数据库使用之数据集下载

2、在检索界面中拉动右侧滚动条,可看到Platforms 与Download family关节词条,这些词条底下红色方框圈住的区域的数据就是我们需要下载的数据。

GEO数据库使用之数据集下载

3、下载platform数据,点击上图中红色方框圈住的GPL17586,进入到平台信息界面,在界面下拉找到Download full table...,点击即可下载到本地。

GEO数据库使用之数据集下载

4、在下载完platform数据信息后,返回GSE70493的搜索界面,在Download family词条下找到Series Matrix File(s) 文件,点击下载保存到本地即可。

GEO数据库使用之数据集下载

二、利用ftp下载

1、进入ftp,Index of /geo (nih.gov) ,找到并点击geo目录,就可以看到有对应的GEO相关的数据目录。

GEO数据库使用之数据集下载

2、在geo目录下,点击platform进去查找对应的GPL编号,点击该编号就可看到所需要下载的文件的格式,点击需 要的格式进行下载,这里我们选soft格式的文件,点击后选取对应的文件进行下载。

GEO数据库使用之数据集下载
GEO数据库使用之数据集下载
GEO数据库使用之数据集下载

3、在geo目录下,点击series目录,进去查找对应的GEO编号,就可以找到对应的文件类型,我们需要matrix文 件,点击就该目录进去选择对应的文件下载即可

GEO数据库使用之数据集下载
GEO数据库使用之数据集下载

三、使用R命令下载

library(GEOquery)
eSet1 <- getGEO("GSE70493",
destdir = '.', getGPL = F)
gpl <- getGEO("GPL17586", destdir= ".")           

等待命令运行结束就可看到需要i爱在的文件了,下载的文件如下图所示:

GEO数据库使用之数据集下载

至此,我们GEO数据的下载就结束了。

继续阅读