如何从ncbi上下载sra数据
- 我参考了网上的一个贴子http://www.plob.org/2014/02/16/7338.html,里面描述了如何用aspera来进行下载,在使用它下载单个数据的时候成功了,批量下载一个文件中所有数据时未能成功,后来我尝试使用wget命令;
- 根据我要寻找的sra数据去ncbi上进行搜索,
![](https://img.laitimes.com/img/9ZDMuAjOiMmIsIjOiQnIsISNzcDM1ETN2EDNwUDM2EDMy8CX0Vmbu4GZzNmLn9Gbi1yZtl2Lc9CX6MHc0RHaiojIsJye.jpg)
选择send results to run selector,之后下载accession list,这个list是个文本文件,里面包含所有样本号信息。例如:ERR260132
- 如果我们要下载单个sra文件时,需要知道ncbi数据库ftp中的相应地址,一个例子如下:
wget -i ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByStudy/sra/ERP/ERP002/ERP002469/ERR260132/ERR260132.sra
- 同样可以将所有url放入一个文件之内,进行批量下载,使用wget命令:
文件中的格式如下所示,每一行表示一个URL地址:
ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByStudy/sra/ERP/ERP002/ERP002469/ERR260132/ERR260132.sra
ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByStudy/sra/ERP/ERP002/ERP002469/ERR260133/ERR260133.sra
-i表示读取文件中的url,sralist3.txt是包含所有uRL的文件;
你可以切换当前目录到你需要下载到的目录,这时候默认下载目录就是当前目录。
- 参考帖子:http://www.plob.org/2014/02/16/7338.html