【数据下载】如何批量下载NCBI SRA数据

标签:
生物信息 |
分类: 生物信息分析杂合 |
在高通量测序文章中,作者一般都会将原始数据上传到NCBI中,供后续研究者验证和参考。
而我们在文章中,可以获得的往往是SRA编号,如:
那么该怎么来批量下载SRA060929中的所有或某几个样本的数据呢?
Step1:打开NCBI的SRA页面(http://www.ncbi.nlm.nih.gov/sra/),并输入SRA060929,点击search;如下,
Step2:获得页面如下,勾选需要下载的样本左侧,按下图指示勾选网页右侧内容,最后点击Create File
控件,网页会自动下载生成SraInforun.csv文件;
SraInforun.cs文件格式如下:
http://s15/mw690/0025Np4Vzy6YQhIxYLkfe&690SRA数据" TITLE="【数据下载】如何批量下载NCBISRA数据" />
http://s15/mw690/0025Np4Vzy6YQhIxYLkfe&690SRA数据" TITLE="【数据下载】如何批量下载NCBI
Step3:
将上图中download_path列的链接放入下载工具中,即可下载对应的SRA文件;
如果使用Linux系统,则可以直接用wget 命令批量下载文件;
下载后的SRA文件可以用sratoolkit的fastq-dump工具转换成fastq格式,以进行后续各种分析。(sratoolkit.2.3.5-2-centos_linux64/bin/fastq-dump)
----------------------------------------------------END---------------------------------------------------------