ncbi中的基因组genome全序列下载
(2011-12-24 15:29:55)
标签:
教育 |
分类: dna搜索研究 |
ftp地址为:
基因组资源 ftp://ftp.ncbi.nih.gov/genomes/
包括人、小鼠、果蝇、线虫等模式生物,以及微生物、植物等的基因组。
各种文件的说明,FTP站点 (genomes 目录) — 下载各种格式的完整的染色体序列数据,包括GenBank的flat file (*.gbk),GenBank的概要文件(*.gbs),FASTA核酸文件(*.fna),FASTA氨基酸文件(*.faa),蛋白表(*.ptt)
模式生物基因组资源,包括人、果蝇、线虫、酵母、大鼠、小鼠、斑马鱼、拟南芥菜、水稻等模式生物。一些常见的模式生物的基因组ftp下载地址
数据下载命令,因为dna文件名一般都是fna或者fa.gz结尾的,因此可以用wget递归下载所有的数据,如
Arabidopsis(拟南芥):ftp://ftp.ncbi.nih.gov/genomes/Arabidopsis_thaliana/
Fruit fly(果蝇) ftp://ftp.ncbi.nih.gov/genomes/Drosophila_pseudoobscura/
Mouse(鼠):ftp://ftp.ncbi.nih.gov/genomes/M_musculus/
Human(人): ftp://ftp.ncbi.nih.gov/genomes/H_sapiens/
Caenorhabditis elegans(线虫):ftp://ftp.ncbi.nih.gov/genomes/Caenorhabditis_elegans/
Zebrafish(斑马鱼):ftp://ftp.ncbi.nih.gov/genomes/D_rerio/
Rice(水稻):ftp://ftp.ncbi.nih.gov/genomes/Oryza_sativa/
酵母 : ftp://ftp.ncbi.nih.gov/genomes/Schizosaccharomyces_pombe_OLD/
海胆:ftp://ftp.ncbi.nih.gov/genomes/Strongylocentrotus_purpuratus/
Xenopus(爪蟾蜍): ftp://ftp.ncbi.nih.gov/genomes/Xenopus_Silurana_tropicalis/
wget –r –nd –l 2 –A '*.fna', '*.fa.gz' 'ftp://ftp.ncbi.nih.gov/genomes/Caenorhabditis_elegans/'
-r:表示递归
-l:level,递归的最大层数
-A,接收的文件名,多个用,号隔开
后面那个就是一个基因组的位置。
前一篇:2011-11-27