加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

ncbi中的基因组genome全序列下载

(2011-12-24 15:29:55)
标签:

教育

分类: dna搜索研究

      基因组的全系列下载最方便的就是通过NCIBI的ftp直接下载。

 

ftp地址为:


基因组资源 ftp://ftp.ncbi.nih.gov/genomes/





包括人、小鼠、果蝇、线虫等模式生物,以及微生物、植物等的基因组。


各种文件的说明,FTP站点 (genomes 目录) — 下载各种格式的完整的染色体序列数据,包括GenBank的flat file (*.gbk),GenBank的概要文件(*.gbs),FASTA核酸文件(*.fna),FASTA氨基酸文件(*.faa),蛋白表(*.ptt)


 


模式生物基因组资源,包括人、果蝇、线虫、酵母、大鼠、小鼠、斑马鱼、拟南芥菜、水稻等模式生物。一些常见的模式生物的基因组ftp下载地址


 


Arabidopsis(拟南芥):ftp://ftp.ncbi.nih.gov/genomes/Arabidopsis_thaliana/


Fruit fly(果蝇) ftp://ftp.ncbi.nih.gov/genomes/Drosophila_pseudoobscura/


Mouse(鼠):ftp://ftp.ncbi.nih.gov/genomes/M_musculus/


Human(人): ftp://ftp.ncbi.nih.gov/genomes/H_sapiens/


Caenorhabditis elegans(线虫):ftp://ftp.ncbi.nih.gov/genomes/Caenorhabditis_elegans/


Zebrafish(斑马鱼):ftp://ftp.ncbi.nih.gov/genomes/D_rerio/


Rice(水稻):ftp://ftp.ncbi.nih.gov/genomes/Oryza_sativa/


酵母 : ftp://ftp.ncbi.nih.gov/genomes/Schizosaccharomyces_pombe_OLD/


海胆:ftp://ftp.ncbi.nih.gov/genomes/Strongylocentrotus_purpuratus/


Xenopus(爪蟾蜍): ftp://ftp.ncbi.nih.gov/genomes/Xenopus_Silurana_tropicalis/

数据下载命令,因为dna文件名一般都是fna或者fa.gz结尾的,因此可以用wget递归下载所有的数据,如

wget –r –nd –l 2 –A '*.fna', '*.fa.gz' 'ftp://ftp.ncbi.nih.gov/genomes/Caenorhabditis_elegans/'

-r:表示递归

-l:level,递归的最大层数

-A,接收的文件名,多个用,号隔开

后面那个就是一个基因组的位置。

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有