基于taxid构建Blast database
(2016-05-25 11:40:45)分类: 宏基因组 |
方法一:
1. 下载pre-formatted NR数据库,两种途径:
3. 从names.dump(来自于taxdump.tar.gz)查看“细菌”taxid为2,提取“细菌”下所有子节点的taxids .
4. 根据上一步提取的taxid列表从gi_taxid_prot.dmp中提取出所有GIs.
5. 根据上一步得到的 GIs 列表,使用 blastdb_aliastool构建细菌NR database,如下:
方法二:
1. 下载pre-formatted NR数据库,同上
2. 在Entrez Protein database(http://www.ncbi.nlm.nih.gov/protein/)搜索"txid2[ORGN]"
3. 搜索结果页面点击"Send to File",并选择 "GI list"格式
4. 根据上一步得到的 GIs 列表,使用 blastdb_aliastool构建细菌NR database,如下:
blastdb_aliastool -gilist vertebrates.gi_list.txt -db nr -out nr_vertebrates -title nr_vertebrates
方法三:
1. 下载pre-formatted NR数据库,同上
2. 在Entrez Protein database(http://www.ncbi.nlm.nih.gov/protein/)搜索"txid2[ORGN]"
3. 搜索结果页面点击"Send to File",并选择 "GI list"格式
4. 使用blastdbcmd 提取fasta sequences,如下:5.
对获得的fasta序列文件,使用makeblastdb建库