IgBLAST使用及后续结果处理
(2016-07-14 10:31:20)分类: 抗体序列分析 |
一、IgBLAST
使用
1)在线使用:http://www.ncbi.nlm.nih.gov/igblast/
2)本地使用FTP下载:ftp://ftp.ncbi.nih.gov/blast/executables/igblast/release/
需要下载:
最新软件版本 ./1.6.0/ncbi-igblast-1.6.0-x64-linux.tar.gz
比对数据库 ./database、./internal_data、./optional_file
编辑IMGT数据库fasta文件header的脚本 ./edit_imgt_file.pl
3)基本命令:
$./bin/igblastn -query infile.fasta -out outfile.igblast.fmt7.out -outfmt 7 -germline_db_V ./database/mouse_gl_V -germline_db_J ./database/mouse_gl_J -germline_db_D ./database/mouse_gl_D -auxiliary_data ./optional_file/mouse_gl.aux -organism mouse -domain_system imgt -ig_seqtype Ig -show_translation -num_threads 10
注意:./internal_data/ 文件夹需要放在当前命令运行的文件夹,否则会报错
4)构建特定数据库,如IMGT数据库:
a. 从IMGT reference
directory下载数据库fasta文件
b. 编辑fasta文件并建index
# V-segment database
$perl edit_imgt_file.pl IMGT_Mouse_IGHV.fasta >
./database/mouse_igh_v
$makeblastdb -parse_seqids -dbtype nucl -in
./database/mouse_igh_v
# J-segment database
$perl edit_imgt_file.pl IMGT_Mouse_IGHJ.fasta >
./database/mouse_igh_j
$makeblastdb -parse_seqids -dbtype nucl -in
./database/mouse_igh_j
# D-segment database
$perl edit_imgt_file.pl IMGT_Mouse_IGHD.fasta
> ./database/mouse_igh_d
$makeblastdb -parse_seqids -dbtype nucl -in
./database/mouse_igh_d
二、parsing igblast output
对于 igblast
输出的结果可以使用python包changeO(http://changeo.readthedocs.io/en/latest/overview.html)进行处理,网站提供了详细的包的安装和使用方法。
1)在线使用:http://www.ncbi.nlm.nih.gov/igblast/
2)本地使用FTP下载:ftp://ftp.ncbi.nih.gov/blast/executables/igblast/release/
3)基本命令:
$./bin/igblastn -query infile.fasta -out outfile.igblast.fmt7.out -outfmt 7 -germline_db_V ./database/mouse_gl_V -germline_db_J ./database/mouse_gl_J -germline_db_D ./database/mouse_gl_D -auxiliary_data ./optional_file/mouse_gl.aux -organism mouse -domain_system imgt -ig_seqtype Ig -show_translation -num_threads 10
注意:./internal_data/ 文件夹需要放在当前命令运行的文件夹,否则会报错
4)构建特定数据库,如IMGT数据库:
二、parsing igblast output