使用interproscan对蛋白质序列或者基因序列进行注释
(2014-02-26 13:07:21)
标签:
股票 |
分类: 软件安装 |
目前interproscan(http://www.ebi.ac.uk/interpro/)已经升级到5版本请下载最新版本及相关数据库。
关于最新版本的介绍,请参见网站:http://code.google.com/p/interproscan/wiki/Introduction
不同于以前的版本,当前版本只需要下载两个数据就可以了:
安装interproscan: (linux版本 下载完毕直接解压就可以)
下载Panther
Models:( 将模块解压到 cd [InterProScan5 home]/dat目录下)
ftp://ftp.ebi.ac.uk/pub/software/unix/iprscan/5/data/panther-data-8.1.tar.gz
可以输出的结果形式包括:TSV,XML,GFF3,HTML,SVG,可以给出kEGG\GO\ipterpro注释
interproscan.sh -i
test_proteins.fasta -d out_dir/ -f tsv,html -iprlookup -pa
-goterms
参数设置:http://code.google.com/p/interproscan/wiki/HowToRun
默认输出的是蛋白质序列,也可以是核酸序列请添加参数:-t
n
错误注意:(导致的错误如)
centos
x86-64需要安装32运行库支持,否则运行interproscan会包找不到/lib/ld-2.12.so库,安装方法:
yum install
glibc.i686
后一篇:宏基因组中物种分类的方法