加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

使用interproscan对蛋白质序列或者基因序列进行注释

(2014-02-26 13:07:21)
标签:

股票

分类: 软件安装
    参考网站:http://fhqdddddd.blog.163.com/blog/static/18699154201391115912281/

目前interproscan(http://www.ebi.ac.uk/interpro/)已经升级到5版本请下载最新版本及相关数据库。

关于最新版本的介绍,请参见网站:http://code.google.com/p/interproscan/wiki/Introduction

不同于以前的版本,当前版本只需要下载两个数据就可以了:

安装interproscan: (linux版本下载完毕直接解压就可以)
  64位:     
  32位:           


下载Panther Models:( 将模块解压到cd [InterProScan5 home]/dat目录下
ftp://ftp.ebi.ac.uk/pub/software/unix/iprscan/5/data/panther-data-8.1.tar.gz

可以输出的结果形式包括:TSV,XML,GFF3,HTML,SVG,可以给出kEGG\GO\ipterpro注释
interproscan.sh -i test_proteins.fasta -d out_dir/ -f tsv,html -iprlookup -pa -goterms

参数设置:http://code.google.com/p/interproscan/wiki/HowToRun

默认输出的是蛋白质序列,也可以是核酸序列请添加参数:-t n
错误注意:(导致的错误如)
centos x86-64需要安装32运行库支持,否则运行interproscan会包找不到/lib/ld-2.12.so库,安装方法:
yum install glibc.i686



0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有