HMMER学习笔记
(2014-05-14 23:46:22)分类: 软件安装 |
hmmbuild (建立参考数据的隐马尔可科夫模型)
输入:多重序列比对的文件(Stockholm file)
输出:建立的这些多重序列比对的隐马尔可科夫模型,
例子:
hmmalign (多重序列比对)
输入:输入是fasta文件和建立的模型文件
输出:Stockholm 格式的多重序列比对文件
例子:hmmalign globins4.hmm tutorial/globins45.fa
hmmsearch(在数据库中寻找已经建立好的模体)
输入:建立好的参考数据模型、要搜索的数据库
输出:输出结果
例子:
====================================================
输入:tutorial/HBB HUMAN 是你要检测的fasta格式的序列,uniprot sprot.fasta你要搜索的数据库
phmmer
tutorial/HBB HUMAN uniprot sprot.fasta
nhmmer(类似于blastn,输入的query可以是fasta格式的DNA或者RNA序列,但是只能是一条。如果是多条请先做多重序列比对(hmmalign),然后使用建立模型(hmmbuild),然后生成的hmm作为输入)
nhmmer MADE1.hmm dna target.fa >
MADE1.out
=================================================
如果你有未知的序列去搜寻已知的模型数据库,例如:Pfam, SMART, or TIGRFams.这个时候搜寻的过程就使用hmmscan,相应的核酸序列就使用nhmmscan.
首先还是要建立模型数据库,如果你要合并多个可以直接:
cat globins4.hmm fn3.hmm Pkinase.hmm > minifam
如果你仅仅有的是模型数据库的多重序列比对格式文件例如来自pfam数据库的(Stockholm file)Pfam-A.seed文件:你可以利用hmmbuild 建立模型数据库:
hmmbuild Pfam-A.hmm Pfam-A.see
生成的文件为pfam-A.hmm
由于你一般建立的模型数据库比较大,所以需要建立index,运行:
hmmpress minifam(感觉有点像formatdb)
最后运行:
hmmscan minifam tutorial/7LESS DROME
======================
以上说明仅供参考,一切还是以hmmer的使用说明为主。