使用GlimmerHMM 预测基因

分类: 生物信息学 |
1:软件网址:https://ccb.jhu.edu/software/glimmerhmm/
2:下载近源物种的gff文件以及基因组序列,这个近源物种的寻找,个人的方法就是搞清楚你所测物种的门、纲、目、科、属,然后分别从属到门作为英文关键词在NCBI上搜索,选择其中组装效果比较好的基因组进行下载,最后是在属一级找到相近的物种
3:准备GlimmerHMM所需要的输入文件:
文件一:这是你下载的近源物种基因组序列无需整理
>seq1
AGTCGTCGCTAGCTAGCTAGCATCGAGTCTTTTCGATCGAGGACTAGACTT
CTAGCTAGCTAGCATAGCATACGAGCATATCGGTCATGAGACTGATTGGGC
>seq2
TTTAGCTAGCTAGCATAGCATACGAGCATATCGGTAGACTGATTGGGTTTA
TGCGTTA
AGTCGTCGCTAGCTAGCTAGCATC
CTAGCTAGCTAGCATAGCATACGA
>seq2
TTTAGCTAGCTAGCATAGCATACG
TGCGTTA
文件二:下面的这个外显子位置信息文件来自于你下载的gff文件,不同的基因之间用空白行隔开,另外如果是“-”编码,注意更换外显子的位置
seq1 5
15
seq1 20 34
seq1 50 48
seq1 45 36
seq2 17 20
seq1 20 34
seq1 50 48
seq1 45 36
seq2 17 20
4:整理好后运行:
trainGlimmerHMM
ref.fna exon_file
glimmerhmm_linux_x86_64
genome1-file training-dir-for-genome1 -g
-o glimmerHMM.gff
前一篇:glibc安装