加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

合并contig数据以完成基因组组装(MIX&&CISA)

(2014-08-13 19:16:17)
分类: 生物信息学
网站链接:https://github.com/cbib/MIX
参考文献:Finishing bacterial genome assemblies with Mix
文献链接: http://www.biomedcentral.com/1471-2105/14/S15/S16

安装什么的都在网站链接里面提供的很详细了,例如:

preprocessing.py -o contigs.fa asm.quiver.fasta NGS_contig.fa

注:asm.quiver.fasta 我这里为一个测序平台输出的contig

NGS_contig.fa   是另外一个平台拼接出来的contig文件,后面还可以跟多个


nucmer --maxmatch -c 30 -l 30 -banded -prefix=alignments contigs.fa contigs.fa

show-coords -rcl alignments.delta > alignments.coords

注意:以上两步需要安装Mumer软件


Mix.py -a alignments.coords -c contigs.fa -o output_dir/


cd-hit-est -i contigs.fa -o cdhit/contigs.fa -c 0.99

注意:最后这一步是我自己加的建议使用,相关参考见链接:http://ged.msu.edu/angus/metag-assembly-2011/velvet-multik.html,关键聚类的参数-c 可以多设置几个值看看


#########################################



软件文章:2013-CISA: Contig Integrator for Sequence Assembly of Bacterial Genomes

软件链接:http://sb.nhri.org.tw/CISA/en/Instruction


下载以后即可以使用,需要修改两个配置文件:
配置文件一(Merge.config):(作用就是将来自不同方法或者不同仪器拼接的contig整合在仪器)


 count=3 data=assembly1.fasta,title=Contig_m1 data=assembly2.fasta,title=Contig_m2 data=assembly3.fasta,title=Contig_m3 Master_file=Contigs_m.fa min_length=100 (default:100) Gap=11
运行命令:

python Merge.py Merge.config

配置文件二(CISA.config):(设定该软件需要的其它软件以及文件输入输出的路径,以及制定基因组大小)


 genome=genome size infile=file outfile=file nucmer=your installed path/nucmer R2_Gap=0.95 (default:0.95) CISA=your installed path/CISA1.0 makeblastdb=your installed path/makeblastdb blastn=your installed path/blastn
运行命令:

    >python CISA.py CISA.config


(附说明:该软件自我感觉没有Mix好)


0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有