加载中…
个人资料
葡萄糖
葡萄糖
  • 博客等级:
  • 博客积分:0
  • 博客访问:87,053
  • 关注人气:63
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
博文
标签:

gatk

vcf

genotype

格式转换

snp

分类: perl

当使用GATK做snp calling的时候,最后所生成的文件格式是vcf格式的,但是当我们想进一步对这些snp进行分析的时候,往往需要先把他们转换成genotype格式,比如使用ihs和xp-ehh对选择信号进行检测、ld分析等。但是gatk好像没有提供转换的工具,其他工具好像可以做到,但是我没有用过。所以每次遇到这样的问题,都是自己写脚本,方便又快捷,关键是有源代码,知道是怎么工作的。代码贴在后面了,复制粘贴可以直接使用。

 

vcf文件格式就不说了

genotype文件格式:

染色体   物理位置   genotype1 genotype2 genotype3 genotype4

 

#!usr/bin/perl
use warnings;
use strict;
use File::Basename;
use Getopt::Long;
#this perl script was used for convert the vcf file to genotype file.
my($help,$raw_snp,$genotype,�gen,$numbe);

�gen=('-' => '-', 

标签:

gatk

bwa

snp

indel

分类: 生物信息

第二大步:变异检测

 

1. Variant Calling

标签:

gatk

indel

snp

bwa

分类: 生物信息

9.Local realignment around indels

这一步的目的就是将比对到indel

  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有