加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

使用Plink将VCF转换为Treemix所需文件。

(2017-03-16 22:12:40)
标签:

生物信息

关联分析

重测序

材料介绍:11个地点的132个个体重测序,获得VCF格式数据,通过Treemix推测迁移事件。
1、使用vcftools将VCF文件转换成.ped(此格式丢失了数据,我换用了.tped格式)或者.tped格式文件;
vcftools --gzvcf  DK.vcf.gz   --plink-tped --out DK
此步骤结束,可得到 DK.tfam 和 DK.tped 文件;
此时DK.tfam文件格式为:IID IID 0 0 0 0;每个个体一行;顺序为VCF文件中的个体顺序;
这里需要将格式转换成: FID IID 0 0 0 0; 
此时DK.tped文件格式: 0 scaffold36:52 0 52 G G X X: 每个个体2个Allele;顺序排开;
 
2、使用plink统计allele的频数
plink --tfile DK  --freq --noweb --missing --within pop.cov
其中 pop.cov中定义了每个个体属于哪个群体,格式如下;
FID IID clusterID
Egypt 161 1

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有