第一步:格式转换
vcftols --vcf sample.vcf --plink --out sample
plink
第二步:Q矩阵和画图
for i in 2 3 4 5 6 7 8 ;do python
(1)For i in 2 3 4 5
6 7 8;python distruct.py -K $i
--input=sample
(2)http://omicsspeaks.com/strplot2/网页版,但是输入必须是csv格式
Gene-Based Association (GBA) analysis是基于全基因组关联分析的一种目前GWAS可以分为基于突变(SNP,CNV,SV),基因和通路三种。其中基于突变的主要是单核苷酸多态(SNP),目前,可以使用的软件比较多,比如TASSEL,GAPIT,PLINK等。从近几年发的文章来看,和人相关的GWAS分析一般都是使用PLINK,而动植物的除了TASSEL,GAPIT外,还有EMMAX,GEMMA,FastLMM等。支持gene-based关联分析研究的工具相对来说偏少,本人翻了google后发现有两个软件比较适用,分别是GCTA和VEGAS2,具体使用方法如下:
1、GCTA
参考资料:https://gcta.freeforums.net/board/2/gcta-user-manual
下载地址:https://cnsgenomics.com/software/gcta/#Download
第一步:数据格式转换
plink --allow-extra-chr --vcf test.vcf --make-bed --out test
plink --file test --make-bed
第二步:fastBAT
gcta64 --bfile test --maf 0.05 --fastBAT assoc.txt --fastBAT-gene-list gene_list.txt --out test --thread-num 10
其中:
(1)assoc.txt:
1:
标签:
杂谈 |
$ samtools flagstat accepted_hits.bam
55176523 in total
0 QC failure
0 duplicates
55176523 mapped (100.00%)
55176523 paired in sequencing
27963041 read1
27213482 read2
48163900 properly paired (87.29%)
52066898 with itself and mate mapped
3109625 singletons (5.64%)
2389916 with mate mapped to a different chr
557742 with mate mapped to a different chr (mapQ>=5)
$ samtools view accepted_hits.bam |cut -f 1|sort|uniq|wc -l
26452140