GWAS中的质量控制(qualitycontrol)
(2018-05-29 09:58:12)分类: GWAS |
质量控制是用于评价样本和基因分型芯片的基因型性能的操作,在实验中存在很多影响因素,如DNA降解、加样错误或是芯片杂交失败等,因此在下一步基因型分析之前评价实验性能是很重要的。同时,确定和排除那些很有可能确实或者错误分型的SNPs是十分重要的。
(1)样本检出率(sample call
rate):是指对于某个样本而言,通过测序并成功判型的SNPs与所有检出的SNPs的比值,通常的标准应当在80%或90%以上。
(2)杂合性程度(heterozygosity):这个参数过高即被排除,因为过高的杂合说明样本可能被污染,从而导致杂合基因型数目不相称,通常标准应该控制在23%-30%之间。
2、单核苷酸多态性的质量控制
(1)SNP检出率(SNP call
rate):指对于某一个SNP位点,被成功检测到的样本与所有样本的比值,一般要求在90%以上。
(2)较小等位基因频率(minor allele frequency,
MAF):对于那些MAF较小的SNPs,能得到的信息量较少,而且目前GWAS对这些SNP的检出效能也不高,通常要求MAF在3%以上。
(3)哈代-温伯格平衡(Hardy-Weinberg equilibrium,
HWE)检出,HWE有助于确定那些有明显基因分型错误的SNPs,因此一般要求位点SNP的等位基因频率符合哈代-温伯格平衡。