基因组重测序的应用!百欧博伟生物
(2022-08-16 13:42:48)
标签:
知识教育应用 |
分类: 百欧博伟生物 |
一、背景
基因组重测序是对已知基因组序列的物种进行不同个体的基因组测序,并在此基础上对个体或群体进行差异性分析。
全基因组重测序的个体,通过序列比对,可以找到大量的单核苷酸多态性位点(SNP),插入缺失位点(InDel,Insertion/Deletion)、结构变异位点(SV,Structure Variation)位点和拷贝数变异位点(CNV,copy number variation)。SBC可以协助客户,通过生物信息手段,分析不同个体基因组间的结构差异,同时完成注释。
技术路线:提取基因组DNA,利用Covaris进行随机打断,电泳回收所需长度的DNA片段(0.2~5Kb),加上接头,进行cluster制备(Solexa)或E-PCR(SOLiD),最后利用Paired-End(Solexa)或者Mate-Pair(SOLiD)的方法对插入片段进行重测序。
二、生物信息分析流程
1、数据量产出
总碱基数量、Totally mapped reads、Uniquely mapped reads统计,测序深度分析。
2、一致性序列组装
与参考基因组序列(Reference genome sequence)的比对分析,利用贝叶斯统计模型检测出每个碱基位点的最大可能性基因型,并组装出该个体基因组的一致序列。
3、SNP检测及在基因组中的分布
提取全基因组中所有多态性位点,结合质量值、测序深度、重复性等因素作进一步的过滤筛选,最终得到可信度高的SNP数据集。并根据参考基因组序列对检测到的变异进行注释。
4、InDel检测及在基因组的分布
在进行mapping的过程中,进行容Gap的比对并检测可信的Short InDel。在检测过程中,Gap的长度为1~5个碱基。
5、Structure Variation检测及在基因组中的分布
目前SBC能够检测到的结构变异类型主要有:插入、缺失、复制、倒位、易位等。根据测序个体序列与参考基因组序列比对分析结果,检测全基因组水平的结构变异并对检测到的变异进进行注释。
三、应用
用于应用全基因组重测序技术筛查原发性肌张力障碍的致病基因研究:
应用全基因组重测序技术对原发性肌张力障碍病患者进行全基因组重测序,结合生物信息学技术,筛查出可能与原发性肌张力表型患者密切相关的基因突变位点,从而发现新的基因或突变,有助于我们对该疾病进行正确的分子诊断以及提供更好的遗传咨询信息。
目的:(1)通过全基因组重测序技术筛查出可能与原发性肌张力表型患者密切相关的基因突变位点,为了该病家系患者的遗传咨询和临床诊断提供依据。
(2)探讨全基因组重测序技术在罕见疾病致病基因筛查应用中的可行性,为该技术的临床应用提供新的信息。
方法:收集原发性肌张力患者及健康对照者外周血标本及临床资料,提取受试者基因组DNA,选取1例具有典型原发性肌张力表型患者的DNA和100例健康对照者DNA分别构建患者全基因组测序文库和健康对照者全基因组测序文库,并进行高通量测序。下机获得原始数据,经过初步数据过滤后与标准基因组序列比对,获得原发性肌张力表型患者及对照组基因变异信息;通过比较原发性肌张力表型患者及对照组基因变异信息,并结合生物信息学技术,筛查可能与原发性肌张力表型患者密切相关的基因突变位点。
结果:(1)通过全基因组重测序一共得到240G bp的数据,其中患者的数据产出为127.90G bp,原始数据测序深度为45X,有效测序深度为40.30X,基因组覆盖比例为98.90%,SNP数量为3,602,141,Indel数量为58,127,CNV数量为831,SV数量为8,431;健康对照者的数据产出为112.91G bp,原始数据测序深度为40X,有效测序深度为35.70X,基因组覆盖比例为99.50%,SNP数量为3,550,305,Indel数量为558,038,CNV数量为824,SV数量为8222。
(2)SNP公共数据库过滤并将病人与健康对照对比后,得到96个突变位点,突变基因包括错义突变,蛋白质提前终止,移码突变,内含子剪切异常等多种类型。
结论:(1)在临床应用全基因组重测序工作中,患者结合健康人群的对照分析,有利于滤过未明确临床意义的基因组变异位点。
(2)发现ANO3(N294H)突变与疾病的表型密切相关,可能是中国原发性肌张力障碍病患者的致病突变之一。
欢迎访问标准物质资源平台,本站罗列了国家标准物质及本公司自行研制的标准品,对照品及化学试剂,方便了客户对标准物质及化学试剂的查询!所接所有订单全部由上门自取改为快递统一发货,既快捷了外地客户对产品的使用,又规范了公司内部的库房结构!让一站式标准物质的购买更加精准,高效!