无创产前基因检测(NIPT)的检测方法是将多个受检者的标本混合在一起测序,对于这样的方法有一个常见的疑问:如何能够区分开每个标本的检测结果,怎么保证每一例标本的检测质量?要回答这个问题,首先让我们来了解一个高通量测序技术的重要策略——多重检测(Multiplexing)。
什么是高通量测序技术中的多重测序?
多重测序是指将带有特殊分子标签(barcode或者index)的不同来源的DNA标本,放入一个反应体系进行测序的方法。与一次检测一种来源的DNA相比,多重检测通过分子标签来区分不同的DNA标本,从而在提高测序的高效性的同时也确保测序的准确性。
人类个体的基因组是30亿个碱基对,即3Gb(3
giga base pairs,即3X109碱基对)。目前的高通量测序仪,单次测序反应可以获得200Gb以上的数据量。例如,BGISEQ1000可以达到2300Gb。这种数据产量远远超越一个人的全基因组测序所需要的数据量,因此产生了将多个标本放入一个反应体系同时测序的多重测序技术。
测序目的不同,所需要的测序量也不同。在测序量满足相关分析需求的情况下,继续增加测序量,对于检测一些发生频率非常低的变异有帮助。不过由于试剂消耗会增加,并需要使用更多的计算资源,所以成本会相应增加。因此,针对不同 的应用,往往需要权衡检测的目标与成本。
目前的高通量测序仪,测序反应需要在一个反应器或载体中进行,以盛放测序反应所需要的反应物质,包括待测DNA模板以及酶等生化试剂。早期的测序仪如3730xl,
测序过程在毛细管电泳泳道进行 。相比之下,高通量测序仪实现了反应体系微量化,测序反应在微量反应器中进行。考虑到不同标本或者不同应用目标,这种反应器一般会物理划分成多个区域,可以分别容纳多个不同测序反应体系,实现多个标本同时测序。每一个分区,对应一个测序反应体系。一个测序反应,可以只检测一个标本,为全基因组的大数据实验提供充分的序列产出。对于基因组较小的物种以及一些不需要大数据产出的标本,人们就开始考虑是否可以将不同标本放到一个测序反应体系中,也就是共享一个测序反应器分区,这样就可以降低每一例标本的测序成本。
这种将多个标本在同一个反应体系同时检测的方法就是通过多重测序技术来实现的。该技术需要在每例标本的核酸片段上加上一小段可以识别的核苷酸序列分子标签(一般称为index或者barcode)。随后,将多个标本放入一个反应体系测序(标本混合,sample
pooling)。
测序时,核苷酸序列标签与待测DNA片段同时被检测,并最终通过这些标签序列的碱基差异,将不同待测标本区分开来。多重测序的方法已经广泛应用于各种高通量测序平台。各家测序公司都开发了适用于各自测序仪的分子标签体系。不同测序技术加入序列标签的原理也不尽相同,有的是通过PCR反应加入,有的是将序列标签合成到测序接头(adaptor)上,通过连接反应加入到待测DNA模板分子上。
http://s1/mw690/004jUbpDzy6MliPczni00&690多个DNA标本混合测序是否可靠?" TITLE="NIPT检测: 多个DNA标本混合测序是否可靠?" />
http://s4/mw690/004jUbpDzy6MliQmBlV73&690多个DNA标本混合测序是否可靠?" TITLE="NIPT检测: 多个DNA标本混合测序是否可靠?" /> 高通量测序的出现使测序数据产出通量有了大幅提升,而多重测序技术进一步提高了单次测序的样本通量。对于NIPT这类染色体非整倍数差异分析,对测序量的需求相对较小,结合多重测序,单标本的成本降到人们可以接受的水平,从而能够率先走向临床应用。
NIPT标本进行多重测序时,如何确定最合适的标本数目?
一般来说,每个测序反应的测序数据量,由测序序列分子数(reads
数)和单个测序序列分子(reads)的读长(碱基数,bp)共同决定。而每一个测序反应可以混合的标本数量,除了与所使用的测序平台有关外,主要取决于单个标本所需要的测序数据量。
针对某一类型别的测序平台,每一个测序反应可以混合的标本数目,可以根据测序目的,计算出一个理论上限,最终经过实验测试确定。通常单一反应体系标本混合数量的上限通过几项指标来综合评估,包括单个标本总序列数、序列唯一比对率、GC含量以及序列重复率等。其中,单个标本总序列数是最为重要的一个指标。
以NIPT检测胎儿染色体非整倍体为例。染色体数目的检测主要是将测序序列(reads)与人类基因组参照序列比对并计数,50bp的读长就可以满足需要。此时,标本测序数据量就取决于测序序列分子数(reads
数)。
除了测序数据量外,NIPT的检测效率还与标本的生物学特性有关系,其中最重要的因素是母体外周血中胎儿游离DNA的含量。在母体外周血中,胎儿源性的游离DNA只占全部游离DNA的一少部分,其余大部分是来自于母体自身。母体外周血中胎儿游离DNA含量一般在11%–13.4%左右,并且存在个体差异(Wang
E,Prenat
Diagn. 2013)。现有NIPT检测技术要准确检测非整倍体,一般需要胎儿游离DNA含量在4-5%以上(Royal
College of Obstetricians and Gynaecologists. Scientific Impact
Paper No. 15 March 2014)。
图2显示的是孕妇外周血中胎儿游离DNA含量与所需有效测序量的关系。为了检出胎儿DNA浓度≥3.5%的异常,我们需要至少7M的测序序列分子数(reads
数)。
在满足这个最低标准的基础上,增加测序量,检测效率会有相应提高,也就是说,当胎儿DNA含量不足3.5%时,也可以准确检测出胎儿非整倍体。例如,数据量达到12M以上,可以有效检出2%左右的异常标本。如果一个测序反应中混合标本过多,部分标本的数据量有可能达不到7M,此时这些标本的检测准确性将受影响;反之,如果混合标本过少,会增加单个标本的测序成本。在保证单个标本检测效果的前提下,需要确定测序最合理的混合标本数量。
http://s11/mw690/004jUbpDzy6Mlj3YMdA3a&690多个DNA标本混合测序是否可靠?" TITLE="NIPT检测: 多个DNA标本混合测序是否可靠?" />
图3(a)(b)是BGISEQ1000测序平台一次NIPT
评估实验的测试数据。根据每次测序产出的数据量和每例标本所需数据量要求,分别取24、32和48例标本进行混合,测序之后将实验结果与检测质控标准比较,从而确定最优标本混合数量。如将7M作为单个标本检测最低数据量要求,且只有当全部标本都能达到这个测序量时,方可通过质控。数据显示,只有24例标本混合时,方能满足上述标准。经过多次上述试验,结果也都如此,因此确定混合标本数量为24例时,可以保证单个标本的检测质量。图3(c)显示的是一个24例标本多重测序的数据。从原始测序分子数柱状图可以看出,这24例标本的测序量都能达到7M,实际上大部分都达到了10M。
http://s5/mw690/004jUbpDzy6Mlj7601S94&690多个DNA标本混合测序是否可靠?" TITLE="NIPT检测: 多个DNA标本混合测序是否可靠?" />
如果混合的标本数量超出这个范围会怎样?超出这个范围,检出质量将受到影响,需要进行二次甚至三次检测,实验成本与检测周期都将成倍增加。所以,需要建立极为严格的质量管理体系,在一系列的标准操作流程和质控节点的全程监控下完成检测。当一项体外诊断检测产品申请国家药监系统审核时,也会有相关技术评估环节,其主要目的也是确保每一例标本的检测质量。
加载中,请稍候......