加载中…
个人资料
铁汉1990
铁汉1990
  • 博客等级:
  • 博客积分:0
  • 博客访问:1,252,110
  • 关注人气:830
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
相关博文
推荐博文
正文 字体大小:

每日一生信--测序技术的简单的比较

(2014-02-14 16:49:01)
标签:

sangersequencing

罗氏454技术:焦磷酸

illuminahiseq2000/25

iontorrent“personal

分类: bioinformatic

第一代测序技术:

Sanger sequencing

在扩增的过程中,用4中不同标记的双末端脱氧的碱基来终止链的延伸,然后用电泳来分离不同长度的扩增片段,根据链的末端荧光标记来识别不同长度链的最后一个碱基是什么,这样末端碱基的位置以及类别知道后,我们把所有的已知位点连接起来就清楚了整个链的序列。

现在仍在使用的原因在于:

序列长度长(700-1000nt)

错误率低

单个碱基质量高

缺点:测序通量低(一般就96孔)

 

第二代测序技术:

二代测序也称深度测序、大规模平行测序等。主要有34种平台:IlluminaHiSeq(包括GAMiSeq等不同型号),Roche454Life Technologies (即ABI)的SOLiDIon Torrent

Roche 454 FLXPyrosequencing, 检测焦磷酸,emulsion PCR;

Illumina Genome Analyzer: Sequencing-by-synthesis with reversible terminators, bridge PCR;

ABI SOLiD: Sequencing by ligation, emulsion PCR

ABI Ion Torrent: Pyrosequencing, 检测质子电位,emulsion PCR

   罗氏454技术:焦磷酸测序技术

05年,第一个二代测序技术

无需电泳,边测序,边合成;DNA片段也无须荧光标记;碱基在加入到序列的时候,脱掉一个焦磷酸,通过检测焦磷酸来知道加上去的是什么碱基;

步骤:

11个特异性的测序引物和单链DNA模板结合,然后加入酶混合物(包括DNA PolymeraseATP SulfurylaseLuciferaseApyrase)和底物混合物(包括APSLuciferin)

2,所有的wells一次仅仅加入4种碱基中的一种,该碱基是没有信号的;如果它刚好能和DNA模板的下一个碱基配对,则会在DNA 聚合酶的作用下,添加到测序引物的3‘末端,同时释放出一个分子的焦磷酸(PPi);ATP硫酸化酶的作用下,生成的PPi可以和APS结合形成ATP;在荧光素酶的催化下,生成的ATP又可以和荧光素结合形成氧化荧光素,同时产生可见光。通过CCD光学系统即可获得一个特异的检测峰,峰值的高低则和相匹配的碱基数成正比

3反应体系中剩余的dNTP和残留的少量ATPApyrase的作用下降解。

4碱基依次更替的加入,重复上面的步骤

测序的问题:重复序列长度越大,测序的分辨率越低,现在可以达到12-13个重复碱基的样子

This sequencing method has trouble with homopolymeric runs, e.g. AAAAAAA.  On the first flood of A you get 10x the light, rather than getting 1x ten separate times.  The difference between 1 and 2 As is easy to detect, A vs. AA. But 9 As vs. 10 As is only an 11% difference in intensity and more difficult to detect. The current chemistry is good up to about 10 or 12, but it’s sequence context dependent– you may get different results depending on neighboring sequence

目前一条序列大概650bp左右,也能到1000bp

每一个run大概有1Mreads,而每个reads大概是650个碱基,所以每个run大概650M的碱基;而每个run大概$10,000(仅仅是试剂);适用用基因组的重头组装;比1代便宜,但是比其他的测序要贵。

 

   Illumina HiSeq 2000/2500

现在使用笔记普遍的测序技术。HiSeq 2000Illumina公司2010年推出的一款新的测序仪,它的测序原理和Genome Analyzer相同,采用稳定的可逆终止法边合成边测序技术。该技术使用4种含有末端阻断基团和不同荧光信号的碱基进行模板互补链的合成, 不仅确保了测序的高精确性和高顺序性,而且排除了由重复序列和同聚物导致的测序错误。

HiSeq2000: ~600Gb/run, in 2 flowcells at 300Gb/flowcell, 8 lanes per flowcell at 200M reads/lane $10,000/600Gb run (reagents only) 从价格上来说也就4541000分之一

HiSeq2500: only 180Gb/run, 2 lanes/flowcell, 150Mreads/lane

HiSeq2500速度上更快一些

原理:加入改造过的DNA聚合酶和带有4种荧光标记的dNTP。这些核苷酸是“可逆终止子”,因为3’羟基末端带有可化学切割的部分,它只容许每个循环掺入单个碱基。此时,用激光扫描反应板表面,读取每条模板序列第一轮反应所聚合上去的核苷酸种类。之后,将这些基团化学切割,恢复3'端粘性,继续聚合第二个核苷酸。如此继续下去,直到每条模板序列都完全被聚合为双链。这样,统计每轮收集到的荧光信号结果,就可以得知每个模板DNA片段的序列

针对重头测序,ChIPseq, RNA-seq 比较好

cost: $20,000/600Gb per run   

测序流程:                

文库制备 Library Preparation

文库制备的具体流程因样本种类和测序目的的不同而不同,比如基因组DNA,转录组(mRNA)microRNA, CHiP-Seq,外显子捕获测序等等,但是大同小异,基本过程是把长链DNA随机打断成短片段,两端接上通用引物,再经过12循环左右的PCR把文库放大。

基因组DNA为例,文库制备详细流程如下:

模板提取:按常规进行DNA的提取、纯化、定量。DNA模板越完整越好,用量不多,只需要0.1-5 ug就足以进行二代测序。

1.1  片段化

运用高压气体的雾化作用、超声波的气穴作用、超声波、金属离子、酶等手段或设备将DNA打断,SR测序的模板长约300碱基,PE测序的模板长约500碱基,MP测序的模板长约1k-10k碱基。凝胶电泳切下所需长度的DNA片段。

1.2  末端修补

使用2种酶分别把DNA片段的两端补平;磷酸化;3‘端挂上一个A

 

1.3  加接头

接头的3’端有一个突出的T;它们通过类似T-A克隆的方式连接起来。不同应用,接头的序列不一样,所以不能混用。

1.4  割胶纯化

留下两端连接完整的产物,去掉残缺不全的。

1.5  PCR富集

进行10-12循环的PCR,使产物富集。

1.6  文库质控

PCR完成后可以进行一次凝胶电泳,或者使用2100,检测文库的质量和浓度。

 

簇生成 Cluster Generation

簇生成在flowcell上进行,要用到专用的仪器cluster station或者cBot。主要步骤有模板杂交,桥式PCR,线性化,末端封闭,测序引物杂交。

2.1  模板杂交

DNA文库经NaOH变性,稀释调整浓度到6pM左右;引入流动池,随机地与分布在FC通道内壁的接头杂交;通过互补链合成而固定到FC上,原来的模板单链则在碱变性后被冲去。

2.2  桥式扩增

固定在FC上的DNA单链的另一端与FC内壁的相应接头杂交,形成桥状结构,在高保真DNA聚合酶的作用下,合成互补链。这一过程重复20次左右,每条单链都被放大到1000-6000条,形成一簇。上百万的簇随机分布在FC的内壁上。

2.3  线性化

此时的簇由双链构成,为了测序,需要把它们切割成单链。FC上固定的接头预先设有化学试剂或者酶的切割位点,因而可以定向切断一条单链,通过碱变性、缓冲液冲洗而去除。

2.4  末端封闭

在所有的游离末端上加一个ddNTP,防止测序时的随机延伸。

2.5  引物杂交

引入测序引物,杂交到通用引物的结合位点上。此时FC即已准备就绪,可以进行测序。

 

边合成边测序Sequencing-by-Synthesis (SBS)

SBSGA或者HiSeq等测序仪上进行。主要步骤有碱基延伸,荧光激发和拍照,剪切等。这3个步骤重复进行,想测定多少个碱基,就重复多少次。推荐每次SR实验测定150个碱基,PE实验测定2x150个碱基。

3.1  碱基延伸

FCcBot搬到测序仪上,进行碱基延伸。所用的dNTP带有荧光基团和终止基团两种修饰,因而每次只能延伸1个碱基。去除未结合的带荧光标记的所有核苷酸。

3.2  信号采集

激光激发荧光基团产生信号,相机拍摄照片。拍照过程相当耗时,一次循环所产生的信号需要40分钟左右才能拍照收集完毕。

3.3  剪切

酶剪切去除荧光基团和终止基团后,去除荧光,并且使链末端的碱基回复到可延伸的状态。

重复上面步骤,进行第二个碱基的信号收集。

 

数据分析 Data Analysis

数据分析包括初级分析、次级分析、数据展示3步。初级分析相当于一代测序的终点:碱基识别。

4.1  初级分析

碱基识别的原理非常简单,简直称不上“原理”这么庄严的词。把照片按时间顺序排列,对每个簇进行坐标定位,然后根据每个簇的颜色变化读取一条序列。序列长度取决于SBS的循环次数。在碱基识别的同时,软件进行碱基质量评估,为每个测得的碱基赋予一个QV分值。

4.2  次级分析

次级分析包括序列的组装和拼接,SNP以及基因突变的识别,mRNAmicorRNA定量等。

4.3  数据展示

由于获得的是海量数据,无法人眼一一过所以需要用软件将分析结果总结归纳成图标和曲线。

Illumina一次实验得到600G碱基的数据,初级分析的结果文件大小为600G比特。

 

Ion Torrent “Personal Genome Machine” (PGM) and Proton

我们实验室就这家伙,据说120万啊

Ion Torrent was founded by the guy who invented 454 before it was sold to Roche

Ion Torrent now owned by Life Technologies

PGM lower output, Proton higher output

both benchtop

uses wells much smaller than 454.  454 uses ~100um wells, Ion Torrent uses 1.3um down to 0.3um wells

density 160M – 1B wells per chip

output in the tens or hundreds of Gb per 2-hour run

Proton II early 2013, Proton III late 2013

same technology as 454 but instead of pyrophosphate it watches the H+ ion that comes off

at a level of abstraction, it is a really sensitive pH meter.

electronics built into bottom of well

no secondary reaction

same issue with homopolymer runs as Roche

200nt reads in 24 hours

Ion Chef is the to-be-released tool to go from sample to beads ready to load into this machine, automatically

 

 

参考资料:

CureFFI.org的博客:http://www.cureffi.org/2012/12/11/uab-day-1-intro-to-sequencing/

cmcheng的个人博客:http://bbs.sciencenet.cn/blog-649590-509003.html


0

阅读 评论 收藏 转载 喜欢 打印举报/Report
  • 评论加载中,请稍候...
发评论

    发评论

    以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

      

    新浪BLOG意见反馈留言板 电话:4000520066 提示音后按1键(按当地市话标准计费) 欢迎批评指正

    新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

    新浪公司 版权所有