加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

测序常见问题分析[转]

(2013-03-01 14:08:16)
分类: 基因组

测序常见问题分析

2012-10-08 15:22 星期一
  打开峰图文件,依据图形初步判定测序质量,SAP酶纯化后的头峰杂度比较大,至少前50bp序列一般不可信,后续峰形如果还不错,主峰高、噪峰低、未见干扰峰,测序结果应该可信。一个正常的成功反应,能保证测序峰形清晰的长度为500 Bases (实际600 —800 Bases)。 在进行DNA测序时,紧接引物的10 — 30 Bases有时不一定能完全读清楚。
   由于DNA结构上的原因,有时会出现反应中途无法进行之情况。如:G/C rich; G/C Cluster;Poly A、 Poly T的连续结构等。此外,另一种情况为反应中途出现的套峰现象,此种情况一般为DNA结构中的重复序列,造成测序用引物和模板之间有二个以上的结合位点。具体问题分析如下:
  1: 测序结果有很多套峰,出现很多N值
  原因分析:
  PCR产物直接进行测序,在PCR产物长度以后将无反应信号,机器将产生许多N值。
  在序列的起始端出现N值,主要是由于有未去除的染料单体造成的干扰峰,是机器无法正确判读出位何值。有时,引物二聚体或者起始端小片段的丢失,也会出现N值。
  模版本身含杂合序列,有等位基因。
  
  2:为什么找不到我的PCR引物序列?
  用PCR引物作为测序引物,所测序列是从引物3末端后第一个碱基开始的,所以就找不到您的测序引物了。可以进行反向测序,得到引物的反向互补序列。还可以将所测片段克隆到适当载体中,由于通用引物与插入序列有一段距离,就可以测出您的引物序列。
  
  3:测序结果和文献资料不一样,为什么?
  原因有很多,如同一种动物,在不同的种族之间,或者不同的个体之间,基因序列也不一定完全一样。如果是PCR产物克隆测序, 那还有PCR过程中的错配因素等等。我们提供的测序结果是客户样品序列的忠实结果,不能保证和文献序列完全一致。
  
  4:过短的PCR产物为什么不适于直接测序?
  首先由于一般的PCR产物纯化试剂盒要求产物片段大于200bp,过短的PCR产物不能进行纯化;再者,测序的前50bp和后50bp的序列是不好的,所以不适于直接测序。
  
  5:酒精如果没有挥发完全,在约300bp处会出现连续异常的G峰,酒精挥发时间过长会导致DNA断裂。
  图一:打开峰图文件,依据图形初步判定测序质量,SAP酶纯化后的头峰杂度比较大,至少前50bp序列一般不可信,后续峰形如果还不错,主峰高、噪峰低、未见干扰峰,测序结果应该可信。一个正常的成功反应,能保证测序峰形清晰的长度为500 Bases (实际600 —800 Bases)。 在进行DNA测序时,紧接引物的10 — 30 Bases有时不一定能完全读清楚。
   由于DNA结构上的原因,有时会出现反应中途无法进行之情况。如:G/C rich; G/C Cluster;Poly A、 Poly T的连续结构等。此外,另一种情况为反应中途出现的套峰现象,此种情况一般为DNA结构中的重复序列,造成测序用引物和模板之间有二个以上的结合位点。具体问题分析如下:
  1: 测序结果有很多套峰,出现很多N值
  原因分析:
  PCR产物直接进行测序,在PCR产物长度以后将无反应信号,机器将产生许多N值。
  在序列的起始端出现N值,主要是由于有未去除的染料单体造成的干扰峰,是机器无法正确判读出位何值。有时,引物二聚体或者起始端小片段的丢失,也会出现N值。
  模版本身含杂合序列,有等位基因。
  
  2:为什么找不到我的PCR引物序列?
  用PCR引物作为测序引物,所测序列是从引物3末端后第一个碱基开始的,所以就找不到您的测序引物了。可以进行反向测序,得到引物的反向互补序列。还可以将所测片段克隆到适当载体中,由于通用引物与插入序列有一段距离,就可以测出您的引物序列。
  
  3:测序结果和文献资料不一样,为什么?
  原因有很多,如同一种动物,在不同的种族之间,或者不同的个体之间,基因序列也不一定完全一样。如果是PCR产物克隆测序, 那还有PCR过程中的错配因素等等。我们提供的测序结果是客户样品序列的忠实结果,不能保证和文献序列完全一致。
  
  4:过短的PCR产物为什么不适于直接测序?
  首先由于一般的PCR产物纯化试剂盒要求产物片段大于200bp,过短的PCR产物不能进行纯化;再者,测序的前50bp和后50bp的序列是不好的,所以不适于直接测序。
  
  5:酒精如果没有挥发完全,在约300bp处会出现连续异常的G峰,酒精挥发时间过长会导致DNA断裂。
  
  图一:http://www.seq.cn/data/attachment/forum/201210/07/145430uipp2dd8wnjiph3l.png
  第一个峰,重叠干扰。如果不判读为干扰峰,那就说明样品不纯,如果是基因组DNA,就很好地说明了样品为杂合子,该位点可能存在SNP现象(T/G)。如果判读为干扰峰,我们只需认定样品此处碱基为T为行了。第二个峰,错位干扰。如果不判读为干扰峰,则说明样本可能比预期多一个碱基(G),如果判读为干扰峰,我们仍只需认定样品此处碱基为T为行了。
  
  6:为什么用PCR产物或质粒测序时,经常会出现套峰现象?
  (1) 下图是pGEM-T载体测序的结果,在83位点处测序结果出现双峰,即模板中含有两个或两个以上的相同载体,但是插入片段不同。
  
  解决办法:重新挑取单克隆或者重新提取质粒。需要注意的是,重新进行PCR反应或者酶切鉴定仅能证明该克隆含有插入片段,并不足以证明模板的单一。
  
  图二:http://www.seq.cn/data/attachment/forum/201210/07/145459ddnkjbiohjhqjb3j.png
  2)对于PCR产物也同样有模板不单一的情况,如下图所示,在197bp前测序峰表现为杂或有明显套峰,且在197bp位置有一个高高的A峰,这个A峰标志着此PCR产物中有一个片段大小为200bp左右的小片段。
  解决方法:对PCR产物切胶纯化,再进行测序。
  
  7:poly结构的测序结果
  图三:http://www.seq.cn/data/attachment/forum/201210/07/1505547q2n2lpfnl2ogrif.png
  以polyT为例,在polyA/T结构之后往往出现移码现象,而在polyG/C之后会往往导致测序信号的衰减。
  解决办法:使用反向引物对模板进行测序,测到该poly结构处,即可完成模板全长的拼接。
  9:G/C rich、G/C Cluster。这种情况一般表现为测序信号突然减弱或消失
  A T的连续结构。这种情况一般表现为A、T连续结构后 面的测序结果出现套峰。根据文献记载,原因在于聚合酶进行聚合反应时,由于A或T的连续,聚合酶难以识别完整的每个A或T,在某个A或T的后面便开始进行A或T连续结构以后序列的聚合反应(打滑现象),造成测序结果紊乱,出现套峰。
  一般在多少个A或T的后面能出现这种情况呢? 现在还没有这方面的报道。根据我们的经验,这一情况的出现和A或T的连续结 构后面的序列的排列情况有着直接的关系。有时10多个A或T的连续结构后面便出现套峰,但有时60~70个A或T的连续结构后面的序列也一样可以完整地读出来。具体情况还有待考证。
  一般来说,PCR片段直接测序时,A或T的连续结构后面的序列测序结果都会出现套峰。原因在于测序时经历了PCR反应及测序反应(测序反应本身也是PCR反应)二次聚合酶的打滑现象。
   原因不明的复杂结构,测序结果出现突然信号减弱或消 失。从序列上看,DNA碱基排列并无特别异常。估计是DNA整体出现复杂结构,从某一位置开始聚合酶的聚合反应便无法进行。
来自:测序之家 http://blog.tianya.cn/blogger/post_read.asp?BlogID=4512360&PostID=47120944

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有