加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

关于产前诊断NIPD(NIPT)的数据处理思路(含loess回归矫正)

(2015-01-21 14:46:12)
分类: 生物信息学
1:在得到原始数据fastq格式,对数据做质控处理,一般选择的最短长度为35(50)nt, 针对不同的测序平台选择不同的质控软件

2;质控完毕后做比对,使用的比对软件有bwa\bowtie\TMAP,当然各有针对性

3:比对后,将比对形式转换为bam格式,这里输出的是最好的是唯一比对的结果(请查看前面的博文),并去除了duplicated reads(picard与samtools都可以),输出的比对质量过滤(见到过用10作为阈值的或者30)

4:下载人类基因组染色体大小文件,下载链接:http://genome.ucsc.edu/goldenpath/help/hg19.chrom.sizes,里面的染色体并不是都需要,只保留一部分就好, 例如:

chr1    249250621

chr2    243199373

chr3    198022430

chr4    191154276

chr5    180915260

chr6    171115067

chr7    159138663

chr8    146364022

chr9    141213431

chr10   135534747

chr11   135006516

chr12   133851895

chr13   115169878

chr14   107349540

chr15   102531392

chr16   90354753

chr17   81195210

chr18   78077248

chr19   59128983

chr20   63025520

chr21   48129895

chr22   51304566

chrX    155270560

chrY    59373566

5:根据染色体大小建立bin文件(bin的大小影响不大20k\50k\100k\300k),并计算出应bin中的GC含量,使用的命令如下:
bedtools makewindows -g hg19.chrom.sizes -w 300000 > hg19_300.bed 
   
6:并计算出相应bin中的GC含量,使用的命令如下:

bedtools nuc -fi genome.fa   -bed hg19_300.bed | cut -f 1-3,5 >  300.gc.bed

7;计算每个bin中比对上的reads counts

bedtools coverage  -abam Sample.bam -b hg19_300.bed > Sample.counts

8:关于的loess回归我只是简单的写了个程序并计算了样本的染色体z_score,小伙伴们要是需要可以跟我索取代码。本来想把代码贴在这里,果断不行,各种符号就没有了。

说明:1:计算z_score的公司来自文献:2011-Non-invasive prenatal assessment of trisomy 21 by multiplexed maternal plasma DNA sequencing: large scale validity study

2:GC矫正使用的公式来自文献:2013-Non-invasive prenatal diagnostics of aneuploidy using next-generation DNA sequencing technologies, and clinical considerations

3:比对质量 bam文件的质控来自文献:2013- Feasibility Study of Semiconductor Sequencing for Noninvasive Prenatal Detection of Fetal Aneuploidy

4:另外还有一个专门用来分析产前诊断的R软件包,可以参考:2014-RAPIDR an analysis package for non-invasive prenatal testing of aneuploidy

5:关于 loess回归参考一下博文学习就差不多了:http://cos.name/2008/11/lowess-to-explore-bivariate-correlation-by-yihui/#more-57(谢益辉大牛的博客文章拜读)


0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有