利用SamTools统计reads
(2012-12-04 16:33:39)
标签:
杂谈 |
一直没有太清楚samtools中这个参数的意义
譬如,处理一个始FASTQ文件包含28036024条reads的样本,Tophat比对结果accepted_hits.bam中reads记录
自己处理结果
是自己处理有误,还是。。?
为什么“26452140”还是“28036024”都在samtools flagstat结果中找不到对应的数值呢?
譬如,处理一个始FASTQ文件包含28036024条reads的样本,Tophat比对结果accepted_hits.bam中reads记录
$ samtools flagstat accepted_hits.bam
55176523 in total
0 QC failure
0 duplicates
55176523 mapped (100.00%)
55176523 paired in sequencing
27963041 read1
27213482 read2
48163900 properly paired (87.29%)
52066898 with itself and mate mapped
3109625 singletons (5.64%)
2389916 with mate mapped to a different chr
557742 with mate mapped to a different chr (mapQ>=5)
自己处理结果
$ samtools view accepted_hits.bam |cut -f 1|sort|uniq|wc -l
26452140
是自己处理有误,还是。。?
为什么“26452140”还是“28036024”都在samtools flagstat结果中找不到对应的数值呢?
http://plobcdn.b0.upaiyun.com/static/common/avatar-mid-img.jpg
http://plobcdn.b0.upaiyun.com/static/common/avatar-mid-img.jpg
suxiaoxing - 做完美的自己
赞同来自:
你先使用“samtools flagstat
*.sort.bam
beforermdup.stat”看看beforermdup.stat里面有没有”55176523 in total“这句话,若有的话,那肯定是两个fastq的reads数
0
suxiaoxing - 做完美的自己
赞同来自:
samtools view
accepted_hits.bam |cut -f 1|sort|uniq|wc -l应改为samtools view
accepted_hits.bam |wc -l
前一篇:fastq文件解读