加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

Kallisto软件定量RNAseq

(2017-08-30 12:29:21)
Kallisto软件步骤
index建立转录组索引 和 quant进行转录本水平的表达定量
用法:
  1. 使用kallisto  index命令

kallisto  index  PATH/Mus_musculus.GRCm38.cdna.all.fa.gz -i  ensemblgrc38.mm.87

  1. 使用kallisto quant命令

kallisto quant -i PATH/ensemblgrc38.mm.87 -o ./ -t 24 PATH/R1.clean.fastq.gz PATH/R2.clean.fastq.gz

  1. 在相应文件夹就会得到3个输出文件:abundances.h5、abundances.tsv和run_info.json。

abundances.h5:HDF5二进制格式的文件,包含了运行日志信息、表达丰度估计值、bootstrap估计和转录本长度信息。该文件可以直接用sleuth读取处理,也可以使用kallisto h5dump命令将其转变为纯文本的tsv格式文件;
abundances.tsv:包含有表头的纯本文tsv格式文件,表头是:target_id, length, eff_length, est_counts, tpm;
run_info.json:一个json格式的日志文件
more abundance.tsv
target_id       length  eff_length      est_counts      tpm
NM_001168316    2283    2105.9  160.606 12581
NM_174914       2385    2207.9  1500.72 112128
NR_031764       1853    1675.9  102.671 10106.2
NM_004503       1681    1503.9  331.118 36320.7
NM_006897       1541    1363.9  664     80311.3
NM_014212       2037    1859.9  55      4878.25
NM_014620       2300    2122.9  591.166 45937.9
NM_017409       1959    1781.9  47      4351.17
NM_017410       2396    2218.9  42      3122.5
NM_018953       1612    1434.9  227.999 26212.1
NM_022658       2288    2110.9  4881    381446
NM_153633       1666    1488.9  361.044 40002.4
NM_153693       2072    1894.9  73.6719 6413.67
NM_173860       849     671.903 962     236189
NR_003084       1640    1462.9  0.00164208      0.18517
文献来源:2016年4月4日,NBT杂志上发表了一篇题为“Near-optimal probabilistic RNA-seq quantification”的论文。数据量化软件 Kallisto成为了该文的主要亮点。Kallisto能在10分钟之内完成30M Reads的序列比对和定量分析。

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有