加载中…
个人资料
Mars-Zhan
Mars-Zhan
  • 博客等级:
  • 博客积分:0
  • 博客访问:1,933
  • 关注人气:52
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

GTF格式的refGene如何在Ensembl及UCSC下载

(2014-10-15 00:33:13)
分类: biology

[转载]GTF格式的refGene如何在Ensembl及UCSC下载

已有 1811 次阅读 2013-8-18 00:46 |系统分类:科研笔记|关键词:如何

GTF格式的refGene如何在Ensembl及UCSC下载

1. 从UCSC genome browser中下载GTF格式的refGene, 方法如下:

2) clade选Mammal, genome选Human, assembly选择相应参考序列版本; group选mRNA and EST Tracks, track中选Human mRNAs; table选RefSeq Genes (refGene); output format选GTF-gene transfer format
3) output file输入文件名, refGene.gtf.gz
4) 点击get output
2. Ensembl GTF文件路径
在linux环境下直接通过ftp下载即可.
作为Tophat输入之前, 还需要进行如下处理:
gzip -dc Homo_sapiens.GRCh37.68.gtf.gz | awk '{
    if ($1=="MT") {
        sub(/^MT/, "chrM", $1)
    } else if (!match($1, "^G|^H")) {
        sub(/^/, "chr", $0)
    }
    print
}' >Homo_sapiens.GRCh37.68.cufflinks.gtf
Homo_sapiens.GRCh37.68.gtf.gz是直接从Ensembl的FTP上下载的.

3. 从UCSC下载Chromosome band文件
1) http://genome.ucsc.edu/cgi-bin/hgTables?command=start
2) 在group中选择Mapping and Sequencing Tracks, 再在track中选择Chromosome Band;
3) 点击get output即可.

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有