加载中…
个人资料
Richard
Richard
  • 博客等级:
  • 博客积分:0
  • 博客访问:149
  • 关注人气:22
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

BED文件格式

(2013-03-19 09:36:51)
分类: 学习

BED 文件格式

       BED 文件格式提供了一种灵活的方式来定义的数据行,以用来描述注释的信息。BED行有3个必须的列和9个额外可选的列。 每行的数据格式要求一致。

必须包含的3列:

  1. chrom, 染色体或scafflold 的名字(eg chr3, chrY, chr2_random, scaffold0671 )

  2. chromStart 染色体或scaffold的起始位置,染色体第一个碱基的位置是0

  3. chromEn 染色体或scaffold的结束位置,染色体的末端位置没有包含到显示信息里面。例如,首先得100个碱基的染色体定义为chromStart =0 . chromEnd=100, 碱基的数目是0-99

 

9 个额外的可选列:

  4. name 指定BED行的名字,这个名字标签会展示在基因组浏览器中的bed行的左侧。

   5. score 01000的分值,如果在注释数据的设定中将原始基线设置为1,那么这个分值会决定现示灰度水平(数字越大,灰度越高),下面的这个表格显示Genome Browser

 

shade                  
score in range   ≤ 166 167-277 278-388 389-499 500-611 612-722 723-833 834-944 ≥ 945

   6. strand 定义链的方向,''+” 或者”-”

   7. thickStart 起始位置(The starting position at which the feature is drawn thickly)(例如,基因起始编码位置)

  8. thickEnd 终止位置(The ending position at which the feature is drawn thickly)(例如:基因终止编码位置) 

  9 itemRGB 是一个RGB值的形式, R, G, B (eg. 255, 0, 0), 如果itemRgb设置为'On”, 这个RBG值将决定数据的显示的颜色。

   10 blockCount BED行中的block数目,也就是外显子数目

   11 blockSize 用逗号分割的外显子的大小, 这个item的数目对应于BlockCount的数目

     12  blockStarts- 用逗号分割的列表, 所有外显子的起始位置,数目也与blockCount数目对应.





参考:http://http://genome.ucsc.edu/FAQ/FAQformat.html#format1

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有