kegg 数据库学习笔记
(2017-10-16 19:19:38)分类: 生物信息学 |
1:作kegg注释,比对使用kobas的ko数据
2:对应的注释信息,需要下载的有,kegg的所有物种org,可以使用R包KEGGREST(http://bioconductor.org/packages/release/bioc/html/KEGGREST.html)
org <- keggList("organism")
write.csv(org,"/Users/fanyucai/Desktop/kegg.org.csv")
4:获得物种简写后获得每个物种对应的gene
描述(http://www.kegg.jp/kegg/docs/keggapi.html#get)
此链接显示的是物种has的所有基因条目及其描述信息:http://rest.kegg.jp/list/hsa
5:使用命令下载所有基因条目:curl -O http://rest.kegg.jp/list/hsa
在当前文件夹生称一个hsa文件。
参考学习链接:http://www.cnblogs.com/xudongliang/p/6845818.html
kegg数据库统计情况:http://www.kegg.jp/kegg/docs/statistics.html
6:截止2018.3.16日总共包含代谢通路(map)524条,ko是高亮KO后的map图,查看map的所有编号(http://www.kegg.jp/kegg/pathway.html),但是以07开头的没有对KO新的KO号,011开头的全部的map,以012开头的综述性的map,以010开头的是化学结构图,也可以对KO进行扩展
mapmanually drawn reference pathwaykoreference pathway
highlighting KOsecreference metabolic pathway highlighting EC
numbersrnreference metabolic pathway highlighting
reactionsorganism-specific pathway generated by converting KOs to
gene identifiers
011global map (lines linked to KOs)
012overview map (lines linked to KOs)
010chemical structure map (no KO expansion)
ko01062
ko01100
ko01110
ko01120
ko01130
ko01200
ko01210
ko01212
ko01220
ko01230
真正的ko pathway 是http://rest.kegg.jp/link/pathway/ko
总共包含440条ko条目,其中减去上面9个综合通路,实际上可注释的总数为431个。
7:KO是KEGG对一类基因簇,截止2018.3.16日总干包含21867个基因簇(http://www.kegg.jp/kegg-bin/get_htext?ko00000.keg),总共包含注释的基因有25875103条
8:一簇基因对应1个KO,1个ko包含多个KO,之间的对应关系:http://rest.kegg.jp/link/pathway/ko
9:kegg还有一种以map为标识的通路图,大部分与ko对应,但ko的数量要少于map,截止2018年3月15,ko的数量为440
10:通过http://www.kegg.jp/kegg-bin/get_htext?ko00000.keg可以下载文件,可以获得所有的KO号。知道单一KO号然后通过http://rest.kegg.jp/link/genes/K00500可以获得单一KO号对应的基因列表
11:KEGG目前涉及到的物种:Eukaryotes (439)+Prokaryotes (4890)
后一篇:常用python包