学者的H指数及其计算
(2013-01-09 16:57:44)
标签:
杂谈 |
分类: 毕业论文 |
转自:赵星(ZhaoXing),http://www.sciencenet.cn/u/zhaoxing/
编者按:本博文主要科普两个知识。第一,什么是学者的h指数?第二,如何计算?
1.什么是h指数?
h指数是美国物理学家Hirsch于2005年提出用于“评价科学家的科研绩效”。虽然笔者看来其原始论文的题目及Hirsch对h指数的含义描述值得讨论,但h指数在短短几年时间内就全球风靡,很快被扩展用于期刊、研究团队、大学、科研院所、学科、国家、基金和研究热点等不同领域。下面以科学家个人h指数进行介绍,其它对象的h指数可以此类推。
h指数的物理含义可简单的表述为:“有h篇论文被引用了不少于h次”。不少学者认为h指数综合衡量了论文的数量和影响力。有趣的是,原本人为规定的h指数居然被一些学者数学推导得出:h指数与原有的评价指标之间存在着微妙的联系。而且数据也一定程度上证实了这些联系。
h指数主要是一个影响力判定参数,其特点是关注科学家发表了多少有影响力的论文。因此,若你的研究没有一定的质量,没有引起学界的关注和交流,无论你发表了多少论文,都无法获得一个较高的h指数。h指数的测度有利于那些出精品的科学家,也可以发现哪些人是“灌水”者。h指数面前,你可以有一些文章成了“睡美人”,但要避免一辈子都怀才不遇。
2.如何计算h指数?
科学家h指数的计算方法可描述为:将科学家某个时段(也可是全部)的论文,按被引次数从高往低排,然后每篇论文得到一个序号,将每篇论文的序号和被引次数进行比较,找到序号h,使得这一篇论文的序号h小于或等于它的被引次数,而下一篇论文(序号为h+1)的序号大于它的被引次数。也许这样的描述还是让你头晕,那么看一个例子,你就明白了。首先将某一学者的论文按被引次数从高往低排,得到表1,然后计算过程如表1所示。
表1某学者的h指数计算过程
序号 |
论文 |
论文被引频次 |
判定 |
1 |
引用次数最多的论文A |
18 |
1<18 |
2 |
引用次数第2的论文B |
8 |
2<8 |
3 |
引用次数第3的论文C |
8 |
3<8 |
4 |
引用次数第4的论文D |
6 |
4<6 |
5 |
引用次数第5的论文E |
5 |
5=5,h指数为5 |
6 |
引用次数第6的论文F |
4 |
6>4 |
7 |
引用次数第7的论文G |
4 |
7>4 |
… |
… |
… |
… |
外文论文的被引次数获取现在常采用的数据库有WebofScience,Scopus和Google学术等,中文论文常采用的有CNKI引文数据库,CSCD和人文社科的CSSCI等。需指出的是,CNKI引文数据库的首页数据问题很大,建议进入旧版手工检索。
当然,任一单一参数的评价都有局限性,h指数的问题也很多,以后再详述。
笔者旗帜鲜明的反对任何单位采用任一h指数及其变体进行涉及资源分配问题的任何形式量化考核。
下面是百度百科上面对H指数的解释:
h指数(也叫h-index )是一个混合量化指标,最初是由美国加利福尼亚大学圣地亚哥分校的物理学家乔治·赫希(Jorge Hirsch)在2005年的时候提出来的,其目的是量化科研人员作为独立个体的研究成果。h指数被认为是对先前众多衡量指标的一大改进;先前的衡量指标都倾向于关注科研人员在其发表论文的期刊,因而,它们都假定作者的贡献等同于期刊的平均值。如果一位科学家的出版成果以它们被引生命周期的数字进行排序的话,那么h指数就是一个最大值,这个最大值是指每篇论文至少被引了h次的h篇文章。
H指数的计算基于其研究者的论文数量及其论文被引用的次数。赫希认为:一个人在其所有学术文章中有N篇论文分别被引用了至少N次,他的H指数就是N。如美国耶鲁大学免疫学家理查德·弗来沃(Richard Flavell)发表的900篇文章中, 有107篇被引用了107次以上,他的H指数是107。
可以按照如下方法确定某人的H指数:1、将其发表的所有SCI论文按被引次数从高到低排序;2、从前往后查找排序后的列表,直到某篇论文的序号大于该论文被引次数。所得序号减一即为H指数。