SCI和影响因子：学术评估与商业运作——Nature实证研究之三（下）_江晓原

http://blog.sina.com.cn/u/1214196680

首页博文目录关于我

个人资料

微博

加好友发纸条

写留言加关注

博客等级：
博客积分：

博客访问：
关注人气：
获赠金笔：0支
赠出金笔：0支
荣誉徽章：

正文字体大小：大中小

SCI和影响因子：学术评估与商业运作——Nature实证研究之三（下）

(2016-01-26 12:26:14)

标签：

nature

《自然》杂志

sci

影响因子

加菲尔德

分类： Nature实证研究系列

载《上海交通大学学报》23卷5期（2015）

SCI和影响因子：学术评估与商业运作——Nature实证研究之三（下）

穆蕴秋　江晓原

（上海交通大学，科学史与科学文化研究院，200240）

摘　要：SCI论文（引用）及期刊“影响因子”，被当今学界视为最权威的学术评估手段，却严重忽视了这两者纯粹的商业性质。本文集中考察三个方面内容：SCI论文（引用）和期刊“影响因子”的历史形成过程；上述两者规则设计的合理性质疑；揭示两者背后的商业化运作机制及学术包装手法。

关键词：SCI（科学引用索引）；JCR（期刊引证报告）；影响因子；尤金·加菲尔德

五、对“影响因子”两项准则合理性的质疑

六、为商业机构打造高端学术形象

七、“黄金俱乐部”的准入门槛

五、对“影响因子”两项准则合理性的质疑

　　1955年，“影响因子”首次作为一个专门术语出现在加菲尔德在《科学》杂志上的一篇文章中，他在两个地方谈及“影响因子”：[[1]]

　　通过该系统（注：指科学引用索引），可以有效检索收录期刊论文被哪些文章引用过，这在历史研究中将发挥明显作用，当人们尝试评估某项研究成果的意义，或它对同时期的文献或思想产生的影响时,“影响因子”应该比科学家出版成果的绝对数量更具说服力。

　　对于意义重大的文章，引用索引具有量化价值，它能帮助历史研究者评估文章的影响——这也就是“影响因子”。

　　从这两段话可以看出，加菲尔德最初是将一篇文章的被引用次数当成“影响因子”。

　　后来在1963年的一篇文章中，加菲尔德把“影响因子”定义重新修正为“期刊文章的平均被引用次数”。[[2]]　这主要是为了解决期刊“体量（size）”差异带来的问题。按照格罗斯夫妇首创的传统期刊评估方法，期刊优劣取决于它总的被引用次数，但通常情形下，期刊发表文章的数量越多，获得的引用次数也就越多。对一些“体量”小的期刊而言，传统方法无疑是不公平的。

　　汤森路透现今逐年发布的JCR 报告上，影响因子算法的标准定义是：期刊X在前面两年发表的源刊文本（source items）在当年度的总被引用数，除以期刊X在前面两年发表的文章（article）总数量，即为期刊X当年度影响因子的得数。[[3]] 其中“源刊文本”，指的是SCI（后来包括SSCI 和 A&HCI）任一收录期刊上发表的所有文本。算式表达为：

期刊N年度影响因子=【期刊（N-2）+（N-1）年所有源刊文本在N年度的总被引用数】/期刊（N-2）+（N-1）年发表文章总数

　　从算式可看出，计算期刊“影响因子”需遵守两项基本准则：

　　第一准则，源刊文本的“引用窗口（citation window）”是两年。通俗的解释就是，SCI期刊文本只在发表后第二、三年度发生的引用，对期刊“影响因子”产生有效贡献——尽管实际上它们可能一直会被引用。

　　加菲尔德在1972年《科学》杂志上的文章中，对这一准则的设定进行了解释（参见该文注释29）[[4]]，　他通过逐年统计1964至1970年SCI收录期刊的参考文献，发现发表年限在三年内的比例依次为：31.09%、30.24%、26.60%、25.91%、25.32%、25.18%和23.95%（换一种呈现方式就是，期刊参考文献和注释发表年限在三年以上的比例依次为：68.91%、69.76%、73.40%、74.09%、74.68%、74.82%、76.05%）。

　　从这组数据，加菲尔德还总结出一种趋势，随着SCI收录期刊数量逐渐增加，发表年限三年内的被引用文献比例在逐渐下降——这意味着如果这种趋势保持下去，比例可能越来越小。但不知何故他居然就得出判定，“论文被引用主要发生在发表当年后的两年内”。

　　照理来说，“两年有效引用”作为“影响因子”算法非常重要的一项准则，加菲尔德有必要在文章中（或单独撰文）详细说明缘由，但他居然只用一条注释草草带过。这也难怪一些西方学者在讨论中，甚至无从知晓“两年”标准是按什么依据得来的。[[5]]

　　事实上，针对这一问题，学者格兰采尔（W. Glanzel）和莫伊德（H. Moed）2002年的一篇论文，已经提供了一个非常有力的反驳案例。[[6]]　他们抽样考察医学期刊《柳叶刀》（Lancet）和社会学期刊《美国社会学评论》（American Sociological Review），对两份期刊1980年发表文章在之后十年的平均被引用率进行逐年比较。发现在前面三年，《柳叶刀》1980年论文的平均引用率明显高于《美国社会学评论》，但随着年限逐渐累积，《美国社会学评论》的引用率大大高于《柳叶刀》（参见表4）。

　　这一结果意味着，对医学期刊和对社会学期刊采用同样的“引用窗口”年限并不合理。医学作为最活跃的研究领域，新旧理论的更迭在频繁发生，其中某些成果发表后引发的关注甚至是“爆发式”的。而是在人文社会学领域，新的思想和观点提出后，往往需要等待若干年的“发酵”，才可能引发关注。换言之，汤森路透-ISI逐年公布的“影响因子”结果，很难讲是一个客观的结论。

表4：两份期刊1980年发表文章不同年限的平均引用率

引用年限

平均引用率

1980-80

1980-81

1980-82

1980-85

1980-89

柳叶刀

0.6

2.4

4.5

9.7

14.0

美国社会学评论

0.2

1.8

4.3

12.1

20.9

　　不过，在“影响因子”被捧上神坛的今天，学界即使意识到这一点，“路径依赖”已让他们别无选择。2003年，加菲尔德对“两年有效引用”的回应，就完全是一副“木已成舟能奈我何”的架势：

　　我们不想等若干年后才了解一份期刊的被引用情况。ISI完全有能力计算3年、5年的影响因子。我们甚至有10年、15年的影响因子数据库，但它们需要单独订阅。[[7]]

　　在这个傲慢的表态中，“影响因子”的合理性是无所谓的，商业利润才是王道——“它们需要单独订阅”。

　　第二准则， “影响因子”算式分母的“文章”只包括“原创研究论文（original research paper）”和“评论（review）”。

　　这一准则专门针对的是那些除了发表原创论文和评论，还发表社论、技术通信、来信、通告、读者来信、科学讯息观察和报告、书评等文本的刊物，当今世界上最知名的几家刊物——《自然》、《科学》、《柳叶刀》、《美国医学会杂志》（The Journal of the American Medical Association），以及《新英格兰医学杂志》（The New England Journal of Medicine），都属于这一类型。对单纯发表原创论文的期刊，如知名的《现代物理评论》（Reviews of Modern Physics）和《化学评论》（Chemical Reviews），就不需要进行这种区分，因为它们的“源刊文本”数量就等于“文章”数量。

　　这一准则的形成也有一个渐变的过程。1972年，加菲尔德发表在《科学》杂志的一篇文章中，[[8]]　以1967、1968和1969三年的SCI数据为基础，计算 1969年度的期刊“影响因子”，他当时的做法是将《自然》、《科学》、《柳叶刀》、《美国医学会杂志》这类刊物上的所有文本都计入算式分母，理由是（参见该文注释28）：“全部计入”不失为较为便捷的处理手段；更重要的是，“这些期刊上的非学术文本也是潜在的被引用文本”。

　　这种做法显然对《自然》、《科学》之类的期刊非常不利，庞大的分母直接拉低它们的影响因子，排名结果全都落到40之后（参见表5）。

　　针对这一情况，在1975年首次作为SCI附卷发布的JCR报告中，加菲尔德对规则进行调整，规定分母项只包括三类“学术文本”：原创研究论文（original research articles）、评论文章（review articles）和技术报告（technical notes）。“非学术文本”不再计入的理由是，它们“很难获得引用”。[[9]]^、[[10]]

　　分母数量大幅减小对《自然》、《科学》这类期刊的影响因子结果产生了立竿见影的效果——尽管加菲尔德只委婉地承认“部分归结于这个原因”，但相较1969年，它们的排名全部大幅上升，其中《美国医学会杂志》惊人地提升了100位（参见表5）。

　　分母规则在1995年度的JCR报告中再次被调整，范围进一步缩小，“技术报告”被剔除，只保留“原创研究论文”和“评论文章”两项——这一做法基本保持到今天。[[11]]

关于“准则二”还有很大的讨论空间，此处姑先指出这一点，后文将做进一步探讨。

表5：1969、1974年五本知名刊物在不同标准下的影响因子排名结果

年份	排名	自然	科学	美国医学会杂志	柳叶刀	新英格兰医学杂志
1969	修改定义前的位数	55	40	127	99	56
1974	修改定义后的位数	38	10	27	8	3

　　相较SCI推广阶段引发的争议，一个饶有意味的对比结果是，尽管“影响因子”从提出到算法定则最终确立，与《自然》和《科学》有着极深的渊源——1955年，它首次作为专门术语出现在《科学》上；1972年《科学》刊登了1969年度期刊“影响因子”报告；1976年，《自然》摘载了JCR报告的减缩版——考虑到JCR在1975年才首次出版，这几乎等同于这两份大牌期刊在帮助它进行市场“预热”和产品“推广”了，[[12]]　而且这两份期刊当时没有出现任何对它的质疑或讨论文章。[[13]]

　　一种可能的解释是，“影响因子”当时没有引起学界的关注。但这种解释不合常理，因为“影响因子”是基于SCI报告的数据得出的，如果SCI存在诸多不合理之处，“影响因子”当然也会存在缺陷，何况加菲尔德提出把“影响因子”作为衡量学术期刊优劣的标准，涉及的同样是学界非常敏感的问题，很难想象学者们能对SCI提出犀利的质疑，对“影响因子”的缺陷却完全视而不见。

　　关于“影响因子”和《自然》杂志之间的微妙关系，笔者将在后续论文“Nature实证研究之四”中，展开进一步的专题研究。

六、为商业机构打造高端学术形象

　　ISI创立之前，美国的科技情报通常由政府学术机构牵头采集、整理和公布，套用今天时髦的话来讲，加菲尔德一手开创了科技情报的商业化经营模式。《科学》杂志1978年的一篇文章称他为“把信息王国建立在脚注上的百万富翁”，可谓十分贴切。[[14]]

　　对加菲尔德而言，1964年投产SCI完全是背水一战的商业冒险。为了弥补资金缺口，他把公司20%股权以50万美元价格卖给华尔街风投。SCI当年的市场发售价格为700美元，老年加菲尔德在一次访谈中回忆，它的第一份订单来自美国中央情报局（CIA）图书馆，出人意料的是第二份订单——它来自中国。[[15]]^、[[16]^]

　　事实证明，加菲尔德对SCI的产品决策堪称“高风险高收益”。SCI从1964年推向市场到1971年短短七年时间，ISI的利润平均每年以27.5%增长，随后又开发了十余款新品，公司业务迅速拓展到全球近十个国家，成为世界第一大科技信息服务咨询公司。[[17]]

　　1988年，加菲尔德把ISI超过50%的股权卖给JPT出版公司（JPT Publishing）。1992年4月，汤森路透以2.1亿美元价格收购JPT出版公司。据汤森路透首席运营官说，交易主要是为了得到ISI，“ISI在全球拥有30万客户，每年净利润约为1500万美元”。[[18]]

　　当前，汤森路透和英国里德·爱斯维尔集团（Reed Elsevier，成立于1993年）、荷兰威科集团（Wolters Kluwer，初建于1836年），共同占据全球情报市场90%的份额。[[19]]

除了SCI和JCR这样的“灵魂产品”，ISI开发的其它知名产品还包括：[[20]]

　　目录快讯（CC），1956年首次面市，对各类期刊和书籍的目录进行汇编，以周刊形式出版，订阅者可通过它快速了解相关领域最新发表的前沿消息。CC最早只对管理类期刊的目录进行汇编（前面提到贝尔实验室购买的这就这种），1957年，它将汇编对象拓展到医药、化学、生命科学等领域的学术期刊。作为ISI开发的第一个产品，CC在SCI出现之前一直是公司最赚钱的产品。

　　化合物索引库（Index Chemicus，简称IC），这一数据库除了有助研究者了解新出现化合物的相关研究数据，还可获得重要有机化学期刊对它的评价结果。1960年开发推出后尽管一直只赔不赚，但加菲尔德对其倾注巨大热情，手下四名主要副手集体辞职也未能迫使他终止，IC如今已成为汤森路透的又一热门产品。

　　由于ISI经营的客户对象以学者和学术机构为主，所以尽可能让自身显得“学术”，也是一种非常重要的营销手段。

　　在公司草创阶段，加菲尔德对公司的冠名，已经带有明显的学术包装意味。如果说“尤金·加菲尔德学会”的前用名还显出几分“伪学术”的话，“科学情报研究所”听起来就完全像一家政府科学机构了（这对中国这样的发展中国家来说尤其如此）。加菲尔德非常坦率地承认，他要的就是这种容易引起混淆的效果——为的是与化学摘要（Chemical Abstracts）和国家医学图书馆这类政府学术机构争夺市场，“特别是在国外，‘科学情报研究所’这样的叫法，很容易被当成一家非盈利机构”。[[21]]

　　ISI商业运转正式上轨之后，接纳了两位诺奖获得者成为公司董事会成员，这其中当然也有打造高端“学术”形象的考虑。[[22]]

　　此外，为了拉近和学术圈的关系，ISI为学术机构、大学图书馆设立专项奖学金，奖金可作为这些机构购买ISI产品的抵扣——这其实相当于发放某种商业“抵扣券”。[[23]]

　　当然，最有效的手段还是发表学术论文和参与学术研讨会，产生的效果可谓一举两得，除了提升企业学术形象，还可以把论文发表期刊和研讨会作为ISI产品的推广平台。

　　加菲尔德本人在这方面充分发挥了表率作用，他一生勤奋高产，对倾力打造的各种信息产品相关的科学写作，始终保持着高昂的兴趣——其中不少成果发表在《自然》、《科学》这类被学界认为高端的期刊上。据作者统计，从1950年代至2012年，加菲尔德发表文章400余篇。1986年，他还创办了《科学家》（The Scientist）杂志。

　　ISI的学术“包装”是如此卓有成效，以至有被误导的公众经常写信抗议，指责ISI作为一家政府科技情报机构，履行职责并不到位。为此加菲尔德又不得不反复澄清，表示ISI完全是一家以市场盈利为目的的商业公司。[[24]]

七、“黄金俱乐部”的准入门槛

　　加菲尔德1985年写过一篇文章专门谈论他的“生意经”，标题是“为你的钱袋子着想”。 [[25]]　大意是，在收录期刊增加、通货膨胀导致成本投入增加的情形下，ISI两种主要产品——CC和SCI的价格涨幅，仍然大大低于行业同类产品的平均增长水平，这主要得自公司不断改进技术，完善产品功能，吸引更多用户，达到了薄利多销的目的。为了贴补成本，《目录快讯》从1982年开始刊登商业广告。[[26]]

　　这些做法都表明，ISI经营方式和一般商业公司并无二致，都要参照成本预算、销售业绩的前提下考虑可能赚取的利润。所以 ISI每年都要做严格的预算，控制期刊的收录数量，对什么样的期刊满足收录条件，设定相应的准入门槛。

　　以SCI为例，早期对收录期刊的选择并没有统一标准，主要由加菲尔德的团队根据经验进行鉴选。但人为经验往往存在很大局限，比如，1964年发布的首期SCI报告，居然没收录在科学界享有很高声誉的《哲学通汇》（Philosophical Transactions）[[27]]，而另一份当时享有世界声誉的苏联期刊《热工程杂志》（Teploenergetica），直到1968年才首次被收录。[[28]]

　　JCR的出现，为SCI筛选期刊提供了一项相对独立的参照评估指标：通过计算待选刊物的“影响因子”，可以了解它被SCI期刊引用的情况。[[29]]

　　以此为基础，加菲尔德将SCI筛选收录期刊的标准归纳为三条：

　　待选刊物的SCI引用情况；

　　杂志本身需要满足的各种形式要件（出版周期、编辑团队、作者国际多样性等）；

　　相关领域专家的评估意见。[[30]]

　　汤森路透基本沿用了这三条筛选标准。[[31]]　其实，按加菲尔德的说法，这样的规则在早期运用过程中，由于存在成本控制的问题，已经存在“灵活操作”的余地：

我们每年做完杂志收录预算，一如既往总有一些杂志出版社或编辑会表达意愿，希望他们的杂志能被收录进来。如果杂志完全满足筛选要求，那怎么办？我们要么告诉杂志主办方等下一年，要么让他们同意自己支付杂志收录的相关费用，这样做可以帮助我们在预算允许的情形下继续经营下去。[[32]]

　　当然，加菲尔德也不忘记澄清，“原则上这是好事。但也造成一些下意识的猜测，认为杂志可以靠钱买进CC或SCI的收录名单。”[[33]]

　　而这样的事也确有发生，1995年8月，《科学美国人》（Scientific American）在一篇文章中批露，墨西哥一家期刊为了能被SCI收录，每年被要求花10万美元订阅ISI的信息产品。[[34]]　汤森路透为此大为光火，威胁要将《科学美国人》告上法庭，后者迫于压力，在10月号上做了更正声明，才算了结此事。[[35]]、^[[36]]

　　SCI如今俨然已被打造成学界的“黄金俱乐部”，准入门槛今非昔比，特别在发展中国家，学术期刊一旦被SCI收录，即被看成“权威”的标志。

　　日常生活中常见的情形是，一些高级“俱乐部”对申请加入的成员，除了必要的资质考量之外，还要求交纳高昂的“会员费”。在SCI面世不到十年的时候，一些符合收录要求的杂志，已经被要求自己为“准入”费用埋单。而如今，在坐落于美国纽约时代广场的汤森路透公司独家经营下，SCI和JCR背后究竟是怎样的光景，确实给人留有很大的想象空间。

（全文完）

[[1]] E. Garfield .Science citation index:a new dimension in indexing[J]. Science .1955.144:649-654.

[[2]] E. Garfield, & I. Sher. New factors in the evaluation of scientific literature through citation indexing[J]. American Documentation, 1963, 14(3), 195-201.

[[3]]考虑到影响因子定义在本研究系列讨论中的重要性，有必要附上原文： The impact factor of journal X would be calculated by dividing the number of all current citations of source items published in journal X during the previous two years by the number of articles journal X published in those two years.

[[4]] E. GarfieldCitaition analysis as a tool in journal evaluation[J]. science. 1972.178:471-479.

[[5]]Éric Archambault, Vincent Larivière .History of the journal impact factor:contingencies and consequences[J]. Scientometrics.2009. 79: 635-649.

[[6]] W. Glänzel, H. Moed. Journal impact measures in bibliometric research[J]. Scientometrics, 2002. 53(2) :171–193.

[[7]]E. Garfield. The meaning of the Impact Factor[J]. International Journal of Clinical and Health Psychology. 2003. 3（2）:363-369.

[[8]]E. Garfield. Citation analysis as a tool in journal evaluation[J].Science.1972-11-03.178(4060):471-479.

[[9]]E. Garfield. Preface to Journal Citation Reports-Vol. 9 of SCI .published by Institute for Scientific Information(philadephia).1975.7-8.

[[10]] E. Garfield. Journal Citation Reports[J]. Current Contents.1976-08-30.35:7-20.

[[11]] 1995 Journal Citation Reports. published by Institute for Scientific Information(philadephia). 1996.11.

[[12]] E. Garfield. Significant journals of science[J]. Nature.1976-12-16. 264: 609-615.

[[13]] M. Benarie. Significant journals of science[J]. Nature .1977-01-20.265, 204

[[14]] W. Broad. Librarian turned entrepreneur makes millions off mere footnotes[J]. Science. 1978-11-24. 202:853.

[[15]] Transcript of an Interview Conducted by Robert V. Williams at Philadelphia, Pennsylvania. P 30、 P 56[EB/OL]（1997-07-29）[2015-03-20].http://garfield.library.upenn.edu/papers/oralhistorybywilliams.pdf

^[[16]^] New Books [J]. Science. 1964-06-05.144（3623）:1211.

[[17]]S. Lazerow. Institute Scientific Information[M]//Encyclopedia of Library and Information science ed. A. Kent et al. New York:Marcel Dekker.1974.12:89-97.

[[18]]The Thomson Corporation History . [EB/OL] [2014-12-05] http://www.fundinguniverse.com/company-histories/the-thomson-corporation-history/

[[19]]Laurence Bianchini . Scientific publication : the model and scandals . [EB/OL] （2011-07-19） [2015-01-05]

https://www.mysciencework.com/news/2852/scientific-publication-the-model-and-scandals

[[20]]作者任职的大学当前就订阅了汤森路透七种信息产品：Web of Science(包括SCI, SSCI, A&HCI等)，JCR，BIOSIS Previews（生物科学数据库）， Current Contents（目录快讯）， Derwent Innovations Index(德温特专利情报数据库)， Essential Science Indicators (基本科学指标, ESI)，ISI Emerging Market(ISI新兴市场信息服务)。

[[21]] E. Garfield .Chemical Information Entrepreneurship – A Personal Odyssey [J].Joseph Priestley Society Symposium “Knowledge: Our Competitive Weapon” at The Chemical Heritage Foundation, Philadelphia, PA. 2004-11-09.

[[22]] W. Broad. Librarian turned entrepreneur makes millions off mere footnotes[J]. Science. 1978-11-24. 202:853-857.

[[23]] E. Garfield .The ISI grant program[J]. Current Contents.1977-05-02.(18):5-6.

[[24]] E. Garfield .The who and why of ISI[J]. Current Contents. 1975-01-06.1:5.

[[25]] E. Garfield .More for Your Money: Technology, Marketing, and Hard Work Help ISI Beat Inflation and the Information Explosion[J]. Current Contents.1985-10-14.41:3-8.

[[26]] E. Garfield. Will Advertising Change Current Contents?— Yes and No[J]. Current Contents.1981-12-14.50:5-6.

[[27]] P.Wouters. The Citation Culture. Doctoral Thesis（University of Amsterdam in the Netherlands）.1999. 19.

[[28]] M. Weinstock. Citation index[J]. Essays of an information scientist.1962-1973.1:208.

[[29]] E. Garfield. Is citation frequency a valid criterion for selecting journals? [J]. Current Contents. 1972-4-5. 13:289-290.

通常情形下，SCI收录期刊的参考文献（和注释）的范围要远远大于SCI收录期刊范围本身，所以一份刊物即使没有被SCI收录，也可以统计它被SCI期刊引用的情况，计算它的影响因子。

[[30]] E. Garfield. How ISI selects journals for coverage: quantitative and qualitative considerations[J]. current contents,1990-05-28.22:5-13.

[[31]]Jim Testa. The Thomson Reuters Journal Selection Process . [EB/OL] （2012-05）[2014-12-05] http://wokinfo.com/essays/journal-selection-process/

[[32]] E. Garfield .Citation Frequency and Citation Impact[J]. Current contents .1973-02-7.5-6.

[[33]] E. Garfield. The Economics and Realpolitik of Exponential Information Growth; or, Journal Selection Ain’t Easy! [J]. Current Contents.1973-08-22. 34:5-6.

[[34]] W. Gibbs. Lost Science in the Third World[J]. Science American.1995-08.92.

[[35]] Clarifications and Errata[J]. Science American.1995-10.10.

^[[36]^] Transcript of an Interview Conducted by Robert V. Williams at Philadelphia, Pennsylvania. P 75-77[EB/OL]（1997-07-29）[2015-03-20].http://garfield.library.upenn.edu/papers/oralhistorybywilliams.pdf

阅读┊ 收藏 ┊ 喜欢 ▼ ┊打印┊举报/Report

前一篇：江晓原：为什么《星球大战》是没有思想的里程碑？

后一篇：《火星救援》能告诉我们什么？它就是NASA的宣传片

新浪BLOG意见反馈留言板　欢迎批评指正