SCI和影响因子:学术评估与商业运作——Nature实证研究之三(下)

标签:
nature《自然》杂志sci影响因子加菲尔德 |
分类: Nature实证研究系列 |
载《上海交通大学学报》23卷5期(2015)
SCI和影响因子:学术评估与商业运作——Nature实证研究之三(下)
穆蕴秋 江晓原
(上海交通大学,科学史与科学文化研究院,200240)
摘 要:SCI论文(引用)及期刊“影响因子”,被当今学界视为最权威的学术评估手段,却严重忽视了这两者纯粹的商业性质。本文集中考察三个方面内容:SCI论文(引用)和期刊“影响因子”的历史形成过程;上述两者规则设计的合理性质疑;揭示两者背后的商业化运作机制及学术包装手法。
关键词:SCI(科学引用索引);JCR(期刊引证报告);影响因子;尤金·加菲尔德
五、对“影响因子”两项准则合理性的质疑
六、为商业机构打造高端学术形象
七、“黄金俱乐部”的准入门槛
五、对“影响因子”两项准则合理性的质疑
1955年,“影响因子”首次作为一个专门术语出现在加菲尔德在《科学》杂志上的一篇文章中,他在两个地方谈及“影响因子”:[[1]]
通过该系统(注:指科学引用索引),可以有效检索收录期刊论文被哪些文章引用过,这在历史研究中将发挥明显作用,当人们尝试评估某项研究成果的意义,或它对同时期的文献或思想产生的影响时,“影响因子”应该比科学家出版成果的绝对数量更具说服力。
对于意义重大的文章,引用索引具有量化价值,它能帮助历史研究者评估文章的影响——这也就是“影响因子”。
从这两段话可以看出, 加菲尔德最初是将一篇文章的被引用次数当成“影响因子”。
后来在1963年的一篇文章中,加菲尔德把“影响因子”定义重新修正为“期刊文章的平均被引用次数”。[[2]] 这主要是为了解决期刊“体量(size)”差异带来的问题。按照格罗斯夫妇首创的传统期刊评估方法,期刊优劣取决于它总的被引用次数,但通常情形下,期刊发表文章的数量越多,获得的引用次数也就越多。对一些“体量”小的期刊而言,传统方法无疑是不公平的。
汤森路透现今逐年发布的JCR报告上,影响因子算法的标准定义是:期刊X在前面两年发表的源刊文本(source items)在当年度的总被引用数,除以期刊X在前面两年发表的文章(article)总数量,即为期刊X当年度影响因子的得数。[[3]] 其中“源刊文本”,指的是SCI(后来包括SSCI 和 A&HCI)任一收录期刊上发表的所有文本。算式表达为:
期刊N年度影响因子=【期刊(N-2)+(N-1)年所有源刊文本在N年度的总被引用数】/期刊(N-2)+(N-1)年发表文章总数
从算式可看出, 计算期刊“影响因子”需遵守两项基本准则:
第一准则,源刊文本的“引用窗口(citation window)”是两年。通俗的解释就是,SCI期刊文本只在发表后第二、三年度发生的引用,对期刊“影响因子”产生有效贡献——尽管实际上它们可能一直会被引用。
加菲尔德在1972年《科学》杂志上的文章中,对这一准则的设定进行了解释(参见该文注释29)[[4]], 他通过逐年统计1964至1970年SCI收录期刊的参考文献,发现发表年限在三年内的比例依次为:31.09%、30.24%、26.60%、25.91%、25.32%、25.18%和23.95%(换一种呈现方式就是,期刊参考文献和注释发表年限在三年以上的比例依次为:68.91%、69.76%、73.40%、74.09%、74.68%、74.82%、76.05%)。
从这组数据,加菲尔德还总结出一种趋势,随着SCI收录期刊数量逐渐增加,发表年限三年内的被引用文献比例在逐渐下降——这意味着如果这种趋势保持下去,比例可能越来越小。但不知何故他居然就得出判定,“论文被引用主要发生在发表当年后的两年内”。
照理来说,“两年有效引用”作为“影响因子”算法非常重要的一项准则,加菲尔德有必要在文章中(或单独撰文)详细说明缘由,但他居然只用一条注释草草带过。这也难怪一些西方学者在讨论中,甚至无从知晓“两年”标准是按什么依据得来的。[[5]]
事实上,针对这一问题,学者格兰采尔(W. Glanzel)和莫伊德(H. Moed)2002年的一篇论文,已经提供了一个非常有力的反驳案例。[[6]] 他们抽样考察医学期刊《柳叶刀》(Lancet)和社会学期刊《美国社会学评论》(American Sociological Review),对两份期刊1980年发表文章在之后十年的平均被引用率进行逐年比较。发现在前面三年,《柳叶刀》1980年论文的平均引用率明显高于《美国社会学评论》,但随着年限逐渐累积,《美国社会学评论》的引用率大大高于《柳叶刀》(参见表4)。
这一结果意味着,对医学期刊和对社会学期刊采用同样的“引用窗口”年限并不合理。医学作为最活跃的研究领域,新旧理论的更迭在频繁发生,其中某些成果发表后引发的关注甚至是“爆发式”的。而是在人文社会学领域,新的思想和观点提出后,往往需要等待若干年的“发酵”,才可能引发关注。换言之,汤森路透-ISI逐年公布的“影响因子”结果,很难讲是一个客观的结论。
表4:两份期刊1980年发表文章不同年限的平均引用率
引用年限 平均引用率 |
1980-80 |
1980-81 |
1980-82 |
1980-85 |
1980-89 |
柳叶刀 |
0.6 |
2.4 |
4.5 |
9.7 |
14.0 |
美国社会学评论 |
0.2 |
1.8 |
4.3 |
12.1 |
20.9 |
不过,在“影响因子”被捧上神坛的今天,学界即使意识到这一点,“路径依赖”已让他们别无选择。2003年,加菲尔德对“两年有效引用”的回应,就完全是一副“木已成舟能奈我何”的架势:
我们不想等若干年后才了解一份期刊的被引用情况。ISI完全有能力计算3年、5年的影响因子。我们甚至有10年、15年的影响因子数据库,但它们需要单独订阅。[[7]]
在这个傲慢的表态中,“影响因子”的合理性是无所谓的,商业利润才是王道——“它们需要单独订阅”。
第二准则, “影响因子”算式分母的“文章”只包括“原创研究论文(original research paper)”和“评论(review)”。
这一准则专门针对的是那些除了发表原创论文和评论,还发表社论、技术通信、来信、通告、读者来信、科学讯息观察和报告、书评等文本的刊物,当今世界上最知名的几家刊物——《自然》、《科学》、《柳叶刀》、《美国医学会杂志》(The
Journal of the American Medical
Association),以及《新英格兰医学杂志》(The New England Journal of
这一准则的形成也有一个渐变的过程。1972年,加菲尔德发表在《科学》杂志的一篇文章中,[[8]] 以1967、1968和1969三年的SCI数据为基础,计算 1969年度的期刊“影响因子”,他当时的做法是将《自然》、《科学》、《柳叶刀》、《美国医学会杂志》这类刊物上的所有文本都计入算式分母,理由是(参见该文注释28):“全部计入”不失为较为便捷的处理手段;更重要的是,“这些期刊上的非学术文本也是潜在的被引用文本”。
这种做法显然对《自然》、《科学》之类的期刊非常不利,庞大的分母直接拉低它们的影响因子,排名结果全都落到40之后(参见表5)。
针对这一情况,在1975年首次作为SCI附卷发布的JCR报告中,加菲尔德对规则进行调整,规定分母项只包括三类“学术文本”:原创研究论文(original research articles)、评论文章(review articles)和技术报告(technical notes)。“非学术文本”不再计入的理由是,它们“很难获得引用”。[[9]]、[[10]]
分母数量大幅减小对《自然》、《科学》这类期刊的影响因子结果产生了立竿见影的效果——尽管加菲尔德只委婉地承认“部分归结于这个原因”,但相较1969年,它们的排名全部大幅上升,其中《美国医学会杂志》惊人地提升了100位(参见表5)。
分母规则在1995年度的JCR报告中再次被调整,范围进一步缩小,“技术报告”被剔除,只保留“原创研究论文”和“评论文章”两项——这一做法基本保持到今天。[[11]]
关于“准则二”还有很大的讨论空间,此处姑先指出这一点,后文将做进一步探讨。
表5:1969、1974年五本知名刊物在不同标准下的影响因子排名结果
年份 |
排名 |
自然 |
科学 |
美国医学会杂志 |
柳叶刀 |
新英格兰医学杂志 |
1969 |
修改定义前的位数 |
55 |
40 |
127 |
99 |
56 |
1974 |
修改定义后的位数 |
38 |
10 |
27 |
8 |
3 |
相较SCI推广阶段引发的争议,一个饶有意味的对比结果是,尽管“影响因子”从提出到算法定则最终确立,与《自然》和《科学》有着极深的渊源——1955年,它首次作为专门术语出现在《科学》上;1972年《科学》刊登了1969年度期刊“影响因子”报告;1976年,《自然》摘载了JCR报告的减缩版——考虑到JCR在1975年才首次出版,这几乎等同于这两份大牌期刊在帮助它进行市场“预热”和产品“推广”了,[[12]] 而且这两份期刊当时没有出现任何对它的质疑或讨论文章。[[13]]
一种可能的解释是,“影响因子”当时没有引起学界的关注。但这种解释不合常理,因为“影响因子”是基于SCI报告的数据得出的,如果SCI存在诸多不合理之处,“影响因子”当然也会存在缺陷,何况加菲尔德提出把“影响因子”作为衡量学术期刊优劣的标准,涉及的同样是学界非常敏感的问题,很难想象学者们能对SCI提出犀利的质疑,对“影响因子”的缺陷却完全视而不见。
关于“影响因子”和《自然》杂志之间的微妙关系,笔者将在后续论文“Nature实证研究之四”中,展开进一步的专题研究。
六、 为商业机构打造高端学术形象
ISI创立之前,美国的科技情报通常由政府学术机构牵头采集、整理和公布,套用今天时髦的话来讲,加菲尔德一手开创了科技情报的商业化经营模式。《科学》杂志1978年的一篇文章称他为“把信息王国建立在脚注上的百万富翁”,可谓十分贴切。[[14]]
对加菲尔德而言,1964年投产SCI完全是背水一战的商业冒险。为了弥补资金缺口,他把公司20%股权以50万美元价格卖给华尔街风投。SCI当年的市场发售价格为700美元,老年加菲尔德在一次访谈中回忆,它的第一份订单来自美国中央情报局(CIA)图书馆,出人意料的是第二份订单——它来自中国。[[15]]、[[16]]
事实证明,加菲尔德对SCI的产品决策堪称“高风险高收益”。SCI从1964年推向市场到1971年短短七年时间,ISI的利润平均每年以27.5%增长,随后又开发了十余款新品,公司业务迅速拓展到全球近十个国家,成为世界第一大科技信息服务咨询公司。[[17]]
1988年,加菲尔德把ISI超过50%的股权卖给JPT出版公司(JPT Publishing)。1992年4月,汤森路透以2.1亿美元价格收购JPT出版公司。据汤森路透首席运营官说,交易主要是为了得到ISI,“ISI在全球拥有30万客户,每年净利润约为1500万美元”。[[18]]
当前,汤森路透和英国里德·爱斯维尔集团(Reed Elsevier,成立于1993年)、荷兰威科集团(Wolters Kluwer,初建于1836年),共同占据全球情报市场90%的份额。[[19]]
除了SCI和JCR这样的“灵魂产品”,ISI开发的其它知名产品还包括:[[20]]
目录快讯(CC),1956年首次面市,对各类期刊和书籍的目录进行汇编,以周刊形式出版,订阅者可通过它快速了解相关领域最新发表的前沿消息。CC最早只对管理类期刊的目录进行汇编(前面提到贝尔实验室购买的这就这种),1957年,它将汇编对象拓展到医药、化学、生命科学等领域的学术期刊。作为ISI开发的第一个产品,CC在SCI出现之前一直是公司最赚钱的产品。
化合物索引库(Index Chemicus,简称IC),这一数据库除了有助研究者了解新出现化合物的相关研究数据,还可获得重要有机化学期刊对它的评价结果。1960年开发推出后尽管一直只赔不赚,但加菲尔德对其倾注巨大热情,手下四名主要副手集体辞职也未能迫使他终止,IC如今已成为汤森路透的又一热门产品。
由于ISI经营的客户对象以学者和学术机构为主,所以尽可能让自身显得“学术”,也是一种非常重要的营销手段。
在公司草创阶段,加菲尔德对公司的冠名,已经带有明显的学术包装意味。如果说“尤金·加菲尔德学会”的前用名还显出几分“伪学术”的话,“科学情报研究所”听起来就完全像一家政府科学机构了(这对中国这样的发展中国家来说尤其如此)。加菲尔德非常坦率地承认,他要的就是这种容易引起混淆的效果——为的是与化学摘要(Chemical Abstracts)和国家医学图书馆这类政府学术机构争夺市场,“特别是在国外,‘科学情报研究所’这样的叫法,很容易被当成一家非盈利机构”。[[21]]
ISI商业运转正式上轨之后,接纳了两位诺奖获得者成为公司董事会成员,这其中当然也有打造高端“学术”形象的考虑。[[22]]
此外,为了拉近和学术圈的关系,ISI为学术机构、大学图书馆设立专项奖学金,奖金可作为这些机构购买ISI产品的抵扣——这其实相当于发放某种商业“抵扣券”。[[23]]
当然,最有效的手段还是发表学术论文和参与学术研讨会,产生的效果可谓一举两得,除了提升企业学术形象,还可以把论文发表期刊和研讨会作为ISI产品的推广平台。
加菲尔德本人在这方面充分发挥了表率作用,他一生勤奋高产,对倾力打造的各种信息产品相关的科学写作,始终保持着高昂的兴趣——其中不少成果发表在《自然》、《科学》这类被学界认为高端的期刊上。据作者统计,从1950年代至2012年,加菲尔德发表文章400余篇。1986年,他还创办了《科学家》(The Scientist)杂志。
ISI的学术“包装”是如此卓有成效,以至有被误导的公众经常写信抗议,指责ISI作为一家政府科技情报机构,履行职责并不到位。为此加菲尔德又不得不反复澄清,表示ISI完全是一家以市场盈利为目的的商业公司。[[24]]
七、“黄金俱乐部”的准入门槛
加菲尔德1985年写过一篇文章专门谈论他的“生意经”,标题是“为你的钱袋子着想”。 [[25]] 大意是,在收录期刊增加、通货膨胀导致成本投入增加的情形下,ISI两种主要产品——CC和SCI的价格涨幅,仍然大大低于行业同类产品的平均增长水平,这主要得自公司不断改进技术,完善产品功能,吸引更多用户,达到了薄利多销的目的。为了贴补成本,《目录快讯》从1982年开始刊登商业广告。[[26]]
这些做法都表明,ISI经营方式和一般商业公司并无二致,都要参照成本预算、销售业绩的前提下考虑可能赚取的利润。所以 ISI每年都要做严格的预算,控制期刊的收录数量,对什么样的期刊满足收录条件,设定相应的准入门槛。
以SCI为例,早期对收录期刊的选择并没有统一标准,主要由加菲尔德的团队根据经验进行鉴选。但人为经验往往存在很大局限,比如,1964年发布的首期SCI报告,居然没收录在科学界享有很高声誉的《哲学通汇》(Philosophical Transactions)[[27]],而另一份当时享有世界声誉的苏联期刊《热工程杂志》(Teploenergetica),直到1968年才首次被收录。[[28]]
JCR的出现,为SCI筛选期刊提供了一项相对独立的参照评估指标:通过计算待选刊物的“影响因子”,可以了解它被SCI期刊引用的情况。[[29]]
以此为基础,加菲尔德将SCI筛选收录期刊的标准归纳为三条:
待选刊物的SCI引用情况;
杂志本身需要满足的各种形式要件(出版周期、编辑团队、作者国际多样性等);
相关领域专家的评估意见。[[30]]
汤森路透基本沿用了这三条筛选标准。[[31]] 其实,按加菲尔德的说法,这样的规则在早期运用过程中,由于存在成本控制的问题,已经存在“灵活操作”的余地:
我们每年做完杂志收录预算,一如既往总有一些杂志出版社或编辑会表达意愿,希望他们的杂志能被收录进来。如果杂志完全满足筛选要求,那怎么办?我们要么告诉杂志主办方等下一年,要么让他们同意自己支付杂志收录的相关费用,这样做可以帮助我们在预算允许的情形下继续经营下去。[[32]]
当然,加菲尔德也不忘记澄清,“原则上这是好事。但也造成一些下意识的猜测,认为杂志可以靠钱买进CC或SCI的收录名单。”[[33]]
而这样的事也确有发生,1995年8月,《科学美国人》(Scientific American)在一篇文章中批露,墨西哥一家期刊为了能被SCI收录,每年被要求花10万美元订阅ISI的信息产品。[[34]] 汤森路透为此大为光火,威胁要将《科学美国人》告上法庭,后者迫于压力,在10月号上做了更正声明,才算了结此事。[[35]]、[[36]]
SCI如今俨然已被打造成学界的“黄金俱乐部”,准入门槛今非昔比,特别在发展中国家,学术期刊一旦被SCI收录,即被看成“权威”的标志。
日常生活中常见的情形是,一些高级“俱乐部”对申请加入的成员,除了必要的资质考量之外,还要求交纳高昂的“会员费”。在SCI面世不到十年的时候,一些符合收录要求的杂志,已经被要求自己为“准入”费用埋单。而如今,在坐落于美国纽约时代广场的汤森路透公司独家经营下,SCI和JCR背后究竟是怎样的光景,确实给人留有很大的想象空间。
(全文完)
[[1]] E. Garfield .Science citation index:a new dimension in indexing[J]. Science .1955.144:649-654.
[[2]] E. Garfield, & I. Sher. New factors in the evaluation of scientific literature through citation indexing[J]. American Documentation, 1963, 14(3), 195-201.
[[3]]考虑到影响因子定义在本研究系列讨论中的重要性,有必要附上原文: The impact factor of journal X would be calculated by dividing the number of all current citations of source items published in journal X during the previous two years by the number of articles journal X published in those two years.
[[5]]Éric Archambault, Vincent Larivière .History of the journal impact factor:contingencies and consequences[J]. Scientometrics.2009. 79: 635-649.
[[6]] W. Glänzel, H. Moed. Journal impact measures in bibliometric research[J]. Scientometrics, 2002. 53(2) :171–193.
[[7]]E. Garfield. The meaning of the Impact Factor[J]. International Journal of Clinical and Health Psychology. 2003. 3(2):363-369.
[[8]]E. Garfield. Citation analysis as a tool in journal evaluation[J].Science.1972-11-03.178(4060):471-479.
[[9]]E. Garfield. Preface to Journal Citation Reports-Vol. 9 of SCI .published by Institute for Scientific Information(philadephia).1975.7-8.
[[11]] 1995 Journal Citation Reports. published by Institute for Scientific Information(philadephia). 1996.11.
[[14]] W. Broad. Librarian turned entrepreneur makes millions off mere footnotes[J]. Science. 1978-11-24. 202:853.
[[15]] Transcript of an Interview Conducted by Robert V. Williams at Philadelphia, Pennsylvania. P 30、 P 56[EB/OL](1997-07-29)[2015-03-20].http://garfield.library.upenn.edu/papers/oralhistorybywilliams.pdf
[[17]]S. Lazerow. Institute Scientific Information[M]//Encyclopedia of Library and Information science ed. A. Kent et al. New York:Marcel Dekker.1974.12:89-97.
[[18]]The Thomson Corporation History . [EB/OL] [2014-12-05] http://www.fundinguniverse.com/company-histories/the-thomson-corporation-history/
[[19]]Laurence Bianchini . Scientific publication : the model and scandals . [EB/OL] (2011-07-19) [2015-01-05]
https://www.mysciencework.com/news/2852/scientific-publication-the-model-and-scandals
[[20]]作者任职的大学当前就订阅了汤森路透七种信息产品:Web of Science(包括SCI, SSCI, A&HCI等),JCR,BIOSIS Previews(生物科学数据库), Current Contents(目录快讯), Derwent Innovations Index(德温特专利情报数据库), Essential Science Indicators (基本科学指标, ESI),ISI Emerging Market(ISI新兴市场信息服务)。
[[21]] E. Garfield .Chemical Information Entrepreneurship – A Personal Odyssey [J].Joseph Priestley Society Symposium “Knowledge: Our Competitive Weapon” at The Chemical Heritage Foundation, Philadelphia, PA. 2004-11-09.
[[22]] W. Broad. Librarian turned entrepreneur makes millions off mere footnotes[J]. Science. 1978-11-24. 202:853-857.
[[25]] E. Garfield .More for Your Money: Technology, Marketing, and Hard Work Help ISI Beat Inflation and the Information Explosion[J]. Current Contents.1985-10-14.41:3-8.
[[26]] E. Garfield. Will Advertising Change Current Contents?— Yes and No[J]. Current Contents.1981-12-14.50:5-6.
[[27]] P.Wouters. The Citation Culture. Doctoral Thesis(University of Amsterdam in the Netherlands).1999. 19.
[[29]] E. Garfield. Is citation frequency a valid criterion for selecting journals? [J]. Current Contents. 1972-4-5. 13:289-290.
通常情形下,SCI收录期刊的参考文献(和注释)的范围要远远大于SCI收录期刊范围本身,所以一份刊物即使没有被SCI收录,也可以统计它被SCI期刊引用的情况,计算它的影响因子。
[[30]] E. Garfield. How ISI selects journals for coverage: quantitative and qualitative considerations[J]. current contents,1990-05-28.22:5-13.
[[31]]Jim Testa. The Thomson Reuters Journal Selection Process . [EB/OL] (2012-05)[2014-12-05] http://wokinfo.com/essays/journal-selection-process/
[[33]] E. Garfield. The Economics and Realpolitik of Exponential Information Growth; or, Journal Selection Ain’t Easy! [J]. Current Contents.1973-08-22. 34:5-6.
[[36]] Transcript of an Interview Conducted by Robert V. Williams at Philadelphia, Pennsylvania. P 75-77[EB/OL](1997-07-29)[2015-03-20].http://garfield.library.upenn.edu/papers/oralhistorybywilliams.pdf