期刊影响因子“大跃进”,滥用何时终止?

03.08.2022  08:35

  是将其作为衡量科学产出质量

  和学术评价的标准

  2022年6月28日,科学界关注的2021年期刊影响因子发布。虽然早有预料,新冠疫情催化下影响因子的“膨胀”会继续,但多家期刊影响因子的“暴涨”仍令人吃惊。四大医学期刊的影响因子几乎比去年翻了2~3倍,《柳叶刀》更是以202.731的超高影响因子“冲到”榜单第二。254 个研究类别、114 个国家和地区的 21000 多种期刊中,共有七种的影响因子首次“破百”。

  这些数字在两年前是不可想象的。以《柳叶刀》为例,新冠疫情前,其影响因子每年涨幅在10%~15%。2020年,《柳叶刀》影响因子的涨幅超过了30%,2021年更是“坐上了火箭”,涨幅达到155.58%。2021年,三大顶刊《自然》《科学》和《细胞》影响因子的涨幅分别达到了30%、33%和61%。

  科睿唯安是影响因子的发布者,每年基于旗下的Web of Science数据库,发布《期刊引证报告》。Web of Science总编辑、编辑副总裁南迪塔·夸德里博士对《中国新闻周刊》指出,今年有65% 的期刊影响因子有所增加,其中一些增长非常显著,这与疫情带来的相关文献“超高引用”有关。“新冠大流行影响了社会的方方面面,这反映在多个学科的文献中,不仅仅是在医学、生物医学和公卫领域。”她说。

 图/视觉中国

   一场疯狂的“下注

  决定影响因子高低的关键因素是期刊文章的引用数。如果仔细看《期刊引证报告2022》,可以发现几乎所有影响因子“大跃进”的期刊,其单篇引用数最高的文章都与新冠有关。

  《柳叶刀》的数据显示,位居引用榜首的论文为《新冠病毒感染患者的临床特征》,引用数高达6478,该期刊此前历年单篇最高引用数一般都不超过1000。其他高引文章涉及新冠死亡患者的临床研究、病毒起源、流行病学特征等。《新英格兰医学杂志》前八高引文章都是新冠主题,《科学》杂志前十高引文章中,有九篇关于新冠。一般来说,单篇文章上百次的引用数已经算很高,上千则算“超高”。

  比利时根特大学经济与工商管理学院教授伊夫·法辛指出,疫情特殊“激发”下,对新冠文章的“爆炸式引用”,对期刊影响因子产生的影响是“破坏性的”。他发现,尤其对一些影响因子很小的专门杂志而言,通过发表大量新冠文章可以在短时间内提高整本杂志的引用次数,大幅提高其影响因子。

  创立于1997年的《医学病毒学杂志》,直到 2019 年,该杂志还没有一篇文章在发表第一年的引用次数超过26次。但2021 年的榜单中,一篇最高引文章达到了627次引用,7篇论文被引用超过250次,均与新冠有关。2021年,该杂志影响因子达到了20.693,较一年前增长789.2%。

  一个经常被忽视的事实是,对大部分期刊而言,95%以上文章只有个位或十位数引用,也就是说,不同文章对期刊影响因子的“贡献率”差异很大。

  自影响因子1975年诞生以来,其算法就没变过。以两年为数据收集窗口期,计算的是总引用数与总出版项目数之间的比值。例如,某期刊2021年影响因子,为该期刊前两年发表的所有项目在2021年收到的引用总数,除以2019年和2020年在期刊上发表的全部“可引用项目”数。换言之,这是一个引用的平均值。

  伦敦大学学院药理学荣休教授大卫·科尔库洪一直致力于批评影响因子均值算法的不合理。他在2018年发表的《挑战影响因子“霸权”》一文中指出,《自然》1999年发表的858篇论文的引用数据显示,16%的文章“贡献”了整本杂志几乎一半的引用数。另一项更新的研究表明,2016年被索引的大多数期刊中,约70%论文引用次数低于平均水平。“也就是说,影响因子目前的计算方式并不能真实反映期刊的整体水平。”科尔库洪对《中国新闻周刊》说。

  多年来,很多科学家都对影响因子算法提出批评,一些专家建议不再计算均值,而改成中位数或几何平均数,另一些则尝试寻找一些替代指标。

  Web of Science数据显示,到2020年底,已有7万篇关于新冠的科学论文发表。与疫苗竞赛一样,学术期刊也缩短了审稿周期,加快了出版进度,这些都让论文的引用量空前增加。另外,值得注意的一点是,2021年影响因子数据显示,即使在医学和生物医学以外的领域,大多数期刊都有一篇或多篇高引文章关于新冠疫情,比如封锁政策对社会经济的影响、供应链中断如何影响农业等。

  长期关注影响因子演变的德国吕贝克大学社会神经科学实验室教授弗里德·保罗斯对《中国新闻周刊》说,来自不同学科的研究人员都将研究方向转向新冠,他们试图获得更高关注和更多科研资金,对新冠研究的资助规模比以往任何时候都大。期刊也知道发表“与新冠相关的一切”可以提高影响因子。

  2018年,保罗斯和伦敦大学伯贝克学院心理科学系妮可·克鲁兹、吕贝克大学社会神经科学实验室教授索伦·克拉赫共同发表了论文《影响因子谬论》。论文作者保罗斯等人在给《中国新闻周刊》的回复中提及当下“新冠研究热”,他们不约而同地指出:“这是期刊在下注。”保罗斯等人认为,影响因子就是期刊的“货币”,影响因子越高,期刊未来几年的投稿就越多,经济收益和认可度也就越大。

  中国的学术期刊《细胞研究》(Cell Research)创办于1990年,由中科院主管、中科院分子细胞科学卓越创新中心和中国细胞生物学学会共同主办。近年来,其影响因子一直在跃升,2021年达到了46.297,比2020年的影响因子翻了近一番,位居国内期刊首位,也在亚洲生命科学领域期刊中夺魁,被称为“国产期刊之光”。

  《细胞研究》主编李党生对《中国新闻周刊》指出,今年,期刊影响因子大幅提高得益于新冠论文的“超高引用”贡献,尤其是在2020年发表的论文,其引用次数会比其他论文高很多。但在“新冠热”下,期刊并没有刻意去多发表与新冠相关的文章,而是注重平衡,在发表标准上和其他论文一视同仁。2020~2021年,《细胞研究》发表的新冠文章占整本杂志的25%~30%上下。

  李党生解释,疫情以来,《细胞研究》对新冠论文的接收基线实际上在不断提高,比如在2020年初,期刊发表的第一篇新冠论文“非常简单”,是关于在细胞上做抗病毒药物筛选,但考虑到当时“大量东西是未知的”,文章发表有利于增加科学界对新冠的理解。到后期,随着各种动物模型、临床试验的跟进,期刊收稿标准也从“一个简单的发现”进化到“有重大突破性进展”,“这种动态调整,要求我们对研究的整体形势有非常准确的判断和恰如其分的把握。”他说。

  2021年2月9日,法国东南部城市阿勒尔的一家医院内,医护人员在照顾新冠肺炎重症患者。图/视觉中国

   玩法”还有很多

  除了引用分布不均外,另一个最常被诟病的算法缺陷指向“分母和分子间的不平衡”。文献计量学家、杭州电子科技大学特聘教授舒非对《中国新闻周刊》指出,影响因子统计的是一个期刊在两年内收到的所有引用数。但最大的问题是,这些引用数针对的是期刊上所有类型出版物,除了论文、综述,还包括社论、新闻、科学通讯等。前者称为“可引用项目”,后者称为“不可引项目”。计算影响因子公式的分母只纳入前者,分子两者都计入。“为什么《自然》和《科学》的引用数那么高,因为很多引用来自杂志发表的新闻和通讯。

  舒非指出,影响因子算法是一个1970年代的公式,在1970至1990年代,期刊很少发通讯、新闻这类文章。而现在从整体来看,期刊发表的“可引项目”和“非可引项目”大约各占一半。

  另外,蒙特利尔大学信息科学教授文森特·拉里维埃批评,影响因子计算是基于两年的引用窗口,并不适用于所有学科。不同学科论文到达引用峰值的周期不同。例如,生物医学论文在发表后8年内平均累积了50%的引用,而社会科学研究则至少需要13年。美国著名记者、新闻编辑、“撤稿观察”网站创始人伊万·奥兰斯基还发现,对影响因子的追求可能让一些期刊延迟撤稿。根据“撤稿观察”网站的统计,论文平均撤稿周期约为三年。

  多位教授指出,期刊进行影响因子“游戏”的最主要方式,是在审稿建议中要求投稿作者增加对期刊内文章的自引。近年来,由于对期刊“自引率”识别力度加大,一些期刊转向更隐晦的“互引”,“关系紧密”的期刊组成“互引联盟”。

  佐治亚州立大学经济学名誉教授、国家经济研究局研究助理保拉·斯蒂芬曾担任《科学》审稿编辑委员会成员,她对《中国新闻周刊》指出,由于这种潜规则的存在,即使在期刊没有“要求”情况下,很多作者也会在投稿前“主动”增加自引以满足审稿人的“期望”。2019年,《自然》调查了4300名研究人员,当被问到“是否因为同行评审压力而在论文中引用多余的研究?”时,66%的人回答“”。

  在一项2016年的期刊大规模研究中,研究人员提出了一个衡量期刊“自引”程度的指标,即“影响因子自引偏向”(下简称“偏向值”),如果该数值大于1,则说明期刊影响因子受到自引“不正常”影响,数字越大,受自引影响越大。2005年后的十年,期刊自引变得愈发普遍,“这与过去十年中人们对影响因子的日益痴迷现象吻合”。此外,该研究还发现,在2010年以后,“偏向值”高于3的生命科学领域期刊数量几乎是物理领域的两倍。

  多年来,影响因子发布者一直尝试“识别”出期刊的“非正常自引”,比如在期刊影响因子旁列出“排除自引后的影响因子”数字,以作对比;或者对于“自引率”过高的期刊进行警告,更严重者,会将它们从影响因子发布列表中剔除,2020年,由于发现了“异常引文行为”,科睿唯安一下子“除名”了33种期刊。从这年起,还开始关注影响因子计算过程中分子过大的情况。

  近年来,论文发表有两个新趋势,一方面,越来越多的期刊会在正式出版前,将经过同行评审的文章先放到线上供读者进行“早期访问”;另一方面,新冠疫情重压下,出于对快速发表的迫切需求,没有经同行评审就直接发表的预印本文章在2020年后迎来大爆发。据《自然》统计,2020 年发表的新冠文章中有3万多篇是预印本,占新冠研究论文总数的17%~30%。

  2020年起,早期访问文章的引用数被纳入影响因子统计。科睿唯安数据显示,2020 年到 2021 年,早期访问文章数量增加了56%,为2021年的影响因子计算贡献了近300万次引用。保罗斯很快发现,一些期刊会推迟文章正式发表的时间,让它们在网上获得尽可能多的引用积累,这些引用只计入分子,只有当文章在期刊上正式发表后,该项目才会被计入分母。

  保罗斯等人则指出,预印本文章由于未经同行评审,因此不计入影响因子计算,但期刊编辑会倾向于发表预印本网站上引用量高的内容,形成一种发表“偏见”。这种偏见下,社交媒体上的所谓大V教授就更具优势,他们可以在同行评审和文章正式发表前将文章分享到各类社交平台上,增加论文的流量。

   这是一个进退两难的问题

  保罗斯认为,对影响因子“最大的滥用”是将它作为衡量科学产出质量和学术评价的标准。

  美国科学信息研究所创始人尤金·加菲尔德最初设计影响因子,是为了给图书馆订阅期刊“做出建议”,通过使用平均引用率对期刊进行排名,可以提示图书馆哪些期刊获得了更多读者。“影响因子是一种期刊指标,而非旨在评估研究人员。”夸德里博士对《中国新闻周刊》强调,将其用于评估科研人员是“不恰当和不负责任的”。“这就像测量一个人的身高,不去单独测量他们每个个体,而是测量平均身高,这毫无意义。”拉里维埃说。

  1980年代起,世界各国对于在国际期刊上发表文章的激励措施越来越普遍。英国1986年率先采用了“研究评估考核”,根据考核结果给大学分配科研资金,而考核的一个重要指标,就是在期刊上发表论文。中国研究机构从1990年开始为学者发表国际论文“按篇计价”,而且将奖金数额与文章所在期刊的的影响因子直接挂钩,影响因子越高的期刊,奖金越多。

  舒非等人在2017年一项研究中统计了中国100所大学1999~2016年间科研奖励政策,他发现,在《自然》和《科学》两个顶刊上发表一篇文章,平均奖金从2008年的2.6万美元攀升至2016年的4.38万美元。Web of Science数据显示,从1995年到 2013 年,中国发表的国际论文数量增长了17倍,从 1.3万篇上升到23.2万篇。

  原《科学》审稿编辑委员会成员保拉·斯蒂芬对《中国新闻周刊》指出,大学越来越关注影响因子,部分原因是它们在大学排名中扮演着越来越重要的角色,而反过来,为了获得更高的大学排名,大学会在教授招聘和晋升决策中越来越强调影响因子。

  美国著名生物化学家、原美国国家科学院院长布鲁斯·阿尔伯茨曾在2009~2013 年间担任《科学》杂志主编。他在2013年发表的《影响因子扭曲》一文中指出,影响因子带来的“最具破坏性的后果”,是“诱导”研究人员转向更容易发表文章或产生高引用的研究领域,而抑制他们想要从事“高风险”或有潜在开拓性研究的欲望。由于急于发表论文,导致论文质量不高,这可以解释当下科学的“可重复性危机”,“在已发表的生物医学论文中有大量的研究结果不可重复。

  2012年12月,150多名科学家和数十个科学组织、资助机构以及包括《科学》在内的期刊共同签署了《旧金山研究评估宣言》,该宣言倡议,不再使用影响因子来评估个体科学家的学术成果,大学和研究机构也不再将其作为教授聘用、晋升或科研资助分配的决策要素。

  欧盟自2020年下半年以来一直在推动“学术评估系统改革”,2022年6月10日,欧盟理事会通过了改革草案并于7月20日发布了协议的最终文本。根据协议,新的评估系统应主要基于定性判断,以同行评审为核心,同时可以适当“负责任地使用”定量指标作为支撑。协议还建议,新的评估系统要涵盖更广泛的研究成果,而不仅仅是期刊论文,比如预印本、调查报告、软件、数据包、专利等,避免在学术评估中使用各类国际排名。

  《中国新闻周刊》记者梳理部分欧美大学的招聘和晋升政策,发现仍会经常见到如下要求:“列出有多少篇影响因子5以上的期刊文章”;“必须在影响因子前50%的期刊发文”;“持续在有高影响力的期刊上发文”等。

  保罗斯指出,在欧洲,大学痴迷于用影响因子来评估科学成果的高峰大约出现在十年前,近年来随着政策变化,这一趋势已经有所减缓,“但它仍在那里,没有消失。”保罗斯说。

  在中国,学术评价改革也在进行。2020年7月,科技部、国家自然科学基金委员会发文明确要求“不将论文发表数量、影响因子与奖励奖金挂钩”。当年11月,教育部和科技部又联合发文,规定“取消直接依据SCI论文相关指标对个人和院系的奖励,避免功利导向”。但舒非指出,“脱钩”新政发布后,一些学校不再以现金方式给予论文奖励,而是进行隐性“挂钩”,比如将论文发表折换成与工资相关的分数作为绩效的一部分在年底发放,“这并没有改变中国当下的科研生态。

  多位教授指出,评估任何科学研究成果,都需要认真阅读文章,努力理解并重视其结果的可重复性,“很难想象哪一种措施可以真正实现这些目标又不付出太大的成本,这是一个进退两难的问题。”保罗斯说。

点击进入专题: 全球多国爆发新冠肺炎疫情

责任编辑:张玉