郝若揚



關鍵詞: 引文規范化評價指標; 相對引用率; 學科規范引文影響力; 期刊規范引文影響力; 論文影響力評價
DOI:10.3969 / j.issn.1008-0821.2023.12.012
〔中圖分類號〕G250.252 〔文獻標識碼〕A 〔文章編號〕1008-0821 (2023) 12-0133-10
近年來, 伴隨著科學技術的迅猛發展, 學科領域的劃分越來越精細, 不同學科之間的交叉、滲透和融合也越來越深入。在這樣的大背景之下, 如何對科研成果(特別是學術論文) 進行科學、公正、客觀地評價, 已經成為文獻計量領域面臨的一個亟待解決的關鍵問題。特別是隨著一些新興的交叉學科領域的出現, 如何對這些交叉領域的成果進行跨學科評價, 也成為了文獻計量領域的關鍵問題之一。早先的文獻計量方法主要通過分析論文的被引頻次及其所在期刊的影響因子等較為簡單指標對論文的影響力進行評價, 這在很大程度上導致了期刊影響因子等計量指標被錯誤使用或被異化的問題[1-2] 。此外, 早先的文獻計量指標由于沒有充分考慮學科領域、文獻類型、引用環境、文獻出版時間等因素的影響, 很難對不同學科領域的論文(特別是跨學科領域的論文)進行客觀、公正的評價, 而且這些指標在對跨學科領域論文的影響力評價時展示出較大的局限性[3] 。
為了解決以上問題, 實現對不同學科領域論文的合理評價, 文獻計量研究人員提出了引文規范化指標, 也被稱為“相對指標”。這類指標充分考慮了學科領域、文獻類型、引用環境、文獻出版時間等對論文引用的影響, 主要采用歸一化算法對相關引文指標進行了規范化處理, 使得不同學科領域、不同發表時間、不同文獻類型的論文的引文指標具有一定的可比性[3] 。1983 年, Schubert A 等[4] 提出了第一個相對計量指標(即相對引文率)來測度期刊論文的影響力。相對引文率被定義為平均引文率與平均影響因子的比值。2010 年, 荷蘭萊頓大學Waltman L 等[5] 基于所有論文在指標計算中應具有相對權重(即規范化)的思想, 提出了“平均規范化引文分數” (Mean Normalized Citation Score, MNCS)。MNCS 指標被定義為每篇論文的被引頻次除以其學科平均引文率所得比率的算術平均值。通過一系列實證分析, Waltman L 等[5] 發現, 在期刊出版年份標準化的情況下, MNCS 指標很大程度上會受到最近出版期刊和被引頻次較高的單一文獻的影響。2010 年, Moed H F[6] 進一步發展了Eugene Garfield定義的學科領域“引用潛力” 的概念, 提出了單篇文獻的“數據源歸一化影響力指數” (Source Nor?malized Impact per Paper, SNIP)。SNIP 指標被定義為某期刊每篇論文的被引用次數與該期刊的被引用潛力的比率。SNIP 指標反映了期刊的上下文對引用的影響, 充分考慮了學科主題領域的特征, 特別是引用成熟度和用于評估的數據庫涵蓋該領域文獻的程度[6] 。SNIP 指標基于引文規范化處理, 使得不同學科領域的期刊可以公平地進行比較, 而不受到學科領域引文行為的影響。同樣基于規范化的思想, 近年來科睿唯安(Clarivate Analytics)在其開發的InCites 平臺上推出兩個重要的規范化指標, 即“學科規范引文影響力” (Category Normalized Cita?tion Impact, CNCI) 和“ 期刊規范引文影響力”(Journal Normalized Citation Impact, JNCI)[7] 。CNCI指標被定義為論文的實際被引頻次除以具有相同文獻類型、出版年份和主題學科領域的論文的預期被引頻次, 而JNCI 指標被定義為論文的實際被引頻次除以同一期刊中論文的平均被引頻次。從這兩指標的定義來看, CNCI 指標是對論文所屬學科領域進行規范化, 可用于對比不同學科領域的論文影響力; 而JNCI 指標對發表論文的期刊進行規范化,可用于對比同一期刊上不同論文的學術影響力。基于CNCI 和JNCI 指標的計算, 可以在一定程度上消除不同學科領域或不同期刊之間引文模式和引用行為的差異, 使得不同學科領域或不同期刊之間的論文可以進行較為直接的比較。
2015 年, 美國國立衛生研究院(National Insti?tutes of Health, NIH)在對論文共引網絡(Co-cita?tion Network)計算和分析的基礎上, 提出了一種新的規范化指標, 被稱為“相對引用率” (RelativeCitation Ratio, RCR)[8] 。RCR 指標被定義為論文的實際引用頻次除以基于共引網絡分析獲得的期望引用次數。RCR 指標是以NIH 的R01 項目資助的論文為基準, 其中R01 項目為“R01 Research Pro?ject Grant”, 它代表了NIH 的原始資助項目, 主要鼓勵跨學科和多學科研究。RCR 指標是基于論文共引網絡來確定論文所屬的學科領域, 而不是基于論文發表的期刊所屬學科進行歸一化的, 因此, RCR指標相對于早先的規范化指標具有較為突出的創新性, 同時其算法也得到了顯著的改進[9] 。為了計算論文的RCR 指標, NIH 開發了一個Web 應用程序, 即iCite[8] 。該程序可以根據相關的算法為具有PubMed ID 的論文計算RCR 指標。關于RCR 指標的優點和具體計算方法將在下一小節進行介紹。
上述介紹的指標(包括MNCS、SNIP、CNCI、JNCI、RCR)都是基于引文規范化思想設計的評價指標。相對于早先基于絕對引文數據進行計量的指標而言, 引文規范化指標考慮了學科領域、出版時間、文獻類型等因素對指標的影響, 并采用特定算法對論文的引文數據在學科領域和發表時間內進行了歸一化處理, 因此, 這些引文規范化指標在對跨學科領域的論文影響力評價方面體現出了極大的優越性。一些引文規范化指標已經被出版商、科研資助機構、學術研究機構等應用到學術成果評價和研究績效考核中。
近些年, 由于引文規范化指標充分考慮了學科領域和文獻類型對引文的影響, 具有一定的先進性,所以規范化指標得到了較多的關注和研究。特別是RCR 指標由于其具有獨特的創新性和改進的算法,得到了國內外研究人員的關注。Hutchins B I 等[9]計算并分析了NIH 獲獎者在2003—2010 年發表的88 835篇論文的RCR 指標發現, 這些論文具有較高的RCR 值, 與學科領域專家對這些論文的評價相一致。同時, Hutchins B I 等[9] 將RCR 指標與其他規范化指標(包括MNCS、SNIP 等)進行了對比研究, 研究結果表明, RCR 指標是基于論文共引網絡進行學科分類的, 不同于早先的規范化指標是基于期刊的學科屬性或預設的分類進行學科分類的。因此, 早先的規范化指標通常是一種先驗定義學科分類, 而RCR 指標是一種后驗定義學科分類的方法[9] 。這是RCR 指標與早先規范化指標最根本的區別之一。Bornmann L 等[10] 研究了F1000 數據庫中16 557篇關于生物醫學論文的RCR 指標及與其對應的MNCS 指標、F1000 分數之間的相關性,結果表明, 這些論文的RCR 指標與MNCS 指標具有較高的相關性(相關系數達到0.88), 且與F1000 分數相關性較低(相關系數僅有0.23 ~0.31)。陳斯斯等[11] 在InCites 數據庫中選取了2016 年22 個ESI 學科期刊文獻、8 種交叉學科期刊文獻和ESI的8 個不同學科領域中被引頻次最高的單學科期刊文獻, 分別計算這些文獻的RCR 與CNCI 數值,并進行了相關性檢驗。結果表明, 對于不同學科期刊文獻、交叉學科文獻及單學科期刊文獻, RCR指標與CNCI 指標均展示了顯著的正相關性, 交叉學科文獻的相關系數低于單學科文獻[11] 。陳斯斯等[12] 利用RCR 指標與CNCI 指標對2009—2018 年PLoS One 期刊所發表論文的學術影響力進行了定量評價發現, RCR 指標與CNCI 指標具有一定的相關性, 但是RCR 指標對于非生物醫學領域論文的學術影響力評價具有一定的局限性。宋麗萍等[13]選取了F1000 和InCites 數據庫中的29 850篇細胞生物學論文和30 326篇生物技術論文, 對這些論文的CNCI 指標與被引頻次進行了相關性分析和研究,結果表明CNCI 指標與被引頻次呈現高度正相關,并且CNCI 在跨學科比較方面具有一定的優越性,可以代償執行引用統計的信息過濾與學術影響力歸譽的功能。陳斯斯等[14] 還選取干細胞領域的學術論文作為研究樣本, 對這些論文的RCR 指標、Scopus 數據庫的FWCI 指標(Field Weighted CitationImpact) 和F1000 分數進行了相關性分析和研究。研究結果表明, RCR 指標與FWCI 指標具有較強的相關性, 而RCR 指標與F1000 分數之間相關性較低[14]。
由 于引文規范化指標采用了歸一化算法, 其計算方法和計算過程相比早先常用的引文指標(如被引頻次等)復雜很多, 導致規范化指標的推廣過程相對緩慢, 加之引文規范化指標(如RCR、JNCI 和CNCI 指標等)大都是近年來提出的新穎的引文指標。從目前的研究現狀來看, 國內外學者對于規范化指標(特別是RCR 指標)的研究處于初期階段,因此關于RCR 指標的研究相對較少。目前已有的研究主要采用實證分析的方法, 研究某單一科學領域中論文的RCR 指標與其他規范化指標(包括MNCS、SNIP 等指標)或早先傳統引文指標之間的相關性。值得注意的是, 論文的學科領域主要局限在生物學和醫學領域, 對于非生物學和醫學領域的論文并沒有進行較為深入的研究。這可能與RCR指標早期主要是起源于iCite 平臺中的生物類和醫學類論文有關。近年來, 隨著學科交叉的不斷發展,iCite 平臺中也囊括了部分非生物學、醫學領域的論文, 使得RCR 指標可以推廣到生物學、醫學領域以外的領域。因此, 本文將選取2018—2022 年在InCites 數據庫中的10 種不同學科領域內的論文作為研究樣本, 對這10 種科學領域(包括多個自然科學和社會科學領域)論文的RCR 指標、CNCI 指標和JNCI 指標進行相關性分析, 并選取3 個具有代表性的學科領域中的論文進行深入分析, 計算并分析論文發表國家和研究機構的平均RCR 指標和CNCI 指標。通過這些研究, 揭示不同學科領域RCR指標、CNCI 指標和JNCI 指標評價論文學術影響力的差異和關聯性, 為深入理解引文規范化評價指標、建立科學評價體系提供一定的指導。
1 3種引文規范化評價指標的對比
1.1相對引用率(RCR)
通過分析不同學科領域論文的共引網絡, 計算論文引文率(Article Citation Rate, ACR)與預期引文率(Expected Citation Rate, ECR), 然后將這兩者(ACR 與ECR)相除即可獲得論文的RCR 指標。其中, 論文的ACR 代表論文的年平均被引頻次,而ECR 的計算過程則較為復雜, 其大致流程為:首先將目標論文共引網絡中每一篇論文的期刊引文率(Journal Citation Rate, JCR)的年平均值作為該篇論文的領域引文率(Field Citation Rate, FCR), 然后選取NIH 的R01 項目資助的論文為基準, 調整ACR 與FCR 的比值, 通過ACR 與FCR 線性擬合,計算其回歸系數即可獲得ECR。在RCR 的計算過程中, 生成論文的共引網絡是非常重要的環節。圖1展示了一篇論文的引用網絡示意圖。圖中紅色點代表了目標論文, 橙色點代表了引用目標論文的相關文獻, 綠色點則代表橙色點所引用的相關文獻, 紫色點代表了目標論文所引用的相關文獻。在圖1 中,橙色點所代表的論文集合構成了目標論文的引文網絡, 綠色點所代表的論文集合構成了目標論文的共引網絡, 紫色點所代表的論文集合構成了目標論文的被引用網絡。RCR 指標的計算主要是基于對論文的共引網絡分析而獲得的。隨著論文出版年限的增長, 論文的引用次數會逐漸增多, 使得論文的共引用網絡發生動態的變化, 進而使得論文的RCR 數值同時也發生變化。在NIH 建立iCite 平臺的早期,平臺中數據主要是關于醫學、生物學等領域的論文,因此, 早期RCR 指標僅適用于醫學、生物學等領域的論文評價。近年來, 隨著iCite 平臺囊括了更多學科領域的論文數據, 使得RCR 指標逐漸拓展到其他學科領域, 特別是交叉學科領域。
1.2學科規范化引文影響力(CNCI)
CNCI 指標是通過將論文的被引頻次除以同出版年、同學科領域、同文獻類型論文的平均被引頻次而獲得的。與RCR 指標不同, CNCI 指標主要是基于期刊的學科分類體系對論文進行分類和統計分析。科睿唯安根據期刊的學科分類對期刊發表的所有論文進行學科分類。當一篇論文被劃歸到單個學科領域時, 其CNCI 指標的計算公式如式(1) 所示:
其中,f代表學科領域,t代表出版年,d代表文獻類型,p為劃歸的該學科領域的論文數量。根據CNCI 的計算公式, 不難看出CNCI 指標是一種基于期刊級別的先驗定義學科分類的相對指標。自從科睿唯安提出CNCI 指標以來, 由于其消除了出版年、學科領域和文獻類型對論文被引頻次的影響,可以對不同出版年、學科、文獻類型的論文的影響力進行較好的評價, 因此CNCI指標得到較為廣泛的認可。但是, 在使用CNCI 指標時, 科睿唯安指出了3點需要注意的事項: ①當待評價的樣本量較小時, 一篇高被引論文的被引頻次將會對CNCI 的數值帶來較為顯著的影響; ②CNCI 指標是一種基于平均值的度量, 因此, 即使待評價的樣本量足夠大, 少數高被引論文也可能對CNCI 的數值產生較大的影響; ③由于論文出版當年的基準值通常很低,因此, 出版當年的CNCI 數值可能高于預期的波動。
1.3期刊規范化引文影響力(JNCI)
JNCI 指標與CNCI 指標較為類似, 其主要區別在于CNCI 指標是基于學科領域進行規范化, 而JNCI 指標是基于論文所發表的期刊進行規范化。JNCI 指標被定義為論文的實際被引頻次與該發表期刊同出版年、同文獻類型論文的平均被引頻次的比值。對于出版社或期刊編輯部來說, JNCI 指標是一種重要的評估工具, 可以幫助他們判斷所發表的論文對學術界的影響力水平, 揭示那些超越平均水平并顯著提高了期刊被引頻次的研究工作。表1展示了科睿唯安提供的CNCI 和JNCI 指標在作者層面的一個應用示例。科研工作者D 和E 的總論文數量和總被引頻次都非常接近, 他們的引文影響力幾乎相同, h 指數也相同。僅用表1 中的前4 個計量指標, 無法區分兩位研究人員的學術影響力。然而, 這兩位研究人員實際上是在不同的學科領域進行研究, 并且有不同的論文發表歷史。使用CNCI和JNCI 指標可以更好地區分和評價他們各自在主題、文獻類型和出版時間方面相對于同行的表現。從表1 可以看出, 科研工作者D 的CNCI(1.32)和JNCI(1.86)的數值都超過了平均值1, 而科研工作者E 的CNCI(0.45)和JNCI(0.72)的數值都低于平均值1。這表明科研工作者D 發表論文的學術影響力高于全球平均水平, 并高于其工作領域期刊論文的平均水平; 而科研工作者E 發表論文的學術影響力低于全球平均水平, 且低于其工作領域期刊論文的平均水平。
1.4 3種指標的總體對比
盡管RCR、CNCI 和JNCI 指標都是基于規范化的思想提出的, 但是由于它們的定義不同, 導致這3 種指標在數據覆蓋范圍、學科領域分類、文獻類型、指標算法及指標意義等方面存在一定的差異。從數據庫覆蓋范圍來看, RCR 指標來源于iCite 平臺, 絕大多數論文是與生物學和醫學領域相關的;而CNCI 和JNCI 指標數據來源于包含Web of Sci?ence(WoS) 數據庫, 學科領域覆蓋面更廣、更全面。從學科領域分類來看, RCR 指標是根據論文的共引網路分析進行學科分類的, 每篇論文的共引用網絡會隨著論文被引頻次的增加而動態變化, 因此每篇論文的學科領域也是不斷變化的; 而CNCI和JNCI 指標是基于WoS 數據庫中期刊的學科屬性進行學科領域劃分的, 因此每篇論文的學科領域是相對固定的, 不過考慮到學科交叉, 一篇論文也可以被分配到1 個或多個學科領域。從文獻類型來看, RCR 指標將文獻類型劃分為Article 或非Arti?cle 兩種, 而CNCI 和JNCI 指標則將文獻類型劃分為Article、Review、Proceeding Papers 和Books 等200 多種。從指標算法來看, 由于RCR 指標計算涉及論文共引網絡的形成和分析, 所以RCR 指標的算法比CNCI 和JNCI 指標的算法更為復雜。從指標意義來看, RCR 指標是以NIH 的R01 項目資助的論文為基準, 當RCR 指標大于1 時, 說明論文的影響力高于NIHR01 項目資助論文的影響力平均水平; 而CNCI 指標反映了論文在同一學科領域的實際被引頻次與期望被引頻次比值的平均值, 當CNCI 指標等于1 時, 說明論文在該學科領域的學術影響力與全球平均水平相當; 當CNCI 指標大于1 時, 說明論文的學術影響力高于全球平均水平;當CNCI 指標小于1 時, 說明論文的學術影響力低于全球平均水平。JNCI 指標主要反映了發表在同一期刊中論文的學術影響力, 因此, 當JNCI 指標等于1 時, 說明論文的學術影響力與該期刊論文的平均水平相當; 當JNCI 指標大于1 時, 說明論文的學術影響力高于該期刊論文的平均水平; 當JN?CI 指標小于1 時, 說明論文的學術影響力低于該期刊論文的平均水平。
2 近5年不同學科領域文獻的規范化指標相關性研究
為了研究在不同學科領域中規范化指標的相關性, 本文從科睿唯安InCites 數據庫平臺下載了2018—2022 年WoS 在10 個不同學科領域中收錄的所有論文的相關信息( 包括WoS 編號、DOI、Pubmed ID、論文題目、作者、出版期刊、學科領域、文獻類型、出版年、被引頻次、發表研究機構、發表國家、CNCI、JNCI 等)。從這些論文中選出有Pubmed ID 的論文, 然后利用Pubmed ID 通過iCite 平臺計算獲得論文的RCR 指標。隨后進一步對具有Pubmed ID 的論文的CNCI、JNCI 和RCR 指標進行統計分析。在本文數據收集和研究中, 所涉及的10 個學科領域涵蓋了自然科學和社會科學的多個分支, 包括信息與圖書情報、經濟學、生物學、遺傳學、內科醫學、細胞生物學、凝聚態物理、有機化學、機器人技術和交叉科學。需要指出的是, 數據中論文所對應的學科領域、發表國家和發表研究機構的界定都是科睿唯安InCites 數據庫直接給出的。對于給定的一個學科領域, 在InCites數據庫中使用“分析” 模塊, 在其中選擇“國家”或“研究機構” 就可以對這個學科領域的論文進行相應的統計分析。
表2列出了2018—2022 年研究的10 個學科領域中論文的數量和所有具有Pubmed ID 論文的RCR、CNCI 和JNCI 指標的平均值, 其中3 種指標的平均值是將所有具有Pubmed ID 論文的RCR、CNCI 和JNCI 指標進行相加求和然后除以PubmedID 論文總數獲得的。從表2 中的數據可以看出,對于生物學、醫學等領域, iCite 數據庫平臺涵蓋了85%以上的WoS 論文; 對于社會科學領域(如信息與圖書情報、經濟學等)、物理學、化學、工程技術科學、交叉科學等, iCite 平臺收錄的論文數量低于WoS 論文數量的50%。這是由于iCite 平臺本身主要是針對生物學、醫學領域的論文評價而建立。近年來, 隨著交叉學科的發展和RCR 指標的廣泛應用, iCite 平臺逐漸擴展到了生物學和醫學領域之外的學科方向, 并收錄了很多相關學科領域的論文。對比表2 中不同學科領域中論文的RCR和CNCI 指標的平均值發現, 遺傳學、內科醫學、細胞生物學、經濟學、凝聚態物理等領域中論文的RCR 和CNCI 指標的平均值較高, 這說明從平均意義上而言, 這些領域中的論文相比其他領域的論文具有更高的學術影響力。
對上述10 種學科領域中具有Pubmed ID 論文的RCR、CNCI 和JNCI 指標進行Pearson 相關性分析, 所獲得的相關系數在表2 中列出。從表2 中相關系數的數值來看, 對于這10 種學科領域, 論文的RCR 指標與CNCI、JNCI 指標呈現正相關, 且CNCI 指標與JNCI 指標也保持正相關。對于其中大多數學科領域而言, RCR 與CNCI 指標之間以及CNCI 與JNCI 指標之間的相關系數均較大, 而RCR與JNCI 指標之間的相關系數相對較小, 表明這些學科領域論文的RCR 與CNCI 指標之間以及CNCI與JNCI 指標之間保持高度的正相關, 而RCR 與JNCI 指標的相關度較低。值得注意的是, 遺傳學論文的RCR 指標與CNCI、JNCI 指標之間的正相關系數僅有0.21~0.22, 展示了低度的正相關。這表明RCR 指標與CNCI、JNCI 指標在論文評價方面出現了不一致, 這可能與3 種指標的來源數據庫覆蓋的引文范圍差異有關, RCR 指標來自于NIH 建立的iCite 數據平臺, 而CNCI 和JNCI 指標來源于科睿唯安的InCites 數據庫。
近年來, 規范化指標不僅被用于評價學術成果的影響力, 而且也被應用于評價個人、研究機構以及期刊的學術水平和學術影響力[11,15] 。在隨后的小節中, 本文從10 種學科領域選擇了3 個具有代表性的學科領域(包括信息與圖書情報、遺傳學和交叉科學), 對這3 種學科領域中論文的發表國家和研究機構的平均RCR 指標和CNCI 指標進行分析, 進而研究不同學科領域中論文的發表國家和研究機構的學術水平。3 個代表性學科領域中, 信息與圖書情報作為社會科學類的代表領域, 遺傳學則是近年來生物醫學類自然科學領域中較為積極活躍的學科領域之一, 而交叉科學則反映了多個自然科學領域的融合。
2.1信息與圖書情報領域論文的發表國家和研究機構的規范化指標
表3和表4 分別給出了2018—2022年信息與圖書情報領域論文發表國家和研究機構情況及其對應的傳統引文指標(論文總數和總被引頻次)和規范化指標的平均值。這兩個表格中的數據都是根據總被引頻次進行排名的, 分別給出領域中排名前十位的國家和研究機構的情況。這兩個表格中的RCR和CNCI 指標的平均值是將對應國家或研究機構在領域內發表的所有具有Pubmed ID 論文的RCR 和CNCI 指標進行統計平均而獲得的。從表3 和表4的數據可以看出, 盡管一些國家(如美國、西班牙、德國等)或研究機構(如美國加州大學、美國賓夕法尼亞聯邦高等教育系統)的論文總數和總被引頻次較高, 但是它們所對應的RCR 和CNCI 平均值卻相對較低。這說明盡管這些國家或研究機構所發表的論文數目較多, 但是其高被引論文的數目相對較少, 或其論文的學術影響力相對較低。同時也進一步表明了國家或研究機構所對應的RCR 和CNCI平均值與總被引頻次呈現較弱的相關性。圖2(a)和2(b)分別展示了表3 和表4 中排名前十的國家和研究機構對應的RCR 平均值與CNCI 平均值之間的線性相關性。從圖中可以看出, 這些國家和研究機構所對應的RCR 平均值與CNCI 平均值具有顯著的線性相關性。根據規范化指標的定義和內涵, RCR 和CNCI 平均值越高的國家和研究機構,其發表論文的學術水平越高, 學術影響力越大。結合表3 的數據可以看出, 在信息與圖書情報領域,相比其他國家, 我國發表論文的RCR 和CNCI 平均值較高, 說明近些年我國在該領域具有較高的學術影響力。結合表4 的數據可以看出, 在信息與圖書情報領域, 中國科學院和武漢大學在國際上具有較高的學術水平。值得注意的是, 在表4 中, 英國斯旺西大學的論文總數僅有74, 但其論文的總被引頻次高達5 478, 其原因是74 篇論文中有10 余篇論文是高被引論文。這些高被引論文使得英國斯旺西大學論文的RCR 和CNCI 平均值高于其他9 所研究機構。這反映出規范化指標的一個局限性: 當待評價的樣本量較小時, 少數高被引論文的被引頻次將會對規范化指標帶來較為顯著的影響。
2.2遺傳學領域論文的發表國家和研究機構的規范化指標
表5 和表6 分別給出了2018—2022 年遺傳學領域論文發表國家和研究機構情況及其對應的引文指標和規范化指標。從表5 和表6 的數據可以看出:被引頻次排名前十的國家或研究機構所對應的RCR和CNCI 平均值與總被引頻次保持較弱的相關性。對表5 和表6 中的RCR 平均值與CNCI 平均值進行相關分析發現, 不同國家對應的相關系數僅有0.248,而不同研究機構對應的相關系數高達0.951。不同國家所對應的相關系數較低是由于在遺傳學領域不同國家發表論文的RCR 平均值非常接近造成的。從表5 的數據中可以看出, 在遺傳學領域, 盡管我國發表的論文總數和總被引頻次均居世界第二位,但是其RCR 和CNCI 平均值與其他國家相比較低,說明我國在遺傳學領域的高被引論文相對較少, 學術影響力與其他9 個國家有一定差距。結合表6 的數據可以看出, 在遺傳學領域, 位于世界前十的研究機構均為歐美發達國家, 并且都是世界知名的研究機構, 而我國未有研究機構進入世界排名前十的位置。
2.3交叉科學領域論文的發表國家和研究機構的規范化指標
表7 和表8 分別給出了2018—2022 年交叉科學領域論文發表國家和研究機構情況及其對應的引文指標和規范化指標。從表7 和表8 的數據可以看出, 被引頻次排名前十的國家或研究機構對應的RCR 和CNCI 平均值與總被引頻次呈現低度的相關性。對表7 和表8 中的RCR 平均值與CNCI 平均值進行相關分析發現, 不同國家和研究機構對應的相關系數分別高達0.975 和0.991。這表明在交叉科學領域, 排名前十的國家和研究機構對應的RCR平均值與CNCI 平均值呈現高度的相關性。從表7的數據不難看出, 在新興的交叉科學領域, 盡管我國發表的論文總數與總被引頻次居于世界第二位,但其RCR 和CNCI 平均值相比表7 中的多數國家偏低, 這說明我國在交叉科學領域論文的學術影響力有待進一步提高。結合表8 的數據可以看出, 在交叉科學領域, 中國科學院的論文總數與總被引頻次居于世界第三位, 其RCR 和CNCI 平均值也處于表8 中的中上水平, 這說明中國科學院在交叉科學領域中具有較多的高被引論文, 其學術水平相對較高。
3結論
本文選取InCites 數據庫中2018—2022 年10種不同學科領域的論文作為研究對象, 對這些論文的RCR、CNCI 和JNCI 指標進行了相關性分析。研究結果表明, 在10 種學科領域中, 論文的3 種規范指標之間均保持正相關; 對于其中大多數學科領域, RCR 與CNCI 指標之間以及CNCI 與JNCI 指標之間相關程度均較高, 而RCR 與JNCI 指標之間的相關程度相對較低。同時, 本文也選取了3 個具有代表性的學科領域, 對其中的論文發表國家和研究機構的規范化指標進行較為深入的分析。分析結果表明, 在不同學科領域中, 被引頻次排名前十的國家或研究機構所對應的RCR 均值和CNCI 均值具有較高程度的相關性, 且對應的RCR 和CNCI 均值能夠反映其在學科領域中的學術水平和學術影響力。目前, 本文的研究仍存在一定的不足之處, 如在研究中沒有分析規范化指標隨時間的演化、研究中選取的學科領域仍較少等。在今后的研究中, 將深入分析規范化指標隨時間的演化, 并關注規范化指標在不同學科領域中評價論文學術影響力的差異, 同時將持續挖掘規范化指標的特點, 驗證規范化指標評價學術影響力的一致性和有效性, 并考慮將規范化指標與其他引文指標相結合, 從而建立多元化、多維度的科學評價體系。