〔摘要〕以統計學方法分析了Scopus收錄期刊SJR指數的分布規律。研究表明,期刊SJR指數的分布具有穩定性和動態性的特征,數據表現出集中與分散的規律。SJR指數的理論值與期刊序號間的關系可用回歸方程:y
kxb來表示,這個方程與實際數據的擬合度很高。SJR指數的理論值與期刊數量、期刊所在學科等等因素有關。
〔關鍵詞〕SJR指數;乘冪分布;布拉德福定律;Scopus
收稿日期:2011-09-08
基金項目:本文為安徽財經大學教學研究項目(ACJYYB201027)研究成果之一。
作者簡介:魏瑞斌(1973-),男,副教授,碩士生導師,研究方向:信息計量學,信息資源建設,期刊評價,發表論文數篇。
DOI:10.3969/j.issn.1008-0821.2011.10.024
〔中圖分類號〕G250.252 〔文獻標識碼〕A 〔文章編號〕1008-0821(2011)10-0100-07
Study on the Distribution Law of the SJR Indicator Based on the Scopus
Wei Ruibin(School of Management Science and Engineering,Anhui University of Finance Economics,Benbu 233030,China)
〔Abstract〕The paper studied on the distribution law of the SJR indicator based on the data from the Scopus database used the method of statistical.Results show that the distribution of the SJR indicator appeared the stability and dynamic characteristics and the data followed the centralization and dispersion law.The theory data of the SJR can express with the regression equation:y
kxb and the equation can fairly fit the actual data.The data of journal's SJR connected with the journal's quantities,subject and other factors.The distribution the SJR indicator accorded to the Bradford's Law of Scattering.
〔Key words〕SJR Indicator;power function distribution;bradford's law of scattering;Scopus
西班牙SCImago小組基于Scopus數據庫的支持,提出了新型期刊評價指標SCImago Journal Rank(SJR)[1]。SJR指數將期刊看作期刊引用網絡的一個個節點,考慮了引文的水平和重要程度,進而衡量期刊的聲望。它在計算時采用了類似PageRank的算法,并將期刊自引最高值限定在33%范圍內。Butler[2]認為SJR的出現將可能打破ISI在期刊評價上的壟斷。
從文獻檢索結果分析,筆者認為國內外關于SJR指數的研究主要集中在兩個方面。一是關于SJR的計算方法等方面的理論研究。Borja González-Pereira[3]等人對SJR的提出背景、計算方法和實現技術進行了全面研究。二是關注SJR與其它期刊評價指標間的相關性。比利時學者Ronald Rousseau及研究小組[4]認為,WoS的影響因子、特征因子、SJR、論文影響因子以及期刊的h指數之間有很強的相關性。趙星等[5]研究發現SJR與影響因子、h指數有較強的正相關性。楊康等[6]對SJR和影響因子從理論和實證兩個層面對兩者的關系進行了研究,分析了影響因子和SJR的局限性。王一華[7]以38種國際圖書情報學期刊為研究對象,研究表明,期刊的SJR、JIF和H指數3個指標之間呈線性相關。總體而言,SJR指數的研究還處于起步階段,尤其是對期刊SJR指數的大樣本研究還較少。
本文將以Scopus收錄期刊1999-2008年的SJR數據為研究樣本,通過對大量數據的統計分析,研究期刊SJR指數的分布規律,為其在期刊評價中的應用提供理論和數據支持。
1 數據獲取
1.1 數據源Scopus是Elsevier公司開發的全球最大的文摘引文數據庫。據Elsevier科技部孫曉鵬先生介紹,Scopus目前在中國大陸地區已經有超過20家的訂戶,如上海交通大學、中國科學技術大學、浙江大學、天津大學、中國農業大學等985高校。從全球來看,Scopus已經超過2 000家的機構訂戶。2010年,在英國QS2009年大學排行榜中排名前20位的高校,有13所大學已經訂購了Scopus。Scopus涵蓋了由5 000多家出版商出版發行的科技、醫學和社會科學方面的18 000多種期刊,其中同行評審期刊16 500多種[8]。期刊分為27個一級學科(圖1)和313個二級學科[9]。最多的是醫學類期刊(Medicine)有4 921種,占總體的29%,最少的能源科學期刊(Energy)只有191種。這些期刊分布在全球93個國家(圖2)。其中,美國、英國、荷蘭和德國出版的期刊都在1 000種以上,它們占總體的69%,而阿塞拜疆、玻利維亞等15個國家只有1種期刊。
1.2 數據收集
本文從http://www.scimagojr.com/journalrank.php免費下載1999-2008年Scopus收錄期刊的詳細數據(1999-2007年有17 124種期刊,2008年為17 120種)。數據文件格式為xls,包括了每種期刊的題名、SJR和H指數等12個指標信息。本文僅對期刊的SJR數據進行統計分析。
2 集中與分散趨勢
2.1 Scopus收錄期刊總體情況
為了直觀觀察SJR的變化情況,本文利用Excel繪制了圖3~6。圖4和圖5的數據進行了歸一化處理。
(1)從圖3看,10年間的SJR指數前5年是緩慢上升的趨勢,之后經過4年的穩定之后略有下降。中位數前8年基本穩定,后兩年略顯下降;眾數前8年連續為0,后2年接近了眾數。這些指標數據的變化情況反映了期刊SJR指數的集中程度比較穩定。
(2)從圖4看,標準差、方差和全距3條曲線都是一個明顯下降的趨勢,這反映了期刊SJR指數整體的離散程度一直處于減小的狀態。
(3)從圖5看,偏度和峰度也表現為明顯下降的趨勢,這反映了SJR指數遠離正態分布的現象有所改善,但整體分布仍然表現為左偏和尖頂峰(如圖6)。隨著時間推移,SJR指數為零的期刊的比例,已經從1999年的37%下降為2008年的6%。
這些指標數據的變化表明,SJR指數整體的差距處于一個縮小的趨勢,即期刊聲望間的差別在不斷減小。
本文將期刊每年SJR數值從高到低順序,并利用SPSS和Excel得到了不同數量期刊的SJR分布圖(圖7、圖8和圖9,X軸為期刊數量,Y軸為期刊SJR指數值)。從圖8看,SJR指數前100種期刊的整體趨勢相近,曲線間在差異隨著期刊數量的增加越來越小。由于圖像大小的局限,圖9和圖10表現SJR指數的曲線除頭部有較明顯的差別外,其余部分幾乎重合。
雖然各個學科收錄的期刊在數量存差異,但從其統計指標看,各學科期刊的SJR指數整體都是正偏態分布且存在尖頂峰。從方差看,社會科學和人文學科期刊SJR指數的集中程度較高,離散程度較小;自然科學期刊的SJR指數由集中程度相對較低,離散程度較大。Immunology and Microbiology、Biochemistry,Genetics and Molecular Biology和Medicine 3個學科SJR指數的全距較大。這種情況反映出這3個學科某些期刊的SJR指數值比較懸殊。如《Annual Review of Immunology》的SJR指數為16.06,而同一學科期刊最小值為0。
表1 各學科期刊SJR集中與分散指標數據匯總
3 SJR指數回歸方程
3.1 Scopus收錄期刊總體逐年回歸方程
本文將每年的SJR數值從高到低順序,利用Excel添加趨勢線自動生成了SJR指數的逐年回歸方程(表2)。表2乘冪方程反映的是SJR指數值與期刊序號(按SJR指數從高到底排序)的關系。乘冪趨勢線是一種適用于以特定速度增加或減少的數據集合的曲線。但是如果數據中有零或負數,則無法創建乘冪趨勢線。因此,表2中的方程是基于期刊SJR指數大于0的條件下回歸的。從R2的檢驗看,曲線的擬合度都非常好,尤其在TOP1000時,每年都達到了99%以上。
趨勢線方程的常數項對應了每條曲線y值的最大值。從歷時數據看,常數項在TOP100和TOP1000時整體呈現下降趨勢,而當取SJR>0時,變化趨勢卻正好相反。結合方程對應的數據看,從1999-2008年,SJR指數為0的期刊數量在不斷減少,即方程常數項的大小與期刊數量之間存在正相關關系(相關系數為0.9716),即期刊數量越多,其對應方程的常數項越大。當期刊數量相同時(如TOP100、TOP1000),常數項的大小與所有期刊中SJR最大值成正相關(相關系數為0.9780)。1999-2008年,每年期刊SJR指數的最大值一直在減少,這種變化與表2 TOP100和TOP1000回歸方程常數項逐年減小相一致。
方程的指數項反映了曲線下降的幅度,指數越大,曲線下降的速度越慢。從表2數據看,TOP100和TOP1000對應曲線的下降速度越來越快,這是由于排名較前的SJR指數間的差異較大,而排序在后面SJR指數間的差異越來越小造成的。當選取SJR>0數據回歸時,隨著期刊數量的增加,越來越多期刊的SJR指數數值相差較小,因此下降的速度減慢。這個結果與前面SJR數據總體的變化趨勢相吻合。
表2 期刊總體SJR指數逐年回歸方程
注:括號內是方程的擬合度,其范圍是[0,1],R2越接近1,曲線與實際數據的擬合程度越好。
3.2 不同學科期刊的SJR指數
本文采用同樣方法得到2008年各學科期刊SJR指數分布曲線的回歸方程(表3)從表3看,除Arts and Humanities的擬合程度較差外,其它學科期刊曲線的擬合度都較好。Multidisciplinary期刊的數量較少,Nature、Science、Proceedings of the National Academy of Sciences of the United States of America 3種期刊的SJR與其它期刊差別太大,方程擬合效果不好,在擬合時將3種期刊排除在外。
雖然表3方程中的常數項與期刊數量之間的相關系數為0.3163,但從表中數據看,自然科學期刊趨勢線方程的常數項要明顯大于社會科學和人文科學的情況看,整體上方程的常數項仍與期刊數量有較大的相關性。指數項大小的情況卻正好相反,這表明自然科學期刊SJR指數對應的曲線下降速度較快,而社會科學和人文科學期刊的SJR指數對應的曲線下降速度較慢。這是由于自然科學期刊SJR指數間的差異較大,而社會科學和人文科學SJR指數間的差異較小。SJR指數間的差異大小可能與三大類學科期刊所刊論文間的引用規律存在較大的差異有關,因為期刊SJR指數計算是基于期刊間相互引用的數量多次迭代后的計算結果。具體到學科之間比較時,期刊數量與方程常數項則不表現與整體相同的情況。如Chemistry比Mathematics期刊數量少,但方程常數項卻正好相反。Immunology and Microbiology的期刊數量雖然較少,但它方程的常數卻較大。
表3 不同學科期刊SJR指數2008年回歸方程
3.3 期刊SJR指數回歸方程的歸納
筆者認為,反映期刊SJR指數值與期刊序號(按SJR指數從大到小排列)的關系可以抽象為:y
kxb(SJR>0)。k是一個正數,它反映的是期刊集合中擬合方程對應的SJR的理論最大值。整體上看,k值的大小與期刊的數量多少有較強的相關性,但具體到一級學科、二級學科層面作比較時,它與期刊數量之間沒有直接關系,與學科本身的SJR數據有關。b是一個負數,它反映的是SJR數據下降的速度,它的值越大,則曲線下降的速度越慢。從表2和表3中的數據觀察,大部分情況下,當R2在0.9以上時,b的取值范圍是(-1,0);當R2小于0.9時,其取值可能會小于-1。
3.4 布拉德福定律驗證
布拉德福定律是文獻計量學中的經典定律之一。它是定量描述相關論文在期刊中的集中與離散規律[10]。參考文獻[11]的研究思路,本文以期刊累積數的自然對數為橫軸,期刊SJR累積數為縱軸,以期刊SJR數值(2008年數據)來驗證其是否符合布拉德福定律(結果見圖10)。從圖10看,期刊SJR的數值分布符合布拉德福定律。布拉德福常數為6.5左右,與趙星等人對ISI 5年影響因子相比,它與傳統的布拉德福定律中的取值5比較更加接近。如果不考慮學科的屬性,按布拉德福定律可以將這些期刊分為3個區(A、B和C區)。其中A區有320種期刊,B區有2 081種期刊,C區有13 671期刊。這個結果只是理論上的一種探討,實際期刊評價過程中,應該堅持分類、分學科的原則。只有充分考慮學科間的差異,根據評價指標將期刊分為不同層次才是有意義和客觀的。
表4是采用與前面同樣方式得到的不同學科期刊的布拉德福分區結果。根據布拉德福常數的大小可以將學科分為4個類別。第一類是前6種期刊,布拉德福常數(下面簡稱常數)在5以上。第二類是常數在3~5之間,3個分區期刊數量相對適中。第三類是常數在3以下,越接近1,各分區期刊數量的差別越小。人文科學和社會科學期刊的常數都小于自然科學期刊。這反映了布拉德福常數的大小與各學科期刊SJR指數差距大小成正相關。結合從方程的指數項看,整體上,從第一區到第三區,方程對應曲線的下降幅度越來越慢,這也是由于SJR指數差距越來越小造成的。
表4 各學科趨勢線方程及布拉德福分區期刊數、常數
4 結 論
從前面的分析看,Scopus收錄期刊的SJR指數分布具有以下特點:
(1)SJR指數分布具有動態性。從時間上看,SJR指數整體的集中程度變化不大,但離散程度有明顯減小的趨勢。
(2)SJR指數分布具有穩定性。所有期刊或是分學科期刊都遵循乘冪分布規律,其分布曲線的趨勢較為穩定。
(3)SJR指數的學科差異比較明顯。因此,SJR指數在期刊評價、文獻采購等科研和實際工作中要堅持同類期刊相比的原則。
(4)SJR指數分布遵循布拉德福定律。這既揭示了布拉德福定律的普遍性,同時也表明SJR指數可以用為期刊評價指標的合理性。
本文是從一級學科層面研究期刊SJR指數的分布情況,今后將進一步研究二級學科期刊的SJR指數分布情況,來驗證本文所提及的結論是否具有普遍性。SJR作為一個較新的期刊評價指標,其計算方法的合理性,在期刊評價中的應用價值,國內期刊SJR數據的獲得及其分布規律等問題都有待進一步深入研究。SJR作為一個新的期刊評價指標,其研究的價值還有待進一步發掘。
參考文獻
[1]趙星,高小強,唐宇.SJR與影響因子、h指數的比較及SJR的擴展設想[J].大學圖書館學報,2009,(2):80-84.
[2]Butler D.Free journal2ranking tool enters citation market[J].Nature,2008,451(7174):6.
[3]Borja González-Pereira,Vicente P.Guerrero-Bote,Félix Moya-Anegón.The SJR indicator:A new indicator of journals' scientific prestige[EB/OL].http://arxiv.org/ftp/arxiv/papers/0912/0912.4141.pdf,2010-09-23.
[4]Rousseau R,the STIMULATE 8 GROUP.On the Relation Between the WoS Impact Factor,the Eigenfactor,the SCImago Journal Rank,the Article Influence Score and the Journal H-index[C].Nanjing,2009.
[5]楊康,劉明政,張旭.SJR指數研究及其與影響因子的比較分析[J].情報雜志,2009,28(11):27-30.
[6]王一華.期刊評價指標SJR、JIF和H指數的關系研究[J].圖書情報工作,2010,54(6):145-147.
[7]http://china1.elsevier.com/ElsevierDNN/資源/科研人員/研究趨勢/評價期刊質量的新視角/tabid/1446/Default.aspx[EB/OL].2010-09-24.
[9]http://www.scimagojr.com/help.php[EB/OL].2010-09-24.
[10]邱均平.信息計量學[M].武漢:武漢大學出版社,2007:101-108.
[11]趙星.JCR五年期影響因子探析[J].中國圖書館學報,2010,36(5):120-126.