,
(沈陽農業大學圖書館,遼寧 沈陽 110866)
多年來,在利用期刊影響因子被引次數、同行評議等指標對論文進行補充計量評價時,我們發現,由于評價時滯過長,評價內容較陳舊及其引文分析固有缺點的限制,使得傳統文獻計量學方法出現了一定程度的局限性。在這種背景下,補充計量學悄然崛起,為學術論文影響力的評價提供了一個新的視角。本文以Mendeley平臺中的論文為樣本,利用Altmetric.com網絡提供的API的9項特征指標構建補充計量學論文影響力評價模型,就我國補充計量學的應用研究做進一步的探討。
文獻補充計量起源于20世紀初,英文名為Altmetrics,它并不是代替原有計量學的方法,而是結合原來的評價體系進行補充新的評價指標,其計量理論和方法廣泛應用于自然和人文科學,為情報分析、績效評估和學術機構組織、學術質量提供重要的參考價值。補充計量學也可稱為“基于社交網絡的科學計量學”,它將開放存取平臺和多種學術社交網絡作為引文網絡,是基于Web2.0科學交流平臺上各學術類型使用與評價的計量,主要包括知名度、熱點、合作注釋、標簽密度等評價指標。在文獻計量數據庫當中,文獻的主題信息包含了機構名稱、作者、期刊來源、發表時間、文章鏈接、被引量與下載量等文獻評價指標,這些都是作為學術影響力的動態指標,其評價結果將提高作者及其單位在國內外的學術地位,推進國際間的學術交流起著重要的作用。
目前,國內外學者對補充計量學的研究已經從概念探討到實證研究階段,例如劉春麗和LI Xuemei等人研究了Mendeley(讀者數)與Citelike(引用指標)的相關關系,結果表明兩者與論文被引量的相關性顯著。林德明以Nature作為數據樣本,采用文獻計量法建立單篇論文的影響因子貢獻率和絕對標準距離的測度指標,并利用回歸分析研究其分布特征。盛麗娜研究了近5年影響因子和期刊特征因子作為期刊影響力評價指標,以了解各位置指標對期刊的評價效力。袁玉花等人探討了Altmetric相關分析工具及實現意義,同時指出了在Altmetric補充計量指標的優勢和其局限性。
綜上所述,目前國內在補充計量學上研究方式上存在一些問題:首先研究僅限于單個指標或較少指標與論文被引量相關性的研究,分析結果較為零散,各指標之間沒有形成關聯,在評價論文影響力時也缺少有力的依據,難以滿足科學化、系統化、標準化的文獻計量與綜合分析需求。其次,也沒有建立補充計量指標的評價模型,沒有詳細說明補充計量指標對論文影響力是否有效。因此,本文利用文獻數據類聚的方法,對補充計量學進行深入的研究。
本文通過收集Mendeley平臺中的論文作為數據來源,在檢索框中輸入農學,發表年限選擇2015年,文獻類型選擇期刊,共檢索到論文 4 500 篇,從中選擇被引量排名前10位的論文,結果見表1。同時,利用Altmetric.com網絡提供的API獲取論文標題、期刊名稱及各相關評價指標,包括facebook、redditers、news、blogs、plnners、google、video、citelike、F1000(世界知名專家對論文的評定)等9項指標。
序號題名期刊名被引量1Irrigation,aproductivetoolforfoodsecurity-areviewSOILANDPLANTSCIENCE13202PotentialapplicationofnaturalphenolicantimicrobialsEdiblefilmtechnologya?gainstbacterialplantpathogensFOODHYDROCOLLOIDS11033Assessingcarbonandwaterdynamicsofno-tillandconventionaltillagecroppingsystemsintheinlandPacificNorthwestUSusingtheeddycovariancemethodAGRICULTURALANDFORESTMETEOROLOGY5874StrengtheningAgronomyResearchforFoodSecurityandEnvironmentQualityENVIRONMENTALSCIENCE&TECHNOLOGY4995ProximalNAVIderivedphenologyimprovesin-seasonpredictionsofwheatquantityandqualityAGRICULTURALANDFORESTMETEOROLOGY4556Practicalimprovementsinsoilredoxpotential(Eh)measurementforcharacteriza?tionofsoilproperties ApplicationforcomparisonofconventionalandconservationagriculturecroppingsystemsANALYTICACHIMICAACTA4247EX-anteanalysisofopportunitiesforthesustainableintensificationofmaizepro?ductioninMozambiqueAGRICULTURALSYSTEMS3158Variationofagronomicandqualitativetraitsandlocaladaptationofmountainland?racesofwinterryefromValVenostaGENETICRESOURCESANDCROPEVOLUTION2149Assessingon-farmproductivityofMiscanthuscropsbycombiningsoilmapping,yieldmodelingandremotesensingBIOMASS&BIOENERGY18610Thesoilqualityconceptasaframeworktoassessmanagementpracticesinvulnera?bleagroecosystems:AcaseStudyinMediterraneanvineyardsECOLOGICALINDICATORS78
根據期刊論文被引量的相關統計數據,并對各區間的數據進行擬合,結果顯示,被引量在0—5次論文篇數為 1 820,引量在11—15次論文篇數為 1 750,被引量在21—25次論文篇數為 1 250,很顯然,被引量的增加與論文篇數之間呈圓滑曲線遞減的趨勢。結果見圖1。
利用SPSS19.0 K-S檢驗方法,本文對這9個相關指標與論文的被引量進行單因子相關性分析,結果見表2。對分析數據進行正態檢驗,如果數據顯著水平<0.05則表明數據不服從正態分布,反之異然。

圖1 被引量與論文量相關統計圖
對比項目facebookredditersnewsblogsplnnersgoogleradiocitelikeF1000均值27 5022 3221 580 320 58733 2422 1011 142 31標準差32 43254 33121 09745 43237 34612 56930 43212 33441 234K-S檢驗21 23123 11223 44315 87913 46529 01115 97623 34421 556漸近顯著性0 010 020 00 010 030 00 00 10 03
據顯示其數據均小于0.05,表明數據不服從正態分布。對于不服從正態分布的數據,可以采取Spearman的方法來描述變量之間的關聯程度,檢驗各項指標的相關性。通過分析,由表3可以看出google的因子對論文影響力是最大的,facebook、redditers、news對論文的影響力是較為分散的,因此不考慮這幾項因子。
相關系數facebookredditersnewsblogsplnnersgoogleradiocitelikeF1000facebook10 340?0 185??0 106??0 019??0 019??0 231??0 121??0 219??redditers10 109?0 214??0 125??0 123??0 153?0 117??0 306??news10 324??0 207??0 189??0 198?0 069??0 014??blogs1-0 314??0 216??0 135?0 178??0 209??plnners10 112??0 149??0 312??0 106??google10 202??0 196??0 304??radio10 108??0 190??citelike10 203??F10001
主成分分析方法,可以實現對不同指標變量進行分組,找出主成分因子中起主要作用的變量。本文通過上述采集的數據,過濾去news、facebook、redditers指標數,對F1000、blogs、plnners、google、radio、citelike進行主成分分析,找出評價論文影響力的主要因子。在主成分分析過程中,分析特征值須大于1,根據SPSS數據處理,得出圖2特征碎石圖數據,
由圖2顯示,在特征值大于1的成分數有3個,因此主成分數量為3。為了確定樣本是否可進行主成分分析,首先要對樣本進行KMO-Bartlett檢驗,當KOM值越接近于1,就越適合進行主成分分析,如表4可知,主成分因子為0.701,大于0.5(正常情況下,主成分因子小于0.5則不適合主成分分析)。

圖2 特征值碎石圖
檢驗數據Bartlett球形度檢驗近似卡方7510 124 df24Sig 000KMO度量值0 701
在SPSS里面采用Oblimin方法得到表5,從表5看出,主成分1與citelike(引用指標)的相關系數最高,主要反應的是引用指標對論文被引量影響最大,主成分2與google(網絡平臺)的相關系數最高,是社交網絡對論文被引量的影響最大,而主成分3與F1000(專家對論文評定)的相關性最高。
指標成分123blogsO 2340 1420 015plnners0 4130 0510 013google0 7450 7860 216radio0 1340 0790 109citelike0 8670 1810 205F10000 1540 2100 543
經過主成分分析得到3個主成分因子,最后得到如下評價模型方程式:
F=0.478F1+0.324F2+0.322F3
為了驗證補充計量指標對論文被引量之間的相關關系,選擇F值排名靠前的論文,并在選取的論文中尋找高被引論文,即F值排名前1%的100篇文章中,高被引論文有70篇,占96%,平均被引次數為176次;F值排名前5%的387篇論文中,高被引論文有300篇,占論文總數的82%,F值與論文被引量的關系見圖3,與圖1的圖形曲線相近,說明補充計量評價模型可以用來描述論文的影響力。

圖3 F值—論文量統計分析
為了進一步檢測主成分評價模型與引用指標之間的相關性,利用SPSS軟件肯德爾和諧系數計算,說明在評價論文影響力時,完全能夠表征論文的影響力,這表明補充計量在評價論文影響力是完全可行的。同時,在分析結果上可以看出,高被引的論文主要集中在微博的傳播上,這說明隨著信息技術的發展及網絡環境的簡便、快捷,大部分讀者對論文的感知更傾向于網絡平臺和高水平的專家對論文的評定,網絡的傳播手段也是提高論文影響力的必要條件和手段。
在本文的研究中,其結果表明在選取的9個補充計量指標中,其中blogs、plnners、google、radio、citelike、F1000指標對論文的影響力具有一定的相關性,在這6個指標中進行主成分分析,并建立評價論文影響力相關模型,結果表明在主成分分析中,完全可以作為評價論文影響的力,主成分分析評價模式能夠較好地捕捉到高被引論文,并且圖3與圖1圖形曲線相近,在當前學術交流模式下,學者更愿意對學術價值高的論文進行分享、推薦,使之在社交網絡、學術平臺廣泛傳播、引起大眾人的關注。隨著社交網絡的普及和發展,這種相互作用將越發明顯,論文的社會影響力將成為論文影響力的重要構成部分。
需要證明的是,學術交流的環境下,作者、單位等已不是產生論文影響力的主要因素,評價論文影響力要結合引用指標和補充計量指標進行評價,在平臺上可以進行瀏覽、下載回復等多項學術互動綜合權衡論文的影響力,這些網絡工具及提供的API將擴大科學計量研究的視野,提升論文評價的時效性。目前,網絡環境涌現出各種開放存取平臺和學術社交網站,對平臺中的數據不同的引用指標對評價論文影響力每年都會發生不同的變化,因此需要對研究領域進行明確的限定,同時需要開發多形式的網絡過濾管理工具以幫助專家與學者遴選出重要的學術論文成果,以確保補充計量指標在評價過程中的可行性、準確性。
[1]王 睿.淺議補充計量學[J].科技情報開發與經濟,2014(8):121—123.
[2]劉春麗.Web 2.0環境下的科學計量學:選擇性計量學[J].圖書情報工作,2012(14):52—56.
[3]劉春麗.不同類型選擇性計量指標評價論文相關性研究——基于Mendeley、F1000和Google三種學術社交網絡工具[J].情報學報,2013(2):206—212.
[4]LI Xuemei.Validating online reference managers for scholarlyImpact measurement[J].Scientometrics,2012(2):461—467.
[5]林德明.單篇學術論文對影響因子的貢獻率研究——基于Nature的定量分析[J].中國科技期刊研究,2016(4):1305—1309.
[6]盛麗娜.影響因子百分位與h指數、累積h指數對期刊的評價效力分析[J].中國科技期刊研究,2017(2):166—170.
[2]袁玉花.SCI收錄高校論文的文獻計量分析[J].農業網絡信息,2012(3):76—79.