魏緒秋,李長玲
一篇學術論文并不是孤立存在的,而是彼此間存在著一定的關聯,學術論文之間的這種聯系表現為學術論文之間的引證與被引證。普賴斯在論及引證與被引證關系時,認為每一篇被引文獻對引證者(論文作者)來說,就是有了一篇參考文獻(Reference),而對被引證者來說,則有了一篇引證文獻(Citation)[1]。
由學術論文引證與被引證所形成的引文網絡是學者們研究和關注的重點,如基于引文網絡的研究知識擴散問題[2-4]、知識脈絡問題[5-6]、開展學術評價[7-9]。在研究過程中運用的方法——引文分析已成為計量評價研究中重要的研究方法,廣泛應用于研究文獻利用規律、科學評價、科學預測和研究科學與社會的關系等方面[10]。在學術論文的引證與被引證過程中,引證內容、引證行為、引證動機等也受到廣泛關注,如楊思洛等基于學科層面研究了我國學者引證行為的變化特征[11],溫斯托克歸納了15 種引證動機[12],劉盛博等對引證內容性質(正向、負向、中性)進行了評價[13]。這使引證研究進一步深化,研究范圍進一步拓展。基于上述研究背景,本研究引入作者首次引證時間、作者引證時間跨度、作者最佳引證時間三個測度指標,以Scientometrics論文為研究對象,以歷年的被引證數據作為數據來源,研究作者引證的變動規律,從而更好地探究文獻利用、科學評價及科學預測等引證研究工作。
科學計量學是以描述科學發展過程,揭示科學發展內在機理,預測科學發展趨勢,為科學研究工作提供支持依據為目的,以定量分析方法為主要途徑,以反映科學活動的主體和客體為研究對象的一門應用性學科[14]。1978年9月Scientometrics的創刊是科學計量學發展史上的里程碑[15]。本研究選擇Web of Science 核心合集為數據的來源,出版物名稱是Scientometrics,文獻類型為article,時間跨度是1978-2017;檢索時間為2018年5月。共檢索出4615篇學術論文,創建引文報告,實現Scientometrics論文歷年被引證數據的下載。
為了研究歷時視角下的作者引證規律,引入3個測度指標公式。總體看,Scientometrics論文發表時間為1978-2017年,作者引證時間為1979-2017年,本研究可以用i 表示學術論文的發表時間,即i∈[1978,2017];用j表示作者引證學術論文的時間,即j∈[1979,2017],且i≤j,用Pij表示i年發表的學術論文在第j年的被引量。
定義1:作者首次引證時間。作者首次引證時間指的是某篇學術論文首次被某作者引證的時間。與學術期刊評價的即年指標[16]相一致,作者首次引證時間用于量化學術論文研究主題的新穎性和受關注度。本研究用T0表示作者首次引證時間,測度公式為T0=j-i(Pij值第一次非零時),T0值越小,說明某篇學術論文的新穎性和受關注程度越高。
定義2:作者引證時間跨度。作者引證時間跨度指的是某篇學術論文發表后,Pij>0 的年份數N,用于反映學術論文的學術價值和應用價值在學術界持續影響力。本研究用Tn表示作者引證時間跨度,Tn值越高,說明某篇學術論文的學術價值和應用價值的持續影響力越大。
定義3:作者最佳引證時間。作者最佳引證時間指的是某篇學術論文在歷年被引證過程中,被引量首次出現的最大年份,其用于反映學術論文學術價值和應用價值在學術界的老化程度。本研究用Tm表示作者最佳引證時間,其測度公式為Tm=j-i(Pij值最大時),Tm越低,說明學術論文學術價值和應用價值的老化程度越快。
(1)Scientometrics期刊論文呈增長態勢。本研究對1978-2017年Scientometrics論文的年度發文量進行統計,以反映科學計量學的發展態勢,如圖1所示。

圖1 Scientometrics論文的年度發文量
由圖1可見,Scientometrics1978年發表5篇學術論文,2017年發表372篇學術論文,年度發文量增長73.4 倍。Scientometrics論文的年度發文量總體呈現增長態勢,可大致將其劃分為三種增長態勢:低速增長、中速增長和高速增長。1978-1988年為低速增長階段,主要特征是Scientometrics論文年度發文量低于50篇;1989-2008年為中速增長階段,主要特征是Scientometrics論文年度發文量維持在50~100篇左右;2009年以后為高速增長階段,該階段的主要特征是Scientometrics論文年度發文量維持在180篇以上,尤其是2014年以來,年度發文量由2013年的249篇急劇上升至338篇,且隨后年份維持在350篇左右,然而2017年Scientometrics發文量上升至372篇。上述數據不僅從文獻量上反映了Scientometrics的發展態勢,也在一定程度上說明科學計量學在科學研究等領域的重要性有所增強。
(2)Scientometrics論文質量較高。由于學術論文的研究主題的新穎性、研究方法的正確性、研究結果的適用性等眾多因素,一些學術論文一經發表就成為學者們關注的重點。學者們仔細閱讀、參考相關學術論文,并將其所使用的研究方法、研究思路、研究經驗等用于自身的科學研究當中,為了表示對相關學術論文作者的尊重以及學術知識的傳承,學者們將相關學術論文在自己的學術論文中以參考文獻的形式出現。因而,在這一過程中,相關學術論文就成為了被引證文獻。本研究認為,一篇學術論文成為被引證文獻,其一定蘊含著某種學術價值和應用價值。
總體來看,4615篇Scientometrics論文中有4047篇成為被引證文獻,成為被引證文獻的比率高達87.69%。為了研究歷年來Scientometrics論文成為被引證文獻的情況及其變動趨勢,本研究對1978-2017年相關學術論文是否是被引證文獻百分比堆積柱形圖進行分析,所繪制的百分比堆積柱形圖見圖2。

圖2 被引證文獻和非被引證文獻百分比堆積柱形圖
由圖2可知,Scientometrics論文質量較高。在1978-2017年間,除1999年、2016年和2017年外,其他出版年份所發表的學術論文成為被引證文獻的比率高達80%,其中1978年、1980年、1981年、1982年、1984年、1985年、2000年、2003年、2007年等 9個出版年份,Scientometrics論文均成為被引證文獻,可見Scientometrics論文質量之高,在科學計量學領域有著重要的影響力。
本研究深入后臺數據,對1999年的研究對象進行分析發現:1999年在奧地利維也納舉辦的International Expert Meeting on Evaluation 會議,有多篇會議論文的題目一致,如有5篇會議論文的題目為Universities-Engines of innovation in the information society(作者分別是Fasella、Viana-Baptista、 Bricall、 Oborne、 Skalicky),有2篇會議論文的題目均為The role of national agencies in evaluation(作者分別是 Papon、Seidel)。且多篇會議論文在1999-2017年間被引頻次為0,致使1999年被引證文獻的比率有所下降。
本研究的檢索時間為2018年5月,與2016年、2017年Scientometrics出版學術論文時間相近。由于學術論文寫作周期、審稿周期以及出版時滯[17]等因素的限制,2016年、2017年Scientometrics刊出的學術論文僅有部分成為被引證文獻。然而由圖2可知,2017年Scientometrics刊出的學術論文成為被引證文獻的比例達28.23%,2016年Scientometrics刊出的學術論文成為被引證文獻的比例上升至71.55%。這進一步說明期刊論文質量較高,且在科學計量學領域有著重要的影響力。
按照定義1 對Scientometrics的4047篇學術論文的作者首次引證時間進行統計,統計結果見表1。作者首次引證時間值為0,說明該篇學術論文在發表當年就被學者們所引證,成為被引證文獻;作者首次引證時間值為1,說明該篇學術論文在發表第一年后成為被引證文獻;以此類推,可知某篇學術論文的作者首次引證時間。例如,Inhaber,H在1978年發表的Worldscienceas an input-output system第一次成為被引證文獻的時間是1979年。同年Garfield 在CURRENT CONTENTS上發表的Journal citation studies.32.canadian journals.2.analysis of canadian research published at home and abroad首次引證Inhaber,H的學術論文[18]。因此,Inhaber,H 的這篇學術論文的作者首次引證時間為1年。而同樣在 1978年 Debbeaver,D 等撰寫的Studiesinscientificcollaboration.1.professional origins of scientific co-authorship第一次成為被引證文獻的時間是2008年。同年,Schmoch Ulrich和Schubert Torben 兩位作者在Scientometrics上發表的Are international co-publications an indicator for quality of scientific research?首次引證Debbeaver,D等的學術論文[19]。因此,Debbeaver,D 等人的這篇學術論文的作者首次引證時間為30年。由上述數據可知,即使是同一年出版的學術論文,作者首次引證時間有所差異。

表1 學術論文作者首次引證時間、引證時間跨度和最佳引證時間統計表
為分析學術論文作者首次引證時間隨出版年的特征規律,本研究采用出版年內學術論文作者首次引證時間的均值予以測度。測度公式如下:

其中,表示第i年學術論文作者首次引證時間均值,Ni表示第i年有Ni篇學術論文含有作者首次引證時間,表示第i年Ni篇學術論文作者首次引證時間總和。本研究對各出版年學術論文作者首次引證時間均值情況進行統計,并采用局部加權回歸Loess(Locally weighted regression)擬合方法對各出版年學術論文作者首次引證時間均值的趨勢進行模擬,結果詳見圖3。
總體來看,各出版年學術論文作者首次引證時間均值的模擬趨勢線呈下降態勢,即學術論文的出版年越晚,學術論文的作者首次引證時間越早。隨著科學技術發展,尤其是Web 出現,研究人員的科學研究交流方式隨之發生巨大的變化。
Web1.0 之前,科研人員的科學研究交流方式主要是閱讀紙質版學術期刊論文進行學術知識、科研經驗、研究方法與技術等的交流與共享等。然而,由于學術期刊的特性,在一定程度上限制了學術交流活動的范圍,如地域限制、時間限制等,滯后了學術知識、科研經驗等的及時交流與共享。Web1.0 至Web2.0 之間,一些專業科研數據庫、學術期刊網站的運行以及開放獲取運動使科研人員的學術交流更為便捷化。此時,學術交流活動不再受到地域、時間等因素的限制,極大地推動了學術的交流與共享。然而,由于信息技術的局限性,此時的學術交流活動具有一定的單向性,在一定程度上限制了科研人員就某一研究問題的深入交流與探討。比較幸運的是,Web2.0 之后,社交媒體的出現使科研人員的學術交流活動具有了互動性,如 Twitter、 blog、Facebook、WeChat等社交媒體工具使學術交流方式有了新的變化。學術交流活動的互動性使深入探討某一研究問題成為了可能,學術交流程度和深度進一步加強。

圖3 各出版年學術論文作者首次引證時間均值
學術交流方式的變動在一定程度上縮短了科研人員獲得最新研究熱點、現狀、方法、技術等的時間,從而避免了科研上的彎路,加快了科研活動的進程。而這一過程反映在學術論文的引證與被引證關系中則表現為某篇學術論文成為被引證文獻的時間越來越短,也就是本研究所定義的作者首次引證時間越來越早。

圖4 出版年份-作者引證時間跨度2模可視化圖譜
按照定義2 對Scientometrics的4047篇學術論文的作者引證時間跨度進行統計,詳見表1的“作者引證時間跨度”列,并構建了出版年份-作者引證時間跨度2 模網絡,并借助NetDraw可視化工具將其可視化,出版年份-作者引證時間跨度2 模可視化圖譜如圖4所示。
在圖4中,圓形節點表示學術論文的出版年份,正方形節點表示作者引證時間跨度,節點間的連線表示某出版年份中含有某引證時間跨度的學術論文,連線越粗說明某出版年份含有某引證時間跨度的學術論文越多。由圖4可知,4047篇學術論文的作者引證時間跨度的分布呈現核心區域-非核心區域:作者引證時間跨度是1~13年,位于出版年份-作者引證時間跨度2 模可視化圖譜的核心區域,其他作者引證年份跨度(如14年、38年)位于出版年份-作者引證時間跨度2 模可視化圖譜的非核心區域。此外,節點間的連線較粗的集中在核心區域的作者引證時間跨度節點與其相應的出版年份節點之間。可見,大部分(91.65%)學術論文的作者引證時間跨度在1~13年內,學術論文的學術價值和應用價值在學術界持續影響力相對較弱;僅有少部分(8.35%)學術論文的作者引證時間跨度在14~38年之間,學術論文的學術價值和應用價值在學術界持續影響力較高。
與學術論文的作者首次引證時間隨出版年的特征規律分析相類似,本研究采用各出版年學術論文作者引證時間跨度均值作為測度某出版年學術論文作者引證時間跨度的測度值,并研究學術論文的作者引證時間跨度隨出版年的特征與規律。本研究對各出版年學術論文作者引證時間跨度均值情況進行統計,并采用三次方程擬合方法對各出版年學術論文作者引證時間跨度均值的趨勢進行模擬,結果見圖5。

圖5 各出版年學術論文作者引證時間跨度均值
總體來看,各出版年學術論文作者引證時間跨度均值走勢呈現下降趨勢:1978-1988年的學術論文作者引證時間跨度在10年及以上,且呈現出下降態勢;1989-2004年的學術論文作者引證時間跨度在10年附近波動,呈現出穩定態勢;2005-2017年的學術論文作者引證時間跨度低于10年,且呈現出下降態勢。
本研究認為各出版年學術論文作者引證時間跨度均值總體呈現下降趨勢的原因主要有兩個方面:(1)創新研究成為當前學術研究的重要追求,隨著科學計量學的發展,科學計量學的知識理論漸已成熟,難以有所突破與創新,新方法、新思路、新工具等的提出、應用與完善是研究創新的另一大突破點,然而由于這些研究方法、研究思路、研究工具具有一定的時效性,當這些研究方法、研究思路、研究工具等的新穎性有所下降時,研究人員將會尋求、拓展或完善相應的方法、思路、工具等。因此,各出版年學術論文作者引證時間跨度均值有所不同且總體呈現下降趨勢。(2)科研人員學術交流活動方式的轉變,加速了學術論文學術價值和應用價值的共享與應用進程,從而使學術論文所含有的學術價值和應用價值在極短的時間內、在更為廣泛的范圍內得以共享、轉化以及最終的被利用。因此,會在一定程度上致使各出版年學術論文作者引證時間跨度均值的總體呈現下降趨勢。
按照定義3 對Scientometrics的4047篇學術論文的作者最佳引證時間進行統計,其統計結果見表1的“最佳引證時間”列,并運用SPSS20 繪制了出版年份-作者最佳引證時間散點圖,詳見圖6。在圖6中,橫坐標表示學術論文出版年份,縱坐標表示作者最佳引證時間,內部數值表示在某出版年份內作者最佳引證時間為某時間的學術論文的數量,如1978年出版的學術論文其作者最佳引證時間為2、6、8、16 和38 各1篇。由圖6可知:(1)就某一出版年份而言,不同的學術論文由于其所研究內容及所取得研究價值的差異,它們的作者最佳引證時間也各不相同,如World science as an input-output system的作者引證數量達到最大值時為學術論文發表的第 16年,即 1994年;而Studies in scientific collaboration.1.professional origins of scientific co-authorship的作者引證數量達到最大值時為學術論文發表的第38年,即2016年。(2)就不同的出版年份而言,學術論文的作者最佳引證時間也存在著一定的差異。由圖6可知,歷年學術論文的作者最佳引證時間的最高值呈現下降趨勢,如1978年的為38,1979年的為37,1980年的為36,1981年的為33,等等。
與學術論文的作者首次引證時間隨出版年的特征規律分析相類似,本研究采用各出版年學術論文作者最佳引證時間均值作為測度某出版年學術論文作者最佳引證時間的測度值,并研究學術論文的作者最佳引證時間隨出版年的特征與規律。本研究對各出版年學術論文作者最佳引證時間均值情況進行統計,并采用局部加權回歸擬合方法對各出版年學術論文作者最佳引證時間均值的趨勢進行模擬,結果見圖7。

圖6 出版年份-作者最佳引證時間散點圖

圖7 各出版年學術論文作者最佳引證時間均值
總體來看,各出版年學術論文作者最佳引證時間均值的模擬趨勢線呈下降態勢,即學術論文的出版年越晚,學術論文的作者最佳引證時間出現得越早。本研究認為:(1)數據時代,信息技術日新月異,研究人員想在科研活動中取得一定的進展,往往需要了解目前最新的研究現狀、研究技術、方法及路線等,保持對新知識、新研究技術、新研究方法、新研究思路等。而這一過程中,無疑加速了學術論文作者最佳引證時間的提前到來。(2)學術交流方式的變動為新知識、新研究方法等的交流共享以及應用提供了便利條件,更有利于學術知識、學術技能的深入交流與探討,從而縮減了學術論文的作者最佳引證時間。
學術論文之間的引證與被引證關系、引證行為、引證內容、引證動機以及基于引證數據評價學術影響力等是科研人員研究的重點。本研究以學術論文的引證數據為出發點,探討研究人員引證學術論文的時間變動規律,引入的作者首次引證時間用于測度學術論文的新穎性和關注程度;引入的作者引證時間跨度用于測度學術論文所蘊含價值的持續影響力;引入的作者最佳引證時間用于測度學術論文價值的老化程度。
本研究以1978-2017年Scientometrics論文為研究對象,以其引證數據為測度指標數據,測度Scientometrics論文的作者首次引證時間、作者引證時間跨度以及作者最佳引證時間三種指標數據,并以其各出版年學術論文對應的均值作為該出版年的測度數據,以分析作者引證的變動規律,分析其成因。然而,本研究僅局限于圖書情報學領域中的Scientometrics論文,樣本數據相對單一。在后續研究中,本研究將拓展研究范圍,進行同領域不同期刊的作者引證規律對比或不同領域的作者引證規律對比。