

〔摘 要〕《Scientometrics》是國際科學計量學研究領域的第一本專門期刊,代表了國際科學計量學研究的主流方向。對其刊載的2001-2010年間的文獻進行計量分析,通過信息可視化技術探測國際科學計量學研究的前沿問題。在文獻共被引網絡基礎上,進行文獻聚類分析,直觀展現了國際科學計量學主流研究方向的前沿問題包括:科學發展規律的數量統計分析;H指數及其相關指標研究;三螺旋理論研究;學術網絡、語義結構研究;中國科學計量學研究等。
〔關鍵詞〕Scientometrics;信息可視化;文獻共被引分析
〔中圖分類號〕G250.252 〔文獻標識碼〕A 〔文章編號〕1008-0821(2012)10-0061-05
科學計量學是20世紀60年代以來,隨著科學技術的飛速發展而創生的一門對科學和技術本身進行定量化研究的新興學科。它是一門實證性很強的應用科學,對于定量地、科學地認識和把握科學的增長(或進步)規律和科學與社會、經濟政治及文化意識形態的相互影響程度、發現科學交流系統的機制,制定RD政策以及從宏觀上把握科學研究的方向等,都產生了異乎尋常的影響[1]。1979年,創刊于匈牙利的《Scientometrics》雜志是國際科學計量學研究的第一本專門期刊,同時,該雜志的創刊也在一定程度上標志著科學計量學作為一門學科的正式出現。從創刊至今,《Scientometrics》期刊一直是國際科學計量學研究的前沿理論陣地,也是相關領域研究的核心期刊之一[2]。國內學者從不同角度對其刊載文獻數據進行分析[3-4],或者以該期刊為例,進行科學計量指標的研究[5]等。本文在前人研究基礎上,對2001-2010年間的數據從文獻共被引網絡知識圖譜和文獻聚類分析等進行可視化分析。
1 數據來源與處理
選取《Scientometrics》期刊2001-2010年的刊載文獻數據作為分析樣本。對下載的數據進行初步的統計分析,以展現國際科學計量學研究的基本現狀。圖1顯示了2001-2010年間《Scientometrics》期刊的載文分布情況,從整體上看期刊的載文量呈逐年上升的趨勢,尤其是2008年以后,出現增長迅速的態勢。這些文獻按照國家分布來看,高產國家主要有美國、比利時、西班牙、中國、英國、荷蘭、德國等(圖2)。
其中,《Scientometrics》2001-2010年刊載的文獻中在Web of Science數據庫中被引頻次最高的達206次,是Ho Y.S.在2004年發表的《Citation review of Lagergren kinetic rate equation on adsorption reactions》一文。10年間被引頻次超過100次的文獻共計近10篇(截止2012年6月檢索)。
圖1 《Scientometrics》期刊載文量按年分布
圖2 文獻量的國家(地區)分布
本文數據分析主要通過當前國際信息可視化技術研究的先進工具——CiteSpace應用軟件系統。它是由美國Drexel大學的Chaomei Chen博士基于JAVA程序語言編寫的專門用于引文分析的信息可視化應用軟件。軟件基于共引分析的原理,通過對文獻數據信息的計量和可視化處理,探測和分析學科研究前沿隨著時間相關的變化趨勢以及研究前沿與其知識基礎之間的關系,發現不同研究前沿之間的內部聯系。通過對學科領域的文獻信息可視化使研究者能夠直觀的辨識出學科知識結構、研究前沿與知識基礎的演進[6-7]。
前10項中,第6項是布朗(Braun T.)發表在《Scientometrics》的關于期刊的H指數計算問題《A Hirsch-type index for journals》。第9項也同樣是關于H指數的具體應用問題,瑞安(Van Raan A.F.J.)于2006年發表在《Scientometrics》上的《Comparison of the Hirsch-index with standard bibliometric indicators and with peer judgment for 147 chemistry research groups》一文。
列第二位的是加菲爾德(Garfield E.)于1979年出版的專著《Citation indexing:Its theory and application in science,technology,and humanities》。《共被引指標的理論及其應用》詳細介紹了共被引網絡的相關指標、理論及其具體的應用案例,已經成為文獻計量學領域的經典之作。該專著在Google-Scholar中搜索其被引頻次已經超過1 575次(2012年6月17日)。
值得一提的是,位列第三位的節點文獻是我國學者周萍(Zhou P.)于2006年發表在《Research Policy》上面的《The emergence of China as a leading nation in science》一文。在共被引網絡圖譜中,該文從2006年發表以后,引起了學術界的廣泛關注,在Google-Scholar中搜索被引頻次超過240余次(2012年6月17日),該文的突現度為5.65,說明近年來學術界對該文的引用量和關注度急劇增加,其中心度為0.9,也表明了該文在共被引網絡結構中的關鍵地位。
第四篇文獻是丹麥學者英沃森(Ingwersen P.)在1998年發表在《Journal of documentation》上的《The calculation of web impact factors》一文,關于網絡影響因子的計算。
第五篇是1990年德國學者艾格(Egghe L.)出版的專著《Introduction to informetrics:quantitative methods in library,documentation and information science》,作為圖書館學和情報科學的定量方法的信息計量學,全面介紹了信息計量學的相關問題。第八篇同樣是關于信息計量學的應用問題,丹麥學者艾曼德(Almind T.C.)于1997年發表在《Journal of documentation》上的《Informetric analyses on the World Wide Web:methodological approaches to‘Webometrics’》一文,介紹了萬維網的信息計量分析。
第七項是吉本斯(Gibbons M.)于1994年出版的經典專著《The new production of knowledge:the dynamics of science and research in contemporary societies》,新知識產出。最后一項是洛特卡(Lotka A.J.)在1926年發表的經典文獻《The frequency distribution of scientific production》。
在文獻共被引網絡圖譜的基礎上,我們對文獻共被引網絡進行了聚類分析,繪制了文獻共被引網絡聚類圖譜,并基于文獻標題,使用TF*IDF算法對聚類結果進行了標注(圖4)。其中,節點數最多的0#聚類,節點文獻發表時間跨度最長,文獻平均半衰期也最大,標識詞為“統計分析(statistical analysis)”。圖譜中最大節點所在的4#聚類的標識詞為“H指數(h-Index)”。我們整理了節點數大于5的聚類結果進行分析(表3),探測《Scientometrics》期刊研究的前沿問題。
圖4 《Scientometrics》文獻共被引網絡聚類的知識圖譜
其中,Cluster ID是聚類的編號,輪廓值(Sihouette)指的是聚類的“純度”,也就是聚類中“節點主題的一致性”,輪廓值越高說明該聚類的主題越集中。標識詞分別由有3種不同的算法提供,包括TF*IDF、log-likelihood ratio p-level和Mutual Information算法[8]。
0#聚類的標識詞是“統計分析(statistical analysis)”,表征了文獻計量學的基礎方法,該聚類包含的節點較多,共181個節點,其中的主要文獻論述了傳統經典的引文分析相關問題,如加菲爾德、Small等學者。
4#聚類包含44個節點,文獻平均的發表時間為2004年,該聚類研究主題是近年來出現的研究領域。聚類的標識詞主要是“h-index,hirsch,scientific research output”,表明該聚類是以Hirsch提出的H指數及其相關理論為主的問題研究。H指數及其相關問題的研究已經成為近年來文獻計量學和科學計量學領域研究的熱點問題,聚類標識詞也出現了由H指數引申的相關指標G指數。
12#聚類包含節點36個,聚類的標識詞包括“triple helix,interaction,technology domain,knowledge production,developing technology”,該聚類主要是關于技術領域和知識產出相關的三螺旋理論研究。
7#聚類包含節點13個,節點文獻平均發表年份是2000年,聚類的標識詞包括“academic web,linguistic,academic web use,linguistic pattern”。該聚類是關于學術網絡,語義結構的研究,屬于信息科學研究的主要領域。
值得一提的是3#聚類,聚類的標識詞出現了“china,researcher,collaboration,metric,contribution”等。這一聚類是關于中國的科研合作及其相關計量問題的研究,新世紀以來,隨著中國文獻計量學和科學計量學界研究者的不斷努力,中國文獻計量學和科學計量學的研究越來越引起國際學術界的關注,大量研究成果處于國際領先地位。與此同時,隨著中國科技強國戰略的實施,中國的科學技術發展日新月異,對中國科學技術及其科研合作等相關問題的研究也為國際文獻計量學和科學計量學界的學者提供了大量的突出的研究案例。
3 結論與展望
《Scientometrics》期刊作為國際科學計量學研究的權威期刊和理論陣地,是惟一以“科學計量學”命名的學術期刊,其刊載的學術文獻可以在一定程度上反應國際科學計量學研究的熱點和前沿問題,代表著國際科學計量學研究發展演進的狀況。本文對新世紀2001-2010年的刊載文獻數據進行信息可視化分析,通過文獻共被引網絡分析的科學知識圖譜直觀展現了科學計量學研究的關鍵節點文獻和研究的前沿問題。近年來,科學發展規律的數量統計分析、H指數及其相關指標研究、三螺旋理論問題、學術網絡、語義結構問題;中國科學計量學研究等成為國際科學計量學領域研究的前沿問題。
本文研究在數據的選取和研究的寬度等方面都存在一定的局限性,進一步研究將在此研究基礎上,進一步擴展用于分析的數據源和研究的角度。一方面,對國際科學計量學研究知識結構和研究前沿問題的分析,可以將數據源擴展至包括《JASIST》,《Information Science》,《Journal of documentation》等期刊在內的更具代表性的數據樣本,或者采用關鍵詞檢索的方法,增強研究數據選取的針對性和有效性。另一方面,在本文的文獻共被引網絡分析的基礎上,可以將分析的視角拓展至關鍵詞共現分析、作者、研究機構、國家共現分析等,從多層面、全視角展現國際科學計量學研究的演進歷程與現狀。
參考文獻
[1]魏屹東.國際刊物《Scientometrics》文獻計量研究[J].科學技術與辯證法,1995,12(6):40-44.
[2]Editorial statements,Seientometries,1979,(1):3-8.
[3]郭美榮,蘇學.科學計量學前沿演進可視化研究[J].情報雜志,2010,29(12):1-4.
[4]王煉,武夷山.從Scientometrics期刊的自引看科學計量學的學科特點[J].科學學與科學技術管理,2006,(2):10-13.
[5]王麗,袁軍鵬,王娜,等.學術期刊的引用認同分析——以Scientometrics為例[J].情報雜志,2011,30(2):18-22.
[6]Chen,C.CiteSpace II:Detecting and visualizing emerging trends and transient patterns in scientific literature[J].Journal of the American Society for Information Science and Technology,2006,(57):359-377.
[7]Chen,C.Searching for intellectual turning points:Progressive Knowledge Domain Visualization[J].Proceedings of the National Academy of Sciences of the United States of America,2004,101:5303-5310.
[8]Chen,C.,Ibekwe-SanJuan,F., Hou,J.The Structure and Dynamics of Co-Citation Clusters:A Multiple-Perspective Co-Citation Analysis[J].Journal of the American Society for Information Science and Technology,2010,61(7):1386-1409.
(本文責任編輯:孫國雷)