韓曾麗
〔摘 要〕文章以h指數的定義,來界定高被引論文,然后以CiteSpaceⅡ軟件作為分析工具,以文獻關鍵詞作為節點。通過對關鍵詞的頻次和關鍵詞之間的連接的分析,從而體現圖情領域研究的熱點和發展方向。
〔關鍵詞〕h指數;知識圖譜;CiteSpaceⅡ;研究熱點
〔中圖分類號〕G250 〔文獻標識碼〕A 〔文章編號〕1008-0821(2012)09-0163-05
h指數代表“高引用次數(High Citations)”,是在2005年由美國Jorge E Hirsch教授首次提出,它將數量指標(發文量)和質量指標(被引量)結合起來,更好地顯示了科學工作者的科研成果。Hirsch將h指數定義為:一位作者的h指數等于其發表了h篇至少被引h次的論文,即一個作者的h指數表明其至多有h篇論文被引用了至少h次[1]。之后,Braun等將h指數用于評價期刊的質量,提出一種期刊的h指數等于該期刊發表了h篇每篇至少被引h次的論文,或者說一種期刊的h指數是該期刊所發表的全部論文中最多有h篇至少被引用了h次[2]。本文中,我們借鑒h指數的定義,認為某一學科領域某一年的h指數等于該領域在該年發表了h篇每篇至少被引h次的論文,或者說該學科領域該年所發表的全部論文中至多有h篇被引用了h次。然后以h值作為界定高被引論文的閾值。
知識圖譜(Mapping Knowledge Domain),是顯示知識發展進程與結構關系的一系列各種不同的圖形,用可視化技術描述知識資源極其載體,挖掘、分析、構建、繪制和顯示知識及它們之間的相互關聯[3]。CiteSpaceⅡ是信息可視化領域的權威專家陳超美博士開發的可視化軟件,屬于多元、分時、動態的第二代信息可視化技術。它能夠繪制科學知識圖譜,顯示一個學科或知識域在一定時期發展的趨勢與動向,形成若干研究前沿領域的演進歷程[4]。
為了準確地分析本世紀以來我國圖情領域的研究熱點,本文引用h指數的定義,來界定高被引論文,然后以CiteSpaceⅡ軟件作為分析工具,以文獻關鍵詞作為節點,通過對關鍵詞的頻次和關鍵詞之間的連接的分析,從而體現圖情領域研究的熱點和發展方向。
1 數據收集及方法選擇
本文利用CNKI數據庫中的中國學術期刊網絡出版總庫,選取“圖書情報與數字圖書館”分類,分別檢索發表于2000-2011年的核心期刊研究論文,按照被引頻次降序排列,根據前文中對h指數的定義,統計出圖情領域2000-2011年各年的論文的h指數,統計結果見表1。檢索時間為2012年6月11日。
將統計出來的528篇文獻記錄輸出保存,轉換成CiteSpaceⅡ可以識別的格式導入CiteSpaceⅡ,然后對需要的參數進行設置,選擇時間跨度為2000-2011年,時間切片為1年,主題來源為標題(Title)、摘要(Abstract)、主題詞(Descriptors)、標識符(Identifiers),主題詞類型為爆發詞(Burst Terms),以關鍵詞作為節點,選取每一時區被引頻次最高的前30個關鍵詞,以最小生成樹的方式對記錄進行分析,繪制出聚類的圖譜。2 結果分析
2.1 聚類圖譜分析
根據網絡節點的組配,繪制出圖情領域高被引論文中文關鍵詞的分析圖譜,圖譜由220個節點、225條連線組成。即分析文獻中有220個關鍵詞通過225條連線進行組配。如圖1所示。
圖1 圖情領域高被引文獻中文關鍵詞聚類視圖
(1)根據關鍵詞的詞頻統計,出現頻次較高的有圖書館、數字圖書館、信息服務、高校圖書館、學科館員、知識管理、圖書館服務、網絡環境、云計算、大學圖書館、公共圖書館、服務模式、知識服務、創新等,這和聚類視圖中顯示出的各個節點相對應。每個節點代表一個關鍵詞,節點的大小表示這個關鍵詞出現的頻次的高低,節點的年輪顏色和寬度代表關鍵詞在時間維度上出現與發展的序列和頻次,節點之間的連線代表關鍵詞在文章中出現的頻次以及與其他關鍵詞的聯系。
(2)在圖1上面沒有顯示出來的,還有一些散落在四周的小節點,它們與圖譜的中心沒有直接的關聯,如語義網、知識自由、h指數、期刊學科分類、期刊評價等,但反映出我國近12年來圖情領域的新興研究以及與其他領域相結合的尚不成熟的研究。
2.2 時間線分析
對關鍵詞聚類進行時間線分析,繪制出圖情領域高被引文獻中文關鍵詞時間線圖譜,如圖2所示。在圖2中可以看出,Modularity Q=0.5708,Mean Silhouette=0.7798。Modularity Q的取值范圍介于0~1之間,越接近1,說明這個網絡越具有模塊性,可以很好的進行聚類,聚類內的聯系越緊密,聚類間的聯系越松散。Mean Silhouette的取值范圍介于-1~1之間,越接近于1,說明這個聚類的主題越明確。這個聚類結果的Modularity Q和Mean Silhouette值說明這次聚類是合適的[5]。
通過圖2,我們可以清晰地看到各主要關鍵詞出現的時間分布及其中心性。在2000-2002年,數字圖書館、信息服務、高校圖書館、學科館員等關鍵詞都已經存在,并且在十幾年間一直是研究的重點;而服務模式在2003年開始出現,說明相關方向的研究是從這時被重點關注的,而對云計算的
圖2 圖情領域高被引文獻中文關鍵詞時間線圖譜
研究是從2009年才開始,這與計算機技術的發展密不可分,圖書館與計算機技術的結合成為圖書館發展的趨勢。
2.3 時區圖譜分析
對關鍵詞聚類進行時區分析,繪制出圖情領域高被引文獻中文關鍵詞時區圖譜,如圖3所示。時區圖譜是由一系列表示時區的條形區域組成,時區按時間順序從左向右排列,因而研究前沿指向知識基礎[6]。
圖3 圖情領域高被引文獻中文關鍵詞時區圖譜
通過圖3,我們可以看到右上角顯示的是最新熱點研究的關鍵詞構成的研究前沿,并可以看出研究前沿與知識基礎之間的千絲萬縷的聯系。這些研究前沿的主題有職業資格、微博客、語義網、共建共享、期刊學科分類等。
3 節點分析
3.1 學科熱點分析
由圖1可以看出,網絡中有7個關鍵節點(關鍵節點是共引網絡中連接2個以上聚類群組且具有中介作用的節點[7]),分別是圖書館、數字圖書館、信息服務、高校圖書館、學科館員、云計算和服務模式。關鍵節點反映了當前的研究熱點。這7個關鍵節點,除了云計算意外,都是圍繞著圖書館這一主題在圖情領域的基礎性研究,反映出一直以來的主流研究主題。
數字圖書館的研究始于信息技術的快速崛起,使數字圖書館成為研究最熱、持續時間最久的主研究題。并且由于圖書館數字資源的建設而催生的一系列現象和問題的出現,數字版權問題、數字圖書館服務模式等問題始終懸而未決,使數字圖書館的研究歷久彌新,始終是圖情領域的熱點問題。
信息服務和服務模式的研究都是針對圖書館的服務,服務一直是圖書館工作的主題,也成為圖情領域學者研究的主題,無論過去、現在還是未來,都存在并將一直存在于圖情領域的研究之中。
高校圖書館是圖書館的一種存在形態,它成為研究的主題與高校的研究氛圍密不可分。而學科館員的研究是圖書館從業者對自身所處環境和問題的認識,有利于提高自身的職業素養,與信息服務、服務模式的研究都緊密相連,成為圖情領域的研究熱點。
而云計算,是關鍵節點中研究開始最晚的,作為圖情領域的新興主題和研究前沿,我們對其重點分析。云計算始于2006年亞馬遜推出彈性計算云服務,而它在圖情領域的應用,是從2009年4月OCLC宣布向它的會員圖書館提供 “基于云的”、Web規模的協作式的圖書館管理服務[8]開始的。在分析的高被引文獻中有20篇關于云計算的文章。其中被引頻次最高也是研究最早的是胡小菁和范并思的《云計算給圖書館管理帶來的挑戰》、劉煒的《圖書館需要一朵怎樣的“云”?》以及王文清和陳凌的《CALIS數字圖書館云服務平臺模型》,這3篇都是《大學圖書館學報》云計算與圖書館的專稿文章,前者討論為應對云計算給圖書館管理帶來的挑戰圖書館理論界應當研究的問題[9],中間重點闡述了云計算將會對圖書館行業的IT應用產生的影響[10],后者提出了CALIS云戰略和相應的數字圖書館云服務平臺模型,都是關于云計算應用于圖書館中的基礎性研究。其后的研究大多都是針對圖書館云計算中出現的問題或模式的研究。而秦曉珠、張興旺和李晨輝的《移動云計算環境下的數字圖書館云服務模式構建研究》作為2010年廣西教育廳科研項目“基于云計算的數字化信息資源建設模型及服務體系的研究”的成果之一,開始分析移動云計算環境下數字圖書館的云服務模式,提出利用移動云計算解決傳統移動圖書館計算能力弱、存儲能力差等問題的思路和模型,使云計算在圖書館中的應用有了突破性的進展[11]。總之,云計算在圖書館的應用才剛剛起步,它給圖書館帶來巨大的好處,但也使圖書館面臨形形色色的問題,它在圖情領域的實踐還有很長一段路要走,也勢必成為圖情領域現在和未來的研究熱點和發展方向。
3.2 學科前沿分析
在圖3的時區圖譜中,我們可以看到當前的研究前沿,有云計算、微博客和職業資格。我們對后兩個進行重點分析。
在分析的高被引文獻中有4篇關于微博客的文章,其中被引頻次最高也是研究最早的是2009年李華和趙文偉的《微博客:圖書館的下一個網絡新貴》,通過對微博客在其他領域的應用分析,提出其在圖書館領域應用的可行性[12]。其后,隨著越來越多的圖書館開通微博服務,利用微博發布信息、共享信息與讀者交流,對微博客在圖書館中應用的研究逐步發展,但大部分停留在對圖書館微博服務的現狀的分析,也有學者提出微博客在圖書館中應用的服務模式、信息交流模式,以及圖書館的微博營銷等問題,把圖書館微博服務的研究推進一步。目前,越來越多的圖書館開通微博服務,但作為機構專業機構的服務平臺,林林總總的信息,參差不齊的服務,以及服務機制等,使圖書館使用微博的過程中遇到接二連三的問題。而作為圖書館的新興個性化服務,微博服務的研究依然成為圖書館服務研究的一個方向,并在未來與微博的發展同步,解決圖書館微博服務的理論和實踐性問題。
職業資格是和學科館員密切相連的。在分析的高被引文獻中的2篇關于職業資格的文章,分別是劉波濤的《建立和完善高校圖書館“學科館員”制度的幾項措施》和陳傳夫、王云娣、盛釗和丁寧的《圖書館員去職業化問題、原因及對策研究》,前者提出建立和完善高校圖書館學科館員的5項措施:建立學科館員崗位責任制,明確學科館員的崗位要求和職責;對學科館員實行資格認證;建立以用戶為主的學科館員考核辦法;建立一支合格的學科館員隊伍;確實提高學科館員的待遇[13],后者根據圖書館員去職業化的現象,指出造成這種現象的原因和應對方式[14]。由于在我國,始終沒有建立圖書館員的職業資格認證制度,造成圖書館員的技術素質參差不齊,因此,在圖情領域,建立圖書館員的職業資格認證制度是一個長久討論但至今未果的問題,對它的研究,是圖情學者對自身領域的責任感和使命感的體現,歷久彌新。
4 問題及結論
本文以我國圖情領域的高被引論文為研究對象,借鑒h指數的評價指標,通過最新的信息可視化技術CiteSpaceⅡ軟件的分析和處理,繪制知識圖譜,展示我國圖情領域的研究熱點,并且分析了當前圖情領域發展所依賴的知識基礎以及前沿的發展趨勢[6]。
但是,本文的研究還存在有很多不足之處。第一,借鑒h指數的定義,以h值作為界定高被引論文的閾值,不能涵蓋所有的高被引文獻。特別是在選取最近兩年的文獻時,由于閾值的限定,選取的文獻較少,而使一些當前的研究熱點,但被引頻次較低的文獻成為漏網之魚,這就使得對研究前沿的分析不能準確地反映當前的實際情況。第二,對學科熱點分析時只對云計算這個既是研究熱點又是學科前沿的節點進行分析,而對其他的關鍵節點的分析不夠全面。第三,對研究前沿進行分析時,只對微博和職業資格兩個前沿主題進行分析,沒能對所有反映學科前沿的主題進行分析。
但通過研究我們依然可以發現,圍繞著圖書館這個主題,一直備受關注的是數字圖書館、信息服務、高校圖書館、學科館員以及服務模式的研究,并且這幾個熱點的研究已經相對成熟。而對云計算的研究在最近三年成為圖情領域的研究熱點,并有持續發展的趨勢,成為研究的前沿。職業資格、微博客、語義網、共建共享、期刊學科分類等主題,以圖情領域的基礎知識和當前的信息技術為依托,成為目前的研究前沿。
參考文獻
[1]Hirsch,J.E.An index to quantify an individual,s scientific research output[J].Proceedings of the National Academy of Sciences of the USA,2005,102(46):16569-16572.
[2]葉鷹.h指數和類h指數的機理分析與實證研究導引[J].大學圖書館學報,2007,(5):2.
[3]秦長江,侯漢清.知識圖譜——信息管理和知識管理的新領域[J].大學圖書館學報,2009,(1):30.
[4]陳超美.Citespace科學文獻中新趨勢與新動態的識別與可視化[J].陳悅,侯劍華,梁永霞,譯.情報學報,2009,28(5):401-421.
[5]衛軍朝,蔚海燕.基于CiteSpaceⅡ的數字圖書館研究熱點分析[J].圖書館雜志,2011,(4):70-77.
[6]趙蓉英,王菊.圖書館學知識圖譜分析[J].中國圖書館學報,2011,(2):40-49.
[7]周金俠.基于CiteSpaceⅡ的信息可視化文獻的量化分析[J].情報科學,2011,(29):98-101.
[8]OCLC News releases.OCLC announces strategy to move library management services to Web scale[EB].http:∥worldcat.org/arcviewer/1/OCC/2011/11/08/H1320767091756/viewer/file4063.htm,2012-06-12.
[9]胡小菁,范并思.云計算給圖書館管理帶來挑戰[J].大學圖書館學報,2009,(4):7-12.
[10]劉煒.圖書館需要一朵怎樣的“云”?[J].大學圖書館學報,2009,(4):2-6.
[11]秦曉珠,張興旺,李晨輝.移動云計算環境下的數字圖書館云服務模式構建研究[J].情報理論與實踐,2012,(5):90-93.
[12]李華,趙文偉.微博客:圖書館的下一個網絡新貴[J].圖書與情報,2009,(4):78-82.
[13]劉波濤.建立和完善高校圖書館“學科館員”制度的幾項措施[J].圖書館論壇,2004,(1):47-48.
[14]陳傳夫,王云娣,盛釗,等.圖書館員去職業化問題、原因及對策研究[J].中國圖書館學報,2012,(1):5-18.
(本文責任編輯:孫國雷)