黎九平
〔摘 要〕運用知識圖譜方法對國際圖情領域2001-2011年的相關文獻進行多角度的定量定性分析,描繪該領域近年來的研究現狀與前沿。結果表明,目前該領域的文獻量穩步增長,核心著者和高產機構主要來自歐美國家。目前的研究前沿主要集中在信息系統、信息服務、信息計量和知識管理等領域,研究方法注重學科和社會人文的融合。
〔關鍵詞〕知識圖譜;研究現狀;前沿分析;圖情領域
〔中圖分類號〕G250.252 〔文獻標識碼〕A 〔文章編號〕1008-0821(2012)09-0020-05
隨著社會信息化和知識化的迅速發展以及iSchool(The School of Information Studies,iSchool)聯盟的不斷推進和壯大,推動了圖書情報領域的研究范圍從傳統的圖書情報領域拓展到信息科技領域、研究對象從實體的圖書情報機構延伸到虛擬數字空間。這些變化使得圖書情報學的研究受到前所未有的關注與重視,眾多專家學者對圖書情報學在社會變革和日常工作中發揮的理論價值和實踐意義有著更深層次的認識和理解,對于圖書情報學知識結構及其演化規律的探索也在不斷向前推進[1-2]。本文在此背景下,為了更加全面的了解和把握國際圖書情報學領域的研究現狀和熱點,運用知識圖譜方法[3]對該領域的相關文獻進行以定量分析為主、定性分析為輔的研究,分析和探索國際圖書情報領域研究現狀和前沿,把握國際圖書情報學領域的研究脈絡,明確圖書情報學研究領域的發展趨勢,為我國圖書情報學領域的研究重點和方向提供一定的參考依據,為推動我國圖書情報學的發展和繁榮提供活力和契機,使其更好地適用于我國信息化社會的建設。
1 數據來源
本文研究的數據來源于美國科學情報研究所建立的全球著名的綜合性社科類文獻數據庫——社會科學引文索引(SSCI)。該數據庫是目前世界上可以用來對不同國家和地區的社會科學論文的數量進行統計分析的大型檢索工具,內容覆蓋社會學、法律經濟、管理系、信息科學等55個領域,具備很高的學術影響力,所收錄的文獻能夠在一定程度上展示國際圖書情報學研究領域的進展和前沿。由于圖書情報學領域的研究呈現多方位、全面性、多學科滲透的交叉發展的趨勢,在實際研究中很難將所有數據采集完全。因此,在數據采集的過程中結合《期刊引證報告》中2006-2011年間圖書情報領域平均影響因子排名前十的期刊作為來數據采集的來源期刊,如表1所示。
確定來源期刊后,在Web of Science數據庫中選擇ISI和SSCI數據庫以2001-2011作為檢索時間段進行檢索,共獲取包含Article、Review、Proceedings Paper等多種類型的文獻8 975篇,選取占文獻總量70.23%的Article和Review作為分析的樣本,總計6 303條。
2 研究現狀描述
2.1 文獻信息量統計
發表文獻的數量在一定程度上代表著某個領域的研究水平和發展趨勢。圖1展示的是所選擇的數據來源期刊10年間的發文數量。
圖1 按所選擇的數據來源期刊進行文獻信息量統計
從圖1可以,圖書情報領域的研究成果主要發表在JOURNAL OF THE AMERICAN MEDICAL INFORMATICS ASSOCIATION和SCIENTOMETRICS期刊上。JOURNAL OF THE AMERICAN MEDICAL INFORMATICS ASSOCIATION是美國情報科學與技術學會的會刊,主要發表權威專家的精辟論述,是情報學界的標志性刊物;SCIENTOMETRICS是科學計量學和情報學領域的前沿期刊,主要運用定量方法進行圖書情報領域的計量分析,反映學科的發展趨勢和典型模式。
2.2 論文著者統計分析
著者發文量和被引頻次可以識別某領域的核心作者及其學術影響力[4]。本文選擇發文量和被引頻次排名前十的作者視為該領域的核心作者和高被引作者,統計分析結果如表2和表3所示。
從表2和表3可以看出,EGGHE L以發文量65篇排在發文量榜首,SALTON G以被引頻次453次成為該領域中被引頻次最高的著者。EGGHE L主要從事科學計量學領域的研究,所發表的學術論文大多是關于g-指數、h-指數等相關文獻學文獻,SALTON G主要從事信息檢索、現代搜索技術的研究與應用開發工作,所提出的向量空間模型、逆文檔頻率、術語頻率、術語偏離值等概念和檢索過程中的相關反饋機制,極大地促進了信息檢索領域的發展,被譽為現代搜索技術之父。更引人矚目的是LEYDESDORFF L、GLANZEL W和SPINK A等3位作者在發文量和被引頻次列表中均進入了前十名。LEYDESDORFF L主要從事系統理論、社會網絡分析和社會學創新等學科的研究,有著較高的發文量和被引頻次;GLANZEL W在被引頻次數量上超過LEYDESDORFF L和SPINK A,足見其在圖情領域中的影響力和核心地位;SPINK A曾就職著名的搜索引擎公司InfoSpace和Vivisimo,主要從事用戶行為和搜索引擎技術的研究[5]。
2.3 高產機構分析
統計表明這些文獻數據來自937個不同的研究機構,表4列出的是發表論文排名前十的高產機構。
從論文數量來看,發文量排名前三的是印第安納大學、華盛頓大學和哈佛大學,其發文量所占比例分別為2.03%、1.79%和1.70%,表明這3個機構在圖書情報領域研究中較為活躍,有較高的學術成果發表。其它排名比較靠前的機構還有北卡羅來納大學、馬里蘭大學、匹茲堡大學、亞利桑那大學等。
從地區上看,排名前十的高產機構中,美國占據90%的席位,顯示出美國在該領域有著強大的學術影響力,支持和推動著圖書情報學的發展和前進。排名第八的比利時天主教魯汶大學是唯一一所非美國的高等院校,該校是歐洲國家的重要高等學府,為圖書情報學在歐洲的發展和普及起到不可磨滅的貢獻和力量。
3 知識基礎與前沿分析
3.1 研究熱點與前沿
關鍵詞是作者對論文主題的高度提煉和概括,能夠準確地反映文本內容的核心和精髓,通過高頻關鍵詞來考察一個學科領域的研究熱點和前沿就具備很強的代表性[6-7]。本文將下載的數據導入CitespaceII中,網絡節點類型選擇Keyword,時區分割選擇為1,即10年的數據以年為單位切為10片,閥值選為出現頻次最高的top50,運行軟件得到關鍵詞共現圖譜,通過點擊圖譜中節點,獲取高頻關鍵詞的出現頻次,如表5所示。
從表5可以看出,關鍵詞頻次最高的是Science,出現頻次為475次,反映出圖書情報領域的研究必須借助科學的方法、工具和軟件才能取得更好的研究成果;其次是Model,表明在實際應用過程中,需借助一定的模型來更好的解決現實問題,借助數據模型是促使圖書情報研究從簡單的定性描述向高級的定量分析的必由之路。排在第三位的是Systems,表明圖書情報領域的研究比較重視理論聯系實際,注重應用系統的開發和應用。其它高頻關鍵詞如Technology、Performance、Behavior等代表圖書情報學科的不同發展趨勢和研究傾向。
為了更好地了解高頻關鍵詞所反映的研究主題,通過聚類將這些關鍵詞按其聯系的緊密程度進行聚類,獲取4個聚類主題,如圖2所示。
通過圖2可以看出,高頻關鍵詞反映的研究主題主要分為4個方面:
3.1.1 信息系統
該主題的高頻關鍵詞主要有system、information-systems、retrieval、information technology、business value等。該主題反映圖書情報學的研究比較注重信息技術的開發和應用,通過利用現代計算機和網絡通訊技術平臺,加強和提高企業的信息化水平,輔助企業決策,體現出國際圖書情報學的研究比較注重將技術、社會和人文進行有機的結合,強調理論研究為應用服務,將學科價值應用到實際生活中去,也是圖書情報學發展的最終目的和自我價值的實現。
3.1.2 知識管理
該主題的高頻關鍵詞主要有knowledge management、information retrieval、networks、www等。該主題反映圖書情報學的研究更多的是挖掘和發現組織中的隱形知識,并對其進行有效地管理和利用。當前,企業獲取知識的途徑由傳統的文獻資料向網絡空間進行過渡,企業更多地通過網絡獲取其所需要的知識和信息。
3.1.3 信息計量
該主題的高頻關鍵詞主要有bibliometrics、journals、citation analysis、collaboration、indicators等。該主題反映出隨著信息資源數字化的迅速發展和普及,通過定量方法來描述和研究信息的動態特征和內在規律,更好地幫助用戶進行信息的篩選和評價,提高信息的利用效率和用戶的滿意度。
3.1.4 信息服務
該主題的高頻關鍵詞主要有behavior、user acceptance、E-commerce、trust、relevance等。該主題反映出隨著社會信息化得發展,從用戶的角度進行信息服務的研究和開展,有助于提供用戶信息服務的滿意度,能夠將有價值的信息傳遞給特定的用戶,實現信息增值和信息資源的優化配置。
為了確定該領域目前的研究前沿,本文選用突變檢測算法來挖掘和發現該領域的突變專業術語,同時選擇時間線索聚類視圖,得到圖3所示的聚類知識圖譜。
圖3 圖情領域關鍵詞聚類圖譜
通過圖3可以看出,通過詞頻變化較高的突變專業術語有information technology、journals、h-index,這些都是目前的研究前沿。此外,生成的關鍵詞聚類圖譜所反映的八大聚類中與高頻關鍵詞聚類得到的四大主題十分相似,都是圍繞信息系統、信息服務、信息計量等方面進行展開。
3.2 知識基礎
通過對知識基礎的共被引分析,有利于進一步明確相關研究熱點的本質屬性和規律,把握學科的發展方向和趨勢[8]。利用CitespaceII提供的共被引分析功能能夠對所采集的文獻數據進行共被引知識圖譜的繪制,運行結果如圖4所示。表6列出的是被引頻次100次以上的高被人文獻,括號中給出的是相應文獻在谷歌學術中檢索到的被引頻次(截止2011-11-25)這些高被引文獻構成了圖書情報學領域的知識基礎,具備很高的學術價值。