田大芳 魏瑞斌
〔摘 要〕[目的/意義]通過共詞分析和聚類分析研究國外2017年信息科學與圖書館學領域的研究熱點。[方法/過程]首先從Web of Science收集數據;然后利用HistCite統計關鍵詞頻次,確定高頻關鍵詞;最后利用VOSviewer對原始數據進行處理,最終得到9個聚類。[結果/結論]研究發現,國外信息科學與圖書館學的研究主題可以歸納為以下9個方面:圖書館管理與服務、用戶研究和信息素養;社交媒體、電子商務、電子政務、智慧城市、信息技術和信息安全;文獻計量學、科學計量學和替代計量學;開放數據、數據分析、數據質量和數據挖掘等;開放存取、數字人文、數字圖書館和信息檢索等;醫療健康信息學;知識管理與開放創新等;公共信息、信息分享、社交網絡和政治交流;圖書館情報學教育。
〔關鍵詞〕信息科學與圖書館學;共詞分析;聚類分析;研究主題;研究熱點
DOI:10.3969/j.issn.1008-0821.2018.08.017
〔中圖分類號〕G250 〔文獻標識碼〕A 〔文章編號〕1008-0821(2018)08-0125-05
〔Abstract〕[Purpose/Significance]This study aimed to explore the research hot topic during 2017 in Information Science & Library Science using the co-words analysis and cluster analysis.[Method /Process]Firstly,the paper collected the raw data from the web of science.Secondly,it counted the frequency of the authors keywords by HistCite.Finally,it used VOSviewer to deal with the data and Generated 9 clusters.[Result/Conclusion]The result showed that there were 9 hot topic which were library management and service,user studies and information literacy;social media,e-commerce,e-government,smart city,information technology and information security;bibliometrics,scientometrics,altmetrics;open data,data analysis,data quality and data mining;open access,digital humanities,digital libraries and information retrieval;health informatics;knowledge management and open innovation;public information,information share,social network and political communication;library and information science education.
〔Key words〕information science & library science;co-words analysis;cluster analysis;research topics;research hot topics
研究熱點是指在一定時期內某一研究領域中,研究人員所共同關注的焦點。研究熱點的識別一直是科學計量學等相關研究領域非常關注的問題之一。隨著各類數據源的不斷豐富,研究工具的便利性和功能性的提升,原有研究方法的改進和新研究方法的涌現,關于學科、主題或某領域的研究熱點的研究產生了一系列的研究成果。
從研究方法的角度看,有些學者使用一種文獻來識別研究熱點。如文獻[1-2]利用詞頻分析方法來識別研究熱點;文獻[3-5]利用共詞分析方法識別研究熱點;文獻[6-7]利用聚類分析來識別研究熱點。有的學者采用多種方法綜合使用來識別研究熱點。如文獻[8-12]使用了至少兩種方法來識別研究熱點。還有的學者從一些新的視角或理論來進行研究熱點識別的研究,如文獻[13-17]。目前,大多數的研究熱點的研究是以期刊論文數據為基礎進行的,也有些學者在研究過程中使用學位論文、科研項目等數據來對某個學科或領域的研究熱點進行識別,如文獻[18-21]。
關于國外圖書情報學研究熱點的研究也已經有了一系列成果,如文獻[22-29]。這些研究成果對于了解國外圖書情報學特定時間段、特定數據范圍的情況有較高的參考價值。同時,它們所使用的研究方法和數據源等對于進行相關研究也有一定的指導作用。本文主要對國外2017年信息科學與圖書館學研究熱點進行研究,以期國內學者能及時了解國外學術期刊上相關論文的研究主題,為其科研選題等工作提供參考。
1 數據與方法
1.1 數據采集
本文以Web of Science為數據源,在其高級檢索中,WC表示Web of Science Category。該分類一共有251個。本文的檢索式為:(WC=“Information Science & Library Science”) AND DOCUMENT TYPES:(Article);Indexes=SCI-EXPANDED,SSCI,A&HCI;,CPCI-S,CPCI-SSH,BKCI-S,BKCI-SSH,ESCI,CCR-EXPANDED,IC Timespan=2017。最終獲得5 721條記錄。在5 721條記錄中,有1 575篇論文沒有關鍵詞信息。
利用HistCite統計的作者關鍵詞總數為13 535個,出現頻次為23 158次,包含關鍵詞的論文的篇均關鍵詞為5.63個。本文僅以包含關鍵詞的論文作為分析對象。
1.2 高頻關鍵詞選擇
筆者認為,一個研究主題能稱之為研究熱點,那么表示這個研究熱點的專業術語應該要達到一定的頻次。本文對研究熱點的研究也是基于高頻關鍵詞來進行分析的。郭春俠等[25]認為,確定高頻詞,一般可以采取兩種辦法:1)研究者根據研究經驗主觀判斷;2)根據齊普夫第二定律,確定高頻詞界限,這種方法由于比較科學、簡單易行而被研究者廣泛使用。齊普夫之后,人們對該方法進行了一些改進,其中Donohue于1973年提出了高頻詞低頻詞界分公式。但本文根據公式計算后僅有一個關鍵詞符合條件,不能滿足本研究的需要。本文根據關鍵詞的詞頻次排序,取10次以上的228個關鍵詞為高頻關鍵詞。它們總的出現頻次約占所有關鍵詞出現頻次的20%。出現100次以上的分別是Social Media(148次)、Academic Libraries(140次)和Bibliometrics(113次)。Bibliography等37個關鍵詞出現頻次為10次。圖1為228個高頻關鍵詞的頻次分布圖。從其分布看,整體表現為乘冪分布,趨勢線的方程為:y=208.86x-0.558,擬合系數為R2=0.9869。
1.3 數據處理工具與方法
Eck N J V等[30]的介紹了VOSviewer的基本功能及原理,并進行了實證分析。張力[31]等比較VOSviewer和CiteSpace發現,兩款軟件給出了基本一致的圖譜結構,表明兩種軟件在信息可視化研究中可以相互參驗。宗乾進等[32]基于VOSviewer,通過對中國知網中收錄的13種圖書館學CSSCI來源期刊文獻信息進行挖掘,可視化展示2010年我國圖書館學2010年的研究熱點主題。綜合來看,VOSviewer比較適合對相關文獻研究熱點的挖掘。
筆者將Web of Science采集的數據直接導入VOSviewer,然后利用其生成高頻關鍵詞(頻次大于等于10)共現網絡,最后利用其繪圖功能生成整體共詞網絡圖(圖2)。結合VOSviewer聚類功能看,這些關鍵詞共形成了9個聚類。
潘瑋等[33]研究了關鍵詞共現方法識別領域研究熱點過程中的數據清洗方法。但從他們臟數據產生的原因來看,其方法對于本文的研究參考價值不大,因為其方法實際主要是從詞的形式上的一種清洗。在對圖2的共詞網絡及聚類結果進行分析時,更多的是要從詞的語義層面進行分析。
結合原始數據看,這些高頻詞當中,有些高頻詞并不能表示一個研究主題。本文將這些詞歸納為:1)表示國家或地區的關鍵詞,如China、Spain和Australia等。2)表示研究方法的詞,如Citation Analysis、Social Network Analysis和Qualitative Research等。3)表示數據源的詞,如TWitter、Facebook和Web of Science等。4)表示研究對象的詞。如Academic Libraries、Public Libraries和University Libraries等。5)表示研究背景的詞。如Web2.0、Internet of Things和Big Data。6)意義比較寬泛的詞。如Assessment、Leadership和Learning等。這些詞一共有117個,占高頻詞總體的51%。這些詞在聚類分析過程中,都會提及。在歸納研究主題時,主要以除以上6類外的詞為主,結合關鍵詞共現,適當使用一些泛詞。
2 基于高頻詞聚類的信息科學與圖書館學研究熱點研究
2.1 圖書館管理與服務、用戶研究和信息素養
第1個聚類一共包括了37個關鍵詞。從關鍵詞來看,這個聚類的研究可以分為兩個小類。一是圖書館的管理與服務的相關研究。圖書館的類型涉及學術圖書館(156次)、公共圖書館(54次)、大學圖書館(42次)和圖書館(37次),管理內容涉及圖書館管理、組織文化、館藏管理、館員學習戰略、信息資源建設等。圖書館服務涉及服務內容、服務質量的評價等;二是用戶研究。用戶研究是圍繞用戶的信息行為、信息需求、信息查找、信息素養、用戶滿意度等。在該聚類中,Institutional Theory(制度理論)出現了10次,這反映了相關研究共用的一個理論基礎。Empirical Study(實證研究,11次)是該聚類中唯一表示方法的關鍵詞,這反映出該聚類的研究比較多的使用了該方法。在相關研究中,以土耳其、巴基斯坦和尼日利亞3個國家的公共圖書館、大學圖書館和學術圖書館為實證對象??傮w看,該聚類的研究都屬于圖書館學研究的范疇。
2.2 社交媒體、電子商務、電子政務、智慧城市和信息技術和信息安全等
該聚類一共有34個關鍵詞。從研究內容看,該聚類的研究主題較多。如Web2.0環境下在線交流的用戶內容生成、云計算和物聯網環境下的智慧城市建設、信息技術與信息安全、技術接受和擴散、社會科學的研究倫理、公民管理、圖書情報學教育等主題。該聚類涉及的研究方法有Case Study(31次)和Ethnography(15次)。相關研究中涉及較多的數據源是Wikipedia(37次)和Facebook(17次)。涉及的國家和地區是India(39次)和China(21次)和Developing Countries(17次)??傮w看,該聚類屬于信息科學研究范疇,相關研究與管理學有一定的交叉。
2.3 文獻計量學、科學計量學和替代計量學
該聚類一共有32個關鍵詞。從其研究內容看,研究比較多的首先是科學合作問題,具體涉及到國際合作、跨學科合作、研究合作等;第二個主題是科研評價;第三個主題是電子資源的社會影響。這個聚類中出現的比較多是研究方法,如Citation Analysis(59次)、Social Network Analysis(37次)、Content Analysis(26次)、Network Analysis(19次)和Structural Equation Modelling(10次)。評價指標涉及Impact factor(16次)、Research Impact(14次)和h-index(13次)。研究過程中使用較多的數據源是Web of Science(33次)、Scopus(21次)和Google Scholar(12次)??傮w看,該聚類的研究非常集中,與其它聚類研究的差別非常明顯,個性比較突出。
2.4 開放數據、數據分析、數據質量和數據挖掘等
該聚類一共有27個關鍵詞。從其研究內容看,主要是圍繞“數據”展開。其研究對象涉及研究數據、電子健康記錄和開放政府等。研究主題包括了數據分析、數據挖掘、數據質量、數據分享、數字可視化、大數據、記錄管理、績效評價、臨床決策支持等。該聚類還涉及了自然語言處理、機器學習、健康信息技術、分類、聚類、算法、混合方法等具體的方法和技術。該聚類中出現較多的國家是Mexico(10次)。總體看,該聚類的研究與計算機科學的交叉較多,領域研究偏向于醫療信息學。
2.5 開放存取、數字人文、數字圖書館和信息檢索等
該聚類一共有27個關鍵詞。從研究內容看,該聚類研究主題相對豐富。其主要是圍繞數字圖書館、開放存取、機構知識庫、數字化保存、關聯數據、用戶體驗和信息檢索展開。在相關研究中涉及元數據、人機交互、語義分析、文本挖掘、本體等方法和技術。該聚類中出現較多的是地區和國家是Africa( 18次)和Brazil(15次)??傮w看,該聚類的研究宏觀上研究了數字化和開放存取對學術交流和科學交流的影響,微觀層面研究了數字圖書館、開放存取和信息檢索的技術環節。
2.6 醫療健康信息學
該聚類一共有27個關鍵詞。從研究內容看,該主題涉及心理健康與疾病、衛生保健、健康、決策支持等,研究的對象有女性和青年人。采用的研究方法包括定性研究、扎根理論、訪談、主題分析和話語分析等。另外,該聚類中出現較多的國家和地區包括了美國、加拿大、北美、歐洲、澳大利亞Australia(26次)、Canada(15次)、Europe(15次)、United States(13次)和North America(10次)??傮w看,該聚類的研究領域集中在醫療健康領域,專業性非常明顯,采用最多的研究方法是定性研究(117次,該聚類中出現次數最多的關鍵詞)。
2.7 知識管理與開放創新等
該聚類有18個關鍵詞。從研究內容看,主要是圍繞知識管理、知識轉移、知識分享和技術接受等展開。在這些相關研究中涉及合作、信息系統、信息技術、組織文化、高等教育等領域。該聚類中涉及的國家South Africa(12次),沒有明顯的研究方法和數據源等關鍵詞??傮w看,該聚類的研究主題與管理學存在一定的交叉。
2.8 公共信息、信息分享、社交網絡和政治交流
該聚類有17個關鍵詞。從研究內容看,其研究主題主要是圍繞網絡環境下的信息分享、基于社交網絡的政治交流。這個聚類中還出現了Scientific Production(19次)、Journalism(12次)、Elections(10次)和Media(10次)。該聚類涉及的數據源是Twitter(52次),研究方法是調查法(Survey,14次),涉及的理論是認識論(Epistemology,10次),出現的國家是Spain(32次)。總體看,該聚類是以信息分享與交流為中心,研究主題與新聞傳播學領域有交叉。
2.9 圖書館情報學教育
該聚類只有5個關鍵詞。從研究內容看,主要是圍繞圖書情報學教育的多樣性和包容性展開。有10篇論文的關鍵詞中同時包含了Library and Information Science和Education。這些論文的研究角度各不相同。如Derakhshan M等[34]使用2000年ACRL標準作為框架,利用半結構化訪談,研究了如何通過提升信息素養來應對圖書情報學領域面臨的挑戰。Lee J等[35]利用Kram和Isabella在組織關系中提出的同伴關系框架研究了圖書情報學博士生的同伴關系。Golub K等[36]基于組織象征主義理論和加入Ischool的意圖,分析了丹麥、挪威和瑞典3所加入Ischool高校的意圖,比較了它們與美國三所Ischool高校的427個碩士課程大綱。
3 結 論
本文以Web of Science 2017年Information Science & Library Science的Article論文為研究對象,以4 146篇論文的高頻關鍵詞進行了聚類分析。從聚類規???,第1、2、3;第4、5、6;第7、8的規模相當,第9個聚類規模較小。與以往相關成果相比,本文在聚類結果分析前,對關鍵詞進行了分類,這種分類有利于最終研究主題的歸納。但由于是人工完成,具有一定的主觀色彩。從聚類結果看,第1、3、4、6、7和9共6個聚類的特色比較明顯,其它3個聚類結果中涉及的研究主題較多。這在一定程度上反映了相關研究的集中性與分散性;從聚類的內容看,第1、3、7和9都是比較傳統的圖書情報學研究主題,其它研究主題則與計算機科學、管理學、醫學和新聞傳播學等有一定的交叉。這反映了信息科學與圖書館學研究主題一方面具有穩定性,同時在與其它學科交叉的過程中,也豐富了其研究主題,體現了一定的包容性。從表示國家或地區的關鍵詞看,有些研究主題具有較為明顯的地域性特征。
隨著人工智能、大數據、虛擬現實等技術的迅猛發展,信息科學和圖書館領域將迎來一些新的機遇和挑戰。結合本文的研究結果和ASIS&T;在2017年10月在華盛頓召開的學術年會的相關信息等內容看,未來幾年內,替代計量學、社區信息學、數字人文、健康信息學、人機交互、社交媒體、信息倫理、知識轉移、信息行為、信息檢索、用戶體驗等將是國外信息科學與圖書館學領域重點關注的研究主題。
參考文獻
[1]鞏永強,劉莉.基于詞頻分析法的情報學研究熱點透析[J].圖書館學研究,2011,(13):9-13.
[2]儲節旺,錢倩.基于詞頻分析的近10年知識管理的研究熱點及研究方法[J].情報科學,2014,32(10):156-160.
[3]Van Den Besselaar P,Heimeriks G.Mapping Research Topics Using Word-reference Co-occurrences:A Method and an Exploratory Case Study[J].Scientometrics,2006,68(3):377-393.
[4]Sugimoto C R,McCain K W.Visualizing Changes Over Time:A History of Information Retrieval Through the Lens of Descriptor Tri-occurrence Mapping[J].Journal of Information Science,2010,36(4):481-493.
[5]李武,董偉.國內開放存取的研究熱點:基于共詞分析的文獻計量研究[J].中國圖書館學報,2010,36(6):105-115.
[6]閔超,孫建軍.學科交叉研究熱點聚類分析——以國內圖書情報學和新聞傳播學為例[J].圖書情報工作,2014,58(1):109-116.
[7]徐春浪,汪天皎.我國學生評價研究熱點聚類分析及其知識圖譜——基于CNKI 684篇核心期刊文獻的關鍵詞共詞分析[J].教育理論與實踐,2016,36(31):35-39.
[8]Chen C,Ibekwe-Sanjuan F,Hou J.The Structure and Dynamics of Co-citation Clusters:A Multiple-perspective Cocitation Analysis[J].Journal of the American Society for Information Science & Technology,2010,61(7):1386-1409.
[9]Chang Y W,Huang M H.A Study of the Evolution of Interdisciplinarity in Library and Information Science:Using Three Bibliometric Methods[J].Journal of the American Society for Information Science and Technology,2012 63(1):22-33.
[10]劉曉波.我國圖書館學研究熱點及趨勢:基于關鍵詞共現和詞頻統計的可視化研究[J].圖書情報工作,2012,56(7):62-67.
[11]張幸,華薇娜.近二十年國際智能代理領域研究熱點分析——基于共詞分析和社會網絡分析[J].現代情報,2014,34(9):133-140.
[12]皇甫青紅,華薇娜,劉艷華,等.國際數字圖書館領域研究熱點及作者團體分析——基于共詞分析和社會網絡分析[J].情報雜志,2013,32(1):118-123.
[13]孫建軍.鏈接分析:知識基礎、研究主體、研究熱點與前沿綜述——基于科學知識圖譜的途徑[J].情報學報,2014,33(6):659-672.
[14]王知津,李博雅.近五年我國情報學研究熱點動態變化分析——基于布拉德福定律分區理論[J].情報資料工作,2016,(3):34-40.
[15]劉自強,王效岳,白如江.基于時間序列模型的研究熱點分析預測方法研究[J].情報理論與實踐,2016,39(5):27-33.
[16]趙雅馨,楊志萍.研究熱點探測的替代計量學方法和應用——以信息與計算科學為例[J].情報雜志,2016,35(11):39-44.
[17]尚曉倩.基于突變檢測的國際Altmetrics研究熱點和趨勢分析[J].情報科學,2017,35(5):51-56.
[18]孫曉寧,儲節旺.近十年知識管理領域碩博士學位論文研究熱點分析——以共詞分析為方法[J].情報雜志,2012,31(6):85-90.
[19]李長玲,翟雪梅.基于碩士學位論文的我國圖書館學與情報學研究熱點分析[J].情報科學,2008,(7):1056-1060.
[20]劉孝文.試論我國圖書館學研究熱點及走向——基于國家社科基金課題指南和研究生培養方向的分析[J].情報資料工作,2007,(1):30-33.
[21]王晴.國內圖書館學學科研究熱點透視與特征分布——基于2012年國家社科基金項目及課題指南的統計分析[J].新世紀圖書館,2013,(2):15-18,58.
[22]王英,馬海群.美國情報學研究熱點管窺——基于BASIST的詞頻統計[J].情報理論與實踐,2009,32(9):125-128.
[23]柯平,賈東琴,李廷翰.2010年國外圖書館學情報學研究熱點分析[J].情報科學,2011,29(9):1281-1288,1293.
[24]趙蓉英,馬麗娜.國際情報學核心期刊與研究熱點的可視化分析[J].情報科學,2011,29(8):1238-1243.
[25]郭春俠,葉繼元.基于共詞分析的國外圖書情報學研究熱點[J].圖書情報工作,2011,55(20):19-22.
[26]邱均平,呂紅.近五年國際圖書情報學研究熱點、前沿及其知識基礎——基于17種外文期刊知識圖譜的可視化分析[J].圖書情報知識,2013,(3):4-15,58.
[27]劉自強,岳麗欣,王效岳,等.主題演化視角下的國際情報學研究熱點與前沿分析[J].圖書館,2017,(3):14-22.
[28]Milojevic S,Sugimoto C R,Yan E,Ding Y.The Cognitive Structure of Library and Information Science:Analysis of Article Title Words[J].Journal of the American Society for Information Science and Technology,2011,62(10):1933-1953.
[29]Bauer J,Leydesdorff L,Bornmann L.Highly Cited Papers in Library and Information Science(LIS):Authors,Institutions,and Network Structures[J].Journal of the Association for Information Science and Technology,2015,67(12):3095-3100.
[30]Eck N J V,Waltman L.Software Survey:VOSviewer,a Computer Program for Bibliometric Mapping[J].Scientometrics,2010,84(2):523-538.
[31]張力,趙星,葉鷹.信息可視化軟件CiteSpace與VOSviewer的應用比較[J].信息資源管理學報,2011,(1):95-98.
[32]宗乾進,袁勤儉,沈洪洲.基于VOSviewer的2010年中國圖書館學研究熱點分析[J].圖書館,2012,(4):88-90.
[33]潘瑋,牟冬梅,李茵,等.關鍵詞共現方法識別領域研究熱點過程中的數據清洗方法[J].圖書情報工作,2017,61(7):111-117.
[34]Derakhshan M,Hassanzadeh M,Higgins S E,et al.The Pedagogical Challenges of Creating Information Literate Librarians[J].Library Review,2017,66(2):570-583.
[35]Lee J,Anderson A,Burnett G.Peer Relationships and Mentoring Between LIS Doctoral Students:A Qualitative Approach[J].Journal of Librarianship & Information Science,2017,49(1):115-124.
[36]Golub K,Hansson J,Selden L.Cult of the“I”:Organizational Symbolism and Curricula in Three Scandinavian iSchools with Comparisons to Three American[J].Journal of Documentation,2017,73(1):48-74.
(責任編輯:陳 媛)