韓鋒 隋福民
【摘要】 以CNKI中收錄的主題詞是“雙一流”建設、高校質量監測的相關研究論文為研究樣本,借助可視化軟件CiteSpace V,繪制出有關這個主題的研究熱點、研究前沿的知識圖譜。運用關鍵詞共現分析法呈現我國雙一流建設、高校質量監測研究的熱點;運用突變詞檢索算法查找突變詞及突變率,揭示行業研究前沿。
【關鍵詞】 “雙一流”建設 高校質量監測研究 共現分析 突變詞CiteSpace V近年來,各級政府和各地高校都非常關注兩件事情,一是“世界一流大學,世界一流學科”(簡稱“雙一流”)的建設,另一件是高校質量監測。2015年10月24日,國務院印發《統籌推進世界一流大學和一流學科建設總體方案》,要求按照“四個全面”戰略布局和黨中央、國務院決策部署,堅持以中國特色、世界一流為核心,以立德樹人為根本,以支撐創新驅動發展戰略、服務經濟社會發展為導向,堅持“以一流為目標、以學科為基礎、以績效為杠桿、以改革為動力”的基本原則,加快建成一批世界一流大學和一流學科。雙一流建設及與之相關的高校質量監測是我們當前關注的熱點和焦點。與之而來的我們很關心近來學者們對此都進行了哪些研究,研究的核心是什么,研究的熱點是什么,研究的前沿是什么。而要回答這些問題無疑要借助現代的可視化研究技術。
本文借助現代可視化工具CiteSpace V,運用共現分析和突變詞檢索算法,結合中國知網數據,對雙一流建設、高校質量監測的研究現狀進行了剖析,希望能夠給研究者在實際研究中提供幫助和參考。
一、研究工具及數據來源
(一)研究工具CiteSpace V簡介
CiteSpace V是用來分析和可視共被引網絡的Java程序,是一款應用于科學文獻中識別并顯示科學發展新趨勢和新動態的軟件。利用CiteSpace V可以尋找某一學科領域的研究進展和當前的研究前沿,及其對應的知識基礎。
(二)數據來源
本文所用數據來自中國知網,檢索方式是主題詞檢索,選取的主題詞是“雙一流”建設或高校質量監測。共搜索到2015-2017年文獻496篇,其中2015年2篇,2016年232篇,2017年263篇。下載時對數據進行了預處理和清洗。主要工作包括去除公告、通信信息,刪除未標注作者引用以及網絡引用,以及根據 CiteSpace V數據格式進行了數據轉化。
二、研究熱點探析
(一)共現分析的研究方法
共現分析(Co-occurrence analysis)是一種內容分析方法,是將各種信息載體中的共現信息定量化的分析方法,以解釋信息的內容聯系和特征項所隱含的寓意,被廣泛用于知識發現的研究中。它的方法論基礎是心理學的臨近聯系法則和知識結構及映射原則。共同出現的特征項之間一定存在著某種關聯,關聯程度可用共現頻次來測度。利用共現關系繪制某一領域的知識圖譜,能夠以可視化的方式來探測該領域的研究熱點和研究前沿,縱向和橫向分析展示相關領域的發展進程、主題結構以及未來發展趨勢,反映當前科學研究水平,展示其研究主題的變遷,進而實現預測關注的主題的趨勢,實現關注主題跟蹤的可視化。鑒于此,本文嘗試運用共現分析方法及其可視化工具CiteSpace V來繪制主題為“雙一流”建設、高校質量監測的知識圖譜,并結合社會網絡理論進行分析。
(二)研究對象的選取
CiteSpace V來實現共現分析,可分為三種情況,作者共現,關鍵詞共現以及領域共現分析。我們關注于雙一流建設或者高校質量監測這個主題的研究熱點,所謂研究熱點是指在所研究的時期內,有內在聯系的、數量相對較多的一系列文獻所探討的科學問題或專題。關鍵詞雖然在文獻中所占的比例很小,但卻是文獻主題的高度凝練和概括,代表了一個領域的知識點和研究熱點,在所關注領域中高頻率出現的關鍵詞常常被視為熱點研究領域。因此,通過分析“雙一流”建設或高校質量監測相關文獻的關鍵詞,可以在一定程度上反映該領域的技術構成和研究動態。
(三)熱點探析的結果
我們接下來做的是關鍵詞共現分析,在共詞網絡中,我們除了關注關鍵詞出現的頻率,同時,也關注每個節點的中心性。一個節點的中心性越高,意味著它控制其他節點間的信息流越多,與其他關鍵詞在文獻中共現的次數也就越多,是控制整個網絡的“瓶頸性”節點,即關鍵節點。所以,在一個表征“雙一流”建設或高校質量監測領域的共詞網絡中,中心性強的節點一般代表該領域的關鍵技術。
在CiteSpace V中,我們把網絡節點類型設定為“Keywords(關鍵詞)”,主題詞來源選擇“標題(Title)、摘要(Abstract)、描述符(Descriptors)和標識符(Identifiers)”,演算路徑為最小生成樹,其他選項為默認設置。繪制雙一流建設或者高校質量監督領域共詞圖譜,得到共有178個節點,175個連接,網絡密度為0.0111。利用CiteSpace V得到關鍵詞共現網絡圖,如圖1所示。圖中的每一個節點代表一個關鍵詞,節點大小取決于相應時段內的出現次數。
在圖1中可以發現,節點比較大的都是高頻關鍵詞,是我們研究的熱點之一。但是有些節點比較大,卻和其他節點間沒有連線,說明中心性比較低。接下來我們具體統計一下關鍵詞頻率和共現網絡中心性,如下表1和表2。表1中,我們列出頻次是7次以上的關鍵詞列表。
由表1所示,一流學科是頻次最高的,而“雙一流”建設、“雙一流”、雙一流其實是可以合并為一類,有關雙一流的研究頻次也很高。再次就是人才培養、高等教育、一流大學建設等。與此相關的研究就是我們關注領域研究的熱點和著眼點。
從圖1我們可以看出,雖然有些節點比較大,但是與其他節點的連線比較少,我們進一步再從中心性的角度來探尋一下關鍵詞共現網絡。我們僅列出中心度高于0.13的關鍵詞。如下表2。endprint
由表2我們可以看出,現代大學制度、高水平大學、學科建設、頂層設計等均具有較高的中心度,這些就是我們關注領域的關鍵技術。
以上,我們對關注領域的研究熱點、關鍵技術進行了剖析。下面我們探尋下關注領域的研究前沿。
三、研究前沿發現
(一)突變詞檢索算法查找突變詞及突變率
從文獻內容來看,研究前沿通常表現為新主題詞的大量出現、詞間關系變化、主題詞含義變遷等。因此,跟蹤分析文獻集中主題詞的變化可以探測研究前沿的誕生。本文所說的研究前沿是指正在興起或突然涌現的技術主題,代表一個新的動態,強調新趨勢和突現(Burst)的特征。
突變詞檢測算法是Kleinberg于2002年提出的,他提出不僅要關注高頻關鍵詞,還要關注那些雖然頻次低但變化率高的詞,即突變詞,因為關鍵詞出現時的密度更加能夠體現關鍵詞的重要程度。該算法可以對文獻中出現的所有詞進行突變分析,及時發現頻率低但具有情報意義的詞。
CiteSpace V采用“突現詞檢測”(burst-detection)算法,從大量文獻中檢測那些頻次變化率高的突現詞(burst-term)。該算法不僅僅是分析詞頻的高低,而是依靠詞頻的變動頻次和變動趨勢來確定研究前沿,基本原理就是統計文獻標題和摘要中詞匯的頻率,根據這些詞匯的增長率來確定研究前沿的熱點詞匯。在CiteSpace V設置中,Term Type中選擇Burst Terms,其他設置如前述不變。
(二)研究前沿探測的結果
突變詞檢索算法查找到的2015~2017年我們關注領域的突變詞及突變率,如下表3所示。
由表3可以看出,突變詞是一流大學、學科評估、研究中心,而且頻率及中心性也較高,說明這幾個關鍵詞揭示了我們關注的領域的研究前沿。
四、結論
我們借助工具CiteSpace V,應用關鍵詞共現方法探究出來,2015~2017年我國主題為“雙一流”建設、高校質量監測的相關研究文獻中高頻率關鍵詞為,一流學科,“雙一流”建設、人才培養等;中心度較高的關鍵詞是現代大學制度、高水平大學、學科建設、頂層設計等。應用突變詞檢索算法查找突變詞及突變率,檢索結果表明突變詞為一流大學、學科評估、研究中心,這揭示了我們關注領域的研究前沿。
參考文獻:
[1]王偉軍,王金鵬.科學知識圖譜在技術預見中的應用探析[J].情報科學,2010,(08):1127-1131.
[2]趙蓉英,許麗敏.文獻計量學發展演進與研究前沿的知識圖譜探析[J].中國圖書館學報,2010,(5).
[3]王
旻霞.基于知識圖譜的國際知識管理研究可視化分析[J].科技管理研究,2011,(20):175-178.
[4]Kleinberg J.Bursty and Hierarchical Structure in Streams[J].Data Mining&Knowledge Discovery,2003,(04) :373-397.
[5]魏曉俊.基于科技文獻中詞語的科技發展監測方法研究[J].情報雜志,2007,(03):34-36.endprint