薛云蘭



摘? 要: 隨著計算機技術的發展,大量的嶺南文化信息被記錄下來。而海量的嶺南文化信息卻難以被有效地利用。文章采用知識圖譜技術對嶺南文化信息進行有效的語義抽取和融合,采用Citespace可視化分析軟件完成了對嶺南文化研究熱詞和趨勢的研究,為嶺南文化的人文歷史的研究提供了技術框架和研究方案。
關鍵詞: 嶺南文化; 知識圖譜; 熱詞分析; 知識演化
中圖分類號:G202,G206? ? ? ? ? 文獻標識碼:A? ? ?文章編號:1006-8228(2021)02-49-03
Abstract: With the development of computer technology, a large number of Lingnan cultural information has been recorded. However, the vast amount of Lingnan cultural information is difficult to be used effectively. This paper uses knowledge graph technology to carry out effective semantic extraction and fusion of Lingnan culture information, and uses CiteSpace visualized analysis software to complete the research on hot words as well as its trends of Lingnan culture, which provides the research of the humanistic history of Lingnan culture with a technical framework and research scheme.
Key words: Lingnan culture; knowledge graph; hot words analysis; knowledge evolution
0 引言
嶺南傳統文化作為廣東文化的重要名片,是廣東對外人文交流的重要組成部分。“一帶一路”倡議為廣東和嶺南傳統文化“走出去”提出了新的歷史使命。隨著互聯網+的飛速發展,海量數據的價值得以充分發揮,通過機器學習,知識圖譜等技術來可視化嶺南文化的演化路徑是嶺南文化研究領域之一。充分挖掘嶺南文化的發展和演化,可以提高地域的影響力和關注熱度,充分發揮地域的人文經濟有重要的價值和參考意義[1]。互聯網信息化的發展給文化信息研究提供了豐富多樣的軟件和工具,為了直觀的展示數據,采用知識圖譜作為可視化工具來標注嶺南文化每年的熱詞、熱詞的演化和熱詞之間的關聯關系。
知識圖譜,主要是為領域知識映射地圖,把知識之間的關聯關系和發展演化用圖形化的形式呈現出來。海量的信息被挖掘、清洗、抽取、標注、融合、加工最后形成一個具有參考意義的領域知識圖譜,對于領域的研究和發展預測有一定的參考價值[2]。文獻計量學是基于數學和統計學的定量分析方法,以參考文獻為研究對象,然而知識圖譜是該領域中新的研究領域,長期受到學者的關注并得到快速的發展[3-4]。
CiteSpace是目前最為廣泛應用的圖譜繪制工具。事件的影響力分析、事件的演化路徑、演化趨勢,熱點研究、行業領域、知識關聯、本體研究等都可以利用CiteSpace可視化工具有效的解決[5]。對嶺南文化研究領域的1500篇中文期刊文獻進行梳理,繪制出知識圖譜,進而挖掘嶺南文化研究的五大熱點主題:嶺南文化、地域文化、廣東、廣州、嶺南建筑等。通過對突現詞的檢測及分析,揭示出嶺南文化演化路徑及熱點主題的變化態勢。研究表明未來一段時期關于嶺南文化自信建設及粵港澳大灣區發展等主題將成為未來的研究熱點。
1 研究方法
知識圖譜中,點代表客觀事物,邊代表了事物的屬性或關系。CiteSpace就是基于共現聚類的思想,首先選取文獻中的信息,接下來憑借信息與信息之間的聯系類型和強度進行網絡結構重構,然后多角度進行計算與統計分析,最后將結論進行可視化。
1.1 數據清洗
對嶺南文化研究領域的1500篇核心期刊文獻進行梳理,刪除和本研究領域關聯關系較弱的文獻,以降低噪聲和冗余。
1.2 可視化分析
采用Citespace可視化軟件從中國知網對嶺南文化相關核心期刊文獻進行采集和數據處理。中國知網對于摘要和年份等信息有直接導出模式,并且支持批量導出。選取其中一篇導出論文,其中內容主要包括出處、作者、來源、題名、分類、年份、關鍵詞、出版號、摘要和語言等基本信息。這些規范、可讀性很高的信息對于我們進行關鍵詞抽取分析是十分有幫助的[5]。
1.3 建立知識圖譜
在知識圖譜具體顯示嶺南文化研究概貌及結構的基礎上,對每一熱門內容進行細化、觀測分析的解讀,能夠全面掌握研究熱點與動態[6]。本文利用文獻計量和信息可視化的方法分析了嶺南文化領域的文章發表趨勢和主要研究機構;通過共詞分析、知識圖譜和戰略坐標分析,探討新時期互聯網和大數據環境研究方法下,嶺南文化研究的發展特點和主題演化,為嶺南文化研究工作的開展提供參考。使用詞頻統計方法,從文章的多種屬性來量化分析文獻特征,這些屬性有文獻數量、文獻題目、作者、作者的機構等。通過作者和機構的共現關系,來構建關于嶺南文化知識圖譜,采用聚類和分類方法來分析嶺南文化的熱點和趨勢問題。
⑴ 根據研究發文趨勢和Citespace分析結果,采用固定時間窗口的方法,將論文數據劃分為連續子時期。提取各子時期關鍵詞,并對同義詞進行合并處理。利用共詞分析法,構造各子時期高頻關鍵詞的共詞矩陣;運用SPSS進行關鍵詞系統聚類,識別各子時期研究主題[7]。
⑵ 基于各子時期關鍵詞共現網絡,計算各研究主題高頻關鍵詞的E相似度指數:Sij=Wij/(Wi×Wj),其中,Wij表示關鍵詞i和關鍵詞j共同出現的次數,Wi表示關鍵詞i在所有文獻中出現的次數,Wj表示關鍵詞j在所有文獻中出現的次數。
⑶ 知識圖譜以X軸和Y軸二維圖展示,用圓形表示熱詞,圓形的面積大小和熱詞的文章數量成正相關,我們通過圓形的大小量化嶺南文化每個熱度的影響力,通過各個圓點之間的聯系邊呈現熱詞的演化路徑,對于嶺南文化的演化有非常大的參考價值和指導意義。
2 研究熱點與趨勢分析
2.1 關鍵詞共現分析
本文檢索了1994年至2019年共計1500篇關于嶺南文化的文獻。將這些數據導出后保存為純文本,用陳超美教授開發的CiteSpace軟件對這些數據進行圖譜繪制,進行進一步的分析。
節點大小代表該節點詞頻的高低,節點越大代表詞頻越高,其中的不同顏色分別表示不同的年份,由1994年到2019年,有暖色調像冷色調轉變。圖譜中的節點大小代表嶺南文化熱點研究的影響力,連線的粗細代表其聯系強度。由圖1可見,廣東節點最大且居圖譜中心位置,表明其為研究的核心在該領域的影響力最大。廣州、廣府文化、嶺南等節點較大且位居中心位置,構成了該領域的研究熱點。
2.2 文獻主題變遷分析
“圖譜”是指進過系統編輯并根據實物描述或攝制的圖,是研究某一學科所用的資料。“圖譜”中的“圖”指地圖,“譜”指系統。圖與譜合一則是空間與時間動態變化的統一表述。圖譜主要表現事物和現象的形態結構、成因機制、組成物質、動態變化等綜合性、復雜性規律,往往以系列圖的形式表示時空動態變化。隨著科學計量學從數學表達方式揭示科學知識及其活動規律,轉向圖形表達方式,形成了最初的知識圖譜。
從圖2可以看出從二十一世紀九十年代開始到2019年,嶺南文化研究熱點的變化趨勢,從廣東、嶺南學、廣東人逐步發展到文化自信和粵港澳大灣區。這些研究的關鍵詞之間的關聯關系可以給將來的進一步研究提供很好的參考價值和預測估計。
2.3 關鍵詞突現分析
從圖3可以看出從二十一世紀九十年代開始到2019年,在2007年到2010年間嶺南文化關于嶺南學的研究熱度最高,熱度其次的是1994-1999的嶺南文化關于嶺南地區研究,1994-2000的嶺南文化關于廣東的研究,2001-2002的嶺南文化研究以及2008-2010關于嶺南文化的構建研究。逐漸發展到近期的研究熱度新高的2014-2017的新嶺南文化的研究、文化自信的研究。根據圖3,我們不僅能看到嶺南文化研究的趨勢,還能統計出熱點研究維持的熱度及其影響力。
3 結束語
嶺南文化研究自1994年起步以來,受關注度不斷增強,發文整體呈增長趨勢,2010年后發文基本穩定,領域發展趨于成熟。知識管理是嶺南文化研究領域基礎的、具有發展潛力的研究方向。現代信息環境下衍生出與知識服務相結合的知識圖譜、關聯數據、可視化及前沿熱點研究等處于成長狀態的熱點主題。新技術環境下,實現知識管理模式的轉型與優化,將成為嶺南文化研究知識服務研究的一個重要主題。
參考文獻(References):
[1] 段園園,林樹文,黃金澤,曾玉榮.知識圖譜視角下我國農業政策研究的演化發展及熱點分析[J].南方農業學報,2018.49(1).
[2] 張曉林.走向知識服務:尋找新世紀圖書情報工作的生長點[J].中國圖書館學報,2000.5:30-35
[3] 邱均平,王曰芬.文獻計量內容分析法[M].國家圖書館出版社,2008.
[4] 陳悅,陳超美等.CiteSpace知識圖譜的方法論功能[J].科學學研究,2015.2:242-253
[5] 陳悅,陳超美等.引文空間分析原理與應用[M].科學出版社,2014.
[6] 吳賓,唐薇.基于知識圖譜的國內養老政策研究熱點主題與演化路徑(2005-2016)人口與發展[J].人口與發展,2018.24(2).
[7] 詹婧,張仁瓊.基于文獻計量的圖書館MOOC研究[J].圖書館學刊,2017.39(8):106-113