席崇俊 劉文斌 丁楷
摘要:[目的/意義]主題識別研究對于理清領域內的知識結構與研究熱點非常重要,對領域主題進行動態識別,可以很好地幫助研究人員了解和掌握領域的發展態勢及未來走向。[方法/過程]利用張量的數據結構形式,在詞共現矩陣中融入時間維度,只需一次聚類便可進行動態主題的識別。[結果/結論]張量結構及非負張量分解算法為詞共現頻次變化視角下的動態主題識別提供一種新的方法,該方法相較于傳統方法更為簡單快捷,有效避免了信息的損失。
關鍵詞:關鍵詞共現 ? ?非負矩陣分解 ? ?非負張量分解 ? ?動態主題識別 ? ?知識管理
分類號:G254.2
引用格式:席崇俊, 劉文斌, 丁楷. 詞共現頻次變化視角下的動態主題識別研究[J/OL]. 知識管理論壇, 2022, 7(2): 197-208[引用日期]. http://www.kmf.ac.cn/p/281/.
1 ?引言
在信息時代背景下,隨著科技文獻數量的迅猛增長,研究人員無法在短時間內吸收和掌握數以萬計的研究成果,即便是針對范圍狹窄的領域進行密切關注、持續閱讀,仍難理清該領域的研究熱點和研究方向[1]。因此,對領域主題的挖掘與演化研究則顯得尤為重要,它可以很好地幫助研究人員了解和掌握領域的發展態勢及未來走向,也是解決信息大爆炸時代情報危機的有效方法[2-3]。本文基于詞共現頻次變化視角對動態主題識別方法進行探討,旨在為科技決策提供更好的支持。
2 ?研究現狀
主題識別與演化研究是利用文獻特征項之間的關聯關系對文獻集合進行分析從而發現主題,并通過主題揭示文獻集合中蘊涵的內容,以了解當前領域的研究熱點并預測未來的發展趨勢[4]。……