999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于LDA主題模型的文獻特征項多重共現可視化方法

2022-06-14 01:08:19翟君偉瞿英郭菲劉濱
河北科技大學學報 2022年2期
關鍵詞:可視化

翟君偉 瞿英 郭菲 劉濱

摘 要:文獻計量學是運用數學和統計學方法對文獻知識單元進行定量分析、揭示文獻內部知識內容的一門科學。共現網絡分析是文獻計量研究中分析文獻特征項數據關系的一種可視化方法,根據被分析特征項的數量分為單重共現網絡分析和多重共現網絡分析。與單重共現網絡分析相比,多重共現網絡分析增加了特征項的維度,對文獻知識的呈現更加深入。但是,由于被分析特征項維度的增加,導致共現網絡中的節點數量增多,節點間連線重合度和交叉頻率過大,降低了文獻計量可視化的效果。因此,目前文獻計量共現網絡分析主要以單重共現為主,多重共現網絡分析可視化效果尚有待提升。

為解決多重共現網絡中節點過多、連線密度過大、不利于發現數據價值以及可視化效果較低等問題,引入LDA主題模型,采用空間劃分的方法,將特征項全域可視化的問題轉化為子空間可視化問題。首先,使用SATI文獻題錄信息分析軟件抽取文獻關鍵詞,進行TF-IDF計算,以計算結果作為實驗數據;其次,使用Python構建主題模型,對目標文獻集合進行主題聚類分析;最后,使用Ucinet軟件對不同主題子空間文獻進行多重共現分析,并將子空間分析結果疊加和重構,完成多重共現可視化系統的結構化表達。結果表明:與原多重共現可視化方法相比,在內容呈現等價的前提下,基于LDA主題模型的多重共現可視化改進方法由于縮小了多重共現網絡分析系統的規模,即子空間文獻數量與特征詞數目,因而降低了共現網絡中的節點數量和節點間連線密度,使得多重共現可視化系統的結構更為清晰,增加了數據的可讀性,突出了數據價值,有效提升了多重共現可視化效果。因此,多重共現可視化改進方法在一定程度上可以推進文獻構成元素在多重組合知識挖掘方面的深入研究,提高不同領域文獻計量的實證研究質量。

關鍵詞:管理計量學;LDA主題模型;多重共現分析;Ucinet;可視化

中圖分類號:G353.1 文獻標識碼:A

Abstract:Bibliometrics is a science to quantitatively analyze literature knowledge units by using mathematical and statistical methods and reveal the internal knowledge content of literature.Co-occurrence network analysis is a visual method to analyze the data relationship of document characteristic items in bibliometric research.According to the number of analyzed characteristic items,it can be divided into single co-occurrence network analysis and multiple co-occurrence network analysis.Compared with single co-occurrence network analysis,multi co-occurrence network analysis increases the dimension of feature items and presents literature knowledge more deeply.However,due to the increase of the dimension of the analyzed feature items,the number of nodes in the co-occurrence network increases,and the connection coincidence degree and crossover frequency between nodes are too large,which reduces the visualization effect of literature measurement.Therefore,at present,the bibliometric co-occurrence network analysis mainly focuses on single co-occurrence,and the visualization effect of multiple co-occurrence network analysis needs to be improved.In order to solve the problems of too many nodes,too large connection density,disadvantage of discovering the value of data and low visualization effect in multi co-occurrence network,LDA topic model was introduced and the method of spatial division was adopted to transform the global visualization problem of feature items into subspace visualization problem.Firstly,the key words were extracted by using sati document title information analysis software,and the TF-IDF calculation was carried out.The calculation results were taken as the experimental data.Secondly,Python is used to construct a topic model for topic cluster analysis of the target literature set.Finally,Ucinet software was used to analyze the multiple co-occurrence of subspace documents with different topics,and the subspace analysis results are superimposed and reconstructed,so as to complete the structural expression of the multiple co-occurrence visualization system.The results show that compared with the original multi co-occurrence visualization method,the improved multi co-occurrence visualization method based on LDA topic model reduces the number of nodes in the co-occurrence network and the connection density between nodes due to the reduction of the scale of the multi co-occurrence network analysis system,that is,the number of documents and feature words in the subspace.It makes the structure of the multi co-occurrence visualization system clearer,increases the readability of the data,highlights the data value,and effectively improves the multi co-occurrence visualization effect.To a certain extent,this study can promote the in-depth research on knowledge mining of multiple combinations of literature constituent elements,and then improve the quality of empirical research on literature metrology in different fields.

Keywords:management metrology;LDA topic model;multiple co-occurrence analysis;Ucinet;visualization

文獻計量學是指運用數學和統計學的方法,定量分析一切知識載體的交叉科學[1],其分析對象包括文獻量(各種出版物,尤以期刊論文和引文居多)、作者數(個人、集體或者團體)、詞匯數(各種文獻標識,其中以敘詞居多)。近年來,文獻計量方法逐漸受到學者們的廣泛關注,發文量不斷增多。登錄中國知網,對主題為“文獻計量可視化”的文獻進行檢索,共得到692篇核心期刊文獻,其中563篇文獻使用共現網絡分析方法對文獻特征項關聯關系進行了計量分析。可見,共現網絡分析是文獻計量學中的常用方法。

根據被分析特征項數量,共現網絡分析可分為單重共現(同一特征項共現)和多重共現(不同特征項共現)[2]。盡管共現網絡分析研究得到學術界的普遍認同,但是多重共現網絡分析仍然是共現網絡分析領域中年輕的子集。對中國知網收錄文獻進行主題為“多重共現分析”、“多重共現”、“共現分析”的文獻檢索,共篩選得到56篇對文獻特征項進行多重共現網絡分析的文獻,其中有48篇文獻研究了2種文獻特征項共現,8篇文獻研究了3種文獻特征項共現。在這些研究中,從共現網絡分析形式來看,主要包括“作者-機構”[3-4]、“國家(地區)-機構”[5-6]、“作者-關鍵詞”[7]、“中圖分類號-關鍵詞”[8]、“關鍵詞-年份”[9]、“機構-年份”[10]、“內容-方法”[11]等雙重共現分析,以及“作者-主題-引文”[12]、“作者-關鍵詞-引文”[13]、“作者-關鍵詞-期刊”[14]、“作者-內容-方法”[15]、“作者-關鍵詞-機構”[16]、“機構-期刊-關鍵詞”[17]等三重共現分析。從可視化方法來看,主要借助CiteSpace[3-7],Ucinet[8-15]及交叉圖[17]等可視化工具進行特征項的全要素展現。

從現有研究來看,與單重共現相比,關于多重共現的研究量較少,特別是關于三重以上的共現網絡分析更是少之又少。從可視化的視角來看,隨著被分析特征項維度的增加,共現網絡中的節點數量過多,線條成幾何級數增加,交叉量較大,從而影響了關鍵特征項統計特征的檢出與分析,導致數據可讀性較弱,可視化效果過低。目前,多重共現可視化主要依賴于分析軟件內置的可視化模塊,這些工具的可視化分析對象一般是研究文獻的全域,因此樣本量大,可視化空間規模巨大。此外,這些模塊可視化呈現方式相對固定,支持用戶交互的能力較弱,很難針對可視化內容進行調整。目前,對文獻共現網絡分析可視化效果改進研究的重視程度仍不夠。本文針對共現網絡分析可視化效果較差的問題,提出在不減少可視化內容的前提下,選擇文本主題聚類方式(LDA主題模型)進行空間劃分,建立可視化子空間,分別對各子領域的文獻進行多重共現分析,減少單次分析特征詞的數量,通過共現矩陣的降維處理,提高可視化效果,進而實現研究領域整體文獻的多重共現分析。

1 共現分析原理

文獻是具有歷史意義或研究價值的圖書、期刊、典章等。共現網絡分析是統計文獻主題詞兩兩之間在同一篇文獻中出現的頻次,使用網絡圖對共現關系進行表示[18]。

2 多重共現可視化改進方法

通過對單重共現和雙重共現的過程對比分析可知,多重共現增加了特征項維度,可以呈現不同類型特征項之間的關系,但是特征項的增加會導致共現網絡中的節點過多,節點間連線密度增加,并且線間交叉增多,降低了共現可視化效果。因此,可使用LDA主題模型對多重共現進行改進,提高多重共現的可視化效果。

2.1 可視化效果改進思路

由共現網絡圖產生過程可知,特征詞的共現矩陣決定了共現網絡圖的復雜性。如果能夠縮減特征詞的共現矩陣規模,就可以減少節點數量,而隨著節點的減少,節點間的連線也會有一定程度的減少。特征詞數量決定特征詞的共現矩陣大小。特征詞析出主要取決于文獻,因此一個基本想法就是采取劃分方法對文獻進行預處理,形成多個研究單元,分別對每個研究單元進行多重共現分析,再將各子空間的共現網絡圖進行疊加,實現整體文獻的多重共現分析。子空間疊加是將各子空間的多重共現網絡分析結果進行匯總,實現對整體研究文獻的多重共現分析。將各子空間共現網絡圖中的相同節點進行合并,保證匯總結果中被分析特征項所對應的特征詞數量與將整體文獻進行多重共現網絡分析中被分析特征項所對應的特征詞數量相同。將節點間連線保持不變,相同節點合并過程中不破壞節點間的共現關系,保證各子空間中共現關系的匯總結果與將整體文獻進行多重共現網絡分析中共現關系一致,從而不丟失信息量。文獻主題是文獻的重要特征之一,本文通過主題聚類方式進行文獻劃分,即采用LDA主題模型對目標文獻進行聚類,實現特征詞降維處理。實施過程如圖3所示。

2.2 LDA主題聚類

2.2.1 LDA模型

主題模型可以對文本信息進行分析,提取文本信息的有效特征,發現和檢測文本主題。LDA是一種概率生成模型,包括文檔、主題和詞語3層結構[20],可以對大規模文檔集合進行建模[21]。該模型認為,每篇文檔都是由若干不同主題的詞語不斷累積生成的。

在文檔生成之前首先需要明確已知的主題數量(K)和每個主題所包含的單詞,其次需要確定所要生成的文檔集合中的文檔數量(N),及每篇文檔中所包含的詞語數量(M)。文檔集合生成過程如下:1)根據文檔將要表達的內容以一定概率選擇某一主題;2)從選擇主題中以一定概率選擇某一詞語,放在文檔所在位置;3)將上述2個步驟重復循環M次,生成目標文檔;4)將上述生成過程不斷重復循環N次,生成N篇文檔集合。生成過程如圖4所示[22]。

文檔生成過程中,由于每篇文檔所要呈現的內容和主題不同,因此各個主題及其內部單詞在每篇文檔中被選擇的概率是不一致的,LDA主題模型可以通過使用貝葉斯模型來表示這種不確定。模型將α和β作為確定主題分布和詞語分布的超參數,生成文檔-主題和主題-詞分布的先驗概率[23],然后根據先驗概率生成每篇文檔中單詞概率,其中α和β需要人為確定。

圖4生成過程分為4部分:1)基于狄利克雷分布和超參數α計算出文檔的主題多項分布θ;2)基于狄利克雷分布和超參數β計算出主題所對應的詞多項分布ψ;3)從文檔-主題多項分布中提取文檔單詞的主題分布Z,基于主題分布和詞的多項分布,采樣生成最終的詞W,重復M次上述計算過程,生成長度為M的目標文檔;4)將上述過程重復循環N次,最終獲得N篇文檔。

2.2.2 困惑度

困惑度(Perplexity)是由BLEI等提出的一種反映模型泛化能力的指標[24]。困惑度可以對概率語言模型的優劣程度進行判斷,度量預測結果與樣本的契合程度,困惑度越小對新文本的預測作用越高[25]。在LDA主題模型中通過計算不同主題數K所對應的困惑度,可以確定LDA模型最優的主題數,當困惑度圖像曲線下降趨勢不再明顯或者拐點處對應的K值可以作為LDA模型最優主題數,困惑度如式(2)所示:

2.2.3 主題聚類分析

LDA主題聚類是文檔生成過程的逆運用,即根據一篇完整文檔找出其所對應的文檔-主題(θ)、主題-詞分布(ψ),然后根據文檔-主題分布將文檔集合劃分為不同的主題,從而實現文檔集合的聚類[26]。LDA主題聚類過程如下。1)文檔預處理。對需要聚類分析的文檔集合進行預處理,主要包括分詞、去除停用詞和文本向量化等,使用TF-IDF函數對文本信息進行向量化處理,計算出每篇文檔中單詞的概率,作為實驗語料庫;2)計算聚類主題數候選集。LDA主題聚類前需要指定文檔劃分的主題數量,主題數過多,會導致聚類類別過于細分,類別間相似度較高;主題數過小,會導致聚類類別內部存在嵌套關系,大類別中包含小類別。為了得到最為合適的主題數,本文采用困惑度計算主題數量,獲得主題數量候選集。3)明確最優主題數。將困惑度計算得到的主題數量候選集和實驗語料庫輸入LDA模型中,將聚類結果可視化展示,通過困惑度計算結果和聚類結果可視化分析,確定最優的主題數量,保證不同類別間的交叉性和相似性較低。4)文檔主題聚類。再次將最優主題數量和實驗語料庫輸入構建的LDA模型,計算出各個主題在文檔中的概率分布,將概率最大的主題作為文檔所屬主題,實現文檔主題聚類。

2.3 多重共現可視化的實現

關鍵詞是從文獻中提取出的代表文獻主旨內容和關鍵內容的詞匯,其作為文獻的代表詞語,反映了文獻研究的重點領域[27]。本文以目標文獻關鍵詞作為實驗語料庫進行LDA主題聚類分析,將目標文獻集進行主題聚類,然后對不同類別中的文獻進行多重共現分析,實現領域整體文獻的多重共現分析。通過LDA主題模型將目標文獻劃分為不同類別,可以減少單次分析的文獻數量和共現網絡中的節點數量,提高共現網絡可視化效果。

基于主題聚類改進的多重共現網絡分析過程如下:1)基于研究主題確定目標文獻集合;2)提取目標文獻關鍵詞,建立文獻-關鍵詞數據表;3)將關鍵詞作為實驗語料庫,使用困惑度算法計算LDA主題數候選集;4)將關鍵詞語料庫和主題數候選集作為參數輸入LDA模型中,將聚類結果進行可視化,保證聚類間具有較好的獨立性,從而確定最優主題數;5)將最優主題數和關鍵詞實驗語料庫再次輸入LDA模型,計算每篇文獻的文檔-主題分布,選擇概率最大的主題作為文獻所屬主題;6)分別對不同主題類別內的文獻進行匯總,建立各主題的文獻特征詞隸屬矩陣;7)基于文獻特征詞隸屬矩陣,建立特征詞間共現矩陣;8)使用多重共現網絡方法對特征詞共現矩陣進行處理,建立多重共現網絡圖。可視化改進流程如圖5所示。

3 實證分析

3.1 數據來源與預處理

為了提高文獻數據的可靠性,以中國知網為數據源,對主題為“高校應急管理”的文獻進行檢索,共得到574篇文獻,通過人工二次閱讀方式,刪除述評、新聞報告、報紙等非學術文獻,得到565篇有效文獻。將565篇有效文獻信息以SATI可以處理的Endnote格式導出。文獻關鍵詞是對文獻研究內容的概括,代表文獻的研究主題。因此,本次分析將關鍵詞作為LDA主題聚類語料庫,SATI作為文獻題錄信息分析軟件,完成對文獻關鍵詞、作者、發表期刊、年份等信息字段的抽取、詞頻統計、共現矩陣生成[28]。由于文獻關鍵詞比較簡短并且充分代表了文獻內容,因而不再進行分詞處理,使用SATI對關鍵詞進行字段抽取,形成如表1所示的實驗語料庫。

3.2 困惑度計算

首先,對文獻關鍵詞進行提取,形成實驗語料庫;其次,基于Python中Gensim庫,使用計數方式對實驗語料庫進行向量化,并依據式(2)計算出各個主題數所對應的困惑度值;最后,將主題數和困惑度值作為橫縱坐標,繪制成二維坐標圖,假設主題數區間為[1,10],步長為1。計算結果如圖6所示。困惑度越小,說明模型預測精準度越高,困惑度最低或拐點處對應的K值為最佳主題數。

通過對圖6進行分析可知,隨著主題數的增加,困惑度不斷降低,當主題數為4和8時,困惑度的計算結果出現拐點,表明在2個主題數局部范圍內模型的聚類效果較好。因此,將4和8作為最優主題數的候選集。

3.3 LDA主題聚類

借助Python軟件中Gensim庫進行LDA建模,對“高校應急管理”研究文獻進行主題聚類,將文獻關鍵詞實驗語料庫和主題數候選集作為參數輸入LDA模型,并將聚類結果進行可視化,結果如圖7所示。

圖7中每個圓圈代表一個主題,圓圈大小表示主題的聚合程度,圓圈越小表示主題的聚合效果越好,圓圈間重合度表示主題間的相似性。對比圖7 a)和圖7 b)可知,主題數為8時,主題圓圈半徑小于主題數為4時的圓圈半徑,表明主題數為8時,LDA模型預測能力的精確度高于主題數為4時,但是主題數為8時,主題1、主題2、主題3、主題5相互重合,表明這些主題之間具有相似內容。通過分析圖6和圖7可知,隨著主題數的增加,LDA模型的預測精度和主題間的相似性不斷增加。本研究通過LDA主題模型預測文獻所屬主題,根據所屬主題將文獻進行聚類,將數據源分成多個類別,保證聚類間差距較大、聚類內部差距較小。結合困惑度和聚類結果可視化分析,將LDA主題模型的主題數預設為4。將文獻關鍵詞實驗語料庫與主題數4作為參數輸入LDA模型中,對“高校應急管理”文獻進行主題聚類,結果如表2所示。

3.4 多重共現對比分析

核心作者作為高發文量和高影響力的作者群體,其所關注的研究方向代表著研究領域中主要的研究內容。基于普賴斯公式,研究領域核心作者發文量為N=0.749×Nmax,Nmax為高發文作者的發文量[29]。因此,高校應急管理核心作者發文量為0.749×4=1.498,將發文在2篇以上的作者作為核心作者。基于Ucinet社會網絡分析工具,分別對各個主題類別中的文獻以及高校應急管理整體研究文獻進行核心作者和關鍵詞雙重共現分析,并刪除“高校”“高等院校”“應急管理”“高校應急管理”等基礎性詞匯,結果如圖8、圖9所示。

圖8的各個子圖和圖9分別對“高校應急管理”領域進行作者-關鍵詞雙重共現分析,其中分別使用不同形狀和顏色節點表示作者與關鍵詞,黃色節點代表研究學者,紅色節點代表關鍵詞,節點大小表示節點出現的頻次,節點間連線表示節點間具有共現關系。圖8的各個子圖基于LDA主題模型,將研究文獻劃分為4個不同的研究主題,分別對各個主題內的文獻進行作者關鍵詞雙重共現分析。圖9是將整體領域文獻作為分析對象,進行雙重共現分析。在圖8和圖9中,黃色節點均為“高校應急管理”研究領域的核心作者。通過困惑度計算結果和聚類結果可視化可知,將高校應急管理領域文獻細分為4個主題,可以保證主題間差距較大。圖8的各個子圖中,黃色節點表示領域核心作者在各個主題文獻中出現的情況,節點間連線分別表示核心作者間的合作關系、核心作者的研究內容。通過對圖8各個子圖的疊加,可以實現對文獻全域的共現分析。將圖8各個子圖中相同節點進行合并,可以保證圖8各個子圖中作者、關鍵詞節點的總數量與圖9中的作者、關鍵詞節點的數量相同。在相同節點合并過程中保持節點間連線不變,可以使圖8中各個子圖展示的作者與關鍵詞間的全部關系與圖9展示的作者與關鍵詞間的關系相同。因此,圖8各個子圖的全部信息與圖9所展示的內容信息相同,不會丟失知識內容。

多重共現網絡分析增加了被分析特征項的維度,可以對研究領域的文獻知識進行深入挖掘。但是節點數量的增多會導致共現網絡中節點間連線的交叉性增加,降低可視化分析的效果。通過圖8和圖9對比分析可知,主題模型在不減少所呈現知識內容的前提下,可以將特征項全域劃分為不同的子空間,減少單次分析的文獻數量和共現網絡中的節點數量,以及節點間連線的交叉度,清晰地展示出作者與研究熱點之間的關系。

文獻計量可視化分析軟件的發展,為文獻計量分析提供了技術支持。數據可視化分析通過使用感知度高的可視化元素對復雜龐大的數據集進行處理,有效表達數據所包含的信息[30]。通過圖8和圖9可視化效果對比分析可知,改進方法將研究文獻劃分為不同的研究主題,分別對不同主題內的文獻進行多重共現分析,可以減少單次分析中文獻數量和共現網絡中的節點數量,簡化共現網絡,提升可視化分析效果。

4 結 論

1)共現網絡分析方法可以對數據間的關系進行分析,并以網絡方式進行展示,廣泛應用于文獻計量學中。相較于單重共現,多重共現增加了被分析特征項的維度,但是會導致共現網絡圖中的節點過多,連線交叉度過大,可視化效果過低。

2)本文提出的基于LDA主題模型的文獻特征項多重共現可視化方法,采用空間劃分-融合思路,對文獻特征項進行多重共現分析,將整體領域文獻劃分為不同子領域,分別對各子領域文獻進行多重共現分析,達到領域文獻全域分析的目的。通過對比分析結果可知,對文獻空間進行劃分可以有效減少單次分析文獻的數量和共現網絡中的節點數量,實現共現網絡的降維處理,降低分析的復雜度,子空間的可視化呈現更加清晰,提升了可讀性,最終提高了多重共現網絡分析的可視化效果。

本研究僅選取關鍵詞作為實驗語料庫對研究文獻進行主題聚類分析,而文獻關鍵詞作為文獻內容的概括,在選取過程中具有一定的主觀性,僅以關鍵詞作為分析對象會對聚類結果的精確度產生一定的影響。后續研究會將文獻摘要、標題、正文等信息作為實驗語料庫內容,進一步提高文獻的聚類效果。

參考文獻/References:

[1] 劉佳英,蔣宏斌,張翔,等.中外漁業領域研究現狀和熱點比較分析[J].中國水產,2021(3):62-66.

LIU Jiaying,JIANG Hongbin,ZHANG Xiang,et al.Comparative analysis of the current situation and hot spots in the field of fishery research in China and foreign countries[J].China Fisheries,2021(3):62-66.

[2] 周娜,李秀霞,高丹.基于LDA主題模型的“作者—內容—方法”多重共現分析——以圖書情報學為例[J].情報理論與實踐,2019,42(6):144-148.

ZHOU Na,LI Xiuxia,GAO Dan.Author-subject-method multiple co-occurrence analysis based on LDA topic model:Taking the library information science as an example[J].Information Studies:Theory & Application,2019,42(6):144-148.

[3] 陳浩天,李玲睿.近十年來中國農村養老服務的研究趨向與價值前瞻——基于Cite Space知識圖譜的可視化分析[J].西北人口,2021,42(5):80-90.

CHEN Haotian,LI Lingrui.Research trend and value prospect of China′s rural elderly care service in recent ten years:visualization analysis of knowledge map based on CiteSpace[J].Northwest Population Journal,2021,42(5):80-90.

[4] 劉翠萍,李奕華.基于CiteSpace科學知識圖譜的國內外宣翻譯研究[J].哈爾濱學院學報,2021,42(7):110-114.

LIU Cuiping,LI Yihua.A scientific CiteSpace analysis of the research on international publicity translation study in China[J].Journal of Harbin University,2021,42(7):110-114.

[5] 陳曉娜,袁敏.中醫針灸研究的知識圖譜、聚類分析和拓展空間——基于WOS文獻的可視化分析[J].中醫藥管理雜志,2020,28(20):9-14.

CHEN Xiaona,YUAN Min.Knowledge map,cluster analysis and expansion space of traditional Chinese acupuncture-visual analysis based on WOS documents[J].Journal of Traditional Chinese Medicine Management,2020,28(20):9-14.

[6] 石晶晶,石樹青,胡元會,等.心血管疾病能量代謝研究的可視化分析[J].中國循證心血管醫學雜志,2020,12(4):428-432.

SHI Jingjing,SHI Shuqing,HU Yuanhui,et al.Visual analysis on energy metabolism of cardiovascular diseases[J].Chinese Journal of Evidence-Bases Cardiovascular Medicine,2020,12(4):428-432.

[7] 王晴.我國MOOCs研究的網絡結構與主題聚類——基于CiteSpaceⅢ的知識圖譜分析[J].中國遠程教育,2015(5):18-23.

WANG Qing.Network structure and topic clustering of MOOCs research in China:a knowledge mapping analysis based on CiteSpaceⅢ[J].Distance Education in China,2015(5):18-23.

[8] 溫芳芳.基于共現分析的中圖分類號與關鍵詞對應關系研究[J].情報科學,2017,35(11):121-125.

WEN Fangfang.Study on the correspondence relationship between Chinese library classification codes and keywords based on co-occurrence analysis[J].Information Science,2017,35(11):121-125.

[9] 王宇燦,李一飛,袁勤儉.國際大數據研究熱點及前沿演化可視化分析[J].工程研究-跨學科視野中的工程,2014,6(3):282-293.

WANG Yucan,LI Yifei,YUAN Qinjian.Visualization analysis on the hotspots and frontier evolution of international big data research[J].Journal of Engineering Studies,2014,6(3):282-293.

[10]康冬冬.2000—2014年我國教育管理研究的可視化分析[D].蘭州:西北師范大學,2017.

KANG Dongdong.Visual Analysis of Educational Management Research in China during 2000—2014[D].Lanzhou:Northwest Normal University,2017.

[11]馬秀峰,郭順利,宋凱.基于LDA主題模型的“內容-方法”共現分析研究——以情報學領域為例[J].情報科學,2018,36(4):69-74.

MA Xiufeng,GUO Shunli,SONG Kai.Suject-method co-occurrence analysis based on LDA topic model-taking the information science field as an example[J].Information Science,2018,36(4):69-74.

[12]劉愛琴,吳瑞瑞.基于引證關系的作者與主題多重共現網絡構建[J].數字圖書館論壇,2019(10):23-29.

LIU Aiqin,WU Ruirui.Construction of multiple co-occurrence network of author and subject based on citation relationship[J].Digital Library Forum,2019(10):23-29.

[13]劉愛琴,吳瑞瑞.基于引證關系的“作者群體—關鍵字—引文”多重網絡構建[J].新世紀圖書館,2020(5):54-58.

LIU Aiqin,WU Ruirui.Multiple network construction of "auther group-keyword-citation" based on citation relationship[J].New Century Library,2020(5):54-58.

[14]魏緒秋,李長玲,劉非凡.3-模數據網絡構建及其可視化探討[J].情報理論與實踐,2014,37(8):74-78.

WEI Xuqiu,LI Changling,LIU Feifan.Probe into the construction and visualization of 3-mode data network[J].Information Studies:Theory & Application,2014,37(8):74-78.

[15]周娜.基于潛在主題挖掘的知識共現研究——以圖書情報學學科領域為例[D].曲阜:曲阜師范大學,2019.

[16]姜思萃,徐俠.關于“五運六氣”相關研究文獻的知識圖譜分析[J].光明中醫,2020,35(3):317-321.

JIANG Sicui,XU Xia.Knowledge map analysis of related documents of "five evolutive phases and six climatic factors"[J].Guangming Journal of Chinese Medicine,2020,35(3):317-321.

[17]龐弘燊.基于科技文獻多重共現的數據模型理論與知識發現應用范例研究[J].圖書情報工作,2019,63(9):61-72.

PANG Hongshen.Research on data model theory and knowledge discovery application based on multiple occurrence of scientific literature[J].Library and Information Service,2019,63(9):61-72.

[18]陳曉東,趙丹妮.新時代中國經濟學發展軌跡及研究特征[J].區域經濟評論,2020(4):146-156.

CHEN Xiaodong,ZHAO Danni.Analysis on the development track and research characteristics of Chinese economics in the new era[J].Regional Economic Review,2020(4):146-156.

[19]王宗水,趙紅,劉宇,等.社會網絡研究范式的演化、發展與應用[J].情報學報,2015,34(12):1235-1245.

WANG Zongshui,ZHAO Hong,LIU Yu,et al.Evolution,development and application of social network paradigm[J].Journal of the China Society for Scientific and Technical Information,2015,34(12):1235-1245.

[20]BLEI D M.Probabilistic topic models[J].Communications of the ACM,2012,55(4):77-84.

[21]熊回香,竇燕.基于LDA主題模型的標簽混合推薦研究[J].圖書情報工作,2018,62(3):104-113.

XIONG Huixiang,DOU Yan.Research on tag hybrid recommendation based on LDA topic model[J].Library and Information Service,2018,62(3):104-113.

[22]蔡永明,長青.共詞網絡LDA模型的中文短文本主題分析[J].情報學報,2018,37(3):305-317.

CAI Yongming,CHANG Qing.Chinese short text topic analysis by latent dirichlet allocation model with co-word network analysis[J].Journal of the China Society for Scientific and Technical Information,2018,37(3):305-317.

[23]唐曉波,向坤.基于LDA模型和微博熱度的熱點挖掘[J].圖書情報工作,2014,58(5):58-63.

TANG Xiaobo,XIANG Kun.Hotspot mining based on LDA model and microblog heat[J].Library and Information Service,2014,58(5):58-63.

[24]王婷婷,韓滿,王宇.LDA模型的優化及其主題數量選擇研究——以科技文獻為例[J].數據分析與知識發現,2018,2(1):29-40.

WANG Tingting,HAN Man,WANG Yu.Optimizing LDA model with various topic numbers:Case study of scientific literature[J].Data Analysis and Knowledge Discovery,2018,2(1):29-40.

[25]關鵬,王曰芬.科技情報分析中LDA主題模型最優主題數確定方法研究[J].現代圖書情報技術,2016(9):42-50.

GUAN Peng,WANG Yuefen.Identifying optimal topic numbers from sci-tech information with LDA model[J].New Technology of Library and Information Service,2016(9):42-50.

[26]王夢宇.基于LDA主題模型的在線評論聚類研究[D].蘭州:蘭州大學,2021.

WANG Mengyu.Research on Online Reviews Clustering Based on LDA Topic Model[D].Lanzhou:Lanzhou University,2021.

[27]吳軍.新媒體時代期刊關鍵詞的應用探析[J].出版廣角,2021(11):49-51.

[28]尹懷瓊,劉曉英,周良文,等.我國圖書館聯盟研究的文獻計量和可視化分析[J].圖書館,2018(2):43-49.

YIN Huaiqiong,LIU Xiaoying,ZHOU Liangwen,et al.Bibliometric and visual analysis of library alliance research in China[J].Library,2018(2):43-49.

[29]李繼紅,王洪江,江珊,等.綜合指數和h系列指數測評期刊核心作者的比較研究[J].中國科技期刊研究,2017,28(3):266-270.

LI Jihong,WANG Hongjiang,JIANG Shan,et al.Comparison of the evaluation of core authors by comprehensive index and h series index[J].Chinese Journal of Scientific and Technical Periodicals,2017,28(3):266-270.

[30]陸菁,劉淵,張曉婷,等.基于用戶體驗的數據可視化模型研究[J].包裝工程,2016,37(2):52-56.

LU Jing,LIU Yuan,ZHANG Xiaoting,et al.Data visualization model based on the user experience[J].Packaging Engineering,2016,37(2):52-56.

猜你喜歡
可視化
無錫市“三項舉措”探索執法可視化新路徑
基于CiteSpace的足三里穴研究可視化分析
自然資源可視化決策系統
北京測繪(2022年6期)2022-08-01 09:19:06
三維可視化信息管理系統在選煤生產中的應用
選煤技術(2022年2期)2022-06-06 09:13:12
思維可視化
師道·教研(2022年1期)2022-03-12 05:46:47
基于Power BI的油田注水運行動態分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
自然資源可視化決策系統
北京測繪(2021年7期)2021-07-28 07:01:18
基于CGAL和OpenGL的海底地形三維可視化
可視化閱讀:新媒體語境下信息可視化新趨勢
“融評”:黨媒評論的可視化創新
傳媒評論(2019年4期)2019-07-13 05:49:14
主站蜘蛛池模板: 无码区日韩专区免费系列| 国产激情国语对白普通话| 亚洲综合中文字幕国产精品欧美| 91精品网站| 国产黄网站在线观看| 色婷婷色丁香| 黄色不卡视频| 国产一区二区福利| 激情乱人伦| 国产成人一级| 免费在线不卡视频| 专干老肥熟女视频网站| 欧美日韩中文国产| 国产在线一区视频| 中文国产成人精品久久| 伊人91在线| 国产精品乱偷免费视频| 久久国产精品影院| 中文字幕在线观| 久久人体视频| 夜精品a一区二区三区| 国产精品无码作爱| 亚洲天堂成人| 综合网天天| 欧美成人综合视频| 欧美综合中文字幕久久| 一本久道久久综合多人| 日韩 欧美 小说 综合网 另类| 亚洲精选无码久久久| 国产精品成人啪精品视频| 99热线精品大全在线观看| 91精品国产91久无码网站| 日韩免费毛片| 91无码人妻精品一区| 一级毛片免费播放视频| 亚洲天堂日韩在线| 97视频精品全国在线观看| 亚洲狠狠婷婷综合久久久久| 波多野结衣爽到高潮漏水大喷| 国产香蕉在线视频| 夜夜操狠狠操| 91色爱欧美精品www| 亚洲日本在线免费观看| 真实国产精品vr专区| 黄色片中文字幕| 欧美精品H在线播放| 麻豆国产精品| 久操中文在线| 亚洲美女视频一区| 日韩av手机在线| 欧美午夜精品| www.99在线观看| 国产系列在线| 人妻精品久久久无码区色视| 精品视频福利| 亚洲第一在线播放| 中日韩一区二区三区中文免费视频 | 无码中文字幕精品推荐| 精品国产网站| 四虎国产精品永久一区| 中文字幕欧美日韩高清| 九九久久精品免费观看| 亚洲一区波多野结衣二区三区| 国产呦精品一区二区三区下载 | 欧美精品v欧洲精品| 免费av一区二区三区在线| 激情综合激情| 国产亚洲欧美日韩在线观看一区二区| 制服丝袜在线视频香蕉| 26uuu国产精品视频| 91视频免费观看网站| 99精品视频九九精品| 草草影院国产第一页| 国产97视频在线| 欧美成人在线免费| 欧美a√在线| 香蕉色综合| 欧美不卡视频在线观看| 亚洲精品大秀视频| 欧美国产成人在线| 无码高清专区| 一区二区三区成人|