999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

我國情報學碩博學位論文研究主題演化分析

2019-06-19 11:09:26李昌吳紅周錦錦
新世紀圖書館 2019年5期

李昌 吳紅 周錦錦

摘 要 論文以CNKI中2001—2017年的情報學碩博學位論文作為研究數據,繪制了情報學2001—2007年、2008—2011年、2012—2017年三個子時期的主題演化脈絡,并從主題演化強度、主題演化關系以及主題演化內容三個方面展示主題演化狀況。研究認為:我國情報學碩博學位論文研究目前正處于有序、快速成長的發展狀態;研究主題內容不斷拓展,呈現由集中到分化的發展脈絡;未來研究會圍繞在數字圖書館,輿情監管,用戶信息行為的影響因素,網絡分析與復雜網絡信息生態鏈等方面。

關鍵詞 情報學 主題演化 演化路徑

分類號 G350

DOI 10.16810/j.cnki.1672-514X.2019.05.018

Abstract This paper takes CNKIs 2001-2017 information science dissertation as the research data, and draws the theme evolution of three sub-periods of information science in 2001-2007, 2008-2011 and 2012-2017. It shows the evolution of the theme from three aspects: the intensity of the theme evolution, the relationship evolution of the theme, and the evolution of the theme. The research believes that the research on Chinas information science and masters degree thesis is currently in an orderly and rapid growth state; the research theme is expanding and shows the development from concentration to differentiation; future research will focus on digital libraries, public opinion supervision, influencing factors of user information behavior, network analysis and complex network information ecological chain.

Keywords Information science. Topic evolution. Evolution path.

碩博學位論文大都是作者在其導師的悉心指導下,歷經1年甚至更久才完成的,是作者整個研究生期間的精華所在,且內容豐富,研究層次深,專業性強,往往具有深刻的理論基礎和前沿觀點[1]。目前已有學者對情報學碩博學位論文進行研究:李長玲等通過對2002—2006年的碩士學位論文的共詞聚類,探索情報學碩士論文的研究熱點[2]。劉非凡等利用TF*IDF方法識別2003—2012年情報學碩士學位論文的經典和代表不同階段特點的特征關鍵詞,利用Linkcomm邊聚類算法進行聚類,分析了情報學學科主題層次性和層疊性結構[3]。李欠欠通過對2004—2014年我國情報學碩博學位論文進行聚類分析,構建戰略坐標圖,研究我國情報學研究熱點[1]。現有研究多從熱點角度進行分析,雖然從不同維度深入研究了情報學的發展現狀,給人們一些啟發,但難以形成學科發展的網狀結構,研究人員難以從整體上判斷與把握情報學領域的研究。

本文以中國知網為數據源,抽取2001—2017年CNKI中優秀碩博學位論文中的關鍵詞,進行聚類分析,構造詞頻強度比指標,利用相似度公式,構建我國情報學主題演化圖。

1 數據來源

在CNKI的博碩士論文文庫中,最早的情報學碩博學位論文文獻在2001年,故以學科專業名“情報學”,檢索時間2017年12月28日,共檢索出3919篇文獻。本文利用固定時間窗的方法結合文獻量,將2001—2017年劃分為3個子時期:2001—2007年;2008—2011年;2012—2017年。利用書目共現分析系統Bicomb抽取關鍵詞,去除出現頻率高但對結果沒有意義的詞語(如情報學等)之后,根據詞頻的高低,利用Donohue提出的高、低頻關鍵詞屆分公式,輔助確定61、67、74個核心關鍵詞,見圖1。高、低頻關鍵詞屆分公式:

2 數據分析

2.1 共現矩陣與相異矩陣

根據提取的高頻詞,利用書目共現分析系統Bicomb生成共現矩陣,因篇幅限制,這里僅展示第一階段部分共現矩陣,如表2所示。

為了消除共詞頻次差異形成的影響[4],本文引入等價系數來表示共現的相對強度,形成相關矩陣。等價系數計算公式如下:

Cij代表i、j兩詞同時出現的頻次,Ci代表i詞出現總頻次,Cj代表j詞出現總頻次。用數值“1”分別減去相關矩陣中的各個數據,最終得到相異矩陣(介于0與1之間,值越大,詞的相似度越差)。部分相異矩陣如表2所示。

2.2 系統聚類分析

依據關鍵詞之間的共現強度值,挖掘關聯強度大的主要詞群,揭示階段研究的熱門領域[5]。把上述相異矩陣導入到SPSS19.0中,進行層次聚類分析(聚類標準:Square Euclidean Distance,標準化處理:z得數,輸出:樹狀圖)。分別得到三個階段的聚類結果,由于篇幅限制,這里展示第一階段的聚類結果,如表3所示。

2.3 主題名稱確定

本文引入粘合力指標,測度主題中的關鍵詞對主題的貢獻程度[6]。粘合力越大,其貢獻程度越高,越能夠代表該主題的核心概念。本文用粘合力最大的主題詞代表主題名稱,但該主題詞也只是在一定程度上表征主題含義,并不能完全代表主題。其計算公式為:

其中,N(Ai )表示關鍵詞Ai的粘合度,F(Ai→Bi)表示關鍵詞Ai與同一主題當中其余關鍵詞的共現頻次,n表示主題中關鍵詞的個數。用粘合度值最大的關鍵詞來表征主題的名稱,如表4所示。

從表4可以看出隨著時間的推移,情報學領域呈現出不斷發展的趨勢,核心主題數量快速增長:2001—2007年有10個核心主題,2012—2017年核心主題數量已經發展到了20個。情報學碩博學位論文研究的主題數量呈現穩步上升趨勢,情報學學科的關注程度逐漸變高,在研究深度和廣度上都有所推進。

2.4 主題相似度計算

采用點積余弦相似度公式計算主題相似度(Topic Similarity Index, )。每個學科有若干主題(Topic)構成,每個主題詞都有若干關鍵詞(Keyword),首先將主題表示為Topic={k1,k2,k3…kn},則主題的詞頻向量(Word FrequencyVector)可以表示為:{weight 1,weight2,weight 3,…,weight n},最后計算相鄰子時期兩兩主題之間的余弦相值(值范圍:0-1,值越大表示兩個主題越相似)[7]。主題相似度指標計算公式為:

式中,分子表示兩個主題向量的點乘積,分母表示兩個主題向量的模的積。

設定閾值a識別不同子時期主題的關系,當時,判定兩個主題具有演化關系,當時,表明兩者沒有演化關系,以此識別主題演化脈絡,形成主題演化路徑[8],主題路徑將各個主題的演化狀態進行了定量描述,較為直觀的展示不同子時期內各個主題的整體變化。本文經過分析研究發現,當a=0.41時,主題網絡清晰,可以直觀、準確地展示演化關系。故本文判定當相似度大于0.41時,兩者存在演化關系。

2.5 主題強度度量

現有的主題強度指標要么從詞頻數量增減變化角度展開,要么從后驗概率定義主題強度,要么把主題映射于文檔,用其數量或者被引量等指標表示主題強度(熱度)[7-9],少有從主題發育狀態變化的角度去展示其演化過程。本文結合時間序列,構建詞頻強度比指標來表征主題強度(Topic Intensity,TI),分析主題隨時間的演化趨勢,動態展現主題熱度變化情況,計算公式為:

階段內詞頻平均強度(Word Frequency Average Intensity, )是所計算子時期內全部共現關鍵詞的平均共現頻次;主題內詞頻平均強度(Thematic Average Intensity, )是子時期內t主題中全部共現關鍵詞的平均共現頻次。是第i年主題t的主題強度,通過趨勢的變化可以顆粒化的觀察主題在一定階段的熱度變化情況:把與1進行比較,當的值≥1時,說明這個主題在第i年高于或等于熱點主題的平均水平,可以判定是高熱門主題類型,當<1時,說明是潛在熱門主題或者是潛在消亡熱門主題類型。計算結果如表5所示,因篇幅限制,僅展示第一階段主題強度。

3 主題演化及其分析

根據點積余弦相似度值和主題強度值繪制主題演化路徑,從左往右表示時間軸,分別為2001—2007年,2008—2011年,2012—2017年3個子時期。黑色文字表示主題名稱,獨立的方塊表示主題,主題內折線圖中直線表示主題強度為1,用來判斷主題的類型,另外一條線代表主題在子時期內強度的變化。相鄰子時期主題之間的連線表示演化關系,實線表示繼承,虛線表示分化、分裂[8]。t時刻主題T與t-1時刻無連線,表明其屬于新生主題,與t+1時刻無連線,表名其屬于消亡主題[8]。圖2為2001-2017年情報學碩博學位論文主題演化圖。

圖2 2001—2017年情報學碩博學位論文主題演化圖

從圖2可知,我國情報學碩博學位論文研究隨著時間的推移,主題數量呈快速增長態勢,相鄰子時期主題的演化關系越來越密切、復雜,表明其研究受到越來越多學者的關注。為更好地闡述情報學學科的發展,揭示其流動規律和發展態勢,本文從主題演化強度、主題演化關系以及主題演化內容三個方面對其主題演化情況進行分析。

3.1 注題演化強度分析

第一階段,各主題的強度值波動較大,此時間段各主題無序發育,說明發育不成熟,正處于探索階段;第二階段,除個別主題強度變化幅度較大以外,大部分主題強度變化趨穩,說明發展漸趨明朗、研究開始回歸理性;第三階段,大部分主題強度呈上升態勢或者平穩變化,說明該領域研究力度穩中有升,多數主題處在成長狀態,少數主題強度快速回落,正逐漸遠離人們的視野,表明研究方向越來越明確,研究人員在對各個主題的把握和研究上更加成熟。

以“知識管理”主題為例:2001—2007年間,其強度于2004年突破1,表明其由潛在熱門話題成為高熱門話題,且一直處于增長狀態,說明其研究的力度在加大。2008—2011年,主題強度一直在“1”上下徘徊,說明其在此期間一直屬于高熱門話題,且主題強度波動幅度變化很小,表明該主題可能趨于成熟。2012—2017年,該主題強度在不斷下降,表明主題熱度在下降,這可能與該主題開始分化有關,也說明主題開始由內部發展轉向外部發展,研究范圍由本領域向其他領域拓展。

3.2 主題演化關系分析

2001—2007年和2008—2011年兩個相鄰子時期主題之間的連線較少,演化關系較少,2008—2011年和2012—2017年2個子時期的主題之間連線快速增加,主題之間的關系更加緊密,主題發展呈現明顯的協同特征,主題分化、融合現象不斷發生。如2001—2007年子時期“本體”分化出“信息組織”主題,“電子政務”主題中的一部分融入到“電子商務”之中;2008—2011年子時期“本體”“電子商務”“電子政務”“知識管理”“實證研究”都出現分化的現象,“本體”與“實證研究”“知識管理”中各有一部分融合成“影響因素”,“數據挖掘”中的一部分融入到“電子政務”之中等。另外,新興主題不斷產生,例如:2008—2011年子時期中的“信息行為”“輿情管理對策”“實證研究”等,2012—2017年子時期中的“信息生態鏈”“微博”“關聯數據等”;一定數量主題(例如2008—2011年子時期中的信息組織)也在不斷消亡。

以“知識管理”主題為例,從演化軌跡來看,2001—2007年子時期與2008—2011子時期只有繼承關系;2008—2011年子時期與2012—2017年子時期之間除了繼承關系之外,還出現分化與融合關系,分裂成“知識共享”與“社會網絡分析”兩個新主題,并與“輿情管理與對策”主題融合成為“輿情管理模式與對策”。

3.3 主題演化內容分析

2001—2007年的研究主要集中于圖書館信息與知識服務方面,具體側重于圖書館數字參考咨詢、知識管理以及個性化服務的信息服務與信息系統;2008—2011年子時期側重于方法對策與評價研究,由之前的信息服務等研究轉向圖書館服務績效評價、評價體系的構建,同時隨著Web2.0的發展,電子商務與政務也成為現階段熱點;2012—2017年子時期,開始探討數字圖書館,關注輿情監管,探討用戶信息行為的影響因素,注重網絡分析與復雜網絡信息生態鏈研究。

以“知識管理”主題內部關鍵詞變化這一微觀視角為例來看:2001—2007年子時期,由表6內主題的關鍵詞可以看出這個時期的研究主要集中于某一點,例如知識共享、知識創新等,說明還處于內部發展階段,主題發育還不成熟;2008—2011年子時期,內部主題詞有了較大的增長,主題內容與含義迅速擴充,同時和網絡分析進行結合,開始由之前的點向線(網絡) 發展,表明“知識管理”的相關研究進入了快速增長的階段;2012—2017年子時期該主題開始與知識地圖、知識網絡、可視化等主題結合,動態顯示知識之間的聯系,研究由線向面發展。

表6 知識管理主題各子時期內主題詞

階段 主題詞(粘合力)

2001—2007 年 知識管理(0.562)知識需求(0.131)知識共享(0.109)知識(0.099)知識創新(0.099)

2008—2011 年 知識管理(0.328)模式(0.131)社會網絡分析(0.127)知識共享(0.117)發展策略(0.085)社會網絡 (0.075)產業集群(0.071)引文分析(0.066)

2012—2017 年 知識管理(0.344)知識地圖(0.197)知識圖譜(0.180)可視化(0.148)可視化分析(0.131)

4 結語

本文從主題演化強度、演化關系與演化內容三個方面分析我國情報學碩博學位論文主題演化狀況,可以發現,隨著信息技術的不斷進步,有關情報學的演化主題越來越多,多數主題處在成長、成熟狀態,少數傳統的主題遠離人們的視野。目前情報學的整體研究呈現由集中到分化的發展脈絡,未來研究將圍繞數字圖書館、輿情監管、用戶信息行為的影響因素,對網絡分析與復雜網絡信息生態鏈等方面研究展開。

參考文獻:

李欠欠.2004—2014我國情報學熱點研究主題分析:基于戰略坐標圖[J].圖書館雜志,2017,37(2):29-34.

李長玲,翟雪梅.我國情報學碩士學位論文的共詞聚類分析[J].情報科學,2008(1):73-76.

劉非凡,李長玲,魏緒秋.我國情報學學科主題結構分析[J].情報理論與實踐,2015,38(2):121-126.

董坤,吳紅.基于論文-專利整合的3D打印技術研究熱點分析[J].情報雜志,2014,33(11):73-76,61.

唐果媛,張薇.基于共詞分析法的學科主題演化研究進展與分析[J].圖書情報工作,2015,59(5):128-136.

鐘偉金,李佳,楊興菊.共詞分析法研究(三):共詞聚類分析法的原理與特點[J].情報雜志,2008(7):118-120.

劉自強,王效岳,白如江.多維主題演化分析模型構建與實證研究[J].情報理論與實踐,2017,40(3):92-98.

劉自強,岳麗欣,王效岳,等.主題演化視角下的國際情報學研究熱點與前沿分析[J].圖書館,2017(3):14-22.

HALL D, JYRAFSKY D, MANNING C D. Studying the history of ideas using topic models[C]//Conference on Empirical Methods in Natural Language Processing,2008:363-371.

主站蜘蛛池模板: 久久视精品| 国产91精品久久| 毛片免费在线视频| 日韩欧美综合在线制服| 国产网友愉拍精品视频| 国产精品亚洲αv天堂无码| 丁香婷婷激情网| 亚洲高清在线播放| 国产十八禁在线观看免费| 99久久精品免费视频| 亚洲天堂2014| 久久精品人人做人人综合试看| 狠狠色丁香婷婷| 99久久亚洲精品影院| 亚洲男人的天堂在线| 亚洲 日韩 激情 无码 中出| 伊人久久婷婷五月综合97色| 国产成年女人特黄特色毛片免 | 国产伦精品一区二区三区视频优播 | 久久综合九色综合97网| 狠狠亚洲五月天| 亚洲天堂视频网站| 国产成人一二三| 国产AV毛片| 精品少妇人妻av无码久久| 无码啪啪精品天堂浪潮av| 亚洲av成人无码网站在线观看| 国产精品太粉嫩高中在线观看| 亚洲区视频在线观看| 91视频首页| 天天综合网色中文字幕| 99热国产这里只有精品9九 | 精品国产免费观看| 91黄视频在线观看| 亚洲欧美在线综合图区| 四虎在线观看视频高清无码 | 欧美成人一级| 91午夜福利在线观看| 国产18页| 精品免费在线视频| 亚洲另类色| 一级毛片在线免费视频| 国产在线97| 99九九成人免费视频精品| 久久国产精品国产自线拍| 中文字幕在线视频免费| 日韩精品一区二区三区视频免费看| 九一九色国产| 国产女同自拍视频| 日韩美毛片| 国产精品男人的天堂| 亚洲国产成人精品青青草原| 天天躁狠狠躁| 亚洲成av人无码综合在线观看| 色135综合网| 91福利在线观看视频| 美女毛片在线| 成人精品在线观看| 91在线播放国产| 在线国产资源| 国产精品久线在线观看| 国产午夜在线观看视频| 亚洲国产日韩在线成人蜜芽| 99久久国产综合精品2023| 天天综合网色| 亚洲国产在一区二区三区| 色噜噜在线观看| 99精品视频在线观看免费播放| 久久国产毛片| a欧美在线| 国产日韩欧美视频| 波多野结衣亚洲一区| 亚洲不卡影院| 91精品小视频| 91尤物国产尤物福利在线| 高清无码一本到东京热| 久久综合九九亚洲一区| 亚洲三级a| 国产91麻豆视频| 在线免费亚洲无码视频| 美女无遮挡免费视频网站| 久久精品一品道久久精品|