999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于CiteSpace 的Web of Science 圖書情報領域的主題探測

2021-03-25 08:04:24馬宇馳吉林財經大學圖書館
圖書館理論與實踐 2021年2期
關鍵詞:分析研究

馬宇馳(吉林財經大學圖書館)

1 引言

分析某一學科在特定時間段的熱點,能夠幫助專家學者迅速梳理領域知識結構、明晰主流研究項目、把握該領域在當前及未來一段時間的發展趨勢。

目前,國內對于圖書情報學(Library and Information Science,LIS) 的行業熱點展望常見于領域內某個主題的演進回顧、分析及前瞻。如,奉國和等運用CiteSpace,以CSSCI 為數據庫檢索源,對國內機構知識庫研究文獻進行分析,識別了機構知識庫領域核心期刊、研究團隊、關鍵節點文獻等知識演進要素[1];肖荻昱以CNKI 數據庫為檢索源,利用CiteSpace 繪制了圖書館智庫領域的文獻作者、機構、關鍵詞及研究前沿圖譜[2];胡浪基于CNKI 的數據,通過CiteSpace 呈現了國內圖書情報學的研究現狀,指出了計量學在圖書情報領域中的增長態勢[3];蘇福等運用CiteSpace,對2014—2015 年被Web of Science(WoS)收錄的圖書情報學期刊進行分析,繪制出當年的領域研究熱點[4];2014 年,孫杰等對SSCI 收錄圖書信息學Top5 的期刊進行CiteSpace 關鍵詞聚類分析,并與國內學者在國際期刊中的發文熱點進行對比,總結學界發展過程中的異同[5]。前人的研究或基于國內數據源、或未經過相應的數據清洗流程、或數據截取的時間跨度短、或因撰寫時間久遠而削弱了對當下借鑒的時效性。本研究嘗試運用數據清洗方法、網絡密度分析結合時序分析法,剖析近五年圖書情報學在SCI 優質期刊中的研究主流及研究熱點,為該領域的相關研究提供一定的借鑒。

2 數據來源與方法

2.1 數據源

以WoS 和其期刊引文報告(Journal Citation Reports,JCR) 作為數據來源。WoS 按主題將其收錄的期刊大致分為250 個學科類別,每份期刊和書籍都至少屬于一個學科類別。在2018 年版的JCR 中,共236 個類目,包含圖書情報學(Information Science&Library Science,LIS)類目的數量為1,此類目下包含期刊出版物的數量為89 個。

2.2 期刊選取原則

作為權威的文獻計量大學排行,荷蘭萊頓大學科學技術研究中心(Centre for Science and Technology Studies,CWTS)及美國免費期刊信息分析平臺Scimago 發布的排行報告在選取優秀出版物的過程中,均將專業領域內前10%這一比例作為選取依據[6]。因此,本研究同樣采用了“10%”作為抽取比例,即選取10 個期刊,按照JCR 的期刊影響因子(Journal Impact Factor)數值降序排列(見表1)。

表1 2018 年圖書情報學影響因子TOP 10 期刊

在WoS 中的檢索策略為SO=(International Journal of Information Management) or SO= (Journal of Computer-Mediated Communication) or SO=(Journal of Knowledge Management) or SO= (MIS Quarterly) or SO= (Government Information Quarterly) orSO=(Journal of The American Medical Informatics Association) or SO=(Information&Management) orSO= (Journal ofStrategicInformation Systems) or SO= (Information Processing&Management) orSO=(Journal ofInformetrics)。檢索時間截止到2019 年12 月24 日,時間跨度為最近 5 年,索引為SCI-EXPANDED、SSCI,共檢索到文獻4,060 篇。在WoS 的數據導出界面中選擇“全記錄與引用的參考文獻”,文件格式選擇“純文本”,由此得到用于共現分析的數據文件。

2.3 應用工具

CiteSpace 是知識可視化的表現手段,其工作原理是應用論文中關鍵詞的詞頻統計及共現分析、文獻的共被引分析等理論,同時結合聚類分析、應用數學分析方法、圖形學等信息可視化技術,形成對知識內在結構的描繪和對知識間相互聯系的揭示。作為計量學在實踐領域的一項應用,CiteSpace 常被用于兩個方面:① 某學科或多學科交叉下的研究主題發現、熱點定位及前沿趨勢探析;② 學科覆蓋下的杰出科研人員、優勢科研機構和國家的可視化標識,以及科研人員之間、機構國家之間的合作共現顯示。

3 結果

3.1 數據清洗結果

應用文獻目錄數據分析某一領域熱點的研究已廣泛開展,但由于數據質量優劣不一,基于該方法的結果的效度難以得到保障。潘瑋等構建了數據清洗的“DEAN”流程,清洗4 類數據對象,即來自同一數據庫或多數據庫間的重復(Duplicates) 條目,不符合檢索需求的文獻類型或檢索策略錯誤(Errors) 記錄,具備相同語法或語義概念的同義不規范關鍵詞(Alias),含有子網或低頻次閾值的噪聲干擾關鍵詞(Noises),并證實該流程提升了對于研究主題識別的有效性和準確性[7]。

按照“DEAN”數據清洗步驟,本次數據清洗的流程及結果見表2。

表2 “DEAN”流程各環節功能及結果

將清洗后的數據導入CiteSpaceV,在功能參數區中將時間切片中的時間范圍設置為“2015-2019”,時間切片為 1 年,節點類型(Node Types) 按照分析對象先后選取“Institution”“Author”“Keyword”等,每個時間切片選擇“Top 50”,連線強度選擇“Cosine”,然后進行數據分析,在可視化的數據分析界面,文獻的關鍵詞以節點的形式出現在視圖中。節點為年輪狀彩色圓環圖,靠近外圈的環以暖色顯示,代表相對近期文獻;內圈的環用冷色顯示,代表相對早期的文獻,圓環厚度及節點面積與關鍵詞頻次成正比。圖中連線表示其兩端連接的節點存在于同一篇文獻中,具有共現關系。

3.2 發文機構分析結果

選取發文頻次機構的數據形成發文機構共現圖(見圖1),在發文頻次排名前10 的機構中,9 所來自美國,1 所來自中國。WoS 收錄的文獻數量是評估機構科研力量的因素之一[8],相比于企業、科研院所及社會研究組織,大學科研團隊在LIS 領域中研究力量具有明顯優勢。從國家角度來說,美國大學科研團隊表現出明顯優勢,這為我國培養LIS 領域研究人員所進行的聯合辦學、學術交流提供了地區借鑒。排名前兩位的布列根和婦女醫院 (Brigham and Women’s Hospital)和哈佛大學醫學院(Harvard Medical School)均來自醫學領域,這表明LIS 領域與醫學學科深度交叉融合,醫學領域對LIS 人才需求量較其他學科更大,高校在構建LIS 專業學生培養計劃時,可適當加大對醫學信息管理等專業的學科投入力度。

3.3 作者分析結果

根據作者數據繪制作者共現圖(見圖2),在發文數排名前10 的作者中,4 人來自美國的機構,5 人來自歐洲的機構,1 人來自中國的機構,且從事醫學信息學研究的作者占比較高,與發文機構分析結果一致。

圖1 發文機構共現圖

圖2 作者共現圖

高產作者中排名第一的是英國胡弗漢頓大學的Thelwall M(發文頻次27),其近五年主要致力于傳統文獻計量指標與替代計量學(Altmetrics)的社交網絡影響力計量化指標的對照分析研究,如全球最大的科研社交網絡服務網站“ResearchGate”是否能廣泛反映現有的學術層級以及各國學者在使用“ResearchGate”提供的服務過程中是否受益于該網站,他對ResearchGate 的用戶進行人口統計學分析,他還基于Mendeley進行替代計量學分析,憑借對“讀者數量”的跟蹤,證實了“讀者數量”在反應科研成果利用率上同傳統文獻計量學“引文數”所發揮的作用高度相關[9]。排名第二的是美國哈佛大學醫學院醫學信息學專業的David A K,他的研究以中大型科研團隊合著為特征,通過研發以患者為中心的網絡化工具包分析包含患者和護理人員共同參與的急性護理過程中的各項醫療信息。此外,他的研究還涉及到臨床診斷支持系統、電子處方系統的處方錯誤分析、藥物過敏預警的失敗案例等[10]。意大利國家研究委員會的Giovanni Abramo 論證了由CWTS 提出的New Crown Indicator(the Mean Normalized Citation Score, MNCS),及諸如國際合作率、高被引文獻數等一系列需計算比率即與自身體量無關的計量指標在衡量科研績效過程中的不適用性;確定了基于SIMCA 的多元隨機模型作為衡量科研產出的計量體系[11-12]。

3.4 研究主題分析結果

自動聚類視圖采用的方法是對數似然比算法。通過聚類算法生成知識聚類,從聚類的施引文獻中提取標簽詞,以此來表征對應一定知識基礎的研究主題[13]。關鍵詞共現聚類見圖3,其中代表網絡模塊化的指標聚類模塊值(Modularity)為0.8328,當其大于0.3 時就意味著網絡社團結構顯著;另一個評價指標聚類平均輪廓值(Silhouette)為0.7951,在0.5 以上時可以認為聚類結果是合理的。

由圖3 可知,2015-2019 年圖書情報領域的研究熱點包括社交媒體(SocialMedia)、知識分享(Knowledge Sharing)、文獻計量學 (Bibliometrics)、開放創新(Open Innovation)、自然語言處理(NaturalLanguageProcessing)、信息技術(Information Technology)、電子健康記錄 (Electronic Health Records,EHRs)、知識管理(Knowledge Management)、社交商務 (SocialCommerce)、情感分析(Sentiment Analysis)。下面是對LIS 研究態勢的演化過程分析。

3.4.1 以時間為視角的主題間演化態勢分析

圖3 2015-2019 年關鍵詞共現圖

(1)2015 年,聚類排名靠前的主題為知識管理和以各種模型、理論為基礎的實證分析與案例研究。數據技術是貫穿LIS 歷年的研究熱點,自然語言處理技術在當年成為熱門,為之后的機器學習、深度學習、情感分析及語義分析提供了基礎,而后者又是社交商務、電子商務、智慧醫學信息系統實現的必要工具,技術進步所累積的成果時至今日仍在為LIS 的學科發展提供支持。當年的文獻計量學熱點聚焦在書目數據庫的構建、引文影響因子、全計數法與分數計數法等理論研究。

(2)2016 年,谷歌云、亞馬遜云平臺的崛起使分布式計算、大數據技術成為當年的熱門工具。大數據與各個行業互相滲透融合的同時,也催生了許多有價值的應用平臺與產品,而基于電子健康記錄利用大數據技術優勢形成的一系列研究成果成為當年的最大聚類。電子政務獲得了當年極高的關注,開放政府數據和電子政務關系密切,對于開放政府數據的用戶接受和信息系統研究成為當年的另一熱點,大量用戶數據具有潛在價值,通過數據技術情感分析發揮價值,為社交商務、電子商務的發展提供基礎。

(3)2017 年,電子商務成為當年新出現的聚類,電子商務的概念及相關理論并非當年首次出現,也并非LIS 領域獨有。在LIS 領域中電子商務的集中聚類主要由于大數據等計算機技術使對用戶生成內容的開發成為可能,為公司組織提供了商業模式上新的視角,在這個過程中發揮作用的大數據及信息系統技術是LIS 的核心研究點之一。創新成為當年的熱門,公司和政府機構都將數字化創新管理列為研究重點。計量學方面,被廣泛應用的Bibliometrix 在這一年上線,實現文獻計量學分析中的主要分析和科學可視化,并成為科學知識圖譜分析的主流工具之一。

(4)2018 年,大數據從幕后到臺前,從云計算本身的歷史演進,到與各個行業應用場景的融合, 涌現了大量對于大數據本身理論和技術的討論。在這一年,網站數據量大量積累,后臺計算能力急速增長、通訊網絡全面部署,研究人員開始關注大數據及人工智能對個人隱私、信息安全的沖擊。數據平臺如Facebook、Twitter 等面臨泄露用戶隱私的質疑。同時,涌現了大量關于數據技術文本挖掘的研究成果。典型的例子是非結構化文本處理技術逐步成熟,使商業智能開發和健康領域的深度學習布局成為可能。

(5)2019 年,伴隨各類線上線下活動、各種信息系統、信息服務游戲化程度加深,社交媒體及社交網站轉向聚焦相關游戲化研究。技術接受模型被更多的研究者所重視,結合整合型技術接受與使用理論(UTAUT),廣泛應用于區塊鏈、移動銀行等新型商務模式的研究。IT 創新結合了創新績效的進展,為公司的決策制定提供了科學的參考,探索更多應用場景的融合。此外,科學技術的雙刃劍效應引起了學者的關注,如在與數據技術緊密結合的醫療健康行業,雖然大數據技術、移動醫療(M-Health)提升了醫院的診療效能,但是在一定程度上造成了醫生身心壓力大、職業倦怠等問題。

3.4.2 以內容為視角的主題內演化態勢分析

LIS 的主題包括研究對象和研究方法,二者并不是孤立存在的,而是彼此促進、互相完善。對于單個主題內部的研究分支演化態勢并非排他的,不存在某一熱點的出現替代消亡之前的研究對象。LIS 的主題依托圖書館作為知識平臺及信息樞紐,以數據技術為技術核心,以圖書館學、情報學、傳播學理論為輔助工具,向相關領域輻射。

社交媒體的歷史并不久遠,但短短十余年間,社交媒體對人類生活產生了顛覆性改變和巨大的影響,其引起的關注不只發生在行業內,同樣延伸到了學術界,包括醫療、商務、政務等方面。關于社交媒體的研究可以分為三個層次。① 將社交媒體本身視為研究對象,對社交網絡的度量、社區結構、牢固和薄弱的聯系、社交網絡的演變、網絡結構和關系、價值觀念和衡量策略、社會資本等核心因素進行評述[14];將傳播學理論應用于因果鏈框架結構的構建,更好地理解使用社交媒體的原因和利用社交媒體帶來的影響[15]、對于社交媒體的疲勞效應和用戶心理健康的分析[16]、對于Gamification 特點和內在需求滿足的研究[17]。② 將社交媒體上用戶行為特征與某一行業進行聯合分析,進行規律的總結和概括,從而指導組織的戰略規劃行為,如社交網絡的興起發展過程中對人們消費及健康行為的改善[18]。③ 脫離用戶行為屬性,抽取用戶生成的數據,應用回歸分析、結構方程模型等手段實現假設推理性的研究,如應用數據分析技術的行業分析,開發數據的潛在商業價值[19]。

電子健康記錄 (Electronic Health Records,EHRs)正在對醫學相關領域進行著一場變革,在健康診療護理中形成的海量數據已是學界公認的重要資源。聚焦于EHRs 的研究首先著眼于計算機技術,包括數據清洗、自然語言處理、文本挖掘、情感分析、可視化等。得益于數據技術發展,EHRs 成為顯著新興的研究熱點,其研究課題較為活躍,內部態勢相對分散,呈現出“探索—總結—再探索”的規律。微觀上表現為結合醫學信息特點的數據技術研究,如基于特定規則算法或機器學習,在結構化及非結構化的健康記錄輸入過程中能有效探測識別目標患者人群[20]。這類研究以統計學為基礎,以算法為工具實現,主要表現為利用處理后的結構化數據構建功能性醫療平臺,提高健康機構的診療護理質量的實證研究。如,利用遞歸神經網絡對心力衰竭進行早期探查[21]、應用云服務移動健康監測平臺遠程幫助患者預防腦卒中[22]。

有關電子政務的研究主要包含兩個方面。一方面是提高用戶參與電子政務積極性的研究,另一方面是提高政府開放數據透明度的研究。在電子政務方面,有學者論述了電子化政府的公共價值,并結合Facebook、Twitter 等社交網絡闡明了社交媒體內容質量與公民參與電子政務積極性的關系[23],以及社交媒體內容質量對公民信任度、政策實施效果的影響[24]。在開放政府數據 (Open Government Data,OGD) 方面,從對OGD 主導模型的梳理[25]到歸納OGD 項目的主流生態環境[26],過渡到OGD 項目的核心不只在于平臺的構建,更在于數據集本身的質量[27]。

關于商務經濟的研究主要包括兩類。一類是基于社交網絡平臺,對社交商務、移動商務、電子商務等商業模式的分析。這類熱點得以興起的原因在于:① 技術上,隨著近年來數據技術的飛速發展,云存儲、云計算能力日益完善,為獲得、處理、分析、利用商務信息數據提供了先進的技術支持;② 在場景上,Facebook、Twitter、微博等社交平臺經過多年的發展,積累了大量用戶行為記錄,為理解用戶行為、完善社交網絡傳播學原理提供了豐富的案例。在總體層面,如社交商務的定義、研究主題和發展趨勢的演進[28];在個體層面,通過數據獲取,幫助用戶選擇最優的機器學習模型,運用自然語言處理技術進行面向服務評論的情感分析,如對星巴克、希爾頓酒店等的分析。移動商務帶來非經濟利益的同時,學界也在思考技術帶來的負面影響,基于UTAUT等模型,展開了對于用戶隱私保護不足的反思討論[29]。另一類是結合經濟學、管理學模型,分析在社交媒體上的社交行為作為中介變量或調解變量在組織內服務創新、知識創新、知識管理、知識分享、知識共創等活動中產生的作用或對績效的影響。

文獻計量學以科研績效評價為主,理論和實踐互為補充,相輔相成,旨在構建完善的科學書目信息源,全面收集科研成果數據,研發基于用戶的信息圖譜可視化工具,客觀科學地呈現科研績效。① 在理論方面,聚焦于標準化工作,包括對采樣時間范圍的標準化[30]以及基于算法分類法的跨學科標準化實踐[31],并討論在標準化程序下科學計量研究中的全計數法、分數計數法以及MNCS 作為研究績效評審指標的科學適用性[11,32]。② 在構建文獻信息源方面,谷歌學術作為科學信息源和科研產出評估數據源的適用性討論;引文計數在Google Scholar、Web of Science、Scopus 三種信息源之間的異同對比分析;替代計量學領域對于新興學術主題的社交網站 ResearchGate、Academia.edu 和 Mendeley 的研究。③ 在實踐方面,依托統計學和算法模型,文獻計量學領域的研究逐漸由回顧轉為結合現狀的前瞻預測,如結合神經網絡學習方法的引文技術預測模型、Altmetric.com 對于長期計數的預測模型、文獻老化預測模型等。

數據技術側重對數據操作及數據分析方法本身的關注,包括利用自然語言處理、文本挖掘、情感分析、神經網絡、決策樹等技術實現商業需求。LIS 行業對于大數據的關注從最初的定義、分析方法、非結構化數據相關分析的各種算法到分布式計算、云計算等前沿技術的評述,以及大數據在物聯網、智慧城市中的角色定位。其中,分布式賬本技術使系統的互操作性有了質的飛躍,實現了醫療、物流供應等多領域的應用升級。當前,大數據的發展正經歷著“新興—實用—探索”反復循環交織的過程,人們在積極探索大數據在各行業應用的同時,也在不斷完善發優化自身對于數據的分析能力,包括認知分析能力、對更高強度的非受控語言的處理能力、更加多元的決策支持模型的開發能力[33]。

4 結語

通過對2015-2019 年LIS 領域頂級期刊的分析,得到以下結論。① 高校的研究機構在LIS 領域中占核心地位;美國及歐洲占主導地位,中國在LIS 領域頂級刊物范圍內也有高產作者。② LIS 領域的高產作者來自于醫學機構,或者與醫學機構深度合作,醫學信息學存在較大發展潛力。③“社交媒體”“知識共享”“文獻計量”“電子健康記錄”“社會電子商務”等成為代表研究熱點的高頻關鍵詞語。④ 圖書情報領域的研究主題在傳統LIS 領域、計算機領域內不斷深化完善,以數據技術為核心、LIS 相關理論為工具,與其他學科聯動擴展,越來越多地與醫學、健康護理、商業經濟、網絡傳播學進行交叉融合。

本研究不免存在一定的局限性,由于CiteS-pace 所呈現的關鍵詞節點僅能定性呈現。在定量的角度上,節點所代表的值來自整個文獻數據集合里該關鍵詞出現的次數,軟件若能對關鍵詞在具體文獻中出現次數加以權重劃分,該研究將有更強的說服性。

猜你喜歡
分析研究
FMS與YBT相關性的實證研究
2020年國內翻譯研究述評
遼代千人邑研究述論
隱蔽失效適航要求符合性驗證分析
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
新版C-NCAP側面碰撞假人損傷研究
電力系統及其自動化發展趨勢分析
中西醫結合治療抑郁癥100例分析
主站蜘蛛池模板: 中文国产成人精品久久| 国产成人高清亚洲一区久久| 日本免费一区视频| 中文字幕人成乱码熟女免费| 亚洲人成影院午夜网站| m男亚洲一区中文字幕| 久久综合结合久久狠狠狠97色| 国产精品视频导航| 色综合日本| 四虎亚洲国产成人久久精品| 国产在线精彩视频二区| 日本精品中文字幕在线不卡| 欧美日韩国产成人高清视频| 在线观看网站国产| 四虎永久免费在线| 欧美特黄一级大黄录像| 国产av剧情无码精品色午夜| 精品午夜国产福利观看| 精品91视频| 在线观看视频99| 成人中文字幕在线| 国产成人三级在线观看视频| 欧美午夜性视频| 亚洲精品制服丝袜二区| a毛片免费在线观看| 国模粉嫩小泬视频在线观看| 在线精品亚洲国产| 色婷婷久久| 久久久久中文字幕精品视频| 成人无码一区二区三区视频在线观看| 日韩A级毛片一区二区三区| 成人另类稀缺在线观看| 成人免费一区二区三区| 亚洲精品第一在线观看视频| 色哟哟国产成人精品| 欧美精品综合视频一区二区| 狠狠色香婷婷久久亚洲精品| 性网站在线观看| 国产精品大白天新婚身材| 日韩美女福利视频| 四虎永久在线| 国产一国产一有一级毛片视频| 亚洲一级色| 欧美一级高清视频在线播放| 国产无码高清视频不卡| 国产精选小视频在线观看| 成人午夜久久| 国产亚洲精品yxsp| 午夜无码一区二区三区| 日韩av高清无码一区二区三区| 免费中文字幕在在线不卡 | 色九九视频| 国产成人盗摄精品| 99热这里只有精品在线观看| 青青久视频| 无码有码中文字幕| 国产欧美日韩专区发布| 久草国产在线观看| 亚洲成A人V欧美综合天堂| 在线观看免费人成视频色快速| 亚洲手机在线| 亚洲美女高潮久久久久久久| 2021国产精品自产拍在线观看 | 熟女视频91| 国产精品免费久久久久影院无码| 日韩毛片在线播放| 乱码国产乱码精品精在线播放 | 国产精品19p| 久久毛片免费基地| 54pao国产成人免费视频| 久久精品女人天堂aaa| 欧美成人国产| 四虎精品国产永久在线观看| 99在线观看视频免费| 国产va免费精品| 日韩东京热无码人妻| 东京热一区二区三区无码视频| 国产在线精品网址你懂的| 免费国产黄线在线观看| 波多野结衣一二三| 中文字幕久久精品波多野结| 久久国产精品娇妻素人|