楊林朋 董一超 趙祖桉 崔雪寧 劉新奎



[摘要] 目的 該文旨在通過信息可視化方法直觀展現和分析醫學信息學領域熱點及前沿趨勢,梳理該學科發展脈絡和學科的演化歷程,提出醫學信息發展建議。方法 以CNKI《中國學術期刊全文數據庫》所載文獻為統計源,運用文獻計量學的詞頻統計和共詞分析及聚類分析方法,借助SATI2.3、Ucinet、Netdraw和SPSS 21.0統計學軟件,對我國2014—2018年醫學信息學研究論文進行計量分析。結果 揭示2014—2018年醫學信息學研究論文的研究熱點和趨勢,提出了醫學信息5個熱點研究方向。結論 國內研究雖然呈現良好的發展態勢,但是就整體而言,國內科研論文的數量和質量仍有待提高。
[關鍵詞] 醫學信息學;文獻計量法;共詞分析;可視化分析
[中圖分類號] R-05 [文獻標識碼] A [文章編號] 1672-5654(2019)08(a)-0160-05
Research Status and Visual Analysis of Medical Information Science in China
YANG Lin-peng, DONG Yi-chao, ZHAO Zu-an, CUI Xue-ning, LIU Xin-kui
The First Affiliated Hospital of Zhengzhou University, Zhengzhou, Henan Province, 450052 China
[Abstract] Objective This paper aims to visualize and analyze the hotspots and frontier trends in the field of medical informatics through information visualization methods, sort out the development of the subject and the evolution of the discipline, and propose medical information development. Methods The CNKI "Chinese Academic Journal Full-text Database" was used as the statistical source, using the word frequency statistics and co-word analysis and cluster analysis methods of bibliometrics, with the help of SATI2.3, Ucinet, Netdraw and SPSS 21.0 statistical software. A quantitative analysis of medical informatics research papers in 2014-2018. Results The research hotspots and trends of medical informatics research papers from 2014 to 2018 were revealed, and 5 hot research directions of medical information were proposed. Conclusion Although domestic research shows a good development trend, on the whole, the quantity and quality of domestic research papers still need to be improved.
[Key words] Medical informatics; Bibliometrics; Co-word analysis; Visual analysis
醫學信息學是一門由醫學、信息學等交叉而來的新興學科[1]。隨著醫學信息領域的范圍增大,醫院信息化的快速發展,醫學信息海量增加,醫學信息學研究成為醫學界和信息學界共同關注的一大熱點[2]。該文通過對2014—2018年醫學信息、醫學圖書情報論文的計量分析,明晰該領域的關注熱點,全面了解我國醫學信息學的發展概況,為以后的相關領域研究提供參考,對于促進我國醫學信息學的進一步發展具有重要的意義。
1? 數據來源與分析方法
以CNKI《中國學術期刊全文數據庫》作為數據庫來源,檢索式TI=(信息+信息學+情報+圖書)*醫學-聲明-稿約-啟事OR KY=(信息+信息學+情報+圖書)*醫學,限定時間為2014—2018年,得到文獻1 623篇,經過篩選、去重后共得到有效文獻1 207篇,其年度分布,見表1。由表1可知,2014—2018年我國醫學信息學領域的發文數量逐年增長,但增長幅度較小,總體上呈現平穩上升的態勢。利用文獻計量分析軟件SATI3.2、社會網絡分析軟件UCINET、可視化軟件NETDRAW以及SPSS 21.0統計學軟件分析樣該文獻的全記錄信息,繪制相關圖譜,從而探討2014—2018年我國醫學信息學研究的發展趨勢。
2? 研究結果分析
2.1? 樣本論文作者合著情況及高產作者群分析
該次研究共得到有效樣本論文1 207篇,涉及作者3 221位,平均一篇論文有2.67位作者,其中合著論文共計809篇,占論文總數的67.03%;參與合著的學者共計2 823人,占作者總人數的87.64%。樣本論文作者合著情況結果詳見表2。由表2可知,合著論文數和作者間的合作率均在60%以上,2~5人合作最為普遍,也存在更多人合著的情況,最高一篇文章作者數量為12人。由此可知,我國醫學信息學研究具有一定的合作基礎,但合作能力和合作意識仍需進一步提升。
由普賴斯定律,選取高產核心作者,即以該領域最高產作者發表論文數的平方根的 0.749倍為界,該文中最高產作者發文11篇,則核心作者中最低產作者論文數應為 2.247篇,取最大整數為3篇,高于此發文量的作者即為該領域的核心作者。統計數據表明,發文4 篇及以上的作者共15人,則這15位作者構成了醫學信息領域核心作者群。由此可知,目前我國醫學信息學領域核心作者群已經形成,具有離散性,核心作者還較為薄弱。
2.2? 樣本論文高頻關鍵詞詞頻統計分析
利用SATI3.2軟件對1 207篇樣本論文的題錄數據進行分析,抽取關鍵詞并進行詞頻統計,合并、去除含義相同或無意義的關鍵詞,得到頻次≥8的關鍵詞40個,按出現頻次降序排列,如表3所示。分析排名前40位的高頻關鍵詞可知,目前我國醫院信息學的研究主要集中在信息素養、信息服務、醫學圖書館建設、衛生信息化、生物信息學、大數據、醫學信息檢索以及信息系統等方面;同時,注重醫學教育、醫學情報、電子病歷、醫學院信息管理、數據挖掘、醫學信息技術以及醫學信息系統等方面的研究;有些還涉及信息工程、云計算、知識圖譜、信息索引等計算機信息技術領域。
2.3? 文獻高頻關鍵詞共現分析
利用SATI3.2軟件構建41×41的高頻關鍵詞共詞矩陣,由于篇幅限制,該文僅列舉頻次排名前10的關鍵詞數據,見表4所示。以共現頻次≥5的關鍵詞為切入點,發現衛生信息化與醫學信息學、醫學生與信息素養、知識圖譜與醫學信息、信息技術與醫學教育以及循證醫學與信息服務等組合出現的頻率較高。為了更加直觀形象地展示近5年來我國醫學信息學領域研究主題分布情況,將高頻關鍵詞共現矩陣導入Ucinet軟件中,利用可視化軟件NETDRAW繪制高頻關鍵詞共現網絡,詳見圖1、圖2。圖1中每個節點代表關鍵詞,節點的大小代表關鍵詞在共現網絡中的中心度,節點越大,說明其位于整個網絡的中心位置,越具影響力,節點位置越分散,節點越小,說明其位于整個網絡的外圍,影響力越小。而圖2中節點間的連線表示關鍵詞之間的共現強度,線條越粗表示兩者共現強度越高,節點之間的距離即節點之間連線的長短可以說明關鍵詞之間的密切程度。結合圖1和圖2可知,醫學信息學、信息技術、醫學圖書館、信息素養教育、衛生信息化以及醫學信息服務等關鍵詞節點較大,位于整個關鍵詞網絡的中心位置,是近5年我國醫學信息學樣本論文的核心關鍵詞,其中醫學信息學與衛生信息化,醫學信息學與信息技術,醫學生與信息素養,醫學信息學、數據庫與電子病歷等共現強度較高,聯系較為密切。
2.4? 樣本論文高頻關鍵詞聚類分析
該文中的聚類分析法通過計算關鍵詞之間的距離,將距離較近即聯系較為密切的關鍵詞聚集起來,形成不同的類別,使得屬于同一類別的關鍵詞之間相似度盡可能大,而不同類別的關鍵詞之間的相似度盡可能小[3]。由于關鍵詞數量過多,通過進一步過濾刪減,限定為頻次排名前35的關鍵詞,并生成35×35的高頻關鍵詞共詞相異矩陣,再將高頻關鍵詞共詞相異矩陣導入SPSS 21.0統計學軟件中進行層次聚類分析,在“聚類方法”中選擇“Ward法”,在“標準化”菜單中選中“Z得分”,最后得到聚類樹狀圖,見圖3所示。
結合樣本論文高頻關鍵詞共現網絡及聚類樹狀圖,可將聚類結果分為五大研究類別,分別對應:(1)計算機信息技術在醫院中的應用。隨著社會經濟的不斷發展和人們生活質量的不斷提高,患者對醫療系統的便捷性提出了更高的要求,醫院必須順應時代發展的要求,盡可能地滿足患者個性化需求,這就需要醫院提高信息化建設能力,運用先進的網絡技術不斷提高信息化水平,增加患者的滿意度。目前,計算機技術涉及醫院信息化建設的多個方面,如醫療服務信息化,醫院通過構建計算機網絡的平臺,解決醫療資源短缺的問題,與計算機技術結合在一起,使得醫院的治療資源實現優化配置;醫技人員通過網絡熟悉并掌握有關醫療器械的相關法律法規,有利于提高設備管理工作的效益;病歷書寫及統計管理信息化,計算機網絡技術的使用使得醫院病案的保管更加有序、安全,其自動生成的統計功能使得醫院日常活動的統計變得更加準確[4-5]。
(2)對臨床醫學和研究型數據等醫學信息資源的開發利用。研究發現,近5年來利用計算機自然語言和文本挖掘技術對醫院電子病歷、醫學影像、病理參數和化驗結果進行研究是我國醫學信息學領域的關注熱點。大數據、知識圖譜、云計算以及數據挖掘等關鍵詞的頻繁應用,表明國內醫學信息學的研究方法的不斷豐富,從單純的文獻計量法到機器學習和數據挖掘方法[6-7] 。
(3)教育與信息素養。開設與醫學信息相關的課程,適合我國高等教育的國情。醫學信息課程種類較多,其中文獻檢索課是我國目前實施信息素養相關教育活動的一種最普遍、最豐要的形式,對學生信息意識和信息能力的提高有一定的作用。目前也有學者認為要樹立新型信息素養教育觀念,對文獻檢索課程體系進行全面革新。此外,對信息的分析和利用也是信息素養的一個重要體現方面[8]。
(4)醫學圖書與循證。首先,文獻信息資源的深度利用,包括從文獻信息服務轉化到知識服務,其次,是探索網絡環境下的信息個性化服務以及很多圖書館都在實施的學科館員制度;另外,循證醫學也是醫學圖書館的信息服務很重要的一部分[9]。
(5)以電子病歷為代表的信息管理。目前,學者們對以電子病歷為首的醫院資源安全管理方面的研究主要集中在以下2個方面:①電子病歷安全隱患。包括電子病歷系統書寫存在的安全隱患、電子病歷運行中存在的安全隱患以及電子病歷醫療信息準確性和真是性無法保障等;②提出電子病歷安全管理策略。如,建立醫院電子病歷安全保障機構,確立醫院電子病歷風險管理體系以及嚴格制定執行醫院安全管理制度等[10]。
3? 結語
該文對近5年來我國醫學信息學領域的國內發文進行共詞分析,利用聚類分析對相關文獻的關鍵詞進行主題分類,借助UCINET構建關鍵詞共現網絡,根據聚類分析的樹狀圖歸納出我國醫學信息學領域國內研究成果的五大類別。通過以上對我國醫學信息學研究熱點的透視,提出新的發展思路,目前我國在醫學信息學領域的研究內的研究成果數量眾多,但是在世界范圍內的影響力較弱[11],科研人員應該增強自身的科研能力以及吸收他人科研成果的能力,與國際同步;另外,在以后研究中,可以結合該領域實踐性的調查研究方法,使研究內容更加豐富,對五大類熱點研究內容也可進一步的拓展分析。
[參考文獻]
[1]? 王偉.醫學信息學[M].北京:高等教育出版社,2006:14.
[2]? 張婷婷,樸雪.醫學信息學與生物信息學發展狀況分析—基于文獻調研[J].繼續醫學教育,2018,32(1):63-66.
[3]? 潘偉.個性化信息服務關鍵技術—聚類分析[J].現代情報,2007(10):212-214.
[4]? 魏石磊.基于信息化平臺的數字化醫院系統研究[J].城市建設理論研究:電子版,2015,5(12):1611-1612.
[5]? 黃正東,肖飛,郭雪清,等.基于信息化平臺的數字化醫院架構研究[J].華南國防醫學雜志,2012,26(4):362-366.
[6]? 李萍.云計算與大數據時代醫院信息化的三個轉變[J].中國醫院管理,2013,33(12):80-81.
[7]? 孫磊,胡學龍,張曉斌,等.生物醫學大數據處理的云計算解決方案[J].電子測量與儀器學報,2014(11):1190-1197.
[8]? 王偉.我國醫學信息教育面臨的發展機遇與挑戰[J].中華醫學圖書情報雜志,2012,21(3):1-3.
[9]? 董瑞玉,馮占英,張曉梅,等.基于大數據應用的醫學圖書館服務定位[J].醫學信息學雜志,2017,38(1):75-78.
[10]? 沈崇德,王彬夫.基于電子病歷的醫療質量控制與安全管理策略[J].中國醫院管理,2012,32(8):42-44.
[11]? 亢川博,王偉,張世玉,陶成琳.國內外醫學信息學研究現狀的可視化分析[J].中華醫學圖書情報雜志,2016,25(8):24-30.