曹 霞 陳云香 崔 雷
(中國醫科大學附屬盛京醫院圖書館沈陽110004) (中國醫科大學信息管理與信息系統(醫學)系沈陽110013)
?
?醫學信息研究?
基于Sci2的國外醫學信息學文獻引文耦合分析
曹 霞 陳云香 崔 雷
(中國醫科大學附屬盛京醫院圖書館沈陽110004) (中國醫科大學信息管理與信息系統(醫學)系沈陽110013)
以JCR收錄的25種醫學信息學期刊為數據樣本,利用可視化工具Sci2軟件對所采集的文獻進行引文耦合分析,繪制醫學信息學研究領域的知識圖譜。通過對施引文獻進行聚類,對該領域不同時間段的代表作者和代表文獻及其研究方向和熱點進行分析,揭示引文耦合圖譜的特點和發展態勢。
醫學信息學;知識圖譜;Sci2;文獻引文耦合
醫學信息學(Medical Informatics)興起于20世紀70年代后期,是以醫學、信息管理學、系統論和計算機科學技術為理論基礎,以醫藥信息化管理為目標,涵蓋醫學信息采集、存儲與傳輸、生物醫學信號處理、醫學圖形和圖像處理、醫學知識系統和智能系統、計算機仿真和醫藥信息工程等眾多概念和范疇的一門新興交叉學科[1]。隨著醫學信息學在生物醫學研究、醫學教育、醫學衛生管理方面的應用逐漸深入,對該領域的研究文獻數量也不斷增加[2]。
引文耦合包括文獻引文耦合、期刊引文耦合、作者引文耦合等。本文涉及的文獻引文耦合是施引文獻通過其參考文獻(被引文獻)建立的耦合關系,即兩篇或多篇施引文獻共同引用了1篇或多篇參考文獻,則這兩篇文獻具有引文上的耦合關系,其中兩篇文獻共有的參考文獻的篇數代表耦合強度[3]。Sci2(Science of Science)是一款知識圖譜分析軟件,在繪制知識圖譜和可視化方面擁有很多優勢,但國內研究人員目前對該軟件研究甚少[4]。本研究采用定量分析法,選取JCR收錄的醫學信息學領域最具影響力的25種期刊為數據樣本,利用Sci2知識圖譜分析軟件研究學科發展,更加直觀地呈現醫學信息領域的研究狀況[5-6]。
2.1 數據來源
本文以2013年JCR(Journal Citation Report)期刊引文報告收錄的醫學信息學領域的25種期刊作為數據來源,檢索時間范圍為2005年1月1日-2013年12月31日,將文獻類型限定為 “article ”,“ review”,“ proceedings paper” ,最終共得到17 910篇科學論文[7]。將數據分為2005-2007年、2008-2010年、2011-2013年這3個時間段進行文獻引文耦合分析。這種對不同時間段的深入研究,可以更好地呈現國外醫學信息學領域研究的動態變化[8]。
2.2 數據處理

3.1 2005-2007年醫學信息學文獻引文耦合圖譜
2005-2007年在JCR收錄的25種醫學信息學期刊中,共檢索出4 196篇文獻,在對這4 196篇文獻進行可視化分析過程中,通過其調試窗口(Console)可知,該文獻引文耦合網絡中,共包含93 470個節點,其中有89 551個是孤立節點,為了網絡優化,應刪除這些孤立節點,留下3 919個節點進行分析。節點間的連線共有72 005條,無自我循環,也無平行邊,邊最大的權重為37,最小的權重為1,該圖譜節點之間有著很強的關聯性,其中最大的網絡包括3 881個節點。利用MST-Pathfinder算法根據權重相似性對網絡進行優化縮減,最后將72 005條邊縮減到3 900條,縮減率為18.463。將耦合強度≥25的文獻在圖譜中顯示出來,共得到9組強耦合文獻,文獻在圖譜中的分布,見圖1。
(1)第1組文獻的耦合強度為37,第2組文獻的耦合強度為26。這3篇文獻主要以Zhou為中心,主要研究時間推理在醫學決策支持系統、醫療語言處理、電子醫療記錄和生物信息系統中的重要作用,提及利用人工智能和醫學自然語言處理系統(MLP)來處理時間表示和推理等時間信息。
(2)第3組文獻的耦合強度為36,第4組文獻的耦合強度為28。這3篇文獻主要以Rosenbloom為中心,探討醫囑錄入系統用戶界面的設計,通過可見的超鏈接來加強上下文相關的教育材料和患者信息的可用性,能夠顯著提升CPOE的利用率以及CPOE對臨床決策支持的影響。
綜上所述,結直腸癌中受miR-1254所調控的DEG,以及其所富集的生物過程、參與的信號通路、PPI網絡雖有待進一步探究和證實,但卻可為后續miR-1254對結直腸癌發生機制的研究提供方向和指導。通過認識miR-1254所調控的基因網絡,可全面了解其可能作用的靶基因,應用適當的RNA修飾或特殊的遞送途徑等方法,盡可能避免“脫靶”效應,以尋找治療結腸癌更有效、安全的方法。
(3)第5組文獻的耦合強度是33。主要研究聚乙烯和鈦鋁釩顆粒的不同配合比對腫瘤壞死因子α和對脂多糖誘導腫瘤壞死因子α mRNA表達的影響。
(4)第6組文獻的耦合強度為32。講述通過統計分類表,利用統計學方法,多尺度分形分析技術和一個大范圍的分類體系來描述乳腺腫塊X線的形態學和診斷學特征。在局部紋理和數據分形分析基礎上使用線性、神經以及支持向量機來描述乳腺腫塊X線特征。
(5)第7組文獻的耦合強度為28,主要探討臨床信息檢索技術對臨床醫生、家庭醫生以及醫學生的影響,臨床信息檢索技術對于臨床醫生的學習和記憶的提高都有積極的作用。
(6)第8組文獻的耦合強度為27。通過將細胞神經網絡和彈性變形進行類比,提出一種模擬軟體物體變形的新方法。該方法不僅可以預測典型的生物組織行為,還可以提供各向同性、各向異性、非均質材料、局部以及大范圍的變形。
(7)第9組的耦合強度為26。主要探討進行健康風險溝通的方法,包括數字、文字以及視覺的形式。但因為某一結果缺乏一致的測試形式,各個形式之間的隨機對照研究以及相關細節和機制的理論基礎,目前仍然無法評估到底哪一種類型的方法最有效。

圖1 2005-2007年文獻引文耦合圖譜
3.2 2008-2010年醫學信息學文獻引文耦合圖譜
檢索得出,2008-2010年共有5 354篇醫學信息學文獻,在進行可視化分析過程中,通過其調試窗口可知,該文獻引文耦合網絡中,共包含130 557個節點,其中有125 422個是孤立節點,這些孤立節點,留下5 135個節點進行分析。節點間的連線共有115 038條,無自我循環,也無平行邊,邊最大的權重為37,最小的權重為1,該圖譜節點之間關聯性較強,其中最大的網絡包括5 115個節點。利用MST-Pathfinder算法根據權重相似性對網絡進行優化縮減,最后將115 038條邊縮減到5 124條,縮減率為22.451。整個圖譜中,耦合強度≥25的耦合文獻有7組,文獻分布具體,見圖2。
(1)第1組文獻的耦合強度為37。主要介紹一款肌肉結構模型,提出該模型算法和數學分析,通過修改輸入參數和控制輸出運動單位纖維密度的分布,來獲得一個逆過程。
(2)第2組文獻的耦合強度為32。主要探討在生存模型中的設限對貝葉斯網絡學習的影響,運用爬山算法和獨立性算法來學習貝葉斯網絡。模型表明,當處理中間設限時,加權方法是最優選擇。
(3)第3組文獻的耦合強度為31。主要探討團隊合作是如何形成的,提出序列性、平行性、同時性3種區分團隊的理論概念,提出群組間的一種中間階段——半平行團隊合作。
(4)第4組文獻的耦合強度為30。主要探討基于群組的審核一體化醫學語言系統中缺失的層次關系,運用遞歸過程定位缺失層次關系。
(5)第5組文獻的耦合強度為25。文章主要目的是識別和描述在住院和門診服務中醫生使用電子病歷和醫囑錄入系統意識行為,隨著用戶對健康信息技術(IT)的興趣日益遞增,醫療健康信息技術的接受度以及使用也越來越重要。
(6)第6組文獻的耦合強度為25。主要通過使用醫囑錄入系統(CPOE)來降低用藥錯誤和藥物不良事件等相對危險度,通過領域控制研究和前后檢測研究方法評價所有類別的CPOE,得出電子處方能夠降低用藥錯誤和藥物不良事件等風險。
(7)第7組文獻的耦合強度為25。主要探討近年來Meta分析在醫學研究中的發展,重點概述了非均質性和隨機效應分析,在不同領域應用時的特殊考慮和評價研究中的偏誤等。

圖2 2008-2010年文獻引文耦合圖譜
3.3 2011-2013年醫學信息學文獻引文耦合圖譜
檢索得出,2011-2013年共有8 360篇醫學信息學文獻,在進行可視化分析過程中,通過其調試窗口可知,該文獻引文耦合網絡中,共包含189 176個節點,其中有181 574個是孤立節點,刪除這些孤立節點,留下7 602個節點進行分析。節點間的連線共有236 003條,無自我循環,也無平行邊,邊最大的權重為64,最小的權重為1,該圖譜節點之間關聯性較強,其中最大的網絡包括7 420個節點。利用MST-Pathfinder算法根據權重相似性對網絡進行優化縮減,最后邊縮減為7 522條,縮減率為31.375。整個圖譜中,抽取權重≥40的6組強耦合文獻的標簽進行顯示,見圖3。
(1)第1組文獻的耦合強度為64。主要研究視網膜影像的血管分割方法,分析探討了視網膜血管提取算法、技術和方法論,通過DRIVE和STARE這兩個視網膜影像數據庫,針對每個區域的受試工作者特征曲線,使用精確度、真陽性率、假陽性率、敏感性、特異性等方法來運行該算法。
(2)第2組文獻的耦合強度為52。主要通過隨機對照試驗,在病人和醫護人員之間使用電子癥狀報告來改善醫療保健服務的質量。
(3)第3組文獻的耦合強度為50。主要探討大規模衛生信息技術,其實施需要復雜的戰略規劃和系統組織。電子健康檔案是現在國際上改善醫療安全性和醫療質量的核心。
(4)第4組文獻的耦合強度為48。主要研究臨床決策支持干預的藥物處方設計,描述臨床決策支持干預系統中的醫療處方的設計屬性,強調感性、認知特點、提高人機交互和病人安全等功能。
(5)第5組文獻的耦合強度為43。主要研究利用互聯網提供量身定制的生活方式——電子郵件定期提醒,探討提示內容和時間的影響。
(6)第6組文獻的耦合強度為43。主要研究在基礎科研中利用計算機心房模型輔助理解病理機制和治療方法。

圖3 2011-2013年文獻引文耦合圖譜
3.4 醫學信息學文獻引文耦合分析總結
本文將2005-2013年的醫學信息學文獻以3年為一個周期,劃分為3個不同的連續時間段進行耦合分析。通過制作分析各個時間段文獻的引文耦合圖譜,可以很清楚地發現,2005-2013年醫學信息學文獻呈現明顯的增長趨勢,在圖譜中表現為節點和連線增多,構建的網絡也越來越大,越來越復雜,不同時間段研究的熱點也各有不同。2005-2007年,代表作者有Zhou、Ancker、Rosenbloom等,研究的主要內容是時間推理系統的醫學應用、醫囑錄入系統設計、利用統計分類表描述乳腺腫塊X線形態學和診斷學特征、臨床信息檢索技術、臨床數據挖掘學習等。2008-2010年,代表作者有Navallas、Stajduhar、Berlin、Chen、Holden等,研究的主要內容有肌肉結構模型開發、貝葉斯網絡學習、團隊合作、一體化醫學語言系統層次缺失審核、醫囑錄入系統的電子處方功能等。2011-2013年,代表作者有Fraz、Johansen、Cresswell、Horsky等,研究的主要內容有視網膜影像血管分割方法、電子癥狀報告和電子健康檔案改善醫療質量、臨床決策支持系統的藥物處方設計、電子郵件定期提醒、計算機心房模型輔助治療。通過對3個時間段研究內容的總結,反映出醫學信息學涉及的研究領域越來越廣泛,包括計算機、醫學、管理學等,已經逐漸成為一個成熟的多領域交叉學科[10]。
本文以JCR收錄的25種醫學信息學期刊為數據樣本,利用可視化工具Sci2軟件繪制出醫學信息學研究領域的知識圖譜,系統全面地對不同時間段進行文獻引文耦合分析。主要的研究結論如下:(1)2005-2013年醫學信息學領域的研究文獻總體呈現上升趨勢,隨著時間的推移,網絡內節點越來越多,各節點間的聯系也越來越緊密,說明在該領域中,作者間的合作增加,學術交流也日趨頻繁。(2)對于同一研究主題的文獻,它們的參考文獻趨同性較高,尤其是同一作者或者是相同團隊的發表文獻,呈現出很高的耦合率。(3)不同時間段的代表作者和主要研究內容有所不同,覆蓋了醫學、計算機和管理學等多個學科,同時研究內容具有一定連續性,例如3個時間段關于電子處方的研究:醫囑錄入系統設計——醫囑錄入系統的電子處方功能——臨床決策支持系統的藥物處方設計,說明了電子系統藥物處方的開發設計是最近熱點研究方向。
本文通過運用可視化工具Sci2軟件,對近年來醫學信息學數據進行文獻引文耦合分析,繪制出本領域的知識圖譜并對施引文獻進行聚類,可以很好地呈現不同時間段的代表作者和代表文獻及其研究的主要方向和潛在研究趨勢,揭示國外醫學信息學文獻引文耦合圖譜的特點和發展態勢,同時為國內
醫學信息研究者提供借鑒和參考。
1 陳先來. 加強臨床醫學生醫學信息學教育的思考[J]. 西北醫學教育,2011,19(1):14-16.
2 崔雷,陳東濱. 國外醫學信息學科研熱點的文獻計量學分析[J]. 醫學信息學雜志,2007,28(2):97-102.
3 許丹,侯躍芳. 國外醫學信息學研究領域可視化引文分析[J]. 醫學信息學雜志,2011,32(10):12-19.
4 邱小花,李國俊,肖明. Sci2——一款新的知識圖譜分析軟件介紹與評價[J]. 圖書館雜志,2013,32(9):79-87.
5 宋艷輝,武夷山. 基于作者文獻耦合分析的情報學知識結構研究[J]. 圖書情報工作,2014,58(1):117-123.
6 邱均平,趙月華,趙蓉英. 國外圖書情報領域可視化研究之分析[J]. 情報理論與實踐,2013,36(1):124-128.
7 曹霞,楊華. 基于SCI-E的中國大陸婦產科學領域論文產出分析[J]. 醫學信息學雜志,2012,33(10):58-62.
8 黃卓泳,賀蓮. 基于知識圖譜的衛生技術評估發展現狀及熱點分析[J]. 醫學信息學雜志,2013,34(6):55-59.
9 李國俊,劉恩濤,邱小花,等. 國外圖書館學情報學知識圖譜研究——基于Sci2的文獻引文耦合分析[J]. 情報雜志,2014,33(1):78-90.
10 栗文靖,許培揚. 近年來國際上有關醫學信息學學科發展的一些探討[J]. 醫學信息學志,2011,32(10):7-12.
Literature Bibliographic Coupling Analysis of Foreign Medical Informatics Based on Sci2CAOXia,
CHENYun-xiang,
LibraryofShengjingHospitalofChinaMedicalUniversity,Shenyang110004,China;CUILei,DepartmentofInformationManagementandInformationSystem(Medicine),ChinaMedicalUniversity,Shenyang110013,China
The paper takes 25 kinds of medical informatics journals from JCR as the data samples and uses the information visualization tool Sci2to make literature bibliographic coupling analysis, draws the knowledge map of medical informatics domain. By clustering the citing literatures, the representative authors, literatures, their research directions and focuses in different periods are analyzed, the characteristics of literature bibliographic coupling map and the development tendency of medical informatics are revealed.
Medical informatics; Mapping knowledge domain; Sci2; Paper bibliographic coupling analysis
2014-10-30
曹霞,助理館員,發表論文9篇;通訊作者:崔雷,副主任,博士生導師,發表論文100余篇。
R-058
A 〔DOI〕10.3969/j.issn.1673-6036.2015.02.011