999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于百科知識的醫療數據知識圖譜構建

2020-10-14 01:03:52魏自強鄭偉偉許永康
網絡安全技術與應用 2020年10期

◆魏自強 鄭偉偉 許永康

基于百科知識的醫療數據知識圖譜構建

◆魏自強 鄭偉偉 許永康

(貴州航天計量測試技術研究所 貴州 550009)

為解決醫療數據分布龐雜,數據間缺乏良好管理與組織,基于高質量的百科數據和醫學本題庫,通過網絡爬蟲技術獲取百科數據,然后對醫療知識圖譜構建過程中的知識抽取、知識融合等關鍵技術研究,最后,在Neo4j圖數據庫中存儲并對其進行可視化展示。

醫療知識圖譜;網絡爬蟲;圖數據庫

大數據時代的到來,醫療領域的數據呈現爆炸式增長。這些醫療信息蘊含著大量的有價值的信息,然而,醫療人員在面對海量的醫療數據時,可能無法快速準確地從中獲取關鍵信息,導致無法高效的診斷疾病,甚至誤診。造成上述問題是醫療數據缺乏緊湊有效的組織結構與形象直觀的可視化查詢方式,沒有形成相應的醫療知識體系,并且國內外醫學標準不盡相同,許多醫學無法直接應用[1],難以深層次的數據挖掘及應用。

知識圖譜(knowledge graph KG)能有效解決上述問題,2012年知識圖譜由谷歌公司提出[2],并將其應用到搜索引擎中。知識圖譜已在學術界等領域得到了廣泛應用,并在推薦系統,智能搜索等方面發揮者不可替代的作用[3]。國外方面,文獻[4]根據知識圖譜將醫學概念與非洲傳統醫學的知識工程方法結合,對復雜的信息需求進行了適當建模。文獻[5]從Web內容中提取的知識并和現有知識庫中獲得的先驗知識進行信息融合。文獻[6]對知識圖譜的提取方法及評估方法做了研究。國內方面,文獻[7]結合萬方醫學網收錄的乙肝領域文獻,采用文本挖掘技術構建工詞矩陣并繪制乙肝領域的知識圖譜,文獻[8]研究了中醫知識圖譜構建方法,并實現中了醫藥知識圖譜的應用,文獻[9]研究了中醫辨證治療的知識體系,將知識圖譜與失眠辨證治療結合,構建中醫個體診斷知識圖譜。與國外向比,國內醫療領域知識圖譜處于起步階段,需構建面向各醫療需求的知識圖譜,以提升國內醫療信息的服務。

本文以百科醫療知識如醫學概念本題庫、尋醫問藥網等作為數據源,從數據收集、知識清洗、知識存儲、圖譜展示等方面,構建醫療數據知識圖譜。

1 知識圖譜技術架構

1.1 基本定義

知識圖譜是一種基于圖的數據結構,由節點和標注的邊組成[10]。本質上是一種實體之間關系的語言網絡[11]。知識圖譜中節點是不同類型的實體,而圖中的邊也是實體間豐富的各種寓意關系[12]。

知識圖譜基本組成單位是“實體-關系-實體”三元組,以及實體及其相關屬性-值對,實體間通過關系相互聯結,構成網狀的知識結構[13]。實體是最基本的組成部分,如疾病、藥品、疾病癥狀、食物等;屬性是實體存在的特征如疾病名稱、病因、治療方法、治療周期等;關系存在與不同實體之間的聯系如疾病常用藥、疾病宜吃食物、疾病所需檢查等。如圖1為疾病實體類屬性圖。

圖1 疾病實體類屬性圖

1.2 體系架構

醫學知識圖譜的構建主要目標是基于多種數據處理技術,多渠道抽取有價值的醫學知識,主要以三元組的形式存儲于圖數據庫中。醫學知識圖譜的構建技術流程如圖2所示。主要通過知識抽取、知識融合、圖譜的構建等技術從多源異構數據中抽取其中的實體、屬性等關鍵知識及其關系[14]。

圖2 知識圖譜構建技術流程

知識圖譜的構建主要分為自頂向下和自低向上兩種構建方法。自頂向下構建知識圖譜在構建過程中需要領域專家構建本題庫,從異構數據源中填充到知識圖譜中。自底向上的構建方式直接將抽取數據中發現的實體、關系和屬性合并到知識圖譜中。自底向上構建方式,成本低,自動化程度高。本文根據實際情況,采用自底向上的構建方式構建依賴數據知識圖譜。本文在綜合考慮醫療數據進行剖析,確定醫療數據基本概念,得到樹形結構數據模式圖,如圖3所示。

圖3 醫療知識實體結構示意圖

1.2.1醫療數據抽取

知識圖譜的構建首要問題是需要抽取醫學知識,而醫學領域數據,數據結構復雜,既有結構化數據,半結構化數據又有非結構化數據。本文數據來源主要是以垂直型醫療網,如從百科醫療知識、醫學概念本題庫、尋醫問藥網;主要通過數據爬蟲的方法自動獲取醫學數據。將數據爬蟲獲取的數據整合成JSON文件保存,然后對數據進行數據清洗等操作。尋醫問藥網疾病百科如圖4所示。

圖4 尋醫問藥網的疾病百科

1.2.2知識融合

利用數據抽取,可實現從非結構化數據、半結構化數據中得到實體、實體的屬性等信息。但這些信息中存在著大量的冗余、錯誤。可以從實體對齊、實體連接兩個方面進行知識融合[1]。

(1)屬性對齊

醫療數據來源的多樣性,使醫療數據存在知識重復、醫療知識之間的聯系不夠、多元指代等問題。屬性對齊首先判斷多源異構數據中的實體是否指向真實世界同一對象。實體對齊可采用成對實體對齊和集體實體對齊兩種方式。

(2)實體連接

實體連接是指實體對象連接到知識庫中對應的正確對象的操作[15]。實體鏈接的基本思想是首先根據給定的實體指稱項,從知識庫中選出一組候選實體對象,然后通過相似度計算將指稱項鏈接到正確的實體對象。

2 知識圖譜可視化與應用

2.1 圖譜可視化展示

本文以疾病為核心,從檢查、科室、疾病、癥狀等方面構建7類實體。表1為實體統計表。

表1 實體統計表

本文采用Neo4j可數據庫進行存儲和可視化展示。如圖5所示。

圖5 醫療知識圖譜

對于急性中毒患者家屬可根據圖6反饋的查詢信息,快速采取措施,如“立即脫離現場至空氣新鮮處,脫去污染的衣著,并用肥皂水或清水沖洗污染的皮膚,并即時送往醫院急診科;醫生根據患者癥狀,根據圖6所示反饋的查詢信息,建議該病人進行“血常規”等相關檢查,以確定患者是什么類型中毒。

圖6 醫療決策幫助的查詢實例

2.2 應用

知識圖譜,可應用于醫療信息搜索引擎、醫療問答系統、醫療決策支持系統。醫療信息搜索引擎結合元搜索引擎和知識庫的搜索引擎,聚合權威的知識、醫療、學術網站為用戶提供包括維基百科、知乎問答等;醫療問答系統對知識庫整合,利用自然語言處理技術的應用來生成和處理問題,最后從知識庫中提取答案;醫療決策支持系統以患者的癥狀描述、化驗等數據,為醫生提供智能診斷,治療方案的推薦,轉診指南,還可以針對醫生的診斷方案進行分析、查漏補缺,減少或避免誤診。

3 結語

本文充分闡釋了知識圖譜的發展、定義及構建。通過網絡爬蟲技術獲取網頁中高質量的百科醫療數據,在通過知識融合等技術消除冗余、錯誤信息。最后利用Neo4j圖數據庫進行存儲和展示。

未來的工作將研究屬性對圖數據隱私推理的影響。

[1]付洋,劉茂福,喬瑞.心臟病中文知識圖譜的構建[J/OL].武漢大學學報(理學版),2020(03):261-267.

[2]Pujara J,Miao H,Getoor L,et al. KnowledgeGraph Identification[C]// International Semantic Web Conference. Springer,Berlin,Heidelberg,2013.

[3]Heiko Paulheim. Knowledge graph refinement: A survey of approaches and evaluation methods. 2016,8(3):489-508.

[4]Kamsu-Foguem B,Diallo G,Foguem C.Conceptual graph-based knowledge representation for supporting reasoning in African traditional medicine[J]. Engineering Applications of Artificial Intelligence,2013,26(4):1348-1365.

[5]Dong X,Gabrilovich E,Heitz G,et al. Knowledge vault:a web-scale approach to probabilistic knowledge fusion[C]. ACM,2014.

[6]Paulheim,Heiko.Knowledge Graph Refinement:A Survey of Approaches and Evaluation Methods[J]. Semantic Web,2017.

[7]劉俊麗,張秀梅,蔣勇青.基于文本挖掘的乙型肝炎相關文獻知識圖譜分析[J].醫學信息學雜志,2014,35(01):48-53.

[8]阮彤,孫程琳,王昊奮,方之家,殷亦超.中醫藥知識圖譜構建與應用[J].醫學信息學雜志,2016,37(04):8-13.

[9]李新龍.中醫師辨證論治失眠癥知識圖譜構建方法研究[D].中國中醫科學院,2018.

[10]侯夢薇,衛榮,陸亮,蘭欣,蔡宏偉.知識圖譜研究綜述及其在醫療領域的應用[J].計算機研究與發展,2018,55(12):2587-2599.

[11]Nickel M,Murphy K,Tresp V,et al. A Review of Relational Machine Learning for Knowledge Graphs[J]. Proceedings of the IEEE,2016,104(1):11-33.

[12]侯夢薇,衛榮,陸亮,蘭欣,蔡宏偉.知識圖譜研究綜述及其在醫療領域的應用[J].計算機研究與發展,2018,55(12):2587-2599.

[13]劉嶠,李楊,段宏,劉瑤,秦志光.知識圖譜構建技術綜述[J].計算機研究與發展,2016,53(03):582-600.

[14]車金立,唐力偉,鄧士杰,蘇續軍.基于百科知識的軍事裝備知識圖譜構建與應用[J].兵器裝備工程學報,2019,40(01):148-153.

[15]Li Y,Wang C,Han F,et al. Mining evidences for named entity disambiguation[C]/ACM,2013.

貴州省科技計劃課題(黔科合支持[2019]2004號)

主站蜘蛛池模板: 欧美一区二区丝袜高跟鞋| 国产丰满成熟女性性满足视频| 欧美翘臀一区二区三区| 亚洲无线视频| 国产精品55夜色66夜色| 国产亚洲欧美日韩在线一区二区三区| 美女被操黄色视频网站| 91精品久久久久久无码人妻| 伊人久久久久久久久久| 香蕉综合在线视频91| 国产一区二区三区精品久久呦| 国产性精品| 天堂成人av| 黄色网站不卡无码| 91精品国产自产在线老师啪l| 国产精品免费入口视频| 亚洲一区二区三区中文字幕5566| 国产精品九九视频| 一级成人a毛片免费播放| 国产aⅴ无码专区亚洲av综合网| 人妻91无码色偷偷色噜噜噜| 精品亚洲欧美中文字幕在线看| 亚洲aaa视频| 性网站在线观看| 波多野结衣在线se| 亚洲天堂网站在线| 毛片大全免费观看| 看国产一级毛片| 91九色国产porny| 色婷婷天天综合在线| 毛片基地美国正在播放亚洲 | 国产性精品| 亚洲一道AV无码午夜福利| 午夜性爽视频男人的天堂| 国产主播喷水| 91在线精品免费免费播放| www成人国产在线观看网站| 女人天堂av免费| 日韩欧美国产另类| 激情综合网址| 成人亚洲国产| 久久综合九色综合97婷婷| 亚洲Av激情网五月天| 日韩毛片在线播放| 波多野结衣视频网站| 女同国产精品一区二区| 久久精品国产精品青草app| 久久精品一品道久久精品| 亚洲视频四区| 成人精品亚洲| 婷婷丁香在线观看| 99久久亚洲综合精品TS| 欧美a在线| 国产第一页免费浮力影院| 欧美综合成人| 国内精品91| 亚洲国产欧洲精品路线久久| 国产91丝袜在线播放动漫| 日本不卡免费高清视频| 一本色道久久88| av在线手机播放| 国产最爽的乱婬视频国语对白| 久久国产乱子伦视频无卡顿| 精品成人一区二区| 国产一级毛片高清完整视频版| 激情综合网址| 久久国产毛片| 色噜噜狠狠狠综合曰曰曰| 亚洲一区二区三区中文字幕5566| 人妻21p大胆| 欧美97色| 一级毛片在线播放| 精品视频第一页| 日韩黄色精品| 亚洲精选高清无码| 欧美区一区| 国产伦片中文免费观看| 国产制服丝袜91在线| 岛国精品一区免费视频在线观看| 亚洲国产综合第一精品小说| 婷婷色在线视频| 亚洲精品片911|