999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

圖數據模型及其在疫情追溯領域的應用研究

2021-03-12 07:00:36李洪磊
軟件導刊 2021年2期
關鍵詞:防控數據庫疫情

沈 陽,李洪磊,陳 杰

(遼寧師范大學政府管理學院,遼寧大連 116029)

0 引言

2019 年年末新型冠狀病毒肺炎蔓延的范圍和擴散速度對全球經濟發展和社會穩定產生了嚴重影響,成為自20世紀初“西班牙流感”大流行以來的重大疫情事件。在中共中央、國務院“科學防控,精準施控”要求指導下,我國政府積極綜合運用網格管理、大數據技術、快速核酸檢測等技術手段,有效遏制了疫情蔓延和零星小范圍疫情反復,為全球提供了“中國方案”。

在疫情防控過程中,以大數據技術為支撐的疫情追溯發揮了重要作用,使防控部門能夠在最短時間內鎖定高風險人群和地區,將疫情有效控制在最小范圍之內。伴隨著移動通訊和大數據技術特征的現代信息技術升級,疫情防控部門對病例行蹤軌跡挖掘更加細致,但是疫情傳播過程的動態性和復雜性導致疫情傳播數據的高維性、碎片化以及高關聯性,傳統的關系型數據模型并不適合表達此類數據類型,并且在追溯查詢方面性能較差。基于以上原因,本文提出一種基于圖數據模型(Graph Data Model)的疫情追溯數據模型,借助NEO4J 圖數據庫建立一個基于該數據模型的疫情追溯數據庫,提出相應的數據操縱及疫情追溯算法。本研究可根據人員行蹤數據構建病例的行程路線圖,再添加時間、交通工具、地點等信息形成傳播關系網,為疫情相關的流行病學追溯問題提供幫助,同時也為后續疫情的防控和預防工作提供決策支持。本文實驗數據來自于權威部門公布的2020 年國內部分地區疫情防控數據。

1 相關研究

數據庫的相關技術誕生于20 世紀60 年代,截至目前已經歷了60 年的發展歷程。數據庫發展經歷了3 個重要階段:①以層次性數據庫和網狀數據庫為主的第一代數據庫系統;②以關系型數據庫為主的第二代數據庫系統;③正在發展的圖數據庫系統以及面向對象的數據庫、基于文檔的數據庫系統等。關系型數據庫模型是目前應用最廣泛的數據庫,在流行病調查及防控領域使用較多。韓金祥[1]建立與研究了罕見流行病臨床數據庫;李永利等[2]基于SQL Server 數據庫建立新突發傳染病信息數據庫系統;李澤庚等[3]根據急、慢性流行病傳染病臨床經驗所構建的流行病傳染病數據庫;青義春等[4]使用Oracle 大型數據庫系統以及C 語言構建的傳染病信息管理系統;姜華等[5]使用Oracle 大型數據庫構建遠程數字化診斷平臺,對口岸進行實時診斷和監控;王秀華[6]基于SEER 數據庫對甲狀腺末分化癌的臨床監測數據檢測和病理學分析;宋敏等[7]以傳染病臨床數據庫為基礎建立的傳染病信息管理系統等。

圖數據模型及圖數據庫在處理復雜數據聯系和表達非結構化數據方面具有優勢,在醫學領域發揮著積極作用。吳思竹等[8]構建以疾病為中心的中文疾病圖數據庫,能更好實現對疾病之間關系的探索;盛明等[9]基于已有臨床醫學知識建立電子病歷的圖數據庫擴展系統,可作為尋診系統的重要組成部分;趙凱等[10]提出一種基于《傷寒論》桂枝湯類方的小型圖數據庫,對桂枝湯類方診斷、配方、開藥進行可視化分析和檢索;林燕榕等[11]基于腎病專科電子病歷構建腎病圖醫學數據庫,為醫生提供臨床決策輔助以提升醫療服務的質量。

除此之外,圖數據庫作為一種以圖為基礎的數據庫模型,在社交關系排查方面發揮著重要作用。如丁洪麗[12]提出基于人員信息、話單和出行信息形成圖數據庫,在排查人物重點關系上與傳統關系型數據庫相比,查詢速度達后者5 倍;黃冰倩等[13]認為基于圖數據庫的話單數據分析有助于警方尋找嫌疑人和其行動軌跡;祁爍[14]根據人員社交關系構建圖數據庫用于對違法犯罪人員進行預測,對于公安辦案人員合理分配警力、提高出警效率很有幫助。

綜上所述,數據庫模型用于傳染病學調查和傳染病臨床信息數據庫構建是可行的,對醫務工作者更有效利用已有數據信息進行傳染病學分析提供信息技術支持。圖數據庫上,一方面基于臨床數據、電子病歷等構建的圖數據庫,在為醫護人員提供信息支持同時還提升了檢索效率,增加了可視化查詢路徑等決策輔助,進一步提升了醫療服務質量;另一方面,圖數據應用領域還拓展到社交關系網絡的構建和查詢上,這一點正是基于圖數據庫的非關系型數據表達和清晰可視化所達成的。但是在目前數據庫研究和應用中,涉及到傳染病學調查多以傳染病數據分析、構建傳染病學數據庫為主,對流行病傳染病的追溯和傳播關系網等涉及較少。由此本文希望將圖數據應用優勢結合起來,可根據行蹤數據構建病例的行程網圖,再添加時間、交通工具、地點等信息形成傳播關系圖,為疫情相關流行病學追溯提供幫助,同時為后續疫情防控和預防工作提供指導意見。

2 圖數據模型

圖數據模型(Graph Data Model)是一種以圖結構進行存儲和表達的數據模型,知識圖譜和圖數據是圖數據模型的主要表現形式。圖數據模型基本結構由實體結點還有連接節點之間的邊(或稱之為關系)組成,通過邊將各個點連接起來形成網狀圖,由此進行快速的圖檢索操作。圖數據模型相關產品最早由美國谷歌公司在2012 年提出并首次使用在其網站關聯搜索上,其目的是希望通過數據之間的聯系提升網站在搜索引擎上的表現。圖數據庫設計解決難以在關系系統中建模的復雜層次結構問題。圖數據模型與20 世紀70 年代的網狀模型相似,都表示一般的圖,但是網絡模型數據庫在較低的抽象層次上運行,不能輕松遍歷一系列數據聯系。目前,圖數據庫是發展速度最快的數據庫技術,能夠克服層次型、網狀型、關系型數據庫在處理復雜數據聯系方面的諸多困難。

基于NEO4J 的圖數據庫是目前圖數據庫技術中最為常用的一種,功能最完善、發展最快。以NEO4J 圖數據庫為例,NEO4J 圖數據庫具有以下特點:①圖數據庫更易于信息可視化,節點和邊所表示的信息更接近現實世界的實體聯系;②圖數據庫中的點和邊更新靈活,動態數據庫模式易于數據庫拓展和更新,便于適應數據的動態變化;③圖數據庫檢索響應時間迅速,這一特點在數據量大信息挖掘層數深時表現更為明顯;④可以完全兼容ACID圖數據庫,便于處理復雜關系。

基于NEO4J 圖數據庫高兼容性、靈活性、高性能特點,在處理非結構化占比較高、數據量不斷增長的疫情數據時,選擇使用NEO4J 圖數據庫技術構建本文的疫情數據圖數據模型能取得較好效果。

3 疫情追溯圖數據模型構建

圖數據模型擅于查找和發現數據之間的關系,本研究希望借助NEO4J 圖數據庫建立一個基于該數據模型的、能夠用于快速確定疫情確診病例和區域范圍的疫情追溯數據庫,為疫情相關的流行病學追溯提供幫助,為后續疫情的防控和預防工作提供決策支持。根據最新信息實時更新數據庫、快速精準查詢病患及其出行事件,同時在一個指定中心和“步長”的區域內進行疫情回溯。

3.1 原始數據與清洗

本文數據全部來自大連市衛生健康委員會2020 年7月22 日至8 月13 日(此后連續14 日無新增確診病例)所公布的信息,包含在大連“7.22”疫情復發事件中核酸檢測結果為陽性的病例共計92 人。數據內容包括病患的姓名、年齡、性別、職業、家庭住址、確診日期、確診前3~7 日內的行動軌跡信息。由于獲取的數據以半結構化信息和文本內容居多,本研究采用分詞的方式將所需信息提取出來形成結構化數據,為后續抽取實體形成圖數據做前期準備。

3.2 實體含義

將所獲得的原始數據進行初步分詞和清洗之后,對數據進行實體抽取,并在獲得實體記錄之后建立關系記錄。實體記錄和關系記錄如表1、表2 所示。

Table 1 The entity record表1 實體記錄

Table 2 The relationship record表2 關系記錄

根據抽取出的實體進行分類,得到兩種主要實體:病患和地點。病患表示所有在本次大連疫情復發事件中感染新冠肺炎的病人,設置唯一標識ID,在病患信息中包括姓名、年齡、性別、職業、家庭住址。地點指感染了新冠肺炎的病例確診前3~7 日內去過的地點,設置唯一標識Place_ID。根據國家衛生健康委發布的規定,新冠肺炎平均潛伏期為7 天。

根據本文抽取出的關系得到兩種主要關系:①Rel;②trace。關系Rel 表示病患節點和地點節點之間的聯系,代表這個病患曾經去到過的地方,填充內容為relation;關系trace 表示地點節點之間的聯系,代表一個出行事件,每個出行事件包括出行人、出行時間、使用的交通方式。

3.3 模型構建

圖數據庫作為一種基于圖形成的數據庫模型,其基本組成元素為抽取出的實體所表示的節點和連接節點與節點之間的邊,根據原始數據中抽取出的實體記錄和關系記錄構建出如圖1 所示的模型。

這一數據模型可簡潔表示為“某人在何時何地用什么樣的交通方式去了哪里,以及所用時長”這一出行事件,本文的圖數據庫就是基于這一簡單結構構成的。

4 模型在疫情追溯中的應用

將全部實體記錄和關系記錄錄入模型系統得到一個實體總量超過200 個、關系數量超過600 條的圖數據結構。基于NEO4J 的圖數據庫環境建立該數據庫。NEO4J 作為一款典型NoSQL數據庫產品,有獨特的查詢和編碼語言Cypher,本文使用該語言完成病患行蹤數據庫的建立,并完成相關數據庫操作,使該圖數據庫能夠基于病患行蹤信息進行查詢、分析研究。根據已有信息構建的圖數據如圖2所示。

Fig.1 Patient travel map data model圖1 圖數據模型病患信息模型

參照流行病學和傳染病調查流程和疫情防控期間大連市衛健委提出的相關措施,將傳染病調查與社交網絡關系追溯相結合進行回溯查詢,本文在該圖數據庫系統上成功實現以下3 個核心功能:數據更新功能、數據查詢功能以及回溯功能。

Fig.2 Patient travel map data圖2 病患出行圖數據庫

4.1 數據更新

為使該模型能充分映射現實世界中的真實情況,對原有數據記錄進行增減修改,修改的內容包括節點記錄和關系記錄。例如隨著調查的深入,發現某病患去過的地點數量不相符,就涉及到地點節點數量的增減;如果大連地區的疫情蔓延情況未有效控制,那么病患節點的數量也會隨之變化。

功能1:節點增加

create(a:patient{name:“丙”,id=“03”}),(a:patient{name:“丁”,id=“04”})return a;

create(a:place{name:“地點3”,place_ID=“003”})re?turn b;

增加3 個節點,用時1ms

功能2:病患和地點節點刪除

MATCH(a:patient)where a.name=“丁”delete a

MATCH(b:place)where b.name=“地點3”delete a

刪除兩個節點,用時2ms

功能3:關系增加

MATCH(a:patient),(b:place)

WHERE a.name=“丙”AND b.name=“地點2”

CREATE(a)-[r:Rel]->(b)RETURN r

增加1 條關系,用時2ms

4.2 模型查詢

在疫情防控及流行病學調查相關工作中,對某一重點地區和重點人物的精準查詢是一個必要功能,并且在“疫情就是命令”要求下,需要系統給出準確快速的反饋,這對相關人員及時做出防控決策和判斷有很大幫助。圖數據查詢主要根據節點屬性和關系屬性進行查找。模型查詢功能包括以下內容:

功能1:節點查詢

MATCH(a:patient)WHERE a.name=“石某”RETURN a

查詢1 個節點,用時1ms

功能2:關系查詢

研究發現,僅單純找出病患或者地點的節點信息是不夠的,還需要進一步查找發生出行事件的地點合集,才能對這名病患的整體出行事件有一個整體了解,幫助劃定防控范圍。如圖3 所示:當需要搜尋與病患id=2 的患者及與其相關的全部出行事件時,找到18 個地點共計47 條關系,查詢用時2ms。醫護人員重點查詢某一條出行事件如大連灣車站至莊河汽車站,可以看到具體時間、交通工具等行程內容,這對進一步掌握病患的出行信息、劃定重點人群范圍有重大作用。

Fig.3 Querying patient trail node relationship圖3 病患信息圖數據庫節點關系查詢

Fig.4 Querying patient trail case圖4 病患信息圖數據庫出行事件查詢

4.3 追溯功能

在傳統關系型數據庫技術背景下,尋找朋友的朋友、課程的前導課等類似問題不是那么容易,同理這些困難也在處理如疫情的傳播鏈梳理、上層傳染者或是傳染地點甚至再上一層傳染者查找時出現,要解決這一難題必然涉及到遍歷數據庫、跨表查詢和引用鍵值等操作,但對單一關系的查詢往往不足以滿足社交關系排查要求,且操作所花費時間成本和運行成本較高。對于需要及時反饋信息的疫情顯然需要更高效的方法。

挖掘數據之間關系是圖數據庫相較其他數據庫模型的優秀之處,基于圖形成的圖數據庫可以通過自身的圖結構清晰顯示兩節點之間的關系。

如圖5 所示,在所有病患去過的地點中,以大連灣地鐵站為圓點,以一次出行事件為一個步長,兩個步長范圍包括全部地點。根據出行時間判斷該病患者在該區域是否留下感染病菌,以便醫務人員對某個時間段內曾經去過該地區的人員進一步排查,同時對重點區域進行防控和消毒處理。

若當前的步長無法得到滿意結果,可以進一步增加步長范圍。

Fig.5 Backtracking range with“Dalian Bay Station" step size of 2圖5 以”大連灣站“為中心步長為2 的回溯區域

5 結語

本文通過構建基于病患行蹤信息形成的NEO4J 圖數據模型,以大連地區2020 年7 月22 日至8 月13 日期間疫情復發數據為例,建立一個節點總數超過200 個、關系數量超過600 條的圖數據庫,使用NEO4J 數據庫技術和Cypher數據庫語言建立該數據庫模型。本文構建一個與現實情況相符合的病患行蹤數據庫,重點對病患查詢、高風險地點排查、傳播范圍劃定等問題進行分析研究。但本文對于疫情預防、不予發布的密切接觸人員信息等情況未進行全面考慮,將在后續系統更新中進一步改進。基于圖數據庫進行疫情防控和管理能夠為醫務人員和防疫機構提供決策支持。

猜你喜歡
防控數據庫疫情
戰疫情
配合防控 人人有責
環球時報(2022-04-25)2022-04-25 17:20:21
豬常見腹瀉病癥狀及防控
今日農業(2021年15期)2021-10-14 08:20:18
抗疫情 顯擔當
人大建設(2020年5期)2020-09-25 08:56:22
疫情中的我
守牢防控一線 靜待春暖花開
人大建設(2020年3期)2020-07-27 02:48:40
疫情期在家帶娃日常……
37°女人(2020年5期)2020-05-11 05:58:52
夏季羊中暑的防控
今日農業(2019年14期)2019-09-18 01:21:44
數據庫
財經(2017年2期)2017-03-10 14:35:35
數據庫
財經(2016年15期)2016-06-03 07:38:02
主站蜘蛛池模板: 在线99视频| 天天躁夜夜躁狠狠躁躁88| 无码一区二区三区视频在线播放| 亚洲欧洲美色一区二区三区| 九月婷婷亚洲综合在线| 亚洲男人天堂久久| 天天色天天综合| 日韩区欧美区| 日本91在线| 91久久偷偷做嫩草影院免费看 | 免费国产在线精品一区| 国产不卡一级毛片视频| 亚洲天堂在线免费| 日韩中文无码av超清| 亚洲av无码牛牛影视在线二区| 91精品伊人久久大香线蕉| 久久久国产精品无码专区| 亚洲大学生视频在线播放| 久久综合五月| 蜜臀AV在线播放| 99视频精品在线观看| 国产一区二区三区日韩精品 | 亚洲欧洲美色一区二区三区| 亚洲精品天堂在线观看| 呦女精品网站| 欧美日韩国产在线观看一区二区三区| 波多野结衣在线se| 国产黄视频网站| 国产亚洲精品97在线观看| 免费av一区二区三区在线| 色婷婷成人| 色久综合在线| 成人在线天堂| 亚洲免费人成影院| 精品乱码久久久久久久| 亚洲人成网站日本片| av在线手机播放| 免费国产在线精品一区| 亚洲人人视频| 国产一级α片| 99热亚洲精品6码| 一区二区三区在线不卡免费| 欧美国产成人在线| 四虎精品黑人视频| 欧美日韩在线观看一区二区三区| a国产精品| 国产成+人+综合+亚洲欧美| 黄色网站不卡无码| 呦女亚洲一区精品| 在线精品亚洲国产| 中国一级特黄大片在线观看| 国产青榴视频在线观看网站| 91国内外精品自在线播放| 狠狠躁天天躁夜夜躁婷婷| 国产一在线| 国产激情在线视频| 成人在线观看不卡| 国产精品漂亮美女在线观看| 亚洲天堂成人在线观看| av一区二区三区在线观看| 国产永久在线观看| 67194成是人免费无码| 国内精品久久人妻无码大片高| 日本91在线| 亚洲综合色区在线播放2019| 99无码熟妇丰满人妻啪啪 | 国产精品美女免费视频大全| 日本在线国产| 国产三级毛片| 天堂在线亚洲| 2018日日摸夜夜添狠狠躁| a毛片在线免费观看| 毛片网站观看| 亚洲不卡av中文在线| 国内精自视频品线一二区| 国产欧美日韩资源在线观看 | 精品乱码久久久久久久| 久久亚洲国产一区二区| 青青草原国产免费av观看| 无码丝袜人妻| 综合天天色| 国产精品午夜福利麻豆|