湛黃涵,譚豪,馬少聰,唐明輝
(南華大學(xué)計算機(jī)學(xué)院,湖南衡陽,421001)
關(guān)鍵字:傳染病;數(shù)據(jù)可視化;數(shù)據(jù)分析;風(fēng)險評估;增長態(tài)勢
傳染病,是指由病原體導(dǎo)致的能夠在生物之間相互傳播的疾病。傳染病對人類有著極大的危害,2001年“非典”、埃博拉病毒疫情、禽流感等,均給人類社會造成了巨大的損失。
而在現(xiàn)代社會,科技技術(shù)高速發(fā)展,隨著互聯(lián)網(wǎng)技術(shù)在醫(yī)學(xué)領(lǐng)域的廣泛運用,許多傳染病的傳播特點、傳播周期等均被人們所捕捉。通過大數(shù)據(jù)技術(shù)對傳染病疫情進(jìn)行分析和預(yù)測,能夠更加精準(zhǔn)地了解各類傳染病的特性,與此同時,也能夠讓政府和群眾在傳染病疫情到來之際,作出預(yù)防措施。
本文根本傳染病的一般特性,設(shè)計并實現(xiàn)了一套傳染病數(shù)據(jù)分析與可視化系統(tǒng)。通過對傳染病相關(guān)數(shù)據(jù)進(jìn)行多維的分析,分析出存在有利用價值的數(shù)據(jù)和信息,供用戶參考。
在“十四五”規(guī)劃中已經(jīng)明確提到“要加快建設(shè)國家政府?dāng)?shù)據(jù)統(tǒng)一開放平臺,推動政府信息系統(tǒng)和公共數(shù)據(jù)互聯(lián)開放共享”。組織建設(shè)現(xiàn)代化經(jīng)濟(jì)體系離不開大數(shù)據(jù)發(fā)展和應(yīng)用。推動實施國家大數(shù)據(jù)戰(zhàn)略,加快建設(shè)數(shù)字,更好地服務(wù)于經(jīng)濟(jì)社會發(fā)展和人民生活改善。運用大數(shù)據(jù)促進(jìn)保障和改善用戶體驗,要堅持以用戶為中心的發(fā)展思想,強(qiáng)化服務(wù),彌補(bǔ)短板,推進(jìn)緊急突發(fā)事件如傳染病、災(zāi)難等領(lǐng)域大數(shù)據(jù)普及應(yīng)用,深度開發(fā)各類便民應(yīng)用。
因此對傳染病大數(shù)據(jù)的可視化分析,極大地契合了“推進(jìn)大數(shù)據(jù)普及應(yīng)用”的相關(guān)政策,也能夠針對我國未來的突發(fā)疫情事件提供良好的基礎(chǔ)和經(jīng)驗,因此具有良好的政策支持。
互聯(lián)網(wǎng)與大數(shù)據(jù)技術(shù)等新興信息技術(shù)的快速發(fā)展,深刻地影響著制造過程,改變了制造過程中人與人、人與組織、人與資源等交互方式,呈現(xiàn)出過程協(xié)同化、方式個性化、資源全球化、數(shù)據(jù)多元化、產(chǎn)品服務(wù)化等特點。因此,良好的大數(shù)據(jù)應(yīng)用能夠大幅度的較少人力物力,提高生產(chǎn)生活效率,節(jié)約資源等,對經(jīng)濟(jì)發(fā)展有著不可估量的意義。
情信息分析領(lǐng)域,傳染病大數(shù)據(jù)分析可視化能夠?qū)魅静?shù)據(jù)以圖表的方式直觀地展現(xiàn) ,使得衛(wèi)健委部門能夠根據(jù)圖表獲取傳染病的發(fā)展特征,并根據(jù)分析結(jié)果提前做出應(yīng)對措施,能夠有效緩解各種大型感染事故的發(fā)生,減少人力物力。
傳染病信息領(lǐng)域大數(shù)據(jù)的普及和應(yīng)用,人們出行能夠有選擇性的選擇出行時間和地點、避開傳染病疫情較為嚴(yán)重的地區(qū)和時間節(jié)點等方式來大幅度減少出行所需要遇到的風(fēng)險、選擇更加科學(xué)等,極大的增加了居民的安全感。
傳染病數(shù)據(jù)分析共分為全國傳染病數(shù)據(jù)分析、州傳染病疫情數(shù)據(jù)分析、縣傳染病疫情數(shù)據(jù)分析三大模塊。
全國傳染病數(shù)據(jù)分析: 該模塊主要從數(shù)據(jù)庫中調(diào)取國家的整體傳染病疫情相關(guān)數(shù)據(jù),然后對數(shù)據(jù)進(jìn)行拆選、清洗從而生成各個數(shù)據(jù)庫,系統(tǒng)可以通過各種數(shù)據(jù)庫來對整體的用戶情況進(jìn)行分析,能夠方便地計算分析各種功能展示所需要的數(shù)據(jù)集合,從而根據(jù)數(shù)據(jù)經(jīng)計算得出我們想要展示的圖表,幫助廣大用戶針對出行進(jìn)行分析決策。
州傳染病疫情數(shù)據(jù)分析:該模塊對指定國家各洲傳染病疫情數(shù)據(jù)進(jìn)行詳細(xì)分析,通過確診率、病死率、死亡率等數(shù)據(jù)分析傳染病疫情發(fā)展趨勢,通過檢測情況、治愈情況分析各州傳染病應(yīng)對水平等。
縣傳染病疫情數(shù)據(jù)分析:該模塊對指定國家各縣傳染病疫情數(shù)據(jù)進(jìn)行詳細(xì)分析,使用基于經(jīng)緯度-確診人數(shù)傳染病疫情風(fēng)險評估模型對指定縣區(qū)周圍地區(qū)的 風(fēng)險進(jìn)行評估。通過累計確診人數(shù)、累計死亡人數(shù)、現(xiàn)有確診人數(shù)等數(shù)據(jù)分析傳染病疫情發(fā)展趨勢。
三大模塊邏輯關(guān)系如圖1所示。

圖1 三大功能模塊邏輯關(guān)系圖
由全國整體的感染人數(shù)、死亡人數(shù)、治愈人數(shù)分別計算得出全國截止日期的感染率、死亡率、治愈率,分別以餅狀圖形式展現(xiàn),其中:

計算、獲取全國截止日期近30天內(nèi)每日的新增確診人數(shù)、新增死亡人數(shù),并分別以柱狀圖、曲線圖的形式進(jìn)行展現(xiàn)。從圖中可以觀察到全國近一個月傳染病疫情的發(fā)展趨勢、了解全國傳染病的嚴(yán)重程度。

圖2 全國整體傳染病感染數(shù)據(jù)比例圖

圖3 全國單月數(shù)據(jù)趨勢圖
從前端可視化界面中選擇某一州,獲取該州所有確診患者的治療情況,分為治愈、死亡、治療中三種情況,通過餅狀圖的方式展現(xiàn)該州的治愈人數(shù)占比和死亡人數(shù)占比,直觀體現(xiàn)各州應(yīng)對傳染病疫情之類的緊急事件的醫(yī)療水平。

圖4 指定州治療情況比例圖
從前端可視化界面中選擇某一州,獲取該州近段時間確診率、死亡率、重癥率,以曲線圖形式展現(xiàn)。通過三種不同數(shù)據(jù)的時間變換,用戶能夠了解該州感染情況是否惡化或改善。
本文通過增長因子評估指定傳染病疫情的增長趨勢,其中增長因子GF計算公為為:

其中,?Cn為第n天新增確診的人數(shù)(第n天確診人數(shù)-第n-1天確診人數(shù)),增長情況分類如下:

圖5 指定州感染數(shù)據(jù)時間變化圖

GC=1代表“爆發(fā)”增長態(tài)勢,GC=-1代表“停滯”增長態(tài)勢,GC=0代表“波動”增長態(tài)勢。(使用論文)

圖6 指定州增長態(tài)勢識別圖
通過使用基于經(jīng)緯度-確診人數(shù)的風(fēng)險評估模型,對指定縣周圍縣區(qū)的風(fēng)險程度進(jìn)行評估,當(dāng)風(fēng)險程度越高,周邊縣區(qū)所代表的圓圈則會越大,并且會顯示具體的風(fēng)險程度數(shù)據(jù)。

圖7 指定縣周圍地區(qū)風(fēng)險圖
6.1.1 模型概述
為獲取指定地區(qū)周邊地區(qū)的傳染病疫情狀況,本文提出了基于經(jīng)緯度-確診人數(shù)的傳染病風(fēng)險評估模型。該模型通過檢索指定城市一定范圍內(nèi)的城市,獲取范圍內(nèi)城市的經(jīng)緯度坐標(biāo),通過經(jīng)緯度坐標(biāo)計算出指定城市到各個城市的距離,并獲取各個城市的確診人數(shù),對各個城市的確診人數(shù)和各城市到指定城市的距離進(jìn)行線性變化和加權(quán),最終得到傳染病風(fēng)險指數(shù)。
6.1.2 計算方法
獲取指定城市經(jīng)緯度A(WA,JA),同時獲取該城市一定范圍內(nèi)的所有城市,計算各個城市B(WB,JB)到該城市的距離,計算公式如下:

從數(shù)據(jù)庫中讀取指定城市和各個城市的確診人數(shù)R。
使用計算獲得的距離和確證人數(shù),進(jìn)行線性變換和加權(quán),得到各個城市的傳染病疫情風(fēng)險指數(shù)Pn:

從前端可視化界面中選擇指定州的指定縣,獲取該縣近段時間累計確診人數(shù)、現(xiàn)有確診人數(shù)、累計確診人數(shù),以曲線圖形式展現(xiàn)。通過三種不同數(shù)據(jù)的時間變換,用戶能夠了解該縣感染情況。
隨著現(xiàn)代科學(xué)技術(shù)的發(fā)展,信息數(shù)據(jù)的急速擴(kuò)增,人工智能時代的來臨,數(shù)據(jù)就是價值的觀念逐漸得到認(rèn)可,大數(shù)據(jù)分析技術(shù)更是飛速發(fā)展。傳染病數(shù)據(jù)的分析通過對傳染病疫情期間各個地區(qū)的感染數(shù)據(jù)進(jìn)行計算與可視化,使用了批處理技術(shù),并且滿足實時性要求,能做到秒級更新數(shù)據(jù),具體頁面可視化效果好。同時,使用了增長態(tài)勢識別技術(shù)和基于經(jīng)緯度-確診人數(shù)的傳染病風(fēng)險評估模型對傳染病疫情數(shù)據(jù)進(jìn)行更為精準(zhǔn)、直觀的呈現(xiàn)。