韓行國,田 野,柯 鑫
(1.湖北省公安廳科技信息處,湖北 武漢 430000;2.湖北省楚天云有限公司,湖北 武漢 430076)
新型冠狀病毒感染疫情已經回歸到常態化的管理中,但是這場針對疫情防控的“戰爭”并沒有結束。為了內防反彈、外控輸入,同時也能夠發揮信息時代大數據技術的作用,需要構建關于涉疫人員的專題數據庫,助力疫情防控[1]。
在疫情防控的過程中,會出現很多種類繁雜的數據。除了確診人員的重要信息,更要密切關注密接和時空關聯人員的各種信息,以及日常健康上報、復工復產的數據等。此外針對醫護資源相關醫護數據、醫療設備等數據也需要統一規整起來。從各地調配的防疫物資不僅要檢驗質量也要根據之前的人員數據進行分配,根據需求變化進預測及采購等。而各種民生物資的價格調控、供應數據也都需要采集入庫,以預備疫情出現時,確保百姓的基本生活可以有所保障。
湖北省人口規模大、流動人口比例也大,為了實現對疫情的有效防控,有序開展復工復產,數字政府的建設工作尤為重要。大數據技術的作用正是在這些海量的數據中剝絲抽繭,發掘有用的信息,是疫情數據的分析利用的重要工具。
首先,通過對重要的“5 類人員”(確診、臨床、疑似、發熱、密接人員)數據、健康上報數據、基層摸排數據等疫情防控數據進行深層次挖掘,找到重要線索,提供預警;其次,結合醫護資源、物資分配、市場供應的數據,能夠為政府部門提供決策支持。
下面針對涉疫人員的專題數據庫框架設計與建設等方面,介紹基于大數據的涉疫人員專題庫的關鍵構建技術。
重大疫情防控工作需要國家的統籌安排及省部級單位的配合和實施。疫情防控過程中涉及的機構復雜、領域廣闊,產生的信息量巨大、信息內容豐富,僅依靠檔案行政管理部門完成數據管理非常困難,需要建立防疫專題數據庫協助行政部門進行信息管理。因此,基于數據庫技術研究一套省域涉疫人員專題庫,通過該數據庫構建湖北省疫情防控管理平臺,有助于加強省級政務平臺的信息化建設[2]。
省域涉疫人員專題庫是湖北省大數據能力平臺的重要組成部分,目標是通過專題庫建設一套基于涉疫人員信息分類的風險管控體系。
圖1 為專題庫的建設思路,專題庫是疫情防控體系中的核心。省域涉疫人員專題庫通過物理匯集當前的疫情防控數據、醫護資源數據、物資分配數據、市場供應數據,結合省大數據能力平臺人口、法人、醫療保障、市場監管等數據,構建疫情防控專題數據庫,實現全省疫情數據歸集共享,為省直相關部門和各市州防疫部門的疫情態勢研判和防控部署提供數據支撐,為社會公眾提供個人疫情數據查詢服務[3]。

圖1 專題庫建設思路
省域涉疫人員專題庫系統架構包括數據資源層、數據處理層、數據存儲層和業務系統層。
1.2.1 數據資源層
數據資源層是專題庫的數據來源,通過專用接口連接其他政務服務系統的數據。數據資源層可以匯聚多個來源的數據,能夠實現數據全面動態整合、及時獲取信息更新,數據資源包括政府官方網站數據、公安部門數據和企業上報的數據等信息。
1.2.2 數據處理層
數據處理層可以完成對數據的清洗、處理和轉換,使得數據滿足國務院發布的《疫情防控管理平臺工程標準》和省疫情指揮部業務流程和信息共享的需要。通過數據處理建立關系數據庫和非關系數據庫。
1.2.3 數據存儲層
數據存儲層基于Hadoop 分布式文件系統構建,能夠存儲海量疫情數據。在數據存儲層再實施相應的安全保障措施,保證數據隱私安全,并能夠向上層業務系統提供安全、可靠的數據訪問服務。
1.2.4 業務系統層
業務系統層通過統一的庫表和接口對政府部門和社會群眾提供數據查詢服務,完成重點人群管理、風險對象智能識別等工作,支撐湖北省健康碼平臺穩定運行。
省域涉疫人員專題庫對系統的性能和并發性有著很高的要求,不僅要滿足日常的查詢需求,還需要應對在專題庫使用高峰時刻巨大的并發量。如果優化設計不當,可能會造成系統崩潰宕機等問題,造成不好的社會影響。因此,采取了以下優化方法提高專題庫的系統響應速度和性能:①負載均衡技術。在楚天云服務平臺上部署省域涉疫人員專題庫,能夠將請求分攤到多個操作單元上執行,可極大增加系統的吞吐量,同時避免了單點故障的問題。②緩存消息隊列。為防止高峰期的訪問量過高導致專題庫崩潰,采用將信息先緩存到消息隊列,再持久化到專題庫中的方式,緩解數據上傳和存儲壓力,保證數據完整性。③分表存儲和查詢。對專題庫的數據表進行切分,減少單機數據庫的負擔,由多臺數據庫服務器一起分擔查詢請求,縮短查詢時間。④關鍵字索引。通過關鍵字索引加快數據的檢索速度,加速表與表之間的連接。通過使用索引,在查詢的過程中使用優化隱藏器,在數據庫內部完成數據處理和計算,提高系統的性能。⑤優化查詢語句。對語句進行預編譯,避免鎖死和檢索堆積的問題。一次編譯、多次運行,省去了解析優化等過程。
專題數據庫主要是通過建立疫情防控、醫護資源、物資分配、市場供應4 大子庫,為省疫情指揮部及各職能部門提供基礎性、戰略性的信息服務和決策支持。
省衛健委、經信、公安、交通運輸、通信管理、電信運營商等責任主管部門根據實際情況制定數據標準并提供至大數據能力平臺,原則上以格式化、可機讀為標準,各級責任主管部門負責數據的準確性。衛健委確診病例信息表(部分)如表1 所示。
對于這些物理匯集的各類疫情數據,基于省大數據能力平臺,形成疫情防控、醫護資源、物資分配、市場供應專題數據庫,按照政務資源共享機制,為省直主管部門及各級防疫部門、社會公眾提供數據支撐服務。
疫情防控專題數據庫主要包括“5 類人員”數據、移動軌跡數據、輿情求助數據、涉疫高危數據、疫情變化數據、復工健康數據等,其中輿情求助數據是通過鄂匯辦搜集的全省新型肺炎求助登記數據與居民健康上報數據,涉疫高危數據是抗疫志愿者、下沉基層公務員、近期在崗超市藥店及外賣人員數據。主要來源于衛健委、公安、交通、運營商、防控指揮部等多部門。
醫護資源相關數據主要來源于省衛健委,對采集入庫的省衛建委業務信息進行質量稽核,使來源人員業務信息與人口基礎信息對應,在此基礎上進行多源校核、檢查,實現醫護資源數據的全鏈分析,構建“一數一源”。將發現的信息質量問題反饋給信息提供單位,由部門依據管理機制通過業務手段對信息進行更正后再通過數據采集、維護流程提交。
醫護資源數據主要包括隔離收治數據、診療救助數據、醫護(含各省援鄂)人員數據、醫療機構資源信息、醫療器材信息等。
針對各類疫情防控物資所建立的分配數據庫,主要數據來源于省衛健委、發改、市場監督管理局等部門。對采集入庫的省衛健委、發改、市場監督管理局等部門業務信息進行質量稽核,將發現的信息質量問題反饋給信息提供單位,由部門依據管理機制通過業務手段對信息進行更正后再通過數據采集、維護流程提交。
物資分配數據依托于疫情物資平臺,主要包括各類疫情防控物資,特別是醫療防護物資(如口罩、防護服、護目鏡、消毒液等)的儲備信息、需求信息、調撥信息、現有產能、來源渠道等數據。
市場供應數據主要是當前各類民生物資(大米、食用油、豬肉、蔬菜等)的市場供應信息、物價水平、市場監管信息等,主要來源于商務廳及市場監管部門。對信息進行質量稽核,將發現的信息質量問題反饋給信息提供單位,由部門依據管理機制通過業務手段對信息進行更正后再通過數據采集、維護流程提交。
省直部門及各級防疫部門可以通過庫表共享、接口調用的方式,直接申請廳局源數據,開展數據查詢、數據校驗和數據訂閱服務,用以支撐疫情防控工作。
2.5.1.1 數據查詢服務
各級防疫相關部門可申請廳局源數據開展數據查詢,如利用公安戶籍信息、衛健委“5 類人員”信息、基層排查信息等,快速查詢人員基本信息,便于篩查工作開展;利用湖北省援鄂醫護情況、湖北省醫護人員情況,查詢其他省份來支援湖北省疫情防控的人員信息,并及時同步給國家;利用醫用防護物資需求清單、醫用防護物資缺口清單、醫療物資匯總表,查詢當前湖北省所有醫院的醫用防護物資庫存,及時發現缺口,調配其他資源進行補充;利用蔬菜生產保供情況、生豬生產保供情況、家禽生產保供情況、水產生產保供情況和飼料生產保供情況,查詢當前湖北省蔬菜、生豬等供應缺口,及時采取應急措施解決。
2.5.1.2 數據校驗服務
各級防疫相關部門可利用廳局源數據對現有數據進行校驗,如利用公安戶籍數據、車輛登記數據等對基層摸排數據進行校驗,提升數據精準度;利用省衛建委的醫院數據等對基層摸排部分醫療資源統計表數據進行校驗,提升數據精準度;利用省衛建委的醫用防護物資數據等物資需求測算數據、疫情防控重點物資需求測算進行校驗,提升數據精準度;利用商務廳及市場監管部門的各類民生物資數據等全省生活物資價格監測、各市州主要生活物資價格調控數據進行校驗,提升數據精準度。
2.5.1.3 數據訂閱服務
支持各級防疫部門訂閱相關疫情數據,如國辦密接人群信息、物資供應信息等數據,為疫情防控中的重點人員追蹤、物資分配等提供數據支撐;湖北省救治場所床位情況等數據,可為疫情防控中的病人床位安排等提供數據支撐;醫用防護物資分配清單(省本級及市州)等數據,可為疫情防控中的病人床位安排等提供數據支撐;全省生活物資庫存(儲備)銷售情況、各市州生活物資庫存(儲備)銷售情況等數據,可為疫情防控中的生活物資庫存管理等提供數據支撐。
2.5.2 關聯結果數據
基于疫情專題庫可進行數據橫向關聯,關聯結果數據發布后各部門按需申請,便于開展數據重點人員精準鎖定、疫情形勢研判、公眾個人疫情查詢。
2.5.2.1 密接人群關聯
將衛健委的“5 類人員”名單與公安戶籍數據進行橫向關聯,形成省內密接人群數據。各市州防疫部門可配合交通出行信息、運營商移動軌跡數據等,對重點人員進行精準追蹤,對重點區域進行嚴格防控。
2.5.2.2 疫情風險研判
根據衛健委提供的“4 類人員”數據、隔離收治、診療救助等數據,完成疫情相關指標的統計分析,便于各級疫情防控部門對當前疫情形勢、發展態勢進行研判,調整防控決策。
2.5.2.3 公眾疫情查詢社會公眾在鄂匯辦上成功注冊并完成實名認證后,可以通過鄂匯辦集成的疫情查詢頁面,在線查詢個人相關疫情數據,為社會公眾提供便捷的查詢服務。
基于省域涉疫人員專題庫實現了湖北省健康碼平臺的運行和維護,湖北省健康碼平臺已運行了2 年多時間,做到了“從未宕機、永不崩潰”。選取某一日的健康碼平臺的運行維護情況進行系統測試。
系統運行正常,主要業務系統運行日志良好。湖北健康碼小程序、省轉碼平臺、疫情防控數據分析平臺、疫情防控大數據平臺、武漢戰疫等主要業務系統日志運行良好。其中基于省域涉疫人員專題庫實現湖北健康碼總發碼量達到6 400 萬張,“武漢戰疫”總發碼量達到3 100 萬張。在24 h 內,全省亮碼次數達1 200余萬次,亮碼峰值時段為07:30—09:30;全省掃碼次數超190 萬次,最高峰值時段為07:40—10:10。
主要業務系統接口訪問情況正常。湖北健康碼小程序支付寶端亮碼接口總請求數為1 231 余萬次,平均每秒請求數為142.49 次,峰值每秒請求數為383.93 次;湖北健康碼小程序支付寶端掃碼接口總請求數為19余萬次,每秒請求數為22.06 次,峰值每秒請求數為70.22 次。武漢戰疫亮碼接口總請求數為2 200 余萬次,武漢戰疫掃碼接口總請求數為170 余萬次。系統在運行高峰時段也能夠在毫秒級實現響應,保障省內居民正常工作出行。
省域涉疫人員專題庫服務器運行情況正常。湖北健康碼政務云、公有云及專有云所有服務器均運行正常,武漢戰疫所有服務器均運行正常。湖北健康碼政務云部分共計使用66 臺云服務器,CPU(Central Processing Unit)最大使用率為92.66%、平均使用率為2.29%,內存最大使用率為91.86%、平均使用率為26.18%;湖北健康碼公有云及專有云部分共計使用90臺云服務器,CPU 最大使用率為3.25%、平均使用率為1.22%,內存最大使用率為26.51%、平均使用率為23.67%。武漢戰疫共計使用140 臺云服務器,CPU 最大使用率為22%、平均使用率為7.5%,內存最大使用率82%、平均使用率57%。
湖北健康碼政務云、公有云及專有云相關網絡設備數據流量及性能監測正常,武漢戰疫數據流量及性能監測正常。
2022 年1 月至今,楚天云網絡層入侵檢測/防護系統共為健康碼系統云上業務進行入侵檢測、防護376次。其中Web 入侵防護6 次,CC 安全防護8 次,掃描防護363 次。期間,楚天云主機防病毒軟件未檢測到健康碼系統互聯網應用或主機存在惡意病毒傳播及感染的情況。
省域涉疫人員專題庫作為湖北省大數據能力平臺的重要組成部分,通過建立疫情防控、醫護資源、物資分配、市場供應4 大子庫,實現了對疫情數據的全方位匯集、分析和管理功能,能為湖北省疫情指揮部及各職能部門提供基礎性、戰略性的信息服務和決策支持。基于省域涉疫人員專題庫開發的湖北省健康碼平臺,承受住了高并發量的訪問考驗,其健壯性和可靠性得到了實踐驗證,在疫情防控工作中發揮了重要作用。