鄧子云
(長沙商貿旅游職業技術學院 湘商學院,湖南 長沙 410116)
面對2020年初新型冠狀病毒肺炎肆虐這一重大疫情(以下簡稱新冠肺炎疫情),大數據技術在疫情管控中發揮了重要作用[1],然而也暴露出諸多的問題,如數據資源整合不夠、解決方案不足等[2]。為此,應當從單純的大數據技術應用,上升到數據治理的高度去看待如何對重大疫情做出有預備的、系統的應急處理,從而實現應急領域治理體系與治理能力的現代化。所謂數據治理指使用數據的一整套管理行為,這套行為能系統地發揮出數據的作用,在組織中促進工作、解決問題、提升效能。重大疫情數據治理的問題與對策研究思路如圖1所示。

圖1 研究思路
對于數據治理的研究已有不少,技術與治理框架日趨成熟,但仍是當前的研究熱點[3]。在掌握大量的數據后,人工智能、區塊鏈等前沿技術被逐漸廣泛運用在各種場景,如政府決策、企業管理、行業分析等[4]。有學者提出了多種數據治理的框架,如將PDCA(Plan-Do-Check-Act,計劃-執行-檢查-處理)管理思想引入大數據治理框架[5]14-20;又如從政務大數據角度提出政務大數據治理框架[6]67-72等。這些框架對重大疫情的數據治理有一定的指導意義,并且在一些觀點上具有共識,如數據治理要通過技術和管理相結合形成框架、專用領域應當有專門的數據治理框架等[5]14-20,[6]67-72。
應用大數據、人工智能等前沿信息技術在應急數據共享[7]、物資配置[8]等方面已有一些先行案例。有學者提出應用大數據決策支持模型來支持指揮中心調度[9];提出建立大數據中心、建立數據模型來支持應急領域的各種應用需求[10-11]。有學者指出大數據、人工智能可以運用在指揮調度[12]、物資管理[13]等方面。而專門針對重大疫情應急處理的大數據管理研究還不多見,僅有針對疫情管控需要而提出或研發的各種信息系統、實驗平臺[14-15]。目前,在CNKI(China National Knowledge Infrastructure,中國知網)中有學者提出大數據治理的通用方法論框架[16]、城市治理現代化框架[17]和針對重大公共衛生事件的“5WHR”數據治理概念框架[18]有一定借鑒作用。
綜上所述,有必要建立重大疫情數據治理框架,從數據治理的理念和視角來看待重大疫情需要解決的問題并提出對策。
2020年初發生的新冠肺炎疫情,在1月和2月上旬,由于數據治理的理念、前沿信息技術沒有得到發揮,疫情一度十分緊急,公共管理問題也時有發生。在2月下旬及之后,大數據、人工智能技術在疫情管控中的作用開始顯現,通過統一指揮及疫情數據平臺的應用等取得了顯著的數據治理成效[19]。
目前,大數據技術在疫情管控上主要應用在應急指揮調度、物資管理與調撥、疫情分析與預測、疫區人員流動管理等方面,已涌現出大數據技術支持抗疫的一些典型案例,如三大通信運營商(中國電信、中國移動、中國聯通)通力合作,研發出人員動向管理查詢軟件[20];鐵路系統提供有病例的車次查詢接口及軟件[21]。一些大型互聯網、移動互聯網平臺企業(如網易、360等)發揮APP、互聯網平臺用戶群體巨大的影響效力,利用部分人工智能技術收集數據并形成應用后提供很多功能給廣大民眾使用,如疫情日報、確診小區查詢、同程查詢、辟謠等[22-23]。華為公司為武漢的方艙醫院提供了先進的5G技術支持[24]。京東集團發揮物流平臺的信息化及運營效率高的優勢,幫助轉運和調度救援物資[25]。阿里云利用人工智能技術幫助醫生快速診斷病情[26]。
有媒體報道指出此次新冠肺炎疫情暴露出我國應急領域數據治理上的不少問題。例如,數據分散、各自為陣,救援物流調度效率低下,信息技術支持能力較差等[27-28]。
重大疫情管控需要的數據來源渠道很多,而且數據之間有較強的關聯性,需要整合才能發揮效用。從此次新冠肺炎疫情已有的報道和大數據服務案例來看,對部分數據資源已作了一些整合,但由于數據平臺和應用系統是由臨時組建的合作研發團隊建立的,所以用信息化手段整合的數據只涉及少數幾個政府部門、企業、醫療機構,雖已形成一些應用,但明顯數據資源的整合力度與應急管理、數據治理的要求相去甚遠。
1.核心的醫療及病人數據、政務數據之間缺乏集成。當這些數據用于根據親屬關系排查確診病例、疑似病例的密切接觸者時有重要的參考價值。指揮調度決策和提供救治服務時也需要掌握醫療及病人的數據。例如,為臨時的新冠肺炎病人收治醫院準備足夠數量的后勤物資儲備,預測醫院的建設規模及醫務、工勤人員的配備數量。
2.社會公共服務的數據缺乏集成。此次新冠肺炎疫情的管控上,采取了一些緊急措施。由提供公共服務的企業(如鐵路公司、民航公司等)開放數據接口并直接提供應用[20-21],一些大型互聯網、移動互聯網平臺企業再借助與公共服務企業的數據接口研發新的功能供廣大民眾使用[22-23],如廣大民眾在APP中可查詢是否與確診病例坐過同一趟公共交通工具、是否在同時間段去過同一個公共場所等。但這些都需要廣大民眾主動查詢,發現有接觸史后再進行自我隔離并上報,存在遺漏的可能。應當做到數據集成后由指揮平臺直接獲知,并安排工作人員配合軟件系統作位置跟蹤及排查處理。
3.大數據平臺型企業發揮的作用不夠。重大疫情不同于普通商業應用,應當在一定可控和安全范圍內允許獲取大數據平臺型企業的可用于重大疫情管控的數據。以人工智能、數據挖掘、海量數據快速存取等技術作為支撐,大型互聯網、移動互聯網平臺企業的社交數據、位置信息、通訊記錄等數據均可用于重大疫情管控。
重大疫情防控要應對的是臨時的社會公共突發事件,事先很難預估,因此必不可少的會需要快速產生臨時應對的數據技術方案。這種臨時應對的數據技術方案分為兩種:一種是事先數據技術預案,即這種預案事先已準備好,可根據臨時發生的情況來選用;另一種事先沒有準備,需要臨時制定。
1.事先數據技術預案準備不充分導致臨時數據技術方案出臺不及時。在重大疫情數據的集成及軟件應用上,盡管在軟件工程中有快速原型法、迭代式開發等方法可用來快速開發軟件,但由于研發需要有一定的周期,很難在數天的時間里快速形成。因此,重大疫情的數據治理需要針對各種可預料的情形準備若干套應對的數據技術預案,緊急事件一旦發生就馬上可用于實施;其次,由形成數據技術解決方案的各個組織機構共同組成應對小組,針對緊急事件制定出臺數據技術解決方案。
2.缺乏對重大疫情下各種數據治理場景的應急演練。不能只作醫療單位配合下的簡單場景演練,應當讓各政府部門、企事業單位、部分民眾共同參與演練。
3.缺乏對數據治理的研究及成果利用。疫情發生后,國家科技部及各省份的科技部門臨時啟動了有關疫情的科研專項。這些項目中也有一些大數據、人工智能的應用研發,研發成果給予疫情管控工作一定的支持。各級社科研究機構、各種智庫、政協、民主黨派也開展了疫情的社科理論和應用研究,并及時向各級黨委、政府獻計獻策,為新冠肺炎疫情后的企業復工復產、大數據技術應用、物資調度等工作提出了許多真知灼見。然而,研究工作有一定的時間周期,絕大多數無法立即取得成果并投入應用,數據治理則更是一套體系的運作,不是簡單的技術應用。
1.應急管理部門對重大疫情的數據資源統籌能力弱。重大疫情涉及的政府管理部門有應急管理部門、衛生健康部門等,還有許多公共事業單位(如疾控中心、醫院等)。由于各級政府的應急管理部門成立時間較短,對數據資源的掌控能力有限,用于重大疫情應急管理的信息系統尚處在建設中或起步階段,致使沒有平臺能對重大疫情具備數據資源統籌的能力,也沒有信息平臺作為支撐進行統一指揮調度。
2.數據資源管理水平低。有了數據的積累和應用軟件系統后,還要輔以管理體制機制的配合,才能擁有擅用軟件系統的能力。例如,建立人員流動管控系統,通過該系統了解疫區所有人員的流動情況,一旦有人離開疫區就自動報警。運用這樣的系統需要合適的體制機制來管理和協調三大通信運營商、互聯網和移動互聯網平臺型企業、地理信息系統供應商、系統集成商,促使各方緊密合作,共同抗疫。
3.數據治理的法律法規不健全。應在立法上授權重大疫情期間在必要范圍內可集成各種數據資源以服務于疫情管控,同時又能保證隱私數據安全,這些數據包括但不限于個人位置數據、社交關系等。
下面提出一種重大疫情下的數據治理體系框架(見圖2)。
1.醫療及病人數據的來源。有的數據(如X光片、心電圖等)帶有很強的專業性,普通的結構化ER(Entity-Relationship,實體關系)關系并不能描述,且由于醫學圖像尺寸過大,互聯網傳輸會有所延遲。病人涉及的醫療保險數據來源于人力資源與社會保障部門。目前,絕大多數城市的醫療保險定點醫院已經與醫療保險中心建立了數據網。

圖2 重大疫情下的數據治理體系框架
2.人員流動管控用到的人口和家庭關系數據的來源。人口數據來源于公安部門,這些數據主要是家庭的戶籍數據。人口的婚姻關系登記數據來源于民政部門。隨著各級政府的機構改革和電子政務工作的推進,有不少地方政府成立了數據資源局或專門的電子政務機構,對分散在各政府部門中的數據作了資源整合,可以較為方便地進行數據交換。
3.位置和公共出行數據的來源。在提供公共服務的國有企業中,掌握著許多重大疫情管控需要的數據。三大通信運營商掌握有移動通信用戶的信息,包括客戶的基本數據、通訊記錄、位置信息等。鐵路、民航、海運等企業掌握有交通出行數據。城市的公共交通部門掌握有市民的公交、地鐵出行數據。
4.互聯網、移動互聯網平臺企業掌握的數據。互聯網、移動互聯網平臺企業掌握的用戶數據可以為重大疫情的管控所用。例如,用戶的位置信息、用戶的社交關系、用戶上報的健康情況數據等。社交軟件QQ、微信既可記錄位置又能即時通訊,還可加掛許多功能應用。
1.重大疫情數據集成平臺。通過這種平臺可集成來自各種數據接口、數據源的數據。平臺應建立在重大疫情大數據中心,并為大數據中心的其它軟件系統提供統一的數據使用接口。但并非所有的數據都要集成到數據中心,如醫學的影像數據尺寸特別大,都集中存儲到重大疫情大數據中心并不現實,只要有接口可以在需要時能調用到即可。
2.重大疫情大數據中心。應面向各種應用主題建立數據集市或主題數據庫,如面向醫療衛生用戶建立醫療衛生數據集市,用于查詢各種病例數據、分析用藥及藥效數據、輔助新藥作大數據分析等。通過從通信運營商、公安、移動互聯網平臺、公共交通部門(公交、地鐵、民航、鐵路、航運等)等集成來的數據,建立位置通信數據集市,便于管控確診病人和疑似病人的出行,廣大民眾也能夠查詢與病人和疑似病人的同行情況。通過集成公安部門的戶籍數據和各種社交平臺的社交數據,可得到公民的社會關系數據、所在位置的精確定位,用于分析、排查確診病人和疑似病人的密切接觸人群,還可用于作傳染病學的傳染關系分析。
應用層的各種應用軟件系統為不同的用戶提供特定的應用功能。疫情上傳系統可用于各單位上報疫情并傳遞各種疫情管控的內部公文、通知、公告等。疫情發布系統可用于統一發布疫情信息,并提供給其它系統獲取重大疫情數據的Web服務接口。物資調度系統可用于交換、統計各種防疫物資的缺口,并與各大物流平臺建立物流數據接口,支持招投標、直接委托物流等業務的線上操作。流動管控系統可在GIS(Geographic Information System,地理信息系統)系統的基礎上,建立可視化的病例和疑似病例分布圖,利用電子圍欄、主動推送信息等技術手段監控人員的流動。交通協調系統可根據在各種公共交通系統中獲得的出行數據得到病人和疑似病人的出行軌跡,及時公告甚至是主動提醒同行人員注意疫情;必要時,可緊急通過該系統及時對接各方,臨時承擔公共事業運輸任務。輿情管控系統可用于獲取互聯網的軟文、評論等數據,然后運用人工智能技術分析公眾的情感偏向、參與人數等。疫情預測系統可利用機器學習、深度學習等人工智能技術,對重大疫情發展的趨勢進行預測。
在更高的層面對重大疫情進行管控,組織進行重大疫情的指揮調度、應急演練,并吸收部分民眾的共同參與,以達到良好的治理成效。
1.數據技術規范和前沿信息技術的應用。在接口層和數據層建立重大疫情的數據技術規范,包括用于數據交換的各種數據集成接口數據規范和重大疫情大數據中心數據規范。為便于知識管理及數據推理,還可以建立語義規范。在積累了大量的數據后,大數據、人工智能等前沿信息技術就能發揮作用,建立多維數據模型、機器學習模型、擬合數據規律公式等。
2.重大疫情法律法規體系。各種軟件系統、應急指揮調度和演練等疫情防控工作的順利推廣實施離不開疫情管控的法律法規。例如,重大疫情下對隱私數據保護的等級規定,在不同的疫情防控等級下對人員流動管控的規定等。
3.先進的治理模式。使用眾包模式,可將“舉報確診病例私自出行”一事放入APP中,由廣大民眾實名舉報,一經核實即可獎勵舉報人;如果沒有得到核實,也可以給民眾以答復;如果舉報人是惡意舉報,還可以進行懲戒。使用競賽模式,可將要解決的重大疫情管控問題拋給市場,由企業、團隊以競賽方式提出解決方案并予以實施,根據問題解決的績效給予獎勵。
1.成立抗疫領導機構。由于抗疫工作涉及的政府部門、事業單位、公共服務機構、企業數量眾多,因此,應當相對明確各自的職責分工,以便統一調度。在黨的領導下,堅持專業人士調度專業事務,行政人員調度行政工作的原則,由前述單位共同組建抗疫領導機構,平時分散合作,抗疫期間集中辦公。
2.在抗疫領導機構下設立數據治理工作組。工作組由計算機、醫藥信息、人工智能、政府治理、輿情管控、通信技術等跨學科的專家組成,即數據治理專家顧問團,提供數據治理的專業建議,編制數據治理科技攻關項目指南,制定重大疫情數據規范。吸收應急管理、數據資源(或電子政務)、公安、科技、衛生健康、大型公立醫院、通信管理、通信運營商、公共交通(民航、鐵路、交通等)、大型互聯網公司、大型移動互聯網公司的專業人士參與,各自承擔數據接口研發、數據集成,應急行政工作、醫療衛生處置工作、聯系專家顧問團、統籌電子政務及數據資源工作,依托已有的電子政務中心運維重大疫情大數據中心的基礎軟件、硬件和網絡系統。
1.在重大疫情大數據中心建立多維數據模型。參照數據倉庫的建設模式,建立多個支持多維數據、歷史數據、海量存儲的數據集市,包括但不限于醫療衛生數據集市、位置通信數據集市、戶籍社交數據集市等。此外,在重大疫情大數據中心還應建立數據技術規范,在數據集成平臺建立與各方數據交換的技術規范。
2.堅持集成數據的3條原則。一是實用性原則。應按數據應用的需求來設計數據接口集成數據,不必抽取各數據來源方的全部數據。二是建章立制原則。應出臺數據隱私保護及數據通信的法律法規,對涉及個人隱私的數據(如位置、社交數據等),在沒有疫情時確保數據通道暢通、可交換測試即可;在重大疫情期間,應有法律法規允許并在對公眾屏蔽了敏感數據的前提下使用該數據。三是數據等級保護原則。可分為“公共-受保護的-機密-核心機密”等多級數據,將不同等級的數據開放給不同使用范圍的人員使用。
1.加快軟件系統的研發。應組織研發的應用軟件系統包括但不限于疫情上報系統、疫情發布系統、輿情管控系統、抗疫物資調度系統、醫療管理系統、交通協查與調度系統、疫情大數據分析系統、抗疫指揮系統等,同時建立呼叫系統、視頻會議系統、短信系統等,集成以上應用系統形成全國統一的疫情管控平臺。
2.開展數據治理的科學研究。在科技計劃、社科基金等項目中設立疫情管控信息技術、數據治理研發專項或指南條目,支持科研人員開展研究;支持軟件企業研發軟件產品;支持開展醫學、軟件工程、大數據、人工智能、政府治理等學科作交叉研究;支持先進信息技術(大數據、云計算、物聯網、5G、人工智能等)在抗疫醫療、政府決策參考等方面的應用型研究。對公共交通企業、通信運營商、大型互聯網和移動互聯網平臺等與抗疫緊密相關的企事業單位優先支持其開展重大疫情數據治理的專項研究,并迅速將其研發成果投入應用;允許在應用的過程中用快速原型法、迭代法等軟件工程開發方法不斷完善數據接口和應用功能,逐步提升軟件質量。
1.對數據治理體系進行演練。重大疫情的數據治理系統必須要進行演練,以測試其建設成效及存在的問題。演練不應只針對醫療體系,而應對整個體系中的各要素、各環節進行全面演練。
2.演練應定期進行并遵循一定流程。在建成重大疫情大數據中心后,至少每隔一年進行一次重大疫情演練,模擬疫情發生的各個環節進行應急處置。遵循發現疫情→緊急上報→啟動疫情級別響應模式→啟用應急平臺各大應用系統→指揮調度→發布疫情→交通管控→人流管控→物資調度→輿情分析與管控→解除各種管控的演練流程,由抗疫領導機構及各工作組各司其職進行操作。
3.演練時應一并測試群防群控系統。可讓部分民眾通過APP、互聯網平臺、電話等在線渠道參與到重大疫情防控演練中來,測試基層的各種業務流程,發現并預防出現過度防控、濫用職權等問題。
1.補齊法律法規短板。建議補充出臺《重大疫情防治條例》《重大疫情下公民信息數據隱私保護與征用規定》《重大疫情下抗疫物資調度規定》等條例或部門規章。
2.應用先進的治理模式。重大疫情發生后可應用的先進治理模式有很多種,這里列出其中的3種及其應用場景示例供參考。一是眾包模式:將疫情管控的部分工作通過APP在可控范圍內(如某街道的共產黨員群體)進行傳播并外包。二是競賽模式:將疫情管控的緊急科研任務通過移動互聯網征集研發單位,規定在指定時間內快速研發成型,對參與研發的組織、團隊按研發成效給以獎勵或回報。三是隨手拍模式:由疫情管控監督人員隨手對問題用手機拍照后上報疫情防控系統,再協調整改疫情防控工作。
本文梳理了我國在此次抗擊新冠肺炎疫情中出現的數據資源整合度低、應對方案不足、管理漏洞多的問題,提出了一種重大疫情下的數據治理體系框架。該框架包括接口層、數據層、應用層、治理層及輔助部分。由此,解決我國重大疫情下數據治理問題的5點對策分別是:成立抗疫領導機構并設置數據治理工作組;在重大疫情大數據中心建立多維數據模型,堅持實用性、建章立制、數據等級保護3條原則;加快應用系統的研發,開展數據治理的科學研究;對數據治理體系進行定期演練,同時測試群防群控系統;補齊法律法規短板,應用眾包、競賽、隨手拍等先進的治理模式。