石 偉
(山東省大數據中心, 濟南250100)
2013 年, 《中共中央關于全面深化改革若干重大問題的決定》中首次使用“社會治理”概念,明確提出要創新社會治理體制[1]。 《中共中央關于堅持和完善中國特色社會主義制度 推進國家治理體系和治理能力現代化若干重大問題的決定》中明確指出:堅持和完善中國特色社會主義制度、推進國家治理體系和治理能力現代化的總體目標是,到我們黨成立一百年時,在各方面制度更加成熟更加定型上取得明顯成效;到二〇三五年,各方面制度更加完善,基本實現國家治理體系和治理能力現代化[2]。要完成國家治理能力現代化的目標,其重點是實現政府治理能力的現代化。 提升政府現代化治理能力的有效途徑是提高政府科學決策、高效決策的水平,其基礎是數據資源的占有和分析。 大數據和AI 技術的發展,為政府整合、匯聚各類政務部門及社會數據資源,并從海量數據資源中快速、及時和穩定的提取所需要的數據信息,提供了手段支撐和技術保障。
各地城市大腦在交通疏導、一體化政務服務平臺等大數據實踐應用成功的本質,就是通過大數據+人工智能分析,實現相關數據的智能化匹配,提升信息處理快速性和數據傳播的精準性,用數據說話,用數據決策[3],從而提高政府的治理水平。
政府治理能力現代化在COVID-19 疫情期間的一個重要體現就是對人員流動的實時、精確檢測和預警能力。 中國經濟的高速發展,促使國內人員流動規模大量增加。 根據中國鐵路總公司歷年統計公報,鐵路旅客運輸發送量從2013 年的207531 萬人增長到2018 年的331740 萬人,2019 年1-10 月份人數為312616 萬人[4],年均增長率為8.13%。 人員的大量流動給COVID-19 “防疫控疫”工作帶來較大的壓力,各地方政府科學制定的各項防控政策都需要人員流動大數據的支撐。
(1)提升精準防控能力的需要。 “防疫控疫”工作的重點在“防”,在“控”,核心是精準。 只有掌握精確到個體的人員流動檢測數據,各級政府部門才能有的放矢的集中人力、物力對重點人員、高危人群進行重點防控,并提供相應配套服務,減少時間成本及物資成本。 全國各地區以社區為基礎開展的拉網式人員登記工作,其主要目的就是掌握轄區內人員信息和流動信息,以便于實施精準防控,提高整個防疫控疫工作效率,減少疫情感染人數,縮短疫情時間。
(2)提升基層工作能力的需要。 跨地區聯防聯控、群防群控工作的核心是重點人員和高危人群的防控工作。 全國部分地區(HB 省除外)采取的以社區為中心的手工作坊式的人海戰術,通過填寫表格及打電話等傳統方式進行人員登記及排查,增加了基層工作壓力,登記的信息時效性差,數據精準性不高,漏報漏登情況時有發生,整體工作效率及工作能力不能滿足工作的需要。
(3)提高精準施策能力的需要。 各級政府在制定聯防聯控、追溯病源、資源調配及預測防控等相關政策時,需要人員流動大數據的實時分析和挖掘結果來支撐政策制定的針對性,需要大數據的計算能力及模型分析能力來提高政策實施的精準性,提升政府治理能力來減輕防疫控疫工作壓力。
習近平同志在《完善重大疫情防控體制機制 健全國家公共衛生應急管理體系》的講話中明確提出“要鼓勵運用大數據、人工智能、云計算等數字技術,在疫情監測分析、病毒溯源、防控救治、資源調配等方面更好發揮支撐作用[5]。” 本文以S 省人員流動檢測能力平臺在疫情期間的應用為例,通過實踐證明大數據在政府治理能力提升方面的支撐作用。
人員流動大數據檢測服務平臺通過數據清洗、智能核對等數據治理手段,充分匯聚政務部門、企事業單位及互聯網企業的數據資源,依托本身的大數據分析和挖掘工具,為各級政務部門提供實時、精準的人員流動軌跡數據及可視化展示平臺,為S 省政府制定精準的防疫控疫政策提供了平臺保障和數據支撐。
人員流動大數據檢測服務平臺采用領域驅動設計(DDD)[6]方式,以業務需求為導向,基于微服務框架設計[7],在減少各微服務模塊之間的耦合性,提升整個平臺的穩定性、可靠性及高并發性的基礎上,加大結構化、非結構化數據的分析和挖掘能力,適應人員流入大省大市對人員信息的集中采集、精準防控的工作的需要,提供大數據分析、決策支撐平臺及可視化展示功能,確保各政府部門精準施策,提高政策實施效率及人力、物力應用效率。 整個平臺技術架構如圖1 所示。

圖1 平臺技術架構Fig .1 The technical architecture of the platform
從應用的技術角度,整個平臺架構從上到下共分為用戶層、應用層、服務層、數據層及存儲層等5層。 其中存儲層為基礎設施層,提供底層的存儲、操作系統及網絡環境。 數據層根據結構化數據和非結構化數據[8]調用頻率不同,調用不同的MPPDB 數據庫支撐,提高系統的快速反應及服務能力;依托共享交換平臺,通過Kafka 流式數據采集功能[9],將MPPDB 數據庫及外部數據中的數據文件實時采集到SPARK streaming 數據庫[10]中,為數據資源引擎提供大數據支撐。 服務層依托SPRING CLOUD 微服務框架技術[11]及數據資源引擎等前沿技術為數據采集、服務管理、輔助決策和可統計、分析、決策、告警及可視化展示支撐等提供服務。
人員流動大數據檢測服務平臺能夠實時、快速的為各級部門提供防疫控疫工作所需要的精準人員信息數據,其核心是對表1 中所列異構數據源數據的快速治理、匯聚,通過大數據分析、人工智能等技術快速生成人員定位及告警信息,并通知信息數據需求方。 整個大數據分析支撐框架如圖2 所示。

表1 數據資源表Tab. 1 The table of data resource

圖2 大數據分析支撐框架Fig .2 Big data analysis framework
數據資源匯聚功能中采用GDS 實現并行數據庫與關系型數據庫之間的數據批量導入導出功能;采用Sqoop 組件[12]完成HDFS 之間的數據拷貝,以提高異構數據庫之間的數據快速交換效率。 數據資源計算引擎功能中采用SPARK 內存級流計算引擎[13],通過Pipeline 分布式執行框架、謂詞下推智能過濾掃描和Tensorflow 神經網絡計算[14]等技術,實現重點人員的智能定位及告警推送。 數據展現功能中,實現重點人員及高危人群信息對社區及街道工作人員的報警,又通過數據展示平臺實現人員軌跡展示及趨勢預測展示。
(1)人員流動軌跡大數據模型分析。 人員流動軌跡大數據模型主要是匯聚交通客運數據、電信運營商及微信、支付寶等基于位置服務的數據(LBS 數據),通過手機信令和LBS 數據等包含地理信息及時間信息的數據,利用spark 大數據分析[15]和Modeler、Knime 數據挖掘工具,繪制重點人員的流動軌跡,同時根據確診病人24 天內的移動軌跡及較長時間內伴行人員的移動軌跡,分析推斷出可能的密切接觸者名單。 為各級政府部門提供精確的重點人員及高危人群名單,既為基層的精準防控提供數據支持,也為預測高危地區和潛在高危地區提供有力依據。
(2)疫情態勢預測大數據模型分析。 疫情態勢預測大數據模型主要是通過對確診病例個體、疑似患者個體及密切接觸人群等數據和新增疫情病例信息、位置信息等數據進行多維度的智能分析,借助傳播動力學模型、動態感染模型、回歸模型等大數據模型和技術,預測發病熱力分布、密切接觸者的風險熱力分布及疫情走勢分布等信息,促使政府各部門有針對性的分地區強化衛生消毒措施,提前部署防疫資源,有效的避免疫情的局部爆發和多點爆發。
A 市是S 省下轄的一個地級市,全市有600 多萬人口,屬于勞動力輸出型城市。 以S 省部署的人員流動大數據檢測服務平臺為基礎,為A 市政府在重點防控、物資調配等方面精準施策提供跨區域漫入漫出不同類別人員及病例個體、高危人員移動軌跡的數據支撐,提升A 市在協同調動、風險研判等方面治理能力。
(1)基于重點人員流動報警應用場景。 人員流動大數據檢測服務平臺將會根據全省人口信息基礎庫及A 市公安部門戶籍人員信息,依托人員流動軌跡大數據模型,按照時間統計半徑,統計出近三十天內乘坐火車和民航等各類交通工具進出重點疫區的重點人員信息,針對近十四天內遷徙到A 市的高危人員通過手機短信、電話等方式進行報警。 同時平臺將高危人員的姓名、聯系方式、家庭住址等詳細信息下沉到各街道及社區,確保街道工作人員和社區網格員能夠及時聯系到該高危人員,并提供相應防控措施。
A 市政府還依托疫情態勢預測大數據模型,對重點區域加強衛生防疫措施,提高物資調配配比,有效的避免二次疫情的爆發。
(2)基于移動軌跡的信息發布應用場景。 人員流動大數據檢測服務平臺依托人員流動軌跡大數據模型,實時分析描繪出病例個體感染期間的具體移動軌跡(該軌跡可以精確到分鐘),并及時向社會公眾發布,保障了公眾的知情權,提升了政府的公信力,避免了社會的恐慌情緒,綜合提高了政府治理能力[16]。
政府治理能力是一種綜合能力[17],不單體現在應對公共安全事件的風險治理能力上,還體現在風險研判能力、協同調度能力、監督執紀能力及公共服務能力等方方面面的能力上。 政府治理能力也遵從木桶原理[18],最低的一塊就是政府治理能力的凹點。 提升政府治理能力就是改進政府治理能力的凹點。 大數據作為一種資源,也是一種新的技術手段,更是一種能力,其提升政府治理能力的本質在于應用及優化。 針對政務治理能力的凹點,應用大數據手段完善凹點,優化凹點工作流程,就可以提升整體的治理能力水平。
目前大數據在政府應用及優化工作流程方面遇到了一定的困難,主要表現在:
(1)缺乏大數據應用特別是政務應用立法,沒有從法律層面規范政府、企事業單位、社會組織及個人數據資源匯聚和應用方面的權利及義務[19],也沒有規范各類大數據,特別是個人隱私數據的應用范圍。
(2)大數據資源共享應用缺乏頂層設計,為共享數據而共享數據,缺少統一的數據應用口徑,政府各部門之間的數據共享[20]不融合,降低了大數據資源利用效率。
(3)政府大數據應用管理和決策配套體系不完善,重復投資和浪費資源情況依然存在。
(4)政府人員大數據技能培訓體系缺失,大數據應用意識缺乏,技術人才重視程度不高,懂業務應用及大數據技術的復合型人才短缺,無法形成體系化的大數據應用氛圍。
(1)加快大數據立法,為大數據應用提供基礎保障。 中國2017 年6 月1 日施行的第一部規范網絡安全的基礎性法律——《網絡安全法》[21],重點關注的是網絡安全及個人數據泄露等方面,缺乏大數據治理能力方面的“憲法性”法律或法規。 全國部分省、直轄市陸續出臺了《大數據發展條例》[22]等地方條例,重點關注的是數據資源應用、共享及安全方面,在治理能力方面涉及較少。
(2)統籌完善大數據管理應用機制,補齊政府治理能力短板。 山東、重慶、福建、浙江、吉林、廣東、廣西、貴州等8 個省份在2018 年的省級機構改革中組建大數據管理機構[24],但各省大數據管理機構的方案各不相同,組織架構區別較大,各項實際工作中缺乏業務抓手,大數據資源獲取能力及大數據資源供應能力與實際需要存在差距。 統籌完善大數據管理機制,理順大數據管理機構與政務大數據生產部門之間的關系,暢通數據資源生產→數據資源治理→數據資源應用通路,提高大數據資源融合水平,徹底解決大數據在治理能力方面存在的“干強枝弱”、“數據少重復性應用多”等問題,強化政府基層治理能力,補齊政府治理能力短板。
2020 春節期間突如其來的COVID-19 疫情,是對全國各級政府治理能力一次大的考驗。 在這次考驗中,網上辦、掌上辦、視頻會議等不見面辦公手段不斷涌現,滿足了政府部門、企事業單位日常辦公的需要,確保了全國經濟的基本運行。 云計算、大數據、人工智能等技術在加快病毒基因序列測算、防疫控疫、物資調配、監督執紀和復工復產等體現政府綜合治理能力的各項工作中提供了技術保障和手段支撐,節省了大量行政運行成本和時間成本。 相信在我黨的堅強領導下,大數據在提升政府治理能力上的價值將進一步凸顯,期待在大數據的推動下,我國社會主義治理體系和治理能力現代化早日實現。