朱涵鈺
(華北水利水電大學 管理與經濟學院,鄭州 450046)
2015 年以來,國務院相繼下發《促進大數據發展行動綱要》和《推進“互聯網+政務服務”開展信息惠民試點實施方案》等文件后,我國政務信息化發展從共享交換時代進入大數據時代。2020 年,《中共中央、國務院關于構建更加完善的要素市場化配置體制機制的意見》明確將數據作為與土地、勞動力、資本、技術四類要素同等的第五類生產要素,同時還指出要通過推進政府數據開放共享來提升社會數據資源價值。數據是數字經濟時代的新型生產要素,其生產價值已經在各個行業凸顯出來。
從借助高分辨率衛星影像等新的數據源,到人口普查記錄等傳統數據集,政府部門擁有的數據比以往任何時候都要多。針對海量數據的收集、分析和使用的新型管理方法正在改變著政府機構的業務流程和為社會大眾服務的方式。政府機構部門眾多,其業務流程不同、參與主體不同、所需的信息技術基礎架構也不同。在對政府大數據的利用和維護過程中,既要參照不同的業務標準,又要兼顧其獨特的業務流程需求。
當前,各地把政府大數據建設作為推動政府治理體系和治理能力現代化、促進經濟社會發展的重要抓手,紛紛成立了大數據管理部門,并制訂了地方大數據發展行動計劃,從數據質量、數據安全、數據應用、共享開放與相互操作等方面展開工作并取得了一定的成效,但仍還存在諸如大數據思想意識不成熟、管控碎片化、責權不明晰等困難。如何重構政務數據治理思維,提升政務數據治理的合理性及邏輯性,做到有效提升數據治理的能力,還需要大數據治理的思想和手段。
大數據是大規模或超大規模的數據資源的集合,也稱海量數據,以數據規模大、處理速度快、數據類型多、價值密度低、數據準確性低為主要特征。在構建、使用和管理大數據的過程中,政府承擔著公共責任,是大數據的主要擁有者。政府大數據是通過大數據技術整合與公共事務和政府事務相關的數據,并將其應用在政府業務領域,以支持政府機構的業務需求,同時提升政務服務的能力。政府大數據包含了政府開展工作過程中產生的內部數據,以及因管理服務需求而采集的外部數據,包括自然信息、城市建設、城市管理、民生消費等。
大數據治理是綜合利用計算機科學、數據科學、公共管理學等多學科知識和技能,對海量數據的集中管理,有組織、有計劃地開展數據識別、政策制定、問題識別、數據評估、數據監督、數據交換等各項活動(見表1)。這些活動之間核心的底層邏輯是基于數據資產化的思路。也就是說,加強政府大數據治理的頂層設計首要問題是將數據視為政府所擁有的戰略資產之一。從關注數據資產利用的視角展開對數據的識別、利用、評估和監督等。

表1 政府大數據治理的關鍵活動
要實現對數據資產的有序治理和高效利用,讓數據發揮其支撐政府部門做出具有時效性、現實性、精準性的管理決策的核心作用,數據治理應遵循三項關鍵的原則。第一,政府大數據治理應具備立法職能(包括標準文件和政策)、司法職能(解決問題或違規的過程)和行政職能(行政管理和持續提供服務)的責任。這些責任在各個組織單位中通用,符合共享決策的總體數據治理原則。第二,政府大數據治理應實現多層級一致性的管理模式。大數據治理包括更廣泛的國家治理以及地方一級的政策制定和計劃,因此,應保持從中央政府到省市縣各級地方政府在各區域、各行業中對數據治理運作的方式相同。第三,參與實施治理的立法和執行的各職能部門之間的職責應相對分離。大數據治理應當遵循政府治理的一般科學規律,政府應將負責治理相關的立法部門和執行大數據治理各部門分離開來,以制衡管理執行過程中權力分配,提升數據治理的執行效能。
組織內缺乏數據文化已經成為數據治理領域排名第一的非技術障礙。Gartner 發布的《CDO 成功構建數據驅動型組織的10 種方法》一文中也指出,數據素養是數據與分析領導者面臨的障礙之一,不改變組織內部對話,就無法改變組織的行為。目前,不論是政府機構還是企業領域,都還普遍存在對大數據及其效能的片面認識,不能深刻理解數據編目、數據清洗、數據分析在保障數據的完整性和準確性方面發揮的關鍵作用。政府機構的多數人員更關注其傳統業務的操作和執行,對新興技術缺乏全面的、深刻的理解,形成了在機構內部及跨部門之間對數據治理工作上投入的人力成本、資金成本,以及時間成本很難產生共同愿景和理解,阻礙了數據素養的提升和數據文化氛圍的形成,降低了數據治理工作執行的效率。
近年來,我國各級政府對數據資產化的管理意識有所提高,但重視程度依然較弱。自2010 年至今,全國共出臺了125 份省級政府層面與政務數據治理直接相關的政策文件,其中接近半數省份出臺的相關政策文件數量都少于三份。實踐中,數據管理部門(或者是數據中心)直接對接業務部門和數據需求,制定數據產生的規則,構建符合標準的數據框架。但是,如此操作也使得數據治理部門影響或改變了原有的業務部門間的權力分配,引發了傳統業務部門的抵制,降低了數據治理部門的治理成效。同時,由于大部分的數據治理需求是在傳統業務部門工作開展之后產生的,而并非由數據本身產生了生產價值而驅動組織去做數據方面的工作,這也使得本應具有統籌權力的數據治理工作更難以高效推行。
高效能的數據治理是建立在高質量數據的基礎上的。當前許多政府部門的核心業務流程系統相對陳舊,并且沒有按照明確定義的數據所有權和職責進行操作,這使得數據存儲欠缺規范性,數據分散存儲在數據孤島中。數據顯示,全國各地方政府開放的有效數據集總數從2017 年的8 398 個,增長至2020 年的98 558個,四年間增長超過10 倍。數據量的增加加劇了不良質量和低效集成的現狀。在這樣的數據質量環境中,再有效的數據分析工具、管理理念、治理方法都無法發揮其應有的優勢。這些數據相關的業務流程的執行效率自然降低,也就會增加對政府的決策產生不利影響的風險。
基于政府大數據治理所面臨的挑戰,本研究建議采取“五步走”策略推動政府大數據治理水平快速提升。
大數據不僅推動了先進技術對我國數據資產的應用,同時也是創新思維的一種外在表現形式。培育全民大數據思維,主要包含三個重要的維度。
第一,樹立整體性的大數據思維。在大數據時代,隨著科技的持續創新,大數據思維也逐步從一元思維晉升到了二元思維。大數據的二元思維方法以效率性、相關性和概率性為主導思想,更適合當今社會快速發展的需求,也為整個國家和社會的創新發展提高了效率。由于整體性的大數據思維模式能夠更高效地完成數據的統計和分析,因此,該思維模式最適合作為解決問題時的首選思路模式。
第二,樹立量化性的大數據思維。當今社會,數字信息技術的快速更新換代已成為互聯網時代發展的必然趨勢,量化性的大數據思維正是這種數字化特征引發的必然結果。量化的具體表現為,采用最新的科學技術和策略方法,對各個行業進行信息全面定量采集以及信息互通,打通信息間隔閡,并進行全新的信息整合,實現分析實用性及數據科學性,創造更具價值的數據應用和信息資產。
第三,樹立價值性的大數據思維。在大數據技術的推動下,大數據的價值化特征及其數據的價值性意義正在不斷被挖掘并變得越來越明顯。隨著大數據思維的不斷開發和研究,越來越多的行業大數據思維模式被采納和應用,國家和政府層面也應不斷提升大數據思維在政務系統中的應用認識高度。
政府數據分類的目的是通過多維數據特征準確地描述政府基礎數據類型,從而實現對政府數據的有效管理和對政府數據價值的最大利用。分類的依據是基于政府數據的屬性或特征,按照特定的方法和原則進行區分和歸類,而后建立相應的分類體系和排列順序,以優化政府數據的管理和使用。
政府數據分類應注意分類的科學性、穩定性、實用性和擴展性,堅持從政府數據的內容屬性度量,采用多維度分類和線性分類兩相結合的方式。先將政務數據從主題、行業和服務三個維度分類,再在每個維度上采用線性分類法將其細分為不同的級別。
政府數據分級是通過政府數據的敏感程度確定數據類型,從而為政府不同類型數據的開放和共享策略的制定提供支撐。因此,分級應按照自主定級和明確需求的準則。分類時應將政府數據對國家安全、社會穩定和公民安全的重要程度,以及數據是否涉及國家秘密、用戶隱私等敏感信息這類因素作為核心關切點考慮。例如,貴州省于2016 年9 月發布的《政府數據數據分類分級指南》 中就將政府數據按照政府數據敏感度分為三類:公開數據為非敏感性數據、內部數據為涉及用戶隱私數據、涉密數據為涉及國際秘密數據。
在完成對政府數據的分類和分級的工作后,根據數據治理需求的迫切程度,確定某個特定類別和級別的數據,開展數據治理工作。這種治理思路的優勢在于能夠更大程度地滿足大數據治理后續跟進工作的需求。負責數據治理的團隊通過和實際掌握業務數據的部門對接,更有效地將信息目標與業務目標有機統一。在這個過程中,所有的政府大數據利益相關者通過協調并達成共識,共同策劃數據治理的策略。這比大范圍地、不分政務業務領域地進行數據治理的方式要容易執行得多。
要進行數據治理,僅僅完成分類分級和制定策略是遠遠不夠的。這些不同類別和級別的海量數據是否具有可用性,以及它們都歸屬于哪些部門都是需要關注的問題。
首先,確認政府大數據的可用性。大數據治理的前提是數據具備可用性。因為一旦數據在這個特性上出現問題,數據的利用度將會直線下降。正因如此,對政府大數據的治理必須從整個政府機構組織的視角入手,查驗數據是否滿足這個性質。政府數據中的數據倉庫、應用程序、已有的文件結構和其他外部系統等產生的數據,形式多樣且體量不一。而且,政府內不同部門對訪問這些數據的要求也不相同,有些數據需要批量訪問,有些數據需要實時或接近實時進行訪問。例如,在公安系統中,對公民的出入境信息進行實時監控是至關重要的。又例如,在稅務系統中,在分析企業全年納稅額度趨勢時,可能需要將該數據以批量調取的方式移動到數據集市進行分析。然后,展開政府大數據調研,確定數據的歸屬部門。由數據治理團隊專門組織調研小組,采取從數據的產生者,也就是從實際使用該業務的公民或企業代表那里開始,通過一對一的訪談或者向他們發放問卷等方式,開展針對數據特征和數據歸屬地的調研活動。調研小組可以和實際操作或使用這些數據的人員一起,利用數據分析的實踐方法來識別業務數據,以分辨出數據傳遞過程的最佳流程。而后,調研小組將這些調研結果轉交給數據治理團隊中的信息技術專業人員,由信息技術專業人員根據調研結果,選取不同的數據清理技術,并啟動基于業務內容或業務規則的數據清理工作。其間,政務數據治理應關注所有數據參與者的需求,反過來,所有數據參與者也都有責任共同確保數據的可用性、正確性和有用性。
數據的可用性、正確性和有用性有了保證以后,還要進一步提升數據的完整性。第一,數據剖析。在分析數據時,根據質量度量的方法來衡量數據質量的高低。這里應該明確,創建數據配置文件不應局限在數據處理流程的開始階段,而應當在整個數據處理流程中持續創建或更新。第二,數據解析和標準化。在對數據屬性進行驗證和糾錯時,應遵循行業標準和組織標準,例如名稱格式、標題格式、案例標準和地址驗證等。第三,數據擴充。數據擴充能夠向已存在的數據中添加其他數據,例如在已有的數據中添加更多的屬性,如在地址信息中加入郵政編碼信息等。第四,數據監控。數據存在的時間越長,對數據進行監控就顯得越發的重要。隨著時間的推移,實時地對數據進行剖析,不但可以掌握數據質量變化的趨勢,而且可以更精確定位數據需要改進的部分。
然而,從實際的數據治理實踐中看,即使完成了以上步驟,有時數據不準確的現象還有可能沒有得到徹底的解決,那些散落分布在業務流程中的數據元素仍得不到妥善的處理。因此,要保持數據具備高度的完整性,還需要建立一個針對數據治理的問責機制,將保障數據完整性的責任指定到具體的部門或個人。合理的問責機制應遵循三個原則:合理配置和劃分行政權力、完善問責機制的結構和內容、強化責任落實機制。為了更好地支持各責任人員的工作,數據治理的治理團隊應為他們提供必要的技術支持和技能培訓,以確保各責任人員的操作更具備科學性,提升工作效率。可以根據第三步中確定的數據歸屬部門,以部門為單位,發布其數據狀態信息,以便數據的實際歸屬部門可以同步地觀察到其負責的數據資產的狀態,并承擔相應的責任。
如今,大多數的政府機關對數據的利用還停留在對未加工的原始數據的存儲水平,并未試圖對這些原始數據進行加工,以挖掘數據潛力,支持業務的發展。政府在對大數據進行治理的整個過程中,應針對政府機構內所有業務部門,努力樹立一種“數據質量的高低直接影響政府決策力”的觀念。
在制定了政府大數據治理策略,確定了數據歸屬部門,并建立了完整的數據治理問責機制之后,對政府大數據治理的又一次升華是將政府機構中那種基于事務數據的原有數據管理文化,逐步轉變為基于主數據的數據治理文化。主數據是指系統中的共享數據,它描述了某一項業務的實體組成,例如,公民、關聯關系人員、房產、車產、學歷、出入境記錄等。對于政府大數據來說,主數據是不同的業務流程中會反復使用的那部分數據,它可以存在于組織中的任何位置,例如應用程序、系統、數據倉庫等。在所有的業務流程中,主數據的信任度級別最高。因此,任何一個應用程序都可以從任何一個子系統中獲取主數據,并將應用程序中與其不一致的數據與主數據保持實時對比并同步修正。對于主數據來說,所有的訪問者得到的都是一致的、真實的版本。
在此之后,為了最大限度地提高數據可用性,在改善數據完整性并為政府大數據分配問責制的基礎上,就能夠更加清楚地觀察到組織中那些核心數據或主數據,并將這些數據作為數據治理的核心資源進行管理和分配。然而,這個流程是一個循環反復的過程,總會出現需要改進的部分。因此,必須在這個循環中設置反饋機制,監控數據的實時狀態,清楚了解大數據治理的執行情況,并運用數據可視化方法展現數據治理流程中成功與失敗的現象。借助這一反饋機制,對已有的治理流程反復打磨,更高效地修正數據治理中出現的問題。
制定政府大數據治理的治理策略和技術方案,確保所有的數據參與者在數據的訪問和使用中得到的數據具備高度準確性和真實性,其意義重大且任務艱巨,但我們相信,只要按照“五步走”的流程,就一定會實現一種高度實用且有效的治理效果,進一步提升政府數據治理的整體能力水平。