黃罡
與其糾結難以繞開的挑戰,不如回歸到技術層面。
今年年初,貴陽在大數據領域又有一項新進展——政府數據開放平臺正式上線運行。雖然不是全國最早的政府數據開放平臺,但貴陽政府數據開放平臺的搭建過程,卻為政府的數據資源開放共享平臺建設如何突破瓶頸,提供了一條新思路。
數據開放挑戰
解讀貴陽案例前,先來看看政府數據資源開放共享的瓶頸。
目前大數據領域已經形成一個共識,在中國當下所存儲的數據中,中央政府各部門、地方政府以及履行公共服務職能的機構與企業所占據的1/3數據,是所有信息當中質量最高的,這是由政府社會管理職能所決定的。這部分數據的開放,不僅能夠有效提升社會運行效率,還能激發出巨大的商業價值。
國家已經充分意識到大數據的價值和政務數據開放的重要性,并推出了一系列的政策舉措。2015年9月,國務院發布了《促進大數據發展行動綱要》(以下簡稱綱要),首次在國家層面提出了“公共數據資源開放”的概念,將政府數據開放列為了中國大數據發展的十大關鍵工程。與此同時,綱要還明確了要在2017年底前形成跨部門數據資源共享共用格局,2018年底前建成國家政府數據統一開放平臺。
從實際情況來看,在國家戰略的推動下,政府數據開放共享已經成為社會共識,各級政府在規劃社會經濟發展的藍圖中,都將大數據戰略放在了極為重要的層面。目前,全國已經有23個省市出臺了74項與大數據發展相關的政策,上海、北京、廣州、貴州等10余個省市建設了專門的政府數據開放網站和平臺。
雖然取得了一定成績,但挑戰也顯而易見。
最顯著的是建設國家政府數據開放平臺的人力和時間成本。北大軟件研究所曾經對神州數碼、中軟、東軟等有資質的信息系統開發廠商進行過調研,得出的結論是一個孤島式的政府信息系統要將它開放共享,人力成本一般是1000人/天。如果放大到全國至少10萬個以上政府信息系統,全部開放共享則至少需要1億人/天。
再進一步的調研結論是,以綱要提出的“2018年底前建成國家政府數據統一開放平臺”為時間節點,如果要利用1億人/天的人力成本實現政府數據開放,需要20萬名中高端軟件工程師。且不說現有中高端軟件工程師數量緊俏,即使是普通的軟件開發人員,我國每年也還有30萬-40萬的缺口。
時間和人才問題只是表面的困難,當前更深層次的挑戰在于,由于長期以來,政府各政務部門根據自身職能自行主導建立各類職能系統,缺乏統一規劃和數據核準,致使政務數據源分散、數據相對割裂、數據格式各異、應用及服務碎片化,無法準確掌握全局數據資產狀況。
這就導致在進行政府數據資產化梳理工作中,往往需上級單位統籌下屬各委辦局,通過行政命令方式協調各單位信息部門、職能部門以及不同的系統開發廠家高度配合,進行人工數據分析、匹配及整合。協調難度大、成本高、耗時耗力、難以推進且數據實時性較低、可用性不高。
甚至隨著數據資產的價值逐漸得到認可,某些政府部門和公共機構把自己掌握和獲取的數據作為自己利益和權力的一部分,看成是私有財產不愿共享開放,搞部門保護,導致各個部門之間的數據融合難度進一步加大。
除了這些主觀因素之外,政府數據開放共享過程中,同樣還涉及到諸多客觀存在的實質性的問題,特別是相關法律問題,比如隱私保護問題、信息安全問題以及各個部門信息立法的問題,等等。
換一種思路
作為全國大數據產業發展的先行城市,貴陽同樣也面臨這些打破信息孤島實現數據開放領域的時間和人力成本挑戰以及溝通協調難題,但從2016年底開始梳理政府各部門的數據資源目錄,到2017年初政府數據開放平臺上線,短短一個月時間,就完成了首批634個數據集以及101個API(程序編程接口)資源的開放工作,基本涵蓋貴陽市級所有政府部門及相關直屬事業單位共50余個部門,進度和速度可謂驚人。
貴陽市解決上述諸多挑戰一個重要的思路,就是與其糾結這些難以繞開的挑戰,不如回歸到技術層面,從網絡層面將此前各個信息孤島的網絡體系變成開放自適應的體系。
以數據開放貢獻第一步所需要的數據資源目錄梳理和對接為例,2016年12月,貴陽市啟動燕云DAAS實現政府數據資產化解決方案在貴陽市政府試點應用,建立貴陽市政府數據資源目錄管理與服務系統,對住建局、人社局、衛計委、工商局、公安局5家試點單位進行政府數據資源目錄梳理及納入系統。
整個過程通過3個工作組,合計5人,用5天時間就完成了5家試點單位共計19個系統836個功能數據項梳理,生成“委辦局-業務系統-功能數據項清單”,并對其中162個主要業務功能數據項進行API接口生成。
因為是從技術層面用自動化的網絡分析工具完成整個生成過程,所以不需要政務信息系統的原開發商的完全配合,不需要業務人員配合完成數據與系統的匹配、也不需要政府部門導出數據庫核心數據,只需要業務部門授權系統界面賬戶密碼訪問權限,就能通過生成的API接口活化生成數據目錄、數據字典并納入數據目錄管理與服務系統,再通過可視化系統對外提供政府數據資源的目錄查詢功能及數據資源管理功能。
更為通俗的解釋,即相當于在獲得許可的前提下,給各個政務部門和相關單位的數據庫接入一根管道,在保證安全的基礎上,利用這根管道跨部門獲取所需數據,進而生成數據資源目錄。
從貴陽的實踐來看,這種“索引管道式”的數據共享交換方法,不僅繞開了各類障礙,還解決了現階段全量政府數據資源目錄梳理過程中“有什么、在哪里”的問題,為下一步數據清洗加工脫敏脫密和數據開放共享奠定一定的基礎。
當然,貴陽的這種技術解決思路想要實施,仍然有一個重要前提,即地方政府部門的觀念轉化和決策推動,這又回到了問題的根本,改革的一大難點在于思想觀念的轉變。貴陽能夠走出這一步,其他一些地方政府,是否有勇氣和決心去挖掘這樣一座座沉睡的數據礦山?