■楊光
政府開放數據培育多元治理主體
■楊光
當今世界是一個由數據構成的世界,而人就是一切數據足跡的總和,這句話恰當地概括出了我們現在所處的數據化世界——無時無刻不被數據包圍,一切行為和事件都以數據的形式被記錄、被儲存、被處理。聯合國的研究報告顯示,全球的數據存量從2005年的150EB(艾字節)增長到2010年1200EB,并預計將以40%的年增長率繼續增長,2020年將達到2007年的44倍,平均每20個月翻一番。更直觀地,1EB的信息量相當于13億中國人人手一本500頁的書加起來的信息量,5EB則相當于3.7萬個美國國家圖書館的信息量。
數據量指數爆炸式增長的同時,數據本身的價值得到了前所未有的重視,奧巴馬政府稱其為“未來的石油”。我國政府同樣高度重視大數據的潛在價值,由中央到地方鋪開了大數據戰略布局:國家“智慧城市”技術和標準試點工作如火如荼;2013年8月,國務院發布《關于促進信息消費擴大內需的若干意見》,引導信息消費推動經濟轉型;廣東省于2012年底就頒布了《廣東省實施大數據戰略工作方案》,提出到2020年基本建成“智慧廣東”的目標;上海市和廣東省先后成立大數據局……
何為政府數據開放?
政府數據開放顧名思義,即不受著作權、專利權以及其他任何限制,將政府掌握的各類數據庫、數據集公開,供社會各界查詢、下載、應用。該運動一方面源于互聯網上的“軟件開源運動”向“數據開放運動”的轉變,另一方面源于社會各界對于政府信息公開的呼聲此起彼伏。美國首席信息官維偉克·昆德拉將這喻為“數據民主化的運動”。
數據開放落腳于實現公共資源的增值再用,為社會、為國家、為民眾提供更加優質的公共服務。而政府管理過程中存在創新性和競爭性不足的局限,提取政府數據價值最好的辦法應是充分挖掘民間智慧,引導公共部門外部開發大數據工具和應用,改善現有的管理方式和思路,從而提高社會運行效率,這本質是由單純的政府管理向多元主體治理轉變,充分契合了十八屆三中全會深化改革的思路。
全球數據開放運動情況如何?
致力于開放數據運動的開放知識基金會發布了2013年的開放政府數據普查結果,包括交通時刻表、政府預算、政府支出、選舉結果、公司注冊信息、國家地區、國家統計、立法、郵政編碼、污染物排放等十個領域指標,涉及了70個國家和地區政府的數據開放情況。
在全球范圍內,建立統一的數據開放門戶網站是各國普遍的做法。從內容上看,重點開放可機讀的數據集(DataSets)、應用程序(APPS)等資源,有的還專門設置了供開放人員參與和公眾反饋的專欄。從覆蓋范圍上看,主要是全國性的,部分地方或部門建立獨立的數據開放網站。從數據集的形式上看,以CSV、HTML、XLS、NII、PDF等一種或多種格式出現。
美國是數據開放運動的起源地。美國的數據門戶(data. gov)在2014年1月全面改版,截至2014年2月10日,網站上共開放了88137個數據集、349個應用程序、140個移動應用、參與的部門達到175個;同時還有40個州、44個縣市建立了單獨的數據門戶。美國的數據開放格式多達46種,其中應用最廣的格式是HTML、ZIP和XML這三種,數據集分別有20775個、12517個和11992個。
而英國的數據開放門戶網站(data.gov.uk)上,共開放了13670個公開的數據集以及4170個非公開的數據集。此外倫敦、曼徹斯特等地以及索爾福德市議會等16個地方和部門還建立了獨立的開放數據門戶。
我國政府數據開放情況如何?
在全球范圍內,目前中國的數據開放程度相對不高,水平相對落后,但是已經邁出了堅實的步伐。
國家層面上,2013年9月12日,與歐美國家的數據開放網站類似的新版國家統計數據庫(http://data.stats.gov.cn/)正式上線為公眾提供數據服務,目前入庫的數據近600萬筆,比原來增加了3倍,數據涵蓋社會經濟的方方面面,既包括了國家統計局生產的主要數據,也包括了有關部委生產的其他數據,還與主要國際機構數據庫網址集成對接。
地方層面上,上海、北京等主要城市率先開展數據開放工作。上海建設了國內首個地方數據開放網站——“上海政府數據服務網”,提供9家試點單位的212項數據產品、30項數據應用可下載,涵蓋地理位置、道路交通、公共服務、經濟統計、
資格資質、行政管理等6大領域,如市住房保障管理局開放了保障房工程信息、房地產開發企業信息、房地產經紀企業信息等數據產品。繼上海市之后,北京市開設政府數據資源網,目前已有29個部門公布了400余個數據包,點擊量最高的是由北京市國土資源局提供的“土地用途分區”數據集,截至2014年6月23日已被下載1045次。此外,青島等電子政務較發達的城市紛紛開展數據開放工作。
緣何開放政府數據?
數據的開放是為了更好地開發應用,服務民眾。截至2011年12月,僅僅在美國的data.gov網站上,就匯集了1140個應用程序和軟件工具、85個手機應用插件,其中有近300個是由民間的程序員、公益組織等社會力量自發開發的。近日,北京市信息資源管理中心組織舉辦了北京市政務數據資源網應用創意大賽,以此吸引更多的企業和個人更充分地挖掘出政務數據資源的價值。目前北京市政府數據資源網上可供下載使用的應用程序全部直接為民眾提供便利,例如“愛健康”應用是北京市所有衛生保健設施的指南應用,包含北京市各級醫院、社區衛生服務中心、婦幼保健院、體檢醫療機構等,用戶可以使用GPS功能定位附近的醫療機構信息。
數據的開放將進一步推動社會治理多元主體的成熟,提高社會運行效率。例如就食品安全問題,美國聯邦政府整合相關部門管轄范圍內的問題商品的召開記錄,開設專門的商品召回查詢網站和手機系統,一方面供民眾查詢,另一方面供民眾舉報問題產品,這就充分發動全社會的民眾監督食品安全,大大減輕了食品監管相關部門的行政成本和工作壓力,更大大提高了食品監督的工作效率。
如何開放政府數據?
與歐美國家相比,我國政府在數據開放上擁有一些獨特的優勢。從數據量來看,我國龐大的人口基數本身就意味著無窮無盡的數據源,更為重要的是,我國政府在社會體系中的地位、能力和影響力比歐美國家政府大得多,這意味著我國政府擁有的公共數據資源更為龐大。從處理數據的能力來看,我國在未來將擁有世界上最大的知識群體,在培養下一代數據科學家方面,擁有無可比擬的人才優勢。
在下一步數據開放部署中,我國政府應做好三件事。
首先要明確數據開放的原則是什么?!癢eb2.0之父”蒂姆·奧萊利曾制定了開放公共數據的8條原則性規定——完整性、原始性、及時性、可讀取性、機器可處理性、獲取無歧視性、格式通用性、無許可證性。這8條規定可作為重要參考,因為目前我國政府公布的數據基本都是報告和報表,沒有標準的格式,處理痕跡明顯,大多數不能夠以數據的形式查到,同時出于保密性考慮,獲取渠道單一,可獲取的僅為冰山一角,因此也無法深入分析、加工和挖掘。
其次,我國政府應明確什么樣的數據能夠開放。
第一,開放的數據應是原始的。有的人主張開放經過加工和解釋的數據,但是這就與基本原則相悖。此外這樣的主張會衍生出兩個問題:一是各部門應該加上什么程度、多少梳理的說明、解釋和觀點,行政部門的工作量無形中增加,可能產生反面效果;二是經過加工和解釋的數據很可能掩蓋了數據原本的本質。因此,開放的數據應是最原始的,我國政府在引導之外,更應該鼓勵企業、個人、公益組織等多元治理主體最大程度利用原始數據發出自己的聲音。
第二,開放的數據應是粒度最小、最細的。文字經過組合可以變成詞語、短語、句子,甚至是華麗的文章。數據也是如此,應該以粒度最小、最細的數據格式呈現出來,讓不同的用戶各取所需,自由組合,最大程度發揮數據的潛在價值。
第三,開放的數據應是高價值的。所謂高價值的數據即為社會最需要的數據,昆德拉對此定義“凡是能增強公眾對政府部門的問責能力和政府部門的反應速度、提高公眾對于政府機關及其運作的了解、推進部門的核心使命、創造經濟發展的機會或者滿足公眾特定要求的數據,就是高價值的數據”。
最后,我國政府應明確要采取什么樣的措施來推動數據開放。
第一步是建立統一的數據開放網站。有必要的情況下可以建立部門系統、地方的數據開放平臺。將割裂儲存于不同地域、不同層級、不同部門的數據在統一平臺上開放,消除政府部門間“信息孤島”,最大程度匯集數據,為數據開發人員提供最齊全的原始數據源,使政府數據的附加價值被充分發掘。
第二步就是要提供盡可能多的原始數據。只要不涉及隱私和國家安全的數據全部開放、開源,允許公眾免費查詢、下載,給予個人和企業以最大自由度重新處理這些數據,使公共數據與民間和企業界擁有的數據資源相互融合,形成巨大的知識創新力、財富創造能力和社會進步推動力。
第三步是通過各種方法鼓勵公眾重新處理政府數據。例如在數據開放網站上提供應用程序開放接口,再如舉辦應用程序創新比賽,這兩種方法是如今比較流行的做法,鼓勵相關IT行業公司自行深入開發應用,激發有能力、有精力的個人(尤其是高校學生)的創新熱情,創造更多的社會價值和商業價值。
數據是“未來的黃金”,政府坐擁最大“金礦”。開放數據的益處無須贅述,在全面深化改革的進程中,加快數據開放的步伐,充分挖掘民間智慧,培養多元治理主體,才能最終實現國家治理體系和治理能力現代化。數據開放的未來值得所有人期待,因為你我必將會成為這波浪潮的踐行者和受益者。