曹雨佳,黃偉群(深圳市委黨校圖書館)
政府數據開放生態系統構建:以數據安全為視角
曹雨佳,黃偉群
(深圳市委黨校圖書館)
為構建安全和諧、可持續的政府數據開放生態系統,提出了政府數據開放的基本指導原則:數據安全依托于所有利益相關方的良性互動。并且,政府在保障數據安全的同時開放更多數量、更高質量的政府數據;數據開發者在創新利用的同時承擔數據安全利用的責任;公眾在積極分享數據開放創新成果的同時保持對個人數據的絕對掌控權。最后,提出了建立數據管理專門機構,負責數據開放安全審查;對政府數據進行分層分級分類管理;制定個人數據保護法;加強政府、數據利用者與公眾之間的互動與反饋等建議。
政府數據;數據開放;數據開放生態系統;數據安全;數據開放原則
政府數據開放是政府信息公開的進一步發展,要求政府相關信息和數據的公開、透明,但政府數據開放將開放對象進一步提升到了原始數據的粒度,并且政府信息公開強調的是公民的知情權,公眾有權了解政府的各項活動及決策信息。而政府數據開放強調的是數據的再利用,公眾可以分享數據利用創造的經濟和社會價值,并且可以根據對數據的分析判斷政府的決策是否合理。目前,世界已有63個國家和地區以及國際組織推行了政府數據開放政策。政府數據開放所帶來的政治、經濟、社會價值日益被人們所認可和期待。但值得注意的是,政府數據中包含大量涉及國家安全、商業秘密、個人隱私以及其他涉密內容,一旦被泄露或濫用會造成難以估量的數據危機,威脅國家安全、社會穩定和個人隱私。安全是數據開放的生命線,只有更好地保護和利用,才會有更好的開放。如何在開放中確保數據安全,構建安全和諧、可持續發展的政府數據開放生態系統是各級政府部門面對的挑戰和亟待解決的難題。
2.1政府數據開放生態系統主體構成
在數據開放的同時確保數據安全,這是一項系統工程,不是依靠任何一方或者個體就能實現的,它有賴于政府數據開放生態系統中的各主體,即政府、數據利用者以及作為數據消費者的公眾。各主體各司其職,同時又分享數據,互利依存,共同實現數據價值的最大化效益,維持生態系統的和諧及可持續發展。
2.1.1政府
政府在生態系統中起著重要作用。首先,政府是政府數據的源頭和生產者,政府擁有海量數據資源,并且掌握著數據是否對外開放以及如何開放的決定權。從數據安全角度說,政府需要在開放和保密中尋求平衡,保護數據的利用創新和安全。國外政府在這方面做出了很好的示范,主要有以下四種做法。
(1)規定豁免開放數據范圍,保護國家安全、商業秘密以及個人隱私。在政府數據開放中,缺乏可依據的開放或保密的范圍容易導致政府工作人員在數據開放工作中無從判斷某一類型數據是否公開,處于免責的考慮而不予開放。因此,推行政府數據開放的國家主要采取三種方式來確定豁免數據范圍。
第一種是劃分豁免開放數據類型,即確定特定數據是否可以被認定為豁免開放的框架,大多數與其信息自由法規定豁免公開的信息類型相同,如表1所示。

表1 三國豁免開放數據范圍[1]
第二種是制定開放數據清單。如,韓國就是由主管部門確定具有共性的開放范圍,再通過公眾需求調查的方式進行補充,去掉有爭議的數據范圍,最后選出36個領域,按計劃進行開放。[2]
第三種類型則是制定豁免開放數據清單。如,印度就制定了一個豁免開放的數據清單,規定涉及國家安全、商業秘密和個人信息方面的數據不予開放。
這三種方式各有優劣,劃分豁免開放數據類型的方式已經在大多數國家的信息自由法實踐過程中使用過,積累了一定的實踐經驗,政府數據的類型太多太雜,無法通過一一列舉的方式確定所有開放的內容,但缺點是賦予了政府部門較大的自由裁量權,工作人員主要根據自身理解來作出數據應該劃分到某一豁免開放類型中去的判斷,容易引起爭議和糾紛。制定開放數據清單的方式在數據開放的初期比較適用,它有針對性地選出了適宜開放且滿足公眾需求的數據類型,有利于減小內部阻力,培養政府部門開放數據的主動意識,同時也可以通過“試點開放”的方式總結經驗和教訓。但此種方式的局限是數據類型有限,從長期看限制了政府數據的全面開放。制定豁免數據開放清單的方式是通過具體列舉不能開放的數據資源的方式實現對數據安全的保護,它的優勢是清晰明了,對政府數據開放工作有相當明確的指引作用,但制定過程相當繁雜,且難以應對日新月異的大數據時代的社會變遷。
目前,我國雖頒布了全國性的政府數據開放行動綱要,但暫無全國性政府數據開放實踐。地方層面自2012年起就開始了探索政府數據開放的活動,并取得了一定成果。上海市是我國最早開始試行政府數據開放的城市,其采取的就是制定開放數據清單方式,重點開放11個領域總計190項政府數據內容。
(2)設立數據管理員,專門負責數據的安全審查和開放。政府數據開放工作一般依照法律規定、審查標準和以往案例對數據開放或保密作出審查,這在很大程度上依賴于工作人員的專業知識和經驗。因此,指派掌握審查知識和技能的專業人員,確保其對政府數據開放與否的屬性準確判定就顯得非常重要。美國在各部門內部指定了數據管理員,他們負責對政府數據的質量和數量進行監控,對數據進行安全和隱私審查,再予以開放。英國則要求政府機構內部各部門配備隱私保護專家,確保在政府數據開放過程中依照隱私保護相關規定執行。
歐洲國家一向注重個人的權利和自由,對個人數據均設有特別的保護手段。即設立專門的個人數據管理機構,任命專門的數據保護專員,直接負責關于個人數據處理的通報及預先審查。也就是說在處理個人數據之前,先要向本國的數據管理機構通報收集及處理的數據類型及數據處理目的。特別是可能給數據主體的權利和自由帶來特殊危險的數據處理行為,數據管理機構應該進行預先審查,在得到批準之后數據控制者才能進行后續的處理工作。這種由數據保護機構實施的審查和批準制度對限制個人數據的非法和不正當公開和使用非常嚴格及有效。如瑞典、匈牙利、芬蘭等國就任命了數據保護監察專員,主要監察數據控制者對個人數據的使用情況,如果存在違反數據保護法的行為,它可以以要求修正或者賠償的方式為個人提供數據保護方面的救濟。另外,法國、波蘭和西班牙等國則采取了數據保護管制模式,也就是可以通過強制性手段來確保法律的遵守。
(3)建立政府數據開放門戶網站,分領域、分階段開放數據。美國、新西蘭、英國等國家均建立了政府數據開放的“一站式”開放平臺,對開放數據進行管理和發布,如表2所示。

表2 國外政府數據開放網站一覽表(數據截止2015年9月25日)
各國的政府數據開放平臺對各政府部門上傳的數據進行安全檢查和質量監控。如,美國Data.gov網站規定所有提交到網站的數據均不能違反當前隱私法的規定,內容性質均不能涉及國家安全或其他保密規定,各政府部門應對各自提交的數據作隱私影響評估;[3]在Data.gov網站中,可以鑒別出個人信息而對個人隱私有損害或與國家安全議題相關的或非屬于聯邦政府管轄的數據都不在開放的范疇。并且規定在向data.gov網站提交數據集之前,各部門機構應使用《國家/國土安全和隱私保密檢查表和指南》[4]對數據進行安全審查,檢查表應當與申請公開的數據集一同提交。英國Data.gov.uk網站隱私政策條例中規定,其收集和使用數據均要遵循1998年的數據保護法。澳大利亞政府規定,政府要開放某一數據時,必須進行隱私匿名化處理,以避免所開放數據對個人隱私權產生沖擊。同時,還需要考慮開放的數據是否會對國家安全造成危害。如果涉及隱私或會影響國家安全等,則不予公開。[5]
我國雖尚無全國范圍的統一平臺,但上海、北京等地已經建立了政府數據開放網站,其中大多數是政府部門自己決定公開的一批開放難度較小的數據集,但相較于國外網站數據集來說數量和種類都較少。隨著政府數據開放工作進一步推動,數據集的范圍將進一步擴大,數據安全的壓力也隨之加大,網站需對政府部門上傳數據的安全情況進行審查,并對開放對象安全使用數據作出明確規定,并根據開放對象以及利用數據方式的不同,分領域、分階段進行開放(見表3)。
(4)鼓勵數據利用,促進數據安全開發。從表2可以看出,國外政府數據網站均提供了API應用的接口,鼓勵用戶通過利用政府數據,創造出受公眾喜愛的應用工具。自2009年起,紐約市政府便資助了“NYC Big Apps”的應用開放競賽,鼓勵用戶利用政府數據來開發網頁或者設計移動應用程序。[6]北京市政務數據資源網也舉辦了主題為“政府數據開放,大數據應用創新”的創意大賽活動,旨在通過競賽活動宣傳和推廣政府數據資源,引導和鼓勵更多公共機構、企業參與政務數據資源開發利用。[7]

表3 國內政府數據開放網站一覽表(數據截止2015年9月25日)
另外,影響政府數據開放和利用的因素很多,包括保守本部門工作秘密的固有價值觀、狹隘的部門利益主義,不愿意共享部門相關數據、擔心所開放的數據被誤用而可能導致責任歸屬問題。同時,若無相關法令或規范的授權,政府開放數據的意愿也會降低。[8]也就是說,政府開放政府數據的意愿會受到自身以及生態系統中其他生態主體行為及外部環境的影響。
2.1.2數據利用者
政府數據開放不是簡單地收集和分發數據,促進數據開發,提高數據的利用率才是核心。數據利用者在資金、技術或者精力上相較于政府部門來說更有優勢,他們通過分析、處理、挖掘和整合政府數據,開發出各種創新應用,給人們生活提供各種便利和個性化服務。在一個良好的政府數據開放生態系統中,數據利用者需做到以下三個方面。
(1)明確數據利用者的數據安全義務,為數據利用承擔責任。盡管政府已進行了數據安全審查,但是,由于信息技術的加速發展,關聯數據所帶來的風險增加,因此需要通過相關的法律法規,明確數據利用者的義務。在過去,數據利用者在收集和處理個人數據時,均采取“告知和許可”的方式,一般來說,都是通過繁雜的法律條款方式告知數據所有者收集、使用數據的目的、方式和范圍,并得到數據所有者的認可。但是,在大數據時代,這種“告知和許可”原則面臨巨大挑戰,政府在收集數據時無法預料數據將如何被使用,也就無法告知數據所有者,數據所有者也無法想象被收集數據的粒度會在何種程度影響其生活,也就無法明確地許可,而未通過這一原則的規定,在一定程度上阻礙了數據開放和創新利用。因此,在大數據時代,傳統的“告知和許可”原則應該被修改,數據利用者應提升數據安全意識,為數據利用的后果負責,承擔數據安全利用的責任。另外,對于可能給國家安全、商業秘密和個人隱私帶來威脅的數據處理行為,數據利用者應當主動向相關數據管理機構匯報,得到安全審查批準之后再進行進一步的處理。
(2)根據用戶需求,積極開發創意性數據產品。數據利用者在生態系統中的重要角色便是利用政府開放數據,創造出受公眾歡迎的創意性數據產品。如根據美國氣象局、美國地質調查局以及美國航空航天局數據開發的應用程序“Climate”,可以及時提供氣候信息、田野作業信息以及農作物生長階段信息,幫助農民作出最優決策,提高勞作效率并增加利潤。[9]只有通過數據利用者的開發和利用,政府數據才能實現潛在的政治、經濟和社會價值。
(3)接受數據安全測評和風險評估,維持相應的防護能力。對于處理一些敏感數據的數據利用者,還應接受第三方機構的數據安全保護能力測評和風險評估。第三方機構應當按照一定的標準對數據利用者的能力和資質進行審核,對其開發數據產品的安全性能進行測試和評估,對于數據產品存在的安全隱患及時排查和通報,降低數據泄密或濫用的風險。
2.1.3公眾
政府數據開放利用需要較強的數據處理和挖掘能力,這將許多普通公眾排除在數據利用者的身份之外,在很多情況下,他們是以數據消費者的形式參與到政府數據開放生態系統中,只有通過公眾的廣泛參與和使用,政府數據開放才能得到應有的關注,才能實現政府數據資源再利用的政治、經濟和社會價值。為了加強與公眾的互動,提升公眾在政府數據開放中的參與度,政府部門一般在政府數據網站上通過博客、欄目以及實時在線交流等方式與公眾進行良性互動。政府應該通過在網站開設虛擬社區等方式及時獲取公眾的反饋意見,營造一個良性循環的開放政府數據體系和生態系統。
公眾在享受政府數據開放利用成果的同時,也應注意保護涉及個人隱私方面數據的安全。在大數據時代,為保護創新的自由發展,數據利用很難做到完全對公眾一一告知,但公眾必須保有對個人數據絕對的控制權。也就是說,當發現個人數據遭濫用或錯誤利用時,個人有權糾正其行為并選擇回收個人數據。美國《消費者隱私權利法案》就對數字化環境下個人的權利作出了如下規定:個人控制,即個人可以控制企業收集和處理個人數據;透明度,即個人有權以簡單明了的方式了解隱私以及安全保障的信息;安全,即個人數據必須得到安全和負責任的處理;可修改和準確性,即個人數據有誤時,在與數據敏感性以及與數據錯誤可能對消費者帶來不利影響的風險性相適應的情況下,個人有權糾正個人資料的準確情況;問責,即擁有個人數據的公司有義務遵守《消費者隱私權利法案》的規定等。[10]
2.2政府數據開放生態系統外部環境
良好的外部環境對政府數據開放生態系統的構建也非常重要,只有將數據產生者、數據利用者、數據消費者與數據政策、數據技術等進行良性互動,才能構建安全的生態系統。首先,數據安全有賴于科學、完善的數據政策。美國一方面對原有政策進行了修改以適應開放政府的需求,如《開放政府指令》提出要在120天內通過審查現有的美國政府預算辦公室政策,如《削減文書方案》和《隱私指導方案》等,識別其中阻礙開放政府和新技術使用的問題并予以修正;另一方面發布了13526號總統令、13556號總統令等一系列相關政策,在促進政府數據開放透明的同時,對政府數據開放的范圍作出相關限制,對數據安全管理問題作了相關規定(見表4)。

表4 美國政府數據開放相關政策內容[11]
同時,數據技術能力也須齊頭并進,包括在技術上去除敏感的手段,如人工合成數據技術,其通過隨機抽樣和填補等一系列統計方法產生多個版本的模擬數據,用來完全代替真實數據。人工合成技術既保留了原始數據的關聯特性和統計特性,又能保證個體樣本的隱私性,在美國人口普查中有所利用,是保護隱私安全方面的一個重大數據技術創新。
2.3政府數據開放生態系統能量流動
在政府數據開放過程中,外部環境,即完善的數據政策、先進的數據技術水平和其他的一些政治、經濟、社會因素以及政府本身的開放意愿和管理水平決定著政府數據能否安全、完整地開放。而政府數據開放之后,數據利用者的責任意識和開發水平則決定著政府數據能否被安全地處理和利用,生產出受人歡迎的數據產品。而公眾對數據產品的積極消費,對數據產品中存在的安全問題積極監督和糾正,就能保證政府數據的開放利用既能產生巨大的公共價值,又能有效地避免國家安全、商業秘密以及個人隱私受到威脅。這樣會進一步消除政府的顧慮,加強開放動力,開放出更多數量、更高質量的數據,從而有利于數據利用者的開發利用,形成一個良性循環。也就是說,要構建一個安全和諧、共享、綠色、可持續的政府數據開放生態系統,需要所有生態主體的良性互動。政府在保障數據安全的同時開放更多數量、更高質量的政府數據;數據開發者在創新利用的同時承擔數據安全利用的責任;公眾在積極享受數據開放創新成果的同時保持對個人數據絕對的掌控權。
3.1建立政府數據管理專門機構,全權負責數據開放和安全審查
政府數據開放工作涉及多個政府部門以及眾多的數據開發利用者,需要建立一個專門的數據管理機構,統籌協調開展數據開放工作。①數據管理機構應當協助各級政府部門確定開放的數據范圍,確保開放數據不會威脅國家安全、商業秘密以及個人隱私等法定保密事宜;②制定詳盡的數據安全審查工作指南,統一全國保密審查標準,規定具體的保密審查流程,包括根據指南評估機密,對涉及保密信息的數據進行相應的脫敏處理等,便于工作人員根據工作指南和保密審查流程開展工作;③對各部門上傳數據標準作出規定,確保數據高質量、高互聯;④對開放數據進行安全審查,通過有效的數據技術手段,對開放數據的質量、安全作出評估;⑤數據管理機構應當對數據利用者的數據開發利用情況進行監管,當涉及不當利用或危害安全隱私的行為時及時進行處理。
3.2依照相關法律法規,對政府數據進行分層分級分類管理
政府數據開放工作不可一蹴而就,應根據實際情況和實際對象,分層次、分級別、分大類進行管理和開放。即根據我國的行政體系,協調好中央政府與地方各級政府開放渠道的關系,建立一條層次縱貫中央-省-市-縣的政府數據鏈,并對這條政府數據鏈中的數據進行安全審查,劃分保密級別。如將一些具有重大經濟、社會價值,能夠促進生產、便捷生活、推動社會創新的數據劃分為完全開放級別,優先對所有公眾和數據開發利用者開放;將有可能威脅到國家安全、違反商業秘密和侵犯個人隱私等的數據劃分為豁免開放級別,納入完全保密處理;將暫時不宜完全對外開放的數據劃分為依申請開放類型,需經公眾或開發者申請,經過對敏感數據的處理或者有效分割處理再予以開放。再者,應為各部門上傳的政府數據創建元數據,并根據元數據的類別劃分數據群,將其覆蓋到社會生活中各個主題,以方便公眾和開發利用者查看和利用。
3.3制定個人數據保護法,規定數據利用者的責任和義務
在大數據時代,個人數據被肆意收集和濫用的風險與日俱增,個人的一言一行都處于被監控和暴露的威脅中,個人對保護隱私的意愿也越來越強烈。因此,要盡快推出我國個人數據保護法,協調政府機構和開發利用者在收集、處理和利用個人數據方面產生的種種問題。值得指出的是,個人數據保護法的立法原則需順應大數據時代以及數據開放利用的新特點,強化數據開發利用者的責任和義務。相關法規應明確規定數據開發利用者使用個人數據的類型,以及個人數據被何種方式利用,同時對敏感數據的處理和通報以及違反安全利用規則的嚴格懲罰,使其承擔數據安全利用的責任。
3.4加強政府、數據利用者與公眾之間的互動與反饋
政府數據生態系統中的各主體相互依賴又相互促進,加強政府、數據利用者與公眾之間的互動和反饋,可以促進生態系統中能量流動和價值創造。政府只有通過溝通了解數據利用者和公眾的需求,才能開放更多有利用價值的數據;數據利用者只有更多地了解公眾的喜好和個性需求,才能開發更多受人歡迎的數據產品,政府數據開放才創造了應有的價值。因此,政府一方面要通過各種應用競賽或者招標購買、補貼獎勵的方式鼓勵和吸引公眾參與政府數據的創新性開發利用,提供更多有助于提高公共服務水平,促進生產活躍發展的數據應用,另一方面要通過網上論壇、在線交流以及數據應用下載頻次管理的方式了解公眾對數據類型、質量、使用方面的偏好和需求,調整開放數據的重點和鼓勵開發應用的方向。
[1]Rininta Putri Nugroho,et al.A comparison of nationalopendatapolicies:lessonslearned[J].Transforming Government:People,Process and Policy,2015,9(3):286-308.
[2]姜涵.“互聯網+”時代如何確定公共數據開放范圍?[EB/OL].[2015-09-20].http://www.cnii. com.cn/informatization/2015-07/13/content_1597371.htm.
[3]侯人華,徐少同.美國政府開放數據的管理和利用分析——以www.data.gov為例[J].圖書情報工作,2011(4):121-124,144.
[4]National/Homeland Security and Privacy/Confidentiality Checklist and Guidance[EB/OL].[2015-09-20].http://www.data.gov/sites/default/files/attachments/ Privacy%20and%20Security%20Checklist.pdf.
[5]楊東謀,等.國際政府數據開放實施現況初探[J].電子政務,2013(6):16-25.
[6]張毅菁.從信息公開到數據開放的全球實踐[J].情報雜志,2014,33(10):175-183.
[7]北京市政務數據資源網.“2014年北京市政務數據資源網應用創意大賽頒獎儀式暨應用推介會”在京舉行[EB/OL].[2015-09-20].http://www. bjeit.gov.cn/zwgk/ztzl/zhbjjs/zhcy/djxm/80627.htm
[8]楊東謀,等.政府開放數據與信息增值:臺灣的經驗與啟示[J].圖書情報工作,2013(10):67-73.
[9]Data.gov[EB/OL].[2015-09-28].http://www. data.gov/applications.
[10]“大數據時代”的美國隱私權保護制度[EB/OL].[2015-09-25].http://www.36dsj.com/archives/18240.
[11]陳美.美國開放政府數據的保障機制研究[J].情報雜志,2013,32(7):148-153.
Construction of Government Data Open Ecosystem:a Perspective of Data Security
Cao Yu-jia,Huang Wei-qun
In order to build a safe,harmonious and sustainable government data open ecosystem,this article presents some basic guidelines:Since data security relies on the positive interaction of all stakeholders,government should open more and higher quality of government data while keeping it security;data developer should take responsibility for data security while making creative use of data;the public should maintain their personal data under absolute control while enjoying the innovative data usage.Specific recommendations are made as follows:establishing a specialized agency responsible for data management;managing the data through layer,hierarchy and classification channels;developing Data Protection Act;strengthening the interaction and feedback among the government,developers and the public.
Government Data;Open Government Data;Open Data Ecosystem;Data Security;Open Data Principle
G254.97;G203
A
1005-8214(2016)10-0020-05
本文系全國行政學院科研合作基金課題“政府數據開放安全審查制度研究”(項目編號:15HZKT113),教育部人文社科研究青年基金項目“我國政府數據開放保密審查體系構建及保障機制研究”(項目編號:15YJCZH237)階段性研究成果之一。
曹雨佳(1988-),女,碩士,深圳市委黨校圖書館助理館員,研究方向:政府數據開放,政府信息資源管理等;黃偉群(1966-),研究生,研究館員,研究方向:政府信息公開、政府數據開放。
2016-02-04[責任編輯]菊秋芳