王 衛,王 晶,張夢君(北京師范大學政府管理學院)
自2009年美國發布開放政府計劃并建立全球首個開放政府數據平臺Data.gov以來,開放政府數據(Open Government Data,OGD)運動迅速席卷全球,英國、加拿大、法國、印度等國相繼實施開放政府數據計劃。開放政府數據蘊藏著巨大價值。從全球來看,開放數據(包括政府數據和私人數據)的潛在經濟價值每年高達4萬億美元;[1]PIRA評估報告顯示,歐盟、挪威開放政府數據每年約產生680億歐元價值;[2]2011-2012年,英國開放政府數據對客戶、企業和公共部門產生的經濟價值約為18億歐元,若包括社會價值則達62億歐元。[3]開放政府數據因其政治、經濟和社會等多方面的價值受到廣泛關注,越來越多的公共機構、企業和公民參與到開放和共享政府數據中。
目前,國內外關于開放政府數據價值的研究主要集中于價值實現的阻礙因素[4-6]、商業模式[7,8]和價值生成機制[9-11]等方面。但開放政府數據涉及主體(政府、企業、普通公眾等)、客體(數據集)和內外部環境(政治環境、經濟環境、社會環境等)等諸多因素,其價值實現不可避免地受到各因素的共同影響,然而,目前尚未有學者從生態系統視角研究開放政府數據的價值實現。因此,本文對現有開放政府數據生態系統的相關文獻進行調研,利用Nvivo 11.0軟件進行編碼與分析,構建開放政府數據生態系統理論模型,并在此基礎上,對影響開放政府數據價值實現的因素進行分析,以期為開放政府數據的價值實現和可持續發展提供一定借鑒。
目前,已有部分學者對開放政府數據生態系統進行研究,但由于每位學者的研究視角、維度不同,導致開放政府數據生態系統的構成要素和關系結構存在差異。為了構建更加系統、全面的開放政府數據生態系統模型,本文基于目前國內外關于開放政府數據生態系統理論與實踐方面的研究文獻,利用Nvivo11.0軟件進行輔助編碼與分析,進而構建開放政府數據生態系統理論模型。
嚴格意義上的開放政府數據(Open Government Data,OGD)是從2009年美國實施“開放政府計劃”(Open Government Initiative)并建立全球首個開放政府數據平臺Data.gov后正式開始的。2009年之前,政府信息公開的相關研究并不算嚴格意義上的開放政府數據,因此本文檢索的關于開放政府數據生態系統的文獻都是2009年以后發表的。本研究選用中國知網、Web of Science、百度學術三個搜索引擎,將“開放政府數據生態系統”“開放數據生態系統”“政府開放數據生態系統”“政府數據開放生態系統”作為主題詞進行全文檢索,最終得到相關文獻共39篇;在剔除書籍和去重后,剩余23篇;通過閱讀摘要,去除研究內容不相關的文獻,剩余16篇;通過精讀,去除內容相關度不高的文獻,剩余9篇。通過對這些文獻所引用的參考文獻重新進行篩選,最終得到符合要求的文獻14篇,作為最終編碼文獻。
開放政府數據生態系統的關鍵構成要素包括利益相關者、內外部環境、價值實現和數據流(見表1)。本文使用Nvivo 11.0軟件分析開放政府數據生態系統的關鍵構成要素。在編碼過程中,由兩人進行獨立編碼,第三人負責審核,當編碼不一致時通過討論決定。具體編碼方法是將文獻中的相關短語編碼成Nvivo 11.0中的一個或多個節點,對節點進行分類使其具有層級關系并生成要素模型,作為構建開放政府數據生態系統理論模型的基礎(見圖1-圖4)。
利益相關者是指開放政府數據過程中涉及的利益群體,具體包括數據提供者、數據利用者和數據受益者。數據提供者主要指政府部門,這是開放政府數據重要的實施者和推動者。數據利用者包括數據開發人員、企業、技術團體、學術團體、創新創業者等,他們是應用開放數據的主力軍,Harrison和史圓圓認為,學術團體在生成數據標準、設計信息系統和技術平臺等實踐創新方面具有重要的意義。數據受益者主要指普通公眾。[12,13]此外,政府、組織機構也是開放政府數據的受益者。

表1 各構成要素的編碼情況

圖1 利益相關者

圖2 內外部環境

圖3 價值實現

圖4 數據流
內外部環境是指影響開放政府數據的政府內部和外部環境,包括政治環境、經濟環境、社會環境和技術環境等。政治環境是主要的影響因素(編碼次數為10),具體包括法律政策、領導人員態度、組織管理水平等,其中法律政策影響程度最大(編碼次數為9);經濟環境既包括整個國家和社會的經濟發展水平,又包括對開放政府數據的資金支持力度;社會環境主要指整個社會的文化氛圍,包括技術人員的知識結構與信息素養、普通公眾的數據需求意識和文化水平等;技術環境包括開放政府數據平臺的建設情況以及技術工具的應用情況等。
價值實現是指開放政府數據產生的價值,包括經濟價值、社會價值和政治價值。經濟價值包括促進經濟增長、創業活動、提供就業崗位等;社會價值包括提高公民生活水平、促進社會包容等;政治價值包括提升政府透明度和公信力、提高辦事效率、輔助決策制定、加強公眾監督問責等。開放政府數據的價值是多方面的,聯合國報告認為,開放政府數據為實現2015-2030年聯合國可持續發展目標帶來的利益包括促進經濟增長和就業、改善公共服務、提高政府透明度、助力智慧城市建設。[14]
數據流是指在開放政府數據過程中,數據從生成、發布到獲取、使用再到管理、評估的整個數據流動過程。通過文獻編碼得到的數據流包括數據生成、數據審查、數據集選取、數據發布、數據獲取、數據使用、數據反饋、數據管理和數據評估九個階段。
構建開放政府數據生態系統模型,不僅要知道關鍵構成要素,還要明確各要素之間的關系,利用工具NVivo11.0進行編碼與分析,最終得到各要素之間的關系見圖5。帶有循環箭頭的圓圈表示任意兩個構成要素之間的關系,例如,價值實現依賴于利益相關者、內外部環境間接影響價值實現。

圖5 各組成部分之間的關系
基于前面對相關文獻的編碼,本文認為開放政府數據生態系統的關鍵構成要素包括利益相關者、數據流、內外部環境和價值實現。通過分析各要素之間的關系構建的開放政府數據生態系統理論模型見圖6。

圖6 開放政府數據生態系統理論模型
開放政府數據生態系統是以價值實現為內在驅動力的,數據從生成、發布、獲取、使用,到管理、評估的整個流動過程,各利益相關者擔負著不同的責任和義務,共同致力于開放政府數據的價值實現,而價值實現又會影響各利益相關者的行為,從而形成一個循環的系統。同時,整個系統受到經濟、政治、技術和社會等外部環境的影響,維持動態平衡發展。
1963年,美國斯坦福研究所首先使用“利益相關者”這一術語。目前,關于利益相關者最有代表性的定義是R.E Freeman于1984年在《戰略管理:利益相關者方法》中提到的,他認為利益相關者是能夠影響一個組織目標的實現,或者受到一個組織實現其目標過程影響的所有個體和群體。[15]在開放政府數據中,利益相關者主要包括數據提供者、數據利用者和數據受益者,他們分別承擔著不同的社會責任,共同影響開放政府數據的價值實現(見圖7)。各利益相關者只有認真履行自己的責任和義務,才能保證開放政府數據的順利開展并創造價值。

圖7 利益相關者參與開放政府數據的情況
(1)政府部門掌握著社會中80%的數據資源,它在開放政府數據過程中扮演著數據提供者的角色,是最重要的利益相關者。政府部門在開放政府數據價值實現過程中承擔的相應責任有以下幾點:① 摒棄傳統封閉的組織文化,采取積極開放的態度,主動開放政府數據接受全社會的監督,履行政府“為民服務”的職責;② 搭建開放政府數據平臺,在不涉及個人隱私、國家安全、商業機密的前提下盡可能多地開放數據;③ 加強與企業、學術團體、技術團體的合作,如通過舉辦競賽活動、合作建立試點項目等方式,使開放出來的數據得到最大程度的利用;④ 了解民生數據需求,優先開放民生關注領域的數據,如醫療數據、教育數據等。
(2)數據利用者主要指企業等第三方開發機構,他們是政府與個人之間的重要媒介,主要通過開發利用政府數據來研發產品與服務最終提供給用戶來實現價值。數據利用者在開放政府數據價值實現過程中承擔的相應責任有以下幾點:① 利用信息技術最大程度開發利用政府數據,如數據關聯、可視化等,發掘開放政府數據的潛在價值;② 了解市場需求,結合使用政府數據、企業數據和個人數據,開發符合市場需求的產品,創造經濟效益;③ 重視用戶反饋,不斷改進數據產品與服務,提升居民生活水平。
(3)數據受益者主要指普通公眾,他們是開放政府數據的最終用戶,他們對改進和完善開放政府數據從而創造更多價值具有重要的作用。數據受益者在開放政府數據價值實現過程中承擔的相應責任有以下幾點:① 積極表達數據需求,推動政府部門開放更多領域的數據;② 對數據產品與服務進行反饋,幫助企業等第三方開發機構不斷完善產品研發;③ 積極利用開放政府數據來監督政府行為、輔助政府決策或解決生活問題,真正實現數據的增值利用。
生態系統主要由主體、客體和環境構成,數據集作為開放政府數據生態系統中的重要客體,在流動過程中會影響開放政府數據的價值實現。利用數據生命周期有助于對每個階段數據如何影響價值實現進行深入分析。數據生命周期是指從數據產生,經數據加工和發布,最終實現數據再利用的過程。[16]開放政府數據作為數據的一種特殊類型,同樣遵循數據生命周期規律。Attard等最早明確提出開放政府數據生命周期,并將其分為數據創建、數據選取、數據協調、數據發布、數據關聯、數據管理、數據獲取、數據開發、數據探索九個階段。[17]本文通過文獻編碼與分析得到開放政府數據生命周期(見表2)。

表2 數據生命周期各階段在本文及編碼文獻中的出現情況
綜上,本文從數據創建與審查、數據集選取、數據發布、數據獲取與利用、數據管理與評估幾個方面描述開放政府數據生命周期各階段對價值實現的影響(見圖 8)。

圖8 數據生命周期各階段影響價值實現的因素
(1)數據創建與審查。社會中每天都會創建生成大量的數據,政府部門掌握的數據主要來源于公共領域和政府部門內部,公共領域的數據包括氣候、污染、公共運輸、交通、教育等方面的數據,政府部門內部的數據包括預算與支出、人口、地理數據、會議數據等。由于生成的數據來源于多個領域,數據類型、格式、標準不統一,因此在數據發布之前需要對數據集進行審查,包括:隱私信息(是否包含私人或敏感信息)、法律信息(是否符合目前與數據相關的政策規定、許可協議和條款等)、機構信息(哪個機構對該數據集負責)、操作信息(數據收集、更新的頻率)、技術信息(數據的格式)、價值評估(數據集潛在的價值有多大)等,數據審查過程是否嚴格、可靠會影響數據的質量,從而影響價值的生成。
(2)數據集選取。開放政府數據面臨的一個重要問題是應該開放哪些數據,理想情況下,所有數據都應該默認為開放。但這一理想狀態的實現需要時間和法律政策的逐步推進,在這之前,數據集選取成為開放政府數據價值實現的重要影響因素。優先發布高價值數據集是各國普遍的數據集選取路徑,對于高價值數據的分類,國際上不同機構有不同的劃分標準。麥肯錫全球研究所將最具價值的開放數據劃分為教育、交通、電力、衛生保健、消費產品、石油和天然氣、消費者金融7個領域,聯合國電子政務調查報告中將其劃分為教育、健康、環境、社會福利、政府支出、勞動就業6個領域,還有OECD、歐盟、萬維網基金會等機構都有各自不同的劃分。[18]目前,數據集選取主要通過三種途徑:① 開放已處于公共領域的數據;② 參照國際最佳實踐標準開放數據,如“G8開放數據憲章”、萬維網基金會等定義的關鍵數據和高價值數據;③ 社會公眾需求的數據。
(3)數據發布。發布數據的機器可讀性、格式多樣化、元數據描述規范、是否具有唯一標識符等會對開放政府數據的獲取和使用產生重要影響,從而影響開放數據的價值實現。數據的機器可讀性不僅影響數據的處理和分析過程,還會影響數據集之間的整合與關聯。Tim Berners-Lee提出了開放數據發布的五星標準,星級越高,越容易對數據進行再利用和相互關聯,機器可讀格式CSV位于3星處,是后續進行數據整合與關聯的前提和基礎。格式多樣化直接影響數據開發人員對開放數據進行加工利用的積極性,提供的數據格式越多,越容易滿足不同開發者的需求,為后續的產品開發與服務提供便利。元數據是描述數據集的結構化信息,它影響資源的發現和高效使用,它需要隨數據集一起發布和更新,缺乏統一的元數據描述規范是目前開放政府數據面臨的重要問題。資源唯一標識符(URIs)是萬維網的組成部分之一,它可以唯一標識一個資源,數據集是否具有唯一標識符將直接影響不同領域、部門數據集之間的關聯,進而影響數據集的再利用、數據產品與服務的創新。
(4)數據獲取與利用。開放政府數據平臺上發布的數據是否容易獲取、數據格式是否滿足用戶需求等對數據價值的實現具有重要影響。目前數據獲取方式通常有兩種:一種是可下載的批量數據,另一種是提供數據集的API接口。API接口是使用較多的方式,它允許技術開發人員實時獲取數據,但必須要有記錄良好的文檔。數據利用是指對數據進行清洗、分析、整合、關聯、可視化等加工處理步驟后生成數據產品與服務的過程,它是實現開放政府數據增值的重要步驟。該過程可能涉及數據溯源、數據確權、數據安全等方面的問題,解決這些問題對促進開放政府數據的價值實現具有重要意義。數據溯源是為確保最終數據產品與服務的可信性、可靠性和有效性,在數據處理的每個階段都需技術人員標明數據來源以便于數據產品的更新換代;數據確權是指確認數據權利以防止侵權現象的出現;數據安全是指保證數據不涉及國家、企業和個人隱私。
(5)數據管理與評估。數據管理與評估貫穿于數據流動過程的每個階段,它是整個數據流正常、高效運轉的保障,是為了使數據更有用從而創造更多的價值,包括對數據及時性、完整性、準確性的管理和評估。此外,數據使用是否符合數據許可協議要求,是否根據用戶的數據反饋完善數據發布等都是數據管理和評估的重要內容。數據管理與評估可以分為階段性的和總體性的。階段性的管理與評估是指對每個階段可能出現的問題與狀況進行管理以保證整個數據流系統的正常運轉,對每個階段產生的效果進行評估以不斷完善改進達到預期目標;總體性的管理與評估主要是從整體上控制數據流動、評估數據開放效果。目前,國際上比較有影響力的總體評估指標有全球開放數據指數和開放數據晴雨表,在指導開放政府數據的開展和價值實現方面具有重要的借鑒意義。
(1)法律政策。法律層面的保障是開放政府數據的主要推動力之一,開放政府數據涉及國家秘密、個人隱私、商業機密等諸多法律問題,模糊的法律規定易造成開放數據的安全性問題,不利于開放政府數據的長遠、可持續發展。目前,我國尚缺乏國家層面關于開放政府數據的法律政策,僅貴陽、上海、青島、威海、哈爾濱等地制定了專門性法規或政策,其中《貴陽市政府數據共享開放條例》是我國首部也是唯一一部專門針對數據開放的地方性法規。
(2)政府內部組織文化。組織文化是組織成員開展工作的持久動力,如果任務不屬于組織文化的一部分,則組織成員對任務就缺少參與的精力和興趣。開放政府數據并不是工作人員職責之內的事情,而且由于政府部門相對封閉的傳統行政文化的影響,政府傾向于不開放或盡量少開放數據,這嚴重阻礙開放政府數據的發展及其價值實現。目前,只有貴陽、北京、東營等3個地方主管部門的負責人公開表態支持政府數據開放。
(3)社會文化氛圍,主要指社會民眾的數據需求意識和參與程度。用戶數據需求是推動開放政府數據價值實現的重要影響因素,而我國社會民眾的監督意識、數據需求意識相對薄弱,導致開放的數據利用率低、供需不匹配現象嚴重。此外,用戶參與數據開放的程度并不是很高,雖然較多地方性開放政府數據平臺都設置了互動交流版塊,允許用戶提交數據請求、建議反饋等,但網友的參與數量仍較少。截至2018年12月,北京市開放政府數據平臺上的咨詢建議總共才13條,最早一條建議是2015年3月發表的。
(4)技術發展水平。技術發展水平直接影響數據開放的程度和質量,我國尚未建成國家統一的開放政府數據平臺,不便于用戶“一站式”獲取數據,這在一定程度上阻礙了開放數據增值利用的效果。對于絕大多數社會民眾來說,普遍缺乏利用開放數據的知識和技能,這就需要平臺提供相關的工具和指導手冊幫助用戶利用數據。目前,我國只有少部分平臺提供了相關工具,如廣州市開放政府數據平臺提供可視化與分析工具、佛山數據開放平臺提供數據開發工具、山東省數據開放平臺提供地理空間工具。
開放政府數據的主要目的是實現數據增值利用,[19]同時開放政府數據作為一個“生態系統”,需要確保其可持續發展。
(1)注重供需匹配,開放高價值數據。各國在開放政府數據過程中面臨的普遍問題是雖然政府不斷推動開放眾多領域的數據,但數據的利用率卻并沒有隨之呈線性增長,而是一直保持在較低的水平。[20]因此,政府應積極開展社會調查,了解用戶實際的數據需求,有針對性地智能披露政府數據;同時,應注重數據管理和評估,保證供給數據的質量,以激發公眾使用數據的積極性,從而提高開放數據的利用率,促進價值實現。政府還應積極開放高價值數據,例如在開放政府數據初期可以先參照國際上高價值數據的標準,優先開放教育、交通、衛生保健領域等關系民生的數據,后期再根據數據開放的實際情況和社會需求進行調整。
(2)借助商業模式推動數據增值利用。開放政府數據可以產生經濟、政治和社會等多方面的價值,尤其在經濟價值方面具有巨大的潛力,從全球來看,通過開放政府數據釋放的潛在經濟價值估計為每年4萬億美元。[21]因此,政府應積極與企業開展合作,鼓勵企業將政府數據與企業、個人數據等進行關聯以生產數據產品與服務來滿足市場需求,通過商業化模式來推動開放數據的增值利用。例如,政府可以通過開展創新應用競賽、合作建立試點項目等方式來吸引企業投資(資金、技術等),激發企業創新能力,創造巨大的商業價值。
(3)開放政府數據涉及國家安全、商業機密、個人隱私、知識產權等諸多問題,若沒有法律層面的保障和技術層面的脫敏處理等就很容易造成侵權問題,不利于開放政府數據的長遠、可持續發展。因此,開放政府數據的可持續性發展離不開政策法律、資金、技術等的長期支持,更離不開與社會公眾及時、有效的交流互動。首先,應完善開放政府數據相關的法律政策、制定統一的數據發布標準,為開放政府數據提供良好的外部環境;其次,加大資金、時間、人員投入,完善開放政府數據平臺、技術工具等基礎設施的建設,及時更新、維護數據,保障數據質量;最后,開放政府數據的可持續性很大程度上依賴于對各利益相關者不斷產生價值,因此,政府要重視公眾的反饋,加強與公眾的互動交流,實時了解用戶的需求和意見,并及時對數據開放進行調整,從而形成良性循環,促進開放政府數據的可持續發展。