張 斌
(黑龍江大學信息管理學院 黑龍江哈爾濱 150080)
從2009年時任美國總統奧巴馬簽署《開放透明政府備忘錄》到如今,開放政府數據已經有10余年時間。在這期間,全球開放政府數據運動蓬勃興起,而且已經成為一種潮流被國際和國內認同[1-2]。我國每半年發布一次《中國地方政府數據開放報告》,其中城市的排名會出現變化,但是這種變化背后的因素有哪些,哪些因素的組合可以影響城市的排名還有待于分析。
關于影響開放政府數據的因素,目前國內相關研究較少,主要集中在實證分析和從用戶的角度進行分析。實證分析方面,王法碩等人[3]與智慧交通項目有關的18個工作人員進行訪談,采用扎根理論的方法處理訪談數據,認為社會經濟轉型、提高政府績效以及提升企業競爭力5個因素可以影響我國開放政府數據。李梅等人[4]采用解釋結構模型法,對影響我國開放政府數據的12個因素進行了驗證與解析。王法碩[5]采用定性比較分析方法,將我國47個地市分為兩部分,并指出加強地方政府的法制化建設、以政府為主導以及創造良好的外部環境等有利于城市排名靠前,但是兩部分的分類較為主觀。齊艷芬等人[6]構建相關模型對部分城市的開放政府數據進行了實證研究,發現4個影響開放政府數據的因素并根據發現的問題提出了相關建議。從用戶的角度進行分析方面,高天鵬等人[7]采用UTAUT模型,分析影響上海市政府開放數據的主要因素。姜紅波等人[8]通過使用問卷調查以及SPSS分析,定量化研究了用戶視角下的4個因素對政府開放數據所產生的影響。董姣等人[9]認為心理賦權和自我決策會促使用戶積極參與到開放政府數據中,懷疑以及不信任則會削弱開放政府數據的建設。
國外則主要從技術角度和相關政策角度進行研究。從技術角度出發,Gechert Sebastian[10]采用回歸分析的方法對搜集到的104個符合研究要求的數據集進行分析,得出財政稅收、公共支出以及財政轉移支付等能夠對該領域的開放數據產生重要影響。Khurshid Muhammad Mahboob等人[11]采用創新擴散理論和統計分析的方法得出用戶行為之間的相容性以及自愿性更能對開放政府數據的使用產生影響。Siddoo Veeraporn等人[12]采用定性分析的方法,對影響泰國政府數據開放的因素進行了研究。而從相關政策角度出發,Lee Gwanhoo等人[13]分析了美國在組織、財物等領域開放政府數據存在的障礙,提出使用包含5個因素的“開放政府成熟度模型”來推動政府數據更加開放和透明。Grimmelikhuijsen Stephan G等人[14]對美國地方政府500個網站進行了調查,認為提升技術水平、合理的組織機構以及靈活的模式能夠促進政府開放數據。Pfenninger Stefan等人[15]認為確保數據的透明度以及技術上的易用性是確保能源領域開放政府數據可以持續的重要因素。
從上述國內外研究來看,針對開放政府數據影響因素的研究或者是采用定性分析,或者是采用定量的模型以及分析手段進行實證研究,或者是針對不同領域的開放政府數據政策進行分析,并針對發現的問題提出相應的解決措施。但是一個城市開放政府數據排名的變化顯然是多因素共同組合發揮作用的結果,因此需要從系統的角度出發,將涉及到的能夠影響開放政府數據的因素作為一個統一整體進行分析。
本文的研究目的在于分析哪些因素的組合能夠影響城市的開放政府數據的水平,對于能夠起到正向促進作用的因素繼續保持,對于起到負面阻礙作用的因素盡量克服,從而更好地促進我國開放政府數據的持續發展,更好地在大數據時代發揮政府數據自身所具有的經濟價值和社會價值,為相關部門結合自身實際更好地制定開放政府數據政策提供借鑒和參考。
定性比較分析法(Qualitative Comparative Analysis,簡稱QCA)是查爾斯·C·拉金在1987年提出的一種方法。該方法將集合的思想與布爾代數的思想結合起來,以案例作為研究導向,通過對不同條件變量組合情況下的不同案例結果進行比較,得出若干變量與不同因果之間的關系[16]。不同的案例,其結果可能是相同的,也可能是不同的。從這個意義上來說,定性比較分析力求兼顧“定性”(案例導向)與“定量”(變量)兩種分析方法的長處。同時,定性比較分析法力圖實現在保留適當因果復雜性的基礎上,以盡量簡約的形式表達出條件變量的組合。根據本文的實際研究情況以及上述三種方法發展的成熟程度和穩健程度,選用清晰集定性比較分析法(csQCA)來研究本文的數據[17]。
使用定性比較分析法,布爾最小化是關鍵的步驟。即若兩個布爾表達式僅在其中某一個條件不同的情況下產生了相同的結果,那么可以認為這個條件是可以去掉的,則該操作被叫做布爾最小化。經過該操作之后,可以找到產生結果的必要條件[16]。
(1)結果變量的獲取
根據定性比較分析的思想以及本文的研究目的,本次研究的結果變量是各個地市(含副省級)在開放政府數據排名中的變化情況。因此,選取由復旦大學數字與移動治理實驗室與國家信息中心數字中國研究院聯合發布的《中國地方政府數據開放報告》(以下簡稱《報告》)作為數據源。該報告每半年發布一次,是我國第一個專門針對地方政府開放數據進行評估的系列報告,通過科學選取相關指標、多維度的分析對比,全面直觀地呈現出了各個地市開放政府數據的發展情況。
2018年下半年發布的《報告》中包含47個地級市和副省級城市,2019年下半年發布的《報告》包含86個地級市和副省級城市,其中有許多城市是2018年下半年《報告》中所沒有的。為了確保對比的合理性,因此只選取2019年下半年《報告》中排名在前47位的地級市和副省級城市與2018年下半年《報告》中的數據進行對比。排名發生變化的城市情況如表1所示,共計32個城市,其中排名變化顯示“+”的為上升名次,如梅州2019年下半年比2018年下半年上升11名,顯示為“-”的為下降名次,如武漢2019年下半年比2018年下半年下降11名。

表1 排名發生變化的城市一覽表
(2)原因變量的獲取
關于哪些因素會對地方政府落實開放政府數據造成影響,不同的學者有不同的觀點。王法碩[5]認為是領導重視、制度以及組織規范、地方的經濟水平、信息技術等因素;梁乙凱等人[18]則指出數據的及時性、可視化和可讀性是重要因素;Conradie Peter等人[19]則指出數據的存儲、獲取和使用方式是影響城市開放政府數據的關鍵因素;Yang TungMou等人[20]認為法律、政策、組織、外部環境和信息技術是影響地方政府開放數據的主要因素;鄭磊[21]指出科學有效的管理機制、高效便捷的數據使用、內部外部環境的支持可以影響地方政府落實開放政府數據。在借鑒已有研究的基礎上,結合本文研究實際,將綜合經濟發展水平、地方機構設置、數據獲取無障礙、地方信息技術發展程度4項指標作為原因變量。
(1)數據編碼
數據編碼是QCA分析中的重要組成部分,按照一定的標準對涉及到的原因變量和結果變量進行編碼,從而可以應用布爾代數進行運算,最終得到符合要求的結果。結合已有研究,本文各變量編碼規范如下。
本次研究的結果變量是“同一城市在不同年份的《報告》中排名發生變化”,據此將排名上升的城市編碼為1,排名下降的城市編碼為0。
“綜合經濟發展水平”是本次研究選取的原因變量之一。特別是在目前的大數據時代,開放政府數據對于充分挖掘數據內部價值、盤活數據潛力、推動當地社會的經濟發展水平具有重要意義,而經濟發展水平越高,反過來也會要求地方政府的開放數據活動持續開展[22]。同時,政府數據的開放還有助于推動大數據等產業的蓬勃發展,優化地方經濟產業結構,破除原有思維弊端,給地方經濟發展注入新的活力,帶動地方綜合經濟實力整體發展[23]。鑒于2019年下半年《報告》統計截止到2019年10月,據此,依次檢索各省統計局公布的所屬各個城市在2018年和2019年前三季度的GDP數據,并測算2019年數據的增長率。若增長率高于2019年前三季度全國同比增長率,則賦值為1,否則賦值為0。
“地方機構設置”是本次研究選取的原因變量之二。政府的數據開放離不開不同部門之間的彼此協作和通盤考量,地方各個部門之間條塊化現象明顯[24],不同部門之間往往出于自身利益考慮,對于數據開放的力度難以達成準確性意見,同時各個部門之間所掌握的數據格式、規范等各不相同,也給數據開放帶來了障礙。因此需要一個專門的結構來協調處理這些問題,整合不同部門之間的數據銜接問題,實現數據之間的高效集成,將政府數據與社會信息高度融合起來。所以,檢索公開報道,若某個城市負責處理此類事務的機構在2019年成立,那么該城市此項內容編碼為1,否則編碼為0。
“數據獲取無障礙”是本次研究選取的原因變量之三。數據開放是一種手段,其目的在于使得數據可以更好地被社會公眾所利用,從而能夠挖掘數據內部存在的潛在價值,而數據獲取的便利程度是確保公眾可以有效利用數據的重要前提,是否方便可以體現出政府對待開放數據的思想態度?!秶倚畔⒒l展綱要》明確指出“推動政府網站信息無障礙建設”,而譚必勇等人[25]對我國10個省市的調查研究也表明,數據便利程度的高低與否對用戶能否從中發現有價值的信息,輔助用戶進行數據創造有著很大的影響。據此,本研究作出如下賦值:若某城市的開放政府平臺能夠在顯著位置標明“信息獲取無障礙”的,則該城市此項內容賦值為1,否則賦值為0。
“地方信息技術發展程度”是本次研究選取的原因變量之四。開放政府數據的發展離不開信息技術的支撐,大數據的發展促使人們將以前由各個部門、各個系統之間分別掌握的數據整合起來,通過分析碎片化的數據,從中發現出內部深層次彼此之間的聯系[26]。所以,一個城市信息技術水平的高低與其數據的多少以及利用能力的高低有著密切的聯系?!堕_放數據晴雨表》也體現出信息技術較為先進的國家和地區在開放政府數據方面走在前列。2019年下半年的《報告》顯示,省級(含直轄市)開放數據排名中,上海、浙江、貴州名列前三名,其中上海和浙江是傳統意義上信息技術較為發達的地區,而貴州得益于其獨特的地理優勢,與世界諸多信息技術廠商有著密切的合作,也使得其信息技術水平有了長足的提高。據此,若某個城市在2019年《報告》中“數據層”統計排名比2018年排名上升,則賦值為1,否則賦值為0。
(2)二分數據表的構建
二分數據表的構建是進行定性比較分析的基礎,按照前文所述的編碼方式并結合本次研究獲取到的實際數據,本次研究所構建的二分數據表如表2所示。其中,每一個case代表一個城市,Y1到Y4代表4個原因變量,Q1代表結果變量,賦值方式參照前文所述的編碼方式進行賦值。
(3)真值表的構建

表2 二分數據表(部分)
真值表的構建是進行csQCA分析的基礎,將上述二分數據表的數據導入TOSMANA軟件中,真值表的可視化形式如圖1所示。

圖1 真值表可視化圖
圖1中,組合為“0000”“1101”“1100”的區域代表能造成結果變量為0的原因變量的組合,共計3種;組合為“0001”“1001”“1111”“1110”的區域代表能造成結果變量為1的原因變量的組合,共計4種;白色區域是“邏輯余項”,即在本次研究中沒有出現,但是從理論上來說應該存在的原因變量的組合,共計6種;以斜線表示的區域即“矛盾組態”,共計3種,需要單獨進行分析,總共16種情況。
“邏輯余項”只是理論上存在但是本次實際觀察中沒有發現,因此存在實際導致結果變量為0或者1的可能。所以需要在將“邏輯余項”納入結果變量為1和結果變量為0的情況下分別分析。
在TOSMANA軟件中進行布爾最小化操作,可以得到造成結果變量為1的布爾表達式為:
Y1{1}*Y3{1}+Y2{0}*Y4{1}→1
由上式可知,兩種狀態下會得到結果變量為1,分別是Y1{1} * Y3{1},Y2{0} * Y4{1} ,“*”表示兩個變量同時存在的情況。
Y1{1} * Y3{1}對應于case7和case11,即濟南市和陽江市。二者的經濟數值增長速度均高于全國平均水平,同時在對待開放政府數據的態度上,兩地政府均積極應對,在開放政府數據平臺上主動標出類似“無障礙閱讀”的字樣,大大降低了政府數據的獲取門檻,方便政府數據真正為社會公眾所獲得,從而盤活政府數據潛力,真正發現其內在價值。張曉娟等人[27]的研究表明,從國際上來看,經濟發展水平較高的地區,其公眾的監督意識也越強,對于政府數據的利用也就越多,進而可以推動整個地區的開放政府數據深化落實,而從國內研究來看,也有著相似的表現。
Y2{0}*Y4{1}對應于case3、case8和case9,即煙臺市、銀川市和東莞市。上述三個城市負責政府開放數據的機構均成立于2019年之前,是本輪政府機構改革的產物,同其他城市相比,上述三個城市的政府在對待開放政府數據上呈現出積極的態度。政府作為數據的擁有者,在開放數據的過程中起到重要的推動作用。此外,政府在提供相應數據的過程中還應該遵循一定的標準以及技術規范,從“大數據”的思想出發[28],與信息技術等對數據格式、規范等內容的要求協調一致,共同發揮政府數據真正的價值。
使用TOSMANA計算可得結果變量為0的布爾表達式:
Y2{0}*Y4{0}+Y1{1}*Y2{1}*Y3{0}→0
由此可知,共有兩種路徑會導致結果變量為0,分別是Y2{0}*Y4{0}和Y1{1}*Y2{1}*Y3{0}。
Y2{0}*Y4{0}對應于case20、case24和case28,即淄博市、濱州市和揚州市。雖然三個城市均在2019年之前成立相應機構來負責政府開放數據的工作,但是只是在制度上確立,并未標明“信息無障礙”獲取等類似的內容,對于公眾獲取相應的政府數據沒有及時提供便利措施[21]。雖然三地的經濟發展水平在一個比較高的層次,但是從開放政府數據的理念來看,深化落實的程度還不夠,尚未充分從公眾的角度出發,充分提供措施來方便公眾利用政府數據。
Y1{1}*Y2{1}*Y3{0}對應于case15、case16、case19、case29和case17,即宣城市、南京市、日照市、佛山市和武漢市。對比真值表來看,主要是因為對數據的利用率不高以及缺乏“無障礙獲取信息”的渠道所致。從已有研究和我國目前開放數據平臺內容來看,醫療、交通、就業以及教育等數據往往是公眾最想獲得的[29],但是國內大部分平臺在開放數據的過程中恰恰忽略了這點,反而按照政府自身的意愿來進行數據開放。同時政府相關部門的技術工作尚未及時更新,目前已有部分平臺開放API接口,供用戶可以基于自身需要自主進行數據的處理,但是在使用難度以及效率上同商業應用還有著很大的差距,造成政府數據利用效率低下。雖然各個城市的GDP增速在全國平均增速之上,但是在彌補技術上的不足上仍顯得力不從心。因此需要構建良好的開放政府數據生態,從制度、思想上降低開放數據的獲取以及使用難度。
關于矛盾組態,根據圖1來看,主要有三種情況,各情況及其所包含的實例如表3所示。

表3 各個矛盾組態的實例
矛盾組態1主要是case1和其他案例的不同。除了case1最后導致結果變量為1之外,其余均導致結果變量為0。case1是梅州市,雖然從2018年前三季度與2019年前三季度的GDP來看,其數值較小,但是梅州市位于廣東省,社會風氣以及地理位置的不同也讓民眾對于開放政府數據有了比其他省份更多的需求。同時其經濟環境和法治環境同內陸諸多省份也有不同,當地政府的治理理念和治理思想與其他省份相比也有不少超前的地方。胡海波等人[30]的研究表明,一個城市開放政府數據所取得成效的高低,與其法律法規的健全程度、政治環境、社會經濟環境等軟實力有著密切的聯系。兩者之間相互支撐,共同保證政府數據開放的效果。
矛盾組態2主要是case21和case32導致的結果變量與其他不同。case21是棗莊市,case32是中山市。中山市的Y1數值為1.15%,相比于廣東省其他地市,增長率處于一個較低的水平面上,而棗莊市的經濟發展水平從GDP數值上來看也排名靠后,2018年和2019年在山東省前三季度排名均排在15位。曹雨佳[31]針對19個地方政府的調研顯示,地市的經濟發展水平能夠對政府開放數據產生重要影響;黃如花等人[29]通過研究發現,在經濟發達的省份或者地區,開放政府數據平臺建設更加完善,更有助于地市在《報告》中的排名上升。
矛盾組態3主要是case4和case30導致的結果變量不同,其中case4是肇慶市,其結果變量為1;case30是廣州市,其結果變量為0。從行政職能來看,廣州市所擔負的行政職能比肇慶市要多,在社會公共資源有限的情況下,勢必會對每一項所投入的資源要少。從時間上來看,開放政府數據是一項長期的活動[32],人力、財政、行政等各方面都要發揮作用共同協調,同時對于開放政府數據過程中出現的潛在威脅也要進行妥善處理,因此導致廣州市在《報告》中排名下降而肇慶市排名上升的結果。
本文通過以《報告》中排名發生變化的城市作為研究對象,分別以排名上升和排名下降作為分類標準,使用定性比較分析法對哪些因素的組合導致城市排名變化的進行分析,得到結論如下:
(1)經濟發展水平高于全國平均增長率的城市,當地政府不僅應在制度上積極落實開放政府數據的要求,同時應該從社會公眾等用戶的角度考慮如何讓他們更加高效便捷地獲取所需要的數據,滿足他們對于政府數據的需求,這能夠更好地促進地市開放政府數據的水平。
(2)信息獲取無障礙程度越低、便利性越低,同時對于日常與數據開放、獲取以及分析等利用密切相關的技術無法及時發揮作用,對地市的開放政府數據會產生阻礙作用。
(3)城市的軟實力高低往往會對開放政府數據的程度起到顯著影響。同時行政級別越高的城市、擔負的行政職能越多的城市在日常對待開放政府數據的過程中更應該在公共資源上給予更好的傾斜,從而確保開放政府數據的力度能夠得到穩步提升。
本文依然存在的不足主要是原因變量的分類略顯粗糙,還可以根據城市的行政級別來進行劃分,同時對于經濟發展水平等原因變量的賦值還可以采取更加細致的賦值方法,后續可以在這方面繼續開展相應的分析以進一步充實研究成果。