












摘"" 要:腐敗程度的測量在評價腐敗治理成效及開展高質量實證研究方面處于基礎性地位。目前,腐敗程度測量方法主要有主觀測量和客觀測量兩類方法,主觀測量法中影響力最大的是透明國際發布的國家清廉指數。探究國家清廉指數的腐敗程度測量流程,分析其局限性及緣何失準的原因,對腐敗測量方法的革新與發展具有重要意義。貝塔斯曼轉型指數是國家清廉指數的重要數據來源之一,其主要通過國家評估、初審、區域審查、不同區域互查、校對五項步驟及兩項具體腐敗測量題目,以十分制形式及“民主”“治理”兩個維度分別測評腐敗預防程度與懲治程度,具有良好的信度與效度。但該指數因專家選擇偏差、存在西方價值觀偏向等問題而一直存在局限性與測量失準風險,因此,應當通過更新腐敗測量方法、提高評分專家代表性等方式提高腐敗程度主觀測量法的測量質量。
關鍵詞:貝塔斯曼轉型指數;國家清廉指數;腐敗程度;測量方法
中圖分類號:D630.9"""""""""""""""" 文獻標識碼:A""""""""""""""" 文章編號:1674-9170(2024)01-0070-15
腐敗是人類社會中普遍存在的一種現象或問題,具有廣泛且嚴重的危害性,是很多國家面臨的最緊迫且重要的公共問題之一。準確測量腐敗或腐敗程度、廉潔程度、清廉程度(以下統一使用“腐敗程度”),對于相關理論研究及實務工作都十分的重要①。然而,由于腐敗具有復雜性、隱蔽性等特征,如基于人情關系的隱性腐敗與文化腐敗①,測量起來十分困難,迄今為止都沒有得到很好解決。為了更有效地治理腐敗、評價治理成效以及開展高質量的實證研究,更需要準確地測量腐敗程度。
本文首先對國內外現有的腐敗程度測量方法文獻進行回顧,重點介紹軟數據法,即問卷調查法,之后以影響力較大的國家清廉指數中用到的貝塔斯曼指數為對象,重點對其中的腐敗程度測量方法進行了介紹和分析。文章最后就加強研究與改進腐敗程度測量方法提出了相關的建議。
一、腐敗程度測量方法及文獻綜述
腐敗程度測量既重要又困難。準確測量出腐敗程度,科學評估其造成的不良影響及后果,才能使反腐敗工作走向深入和徹底②。腐敗程度測量方法經過多年的發展,已經日益普遍地在各國很多地區和部門開展起來,但實踐中所采用的腐敗程度測量方法仍存在爭議與較大的局限性,嚴重地制約了腐敗程度測量方法的發展及其結果的科學性。
當前學術界多由腐敗程度測量方法的類別、應用及影響的視角對腐敗測量方法進行研究。透明國際公布的國家清廉指數作為腐敗程度測量指數中最具影響力及代表性之一的數據,主導了國家腐敗程度測量領域的方法發展及演變,在國際社會影響巨大,其具體分數往往視作一個國家或地區的清廉水平,但其在腐敗評價標準等方面仍存在意識形態偏見③。具體到一個國家中,經由定量、定性或混合研究視角所得出的腐敗程度,往往與政府工作效率④、公眾反腐敗意愿⑤、地區發展水平⑥等具有高關聯度,并以此作為政府工作改進及完善的“標尺”,這也意味著腐敗程度測量方法合理性及結果科學性研究是重要且必要的。因而,部分學者由國際研究視角切入,對國外腐敗研究及個案進行梳理,總結腐敗測量方法類別,分析各類測量方法的可靠性與局限性,并探討如何有效遏制腐敗⑦⑧。
學界依照測量對象或途徑的不同,將腐敗程度測量方法劃分為主觀測量法、客觀測量法與行為測量法三種。其中,使用廣泛的是前兩種方法。客觀測量法(或硬數據法),主要根據一個國家的執法部門、司法機構當期查處的腐敗案件數量、官員級別及涉案金額等來評價腐敗程度。主觀測量法(或軟數據法),主要使用受訪者個人對于腐敗程度的主觀看法來進行評價,其中使用最多的就是問卷調查法,也稱為民意調查法。學者任建明對這兩種主要方法進行了分析研究,同時,在對現有腐敗程度定義進行討論和修正的基礎上,提出了一種可準確測量腐敗程度的新型測量方法,即行為測量法①。行為測量法是基于人們的真實經歷即行為來直接測量腐敗水平。相比于傳統的兩種主要方法,行為測量法還比較新,使用較少,還未受到足夠的重視。各類方法測量的對象與機制均有明顯區別,仍存在較大的爭議。其一,腐敗程度測量應從各種影響因素著手分析,其應由時間、空間視角下考慮經濟、社會與環境等多維度情況進行測評,以確保其全面性及結果的科學性②。其二,在具體測量實踐過程中,由腐敗狀況、反腐敗績效、腐敗風險三個維度構建測量腐敗的框架,將會是兼具有系統性與科學性的指標體系③。其三,于中國而言,應充分考慮中國在不同發展時期中面臨的反腐敗問題類型、程度和趨勢方面的特點④,動態調整對國際腐敗程度測量方法的采納與借鑒,并給出適用于中國新時代背景下廉政建設話語體系的腐敗測量方法。
因此,客觀測量法是最早得到使用的方法,其缺陷也暴露得比較充分。有鑒于此,自上世紀90年代以來,作為其改進方法的主觀測量法應運而生,且日益成為主導方法,使用頻次很高。本研究聚焦主觀測量法中的代表性測量指數,對其進行分析,以窺探腐敗程度測量方法的異同優劣、局限性及改進策略。在諸多主觀測量法中,有一個側重測量國家腐敗程度的指數是國家清廉指數(Corruption Perceptions Index,CPI),由影響較大的國際民間組織透明國際(Transparency International,TI)每年發布⑤。該指數由多個獨立調查數據合并而成,其中一個重要來源便是貝塔斯曼轉型指數(Bertelsmann Stiftung’s Transformation Index,BTI,下文統稱為“貝塔斯曼指數”)。貝塔斯曼指數是一個基于問卷調查獲得的主觀數據而形成的指數,主要用于評價轉型國家的民主、經濟、治理狀況,其中包含腐敗程度方面的測量。因其腐敗程度測量數據被透明國際的國家清廉指數所引用,進而獲得較大的影響力和知名度。相較于其他測評指數,該指數在評測對象的選取、測評流程、問卷的信度和效度方面更具有優勢,考慮到了國別間的差異性及政策的時滯性,最終得分能夠一定程度上反映被測評國家的反腐敗力度及腐敗懲治程度,但在實踐評測及理論研究過程中,其評價結果片面性、西方價值觀局限性等各類弊端也得到暴露,也是主觀測量法的通病。
總體來說,當前學界對腐敗程度測量方法的流變、發展與應用已具有一定共識,但對于其中的具體方法,特別是主觀測量法的使用、解釋力及準確性方面仍存在爭議。誠然,學界已有部分研究關注腐敗測量方法的弊端與改進⑥,但鮮有研究對國家清廉指數的來源指數進行分析,聚焦于某個具體測量方法的局限性分析更加匱乏。貝塔斯曼指數作為國家清廉指數來源指數中的代表性數據,總結其與其他測量指數之間的優劣,歸納測量方法中所共有的缺陷,對未來腐敗程度測量方法的改進具有重要意義。貝塔斯曼指數方法包括其中的腐敗程度測量方法依托專家團隊成員,有嚴格的評價程序和標準,選擇它作為個案進行深入研究,一方面有助于了解腐敗程度主觀測量方法的主要流程、標準及應用解釋范圍,另一方面也有助于由國家清廉指數來源指數的視角切入,分析當前腐敗測量方法的通病及改進策略。因此,本文以貝塔斯曼指數為例,分析其具體腐敗測量流程,聚焦研究問題為:貝塔斯曼指數與其他腐敗測量指數相比有何優劣?其具體測量過程中,西方偏頗價值觀等因素何以影響測量過程而導致測量失準?未來如何改進及對中國腐敗測量有何啟發?本文以貝塔斯曼指數尤其是其中的腐敗程度測量方法為研究對象,對其基本情況、測量方法、測量結果及局限性進行多角度的分析與研究。
二、貝塔斯曼轉型指數概述
貝塔斯曼指數是由評分主體經過評估、審核、校準等環節形成最終評價數據,并由貝塔斯曼基金會發布的一項評估指數。貝塔斯曼基金會成立于1977年,是一家具有一定獨立性、非政黨且具備一定研究能力的非政府組織。總體評估過程包括三大環節,首先由貝塔斯曼指數團隊組建評分主體,將全球劃分為7個區域①,而后由評分主體對來自7個區域的137個國家②進行評估與審核,最后形成評分數據集與評估報告。
(一)貝塔斯曼指數評價過程與指標體系
1.指數評價與審核
評分主體由包括貝塔斯曼指數團隊成員在內的三部分專家人員共同構成,其余兩部分為區域協調員及國家專家。
詳細的評估過程參見圖1,分為國家評估、初審、區域校準和審查、不同區域審查和校準及最終校對5個步驟。第一步,國家評估階段,由2名專家對單個被測評國家的經濟、民主和治理方面情況進行評估打分,2名專家中,1名是被測國家當地的專家,1名是外國專家,總共有286名專家參與137個國家的打分。第二步,由負責校準得分的區域協調員進行分數與內容的初審。第三步,區域協調員再對其所在區域國家的總體評分及報告進行校準,以確保得分無誤。第四步,由指數項目團隊進行所有評價國家的分數校準。第五步,由貝塔斯曼基金董事會進行審核。該方法中的專家打分仍具有較強的主觀局限性,在后期應通過均衡不同地域的專家比例或引入客觀交叉數據等方式予以修正,以提高效度與信度。
2.指標體系
貝塔斯曼指數的指標體系包括民主、經濟、治理三個維度,三個維度下共有17個二級指標及52個具體題目。民主維度包括5個二級指標及18個測量題目,主要對國家暴力(force)、法治體系等方面進行評價,法治指標中的題目3.3用于測量國家對腐敗現象的懲處程度。經濟維度包含7個二級指標及14個測量題目,對國家宏觀經濟運轉情況進行評估。治理維度包含5個二級指標及20個測量題目,主要對決定國家治理成敗的關鍵領導者、政策因素進行評估,資源效率指標中的題目15.3用于測量國家對腐敗現象的遏制程度。與腐敗程度測量有關的指標及題目如表1所示。
(二)貝塔斯曼指數計算方法與評價結果
1.指數賦分與審核
貝塔斯曼指數得分結果的形成經由三個步驟,即國家評估、多層審核及聚合計算。
首先,在國家評估階段,各國參評專家使用貝塔斯曼指數團隊編制的編碼表(Code),基于52個問卷題目給出國家得分。得分結果為數字等級形式,由1到10,該10分總區間由低到高劃分為4個等級,分別為1—2、3—5、6—8、9—10分。
2.得分加權與匯總
在確定所有指標下設題目分數無誤后,進行指數聚合計算。根據各維度題目的標準得分加權平均值計算每個維度的總平均得分,而后民主、經濟與治理三個維度,分別按照圖2所示的計算流程,聚合為“趨勢指數”與“治理指數”。
“趨勢指數”用來測評國家在民主法治和市場經濟體制下走向民主狀態的趨勢,由“民主”和“經濟”兩個維度總得分的平均值表示。“治理指數”反映領導變革過程中的政治領導素質,由加權計算“治理”維度所有題目的平均分數表示。兩個指數從不同方面反映被測評國家的轉型情況,分值高低代表國家轉型程度的強弱,并作為國別間比較的依據。
總體來說,由指數的基本特征出發,貝塔斯曼指數與其他諸如世界正義指數(Word Justice Project)等國家清廉指數來源指數比較而言,具備以下優勢:國家或地區的打分更具有代表性、評價國家或地區涵蓋范圍更廣泛、打分過程更具有合理性等。具體而言,貝塔斯曼指數打分過程總共有286名專家參與137個國家的打分,國家與地區的數量與其他指數而言相對較多,一方面,在選取國家時并不選取國家內具有代表性的某一座或兩座城市進行打分,而是由專家根據國家的整體情況進行賦分,確保能夠更加具體且真實地反映該國或地區的清廉狀況;另一方面,在專家選擇過程中更多選擇高校或在領域具有影響力的權威專家進行打分,確保結果的合理性與科學性。
三、腐敗程度測量方法及分析
(一)腐敗測量指標介紹
1.題目得分與等級劃分
貝塔斯曼指數分析并評估了轉型國家的民主和經濟狀況,所發布報告中提供了各國家的總得分及各個指標得分,分值由1到10分,劃分為4個等級,分別為1—2、3—5、6—8、9—10,分值越高表明這個指標轉型情況越好,反之為越差。其中有2個具體題目測量被評估國家的腐敗程度,即題目3.3與題目15.3。
題目3.3測評濫用公共權力者受到懲處(penalize)的程度(extent)。四個等級得分分別表示濫用公共權力者“幾乎未受到懲處”“受到一定程度的懲處”“受到較大程度的懲處”及“受到極大程度的懲處”,等級越高,表示受到懲處的程度越大。
題目15.3主要測評政府防控(contain)腐敗的程度(extent)。四個等級得分分別表示“政府幾乎未遏制腐敗”“政府在一定程度上遏制了腐敗”“政府在較大程度上遏制了腐敗”及“政府在很大程度上遏制了腐敗”,分值越高,表示一國政府對腐敗的遏制程度越好,反之為越差。
國家清廉指數的具體計算方法經過一次大的調整,調整前,計算方法是百分比匹配法,即對不同報告數據進行標準化處理后,利用新的報告數據和前一年的清廉指數進行匹配,將前一年清廉指數中的最高得分賦予在新的報告數據中排名第一的國家的標準化值,并以此類推。調整后,計算方法是簡單平均法。在新計算方法中,來源于貝塔斯曼指數的這2個題目得分同樣以簡單平均的方式納入國家清廉指數之中,具體包括估算缺失值、數據標準化處理、計算數據來源的平均分與方差3個步驟。首先,因為各個原始報告所測評的國家不同,因而需要估算沒有包含在某個報告中的國家的分數,從而獲得各報告的完整數據集。其次,將不同分數取值范圍的原始報告得分都轉化為百分制分數,此即數據標準化處理。最后,將經標準化處理后的各報告數據進行簡單的算術平均,即為某個國家的清廉指數得分。
2.測量題目含義解析
題目3.3與題目15.3均是對某個國家的腐敗程度進行測量,但不同題目測評的側重點不同,問卷設計中的得分等級設計也各不相同。最終題目得分的高低代表著被測評國家的腐敗程度的高低。
題目3.3側重于測量政府依法懲處官員腐敗的程度。該題目旨在評價公職人員產生腐敗行為后是否以及在多大程度上會經由公眾監督及法律起訴從而被追究責任,另一方面也反映了法治受到腐敗破壞的程度強弱,最終表現形式是依法對腐敗行為與官員的懲處程度。
如圖4所示,該題目得分的高低代表了腐敗官員受到法律懲處程度的強弱,該題目得分越高,表示違法腐敗官員受到法律懲處并被當作負面典例予以報道的程度越大,則被測評國家的法治體系越良好,受到腐敗影響的程度越小;反之,該題目得分越低,反映腐敗行為越不會受到有效的懲處與負面報道,法治體系被嚴重侵蝕。如圖3,如果測量的是腐敗程度,該題目的得分屬于“負向”指標,即分數越高,腐敗程度越低;如果測量的是清廉程度,該題目的得分屬于“正向”指標,即分數越高,清廉程度越高。
題目15.3側重于測量政府遏制腐敗的效果。主要測評在國家財政支出審計、公民和媒體獲取信息渠道、官員問責制、廉潔行為準則等7個廉政機制下被測評國家是否有適當的制度安排及反腐敗政策,以及這些政策在多大程度上起到了遏制腐敗的作用。
如圖5所示,該題目得分的分值高低代表了政府遏制腐敗的程度強弱。該題目得分越高,表示被測評國家對腐敗的遏制程度越大,表明國內廉政機制運轉越有效;反之,該題目得分越低,反映被測評國家越不能遏制國內的腐敗,廉政機制幾乎無效。如圖3,如果測量的是腐敗程度,題目15.3的得分屬于“負向”指標,分數越高,則腐敗程度越低;如果測量的是清廉程度,該題目的得分屬于“正向”指標,即分數越高,清廉程度越高。
(二)測評可靠性及比較分析
貝塔斯曼指數中的2個腐敗測量題目作為國家清廉指數的重要來源數據之一,其需要具備一定的可靠性與準確性。本部分將通過效度、信度及評價結果的比較分析評價其可靠性。
1.效度與信度分析
本研究以貝塔斯曼指數目前所采用的最新版本測評問卷為基準,對其中指標及題目運用SPSS及AMOS24.0進行效度與信度檢驗。
(1)效度檢驗
效度分析主要包括內容與結構兩個方面。在內容效度方面, 2個題目可以較好地貼合打分選項,并有效反映被測量國家的腐敗程度,但在評分方面具有較大的價值觀偏向問題。
一方面,國家清廉指數及貝塔斯曼指數都是具有較大世界影響力的指數,就其本身的數據編制及來源而言,具有較高的內容效度,但在內容賦值環節仍具有較大的西方價值觀導向問題①。我國自十八大以來采取了更為嚴格的反腐敗措施,查辦的案件及人員數量有顯著增加,但兩個指數的得分增幅并不明顯,近幾年甚至低于如俄羅斯、巴西等反腐敗政策力度不大的國家。該指數未對中國近年來的反腐敗進展與成效予以應有的呈現,可見其內容效度還存在一定的偏差與問題。
另一方面,就題目3.3及題目15.3本身而言,其測量的主要不是腐敗程度,而是政府的反腐敗程度,但國際透明直接用這2個題目計算被測量國家的腐敗程度,并沒有對如何轉化其中的反腐敗程度內容做出解釋,具有一定的不合理性。某一問題的解決措施及有效程度與問題本身之間雖有一定關聯,但并不能直接劃等號,即一個國家的反腐敗政策有效程度大小無法準確反映出一個國家的腐敗程度,故這兩個題目在換算為國家清廉指數時具有一定邏輯缺陷,內容效度因此有所缺失。
在結構效度方面,以2012年及之后的貝塔斯曼報告中總得分數據與2個腐敗測量題目數據作為樣本,進行因子分析以檢驗問卷的結構效度,得到結果如表3所示。Bartlett檢驗對應p值小于0.05,通過Bartlett檢驗,同時KMO值為0.718,介于0.7—0.8之間,說明問卷整體效度較好。
運用主成分分析法,通過最大方差法進行因子旋轉,特征根大于1的因子有3個,各題目在該因子的載荷均大于0.65,因而運用AMOS對樣本進行驗證性因子分析,采用極大似然法檢驗單因素模型擬合程度,結果如下表4,各指標均符合臨界值范圍,效果良好①。
另外,單獨對問卷中題目3.3與題目15.3得分進行效度檢驗,方差解釋率與旋轉后累積方差解釋率均為96.611%,因子載荷系數為0.983,公因子方差為0.966,且所有研究項對應的共同度值均高于0.4,因子旋轉后累積方差解釋率也大于50%。這說明,研究項的信息量可以被有效地提取出來,2個測量題目能夠有效反映被測評國家的反腐敗程度或腐敗程度。
(2)信度檢驗
在信度檢驗方面,同樣選取2012年及之后歷年得分數據作為樣本,使用SPSS進行檢驗。本研究采用如下公式計算克朗巴哈系數(Cronbachα)進行信度檢驗。
?琢=(1-)(1)
其中K為的項數,?滓為總樣本的方差,?滓為觀測樣本的方差,計算得到Cronbachα值為0.946,大于0.9,說明調查問卷的信度非常好。
此外,對題目3.3及15.3得分進行檢驗,如表5所示,得到Cronbachα值為0.965。信度系數值為0.965,大于0.9,說明信度很高。針對“CITC值”,分析項的CITC值均大于0.4,說明分析項之間具有良好的相關關系,同時也說明信度水平良好。
2.評價結果的比較分析
為進一步分析腐敗測量題目的質量,本部分以2003年數據作為基準年數據,分別選擇題目3.3與題目15.3的歷年得分對中國與其他相似國家進行橫向比較,同時對中國得分進行時間序列的縱向比較。
首先選取我國數據作為基準,根據地緣距離、發展態勢、國家體量及近年表現等因素,結合貝塔斯曼指數報告中所劃分的7個區域:亞洲和大洋洲(區域1)、蘇聯后歐亞區域(區域2)、中東歐和東南歐(區域3)、中東和北非(區域4)、拉丁美洲和加勒比區域(區域5)、南部和東部非洲區域(區域6)、西非和中非(區域7),共選出6個對比國家,分別為新加坡、波蘭、印度、俄羅斯、巴西和印度尼西亞。
(1)中國與他國橫向比較
比較歷年各國2個題目的得分,顯示我國得分普遍低于所對比的其他6個國家,在題目3.3的得分對比中更為明顯,如表6與表7所示。
亞洲區域內比較顯示,中國與新加坡的分數差距最大,依照貝塔斯曼指數的評分依據,巨大的分差主要與新加坡法治水平較高及嚴格的法律和紀律執行有較大關系;但是,我國與印度、印度尼西亞分差不大,與印度尼西亞的差距最小,這與近些年中國反腐敗政策力度遠大于印度和印度尼西亞的情況不符。
不同大洲間比較,我國的測評得分與俄羅斯較為接近,而與波蘭及巴西有一定差距。近年來,從法律政策制定、反腐體制改革及查辦腐敗案件數量角度來看,中國比之俄羅斯、印度及巴西等國家,顯然都具有更高程度的政策力度與決心。橫向比較結果顯示,這種主觀評價的背后還是有明顯的價值觀或意識形態影響,這種影響甚至會產生巨大的偏差。因此,需要辯證且客觀地看待和使用此類指數評價結果。
(2)中國得分縱向比較
匯總中國2003—2020年的總得分及題目3.3、題目15.3得分如表8所示。
比較中選取黨的十八大為一個重要時間節點,進行前后的對比分析。黨的十八大后,我國開展了全面從嚴治黨和高壓反腐①,反腐敗決心和力度達到前所未有的高度。但是自2014年及以后年度,題目3.3及題目15.3的得分雖有所提高,但并不顯著,與其他指數相比(參見表9),清廉指數中國2014年、2016年、2018年及2020年得分分別為36分、40分,39分、42分②,世界正義指數(WJP)下屬的法治指數中國2014年、2016年、2018年、2020年得分分別為0,48分、0.52分、0.55分、0.53分③,可以看出,得分雖有波動,但整體呈現出樂觀的上升態勢,且上升的幅度均大于評價指數的最小得分單位(1分或0.01分),因而題目3.3與15.3中常年得分為4或5的情況不能很好地反映出中國治理腐敗的進展與成效。綜合之前的橫向比較,說明貝塔斯曼指數中的腐敗程度測量還是具有較大的局限性,尤其無法全面、及時反映中國的情況。
貝塔斯曼指數中的腐敗程度測量結果,或許在一定程度上與我國紀法并重有關。近些年來我國反腐力度與決心雖然顯著加大,查辦案件總數激增,但腐敗案件進入法律訴訟階段的數量占比依然很少,增加并不明顯。題目3.3與題目15.3衡量的主要是依法反腐力度,這或許是評估得分較低的一個原因。
總體而言,由指數測量過程、指標選擇及問卷設計出發,相較于其他指數,貝塔斯曼指數具有較高的信度與效度,保證了問題得分的可信度與報告的可借鑒性。此外,貝塔斯曼指標體系中的具體問題更能代表一個國家對腐敗的懲治及預防程度,減少了其他可能對專家評分產生影響的要素,保證最終得分結果的相對客觀性。但是需要注意的是,無論是貝塔斯曼指數還是世界正義指數,都存在著極大的西方價值觀偏好導向,影響了其他價值體系國家的得分情況,在后期應該逐步改進。
四、測量失準原因及改進建議
作為國家清廉指數重要數據來源之一的貝塔斯曼指數,在腐敗程度測評方面有著重要的國際影響力。該影響力體現在國際、國家、社會及個人等不同層面。但人們同時也要看到它的局限性,貝塔斯曼指數通過專家打分的方法測評腐敗程度,不可避免地會存在專家個人的主觀性和價值觀方面的偏差,造成評價的失準。盡管貝塔斯曼基金會在2012年已針對存在的問題對評分標準進行了改進,并采用了新版調查問卷,但在公信力與解釋力方面的問題依然存在。因而人們需要辯證看待貝塔斯曼指數的評價結果,特別是近年來對中國的評價情況。
(一) 指數影響分析與評價
貝塔斯曼指數報告每2年發布一版,涵蓋所測評各個國家的具體得分與排名,可依此在國家間做橫向對比分析或一國內縱向比較研究。作為轉型發展方面的權威指數,貝塔斯曼指數報告在評價、衡量和引導國家發展、社會進步與腐敗測量方面還是具有一定的價值。下面從不同層面分析其影響力。
1.國際與國家層面
在國際層面上,貝塔斯曼指數提供了一個國際認可度較高的基礎數據與比較依據。基于該指數評估的專業性與合理性,被公認為是對國家轉型過程進行評判比較的全球權威工具之一,英國、德國和美國政府將其作為評估其伙伴國的標準。特別是腐敗程度測量方面,貝塔斯曼指數中的腐敗測量數據常被作為學術理論研究的數據支撐與媒介報道的重要引據。
在國家層面上,貝塔斯曼指數為國家轉型及具體措施的實施提供了一定的理論支撐。比如,關于腐敗程度測量問題的具體得分為各個國家提供了一個定位與參考,其中得分排名也在一定程度上為國家間的比較提供了一個標準,從而使國家間的比較成為可能,由此推動人們對發展與轉型及其趨勢的關注,其他指標間的比較亦是如此。有必要指出的是,在使用上不應只關注排名或得分,而應結合非匯總分數及國家報告進行綜合分析,同時辯證地看待排名與分數可能存在的不足,以得到更有參考價值的轉型與發展建議。
2.社會與個人層面
在社會層面上,貝塔斯曼指數為社會發展與腐敗治理提供了一定的指引。基于歷年的貝塔斯曼指數報告及指數地圖集(BTIAtlas),可對每個被測評國家的腐敗治理情況進行多角度的觀察與對比,如時間序列比較、相關性分析等,通過不同指標間的差異來發現問題,為未來社會的發展及腐敗治理提供更明確的方向。
在個人層面上,貝塔斯曼指數有助于公民獲取信息并實施監督。貝塔斯曼報告為各國公民個人提供了一個多元化的信息了解渠道,方便個人對國家發展的相關信息進行獲取與解讀。特別是公民對腐敗程度方面信息有了更深入理解,有助于公民對公共權力濫用問題進行監督①。與許多其他指數項目不同,貝塔斯曼指數評估方法及流程透明度高,歷年報告及得分均可搜集獲得,在擴大公民信息獲取源的同時也為公權力使用的監督提供了保障。
(二)局限性分析
1. 樣本選取與測量邏輯的局限性。局限性主要體現在兩個方面。其一,是國家樣本選擇方面的偏差。貝塔斯曼指數是一個國家轉型發展方面的專業指數,因此選擇的國家樣本都是轉型期或發展中國家。任何國家和地區都存在腐敗問題,因此國家清廉指數力圖評價全球盡可能多的國家。二者之間在國家樣本選擇上有著很大的不同,由此帶來國家樣本選擇上的巨大偏差。其二,國家清廉指數和貝塔斯曼指數相關指標在邏輯上缺乏強關聯性,會導致評價偏差或錯誤。國家清廉指數評價的是各個國家政府或公權力的腐敗程度,當然,從相反的方面看,也可以看成是清廉指數。國家清廉指數的大部分原報告也都是評價腐敗程度。但其引用貝塔斯曼指數中的題目3.3和題目15.3評價的不只是腐敗程度,甚至主要不是腐敗程度而是反腐敗程度。腐敗程度和反腐敗程度是完全不同的兩類變量或指標,二者之間并沒有必然的邏輯關聯性②。例如,甲國政府對反腐敗并不重視,但該國卻可能比較廉潔;乙國政府堅定地反腐敗,但該國卻可能比較腐敗。這種較為極端的情況是存在的,甚至在一定的時期內還較為普遍。用反腐敗程度指數來評價兩個國家的腐敗程度,會帶來很大的邏輯偏差。
2.意識形態因素與分數比較的局限性。評分主體大多為各個國家的專家,即286名專家參與137個國家的打分,但在貝塔斯曼指數報告中缺少如何合理選擇專家的具體說明與流程。各國專家之間在知識能力、對評分標準的理解程度上肯定存在一定的差異,在這些專家何以能有效擔當起評分主體角色這個問題上,指數報告中并沒有給出具有說服力的解釋。另外,由于發布機構的意識形態、西方價值觀等原因,在選擇樣本國家時,并非秉持客觀標準。例如,新加坡是公認的發達國家、民主與法治國家,但由于長期的西方偏見,新加坡一直被歸為非民主國家,列在轉型指數評價所選國家樣本之中。
此外,貝塔斯曼基金會依照指數得分情況對被測評的國家進行排名,目的是更方便地進行國家間轉型情況的比較。但因為指數得分精確度與年份問題往往導致這種排名方式缺乏公信力與準確性。由于每年測評的具體國家樣本和數量有所不同,且在不斷地更新變化,這必然對比較的連續性和穩定性帶來不利影響。另外,該指數所使用調查問卷在2012年也經過一次更新,這也會對單個國家前后得分與排名產生影響,降低了可比性。
(三)改進建議
針對貝塔斯曼指數尤其是腐敗程度測量方法與結果上的局限性,提出以下三個方面的建議。
1.不斷提高專家的代表性。貝塔斯曼指數測評方法是腐敗主觀測量法中具有代表性的方法,在測評過程中產生不公平對待問題的根本原因在于專家人數過少以及由此可能放大的專家個人的意識形態偏見與局限性,從而影響測評的信度與效度。與普通大眾相比,專家在知識、信息、客觀、中立等方面均有著一定的優勢,但專家也是個體,一定存在著個人的偏見與局限性。如果專家人數過少,這種局限性就會被放大。貝塔斯曼指數通過286名專家對137個國家進行打分,缺少客觀評價數據支撐,主觀性過強。因此,貝塔斯曼指數亟待解決的一個問題是增加來自不同地區國家的專家數量并調配好各地區專家數量的比例。只有各國的專家數量增加到一定的標準,專家的代表性才有保證,專家個人的偏差才能有所抑制,從而提升和確保評價結果的可靠性。特別是中國作為全球轉型發展中國家中的大國,更應考慮在專家總數中增加中國專家數量,以確保評價結果的可靠性和代表性。
2.更新并改進指數的數據源。盡管國家清廉指數影響力很大,但從其測量方法的合理性角度而言,僅具有一定的參考作用,仍存在一定的缺陷。針對題目測量內容與國家清廉指數之間的換算邏輯缺陷,主要可以從三方面進行修正:第一,更新國家清廉指數的數據源。自1995年發布以來,國家清廉指數每年的數據源都在發生變化,在未來測算過程中應適時剔除與腐敗程度相關度不大的測量題目與數據源,及時更新更貼合的數據源,選取如世界正義項目(WJP)中“政府官員利用公職謀取私利的程度”此類題目,對腐敗程度進行更直觀測量;第二,透明國際應盡快設置獨立的調查方案與數據庫。國家清廉指數目前沒有獨立的調查方案,完全依靠其他組織機構的腐敗調查數據編制而成,過程中會面臨不同數據的時間、標準與測評地區不一等問題,后期應著力開發獨立調查方案并建立數據庫,保障測量的內容效度,避免其他數據源的客觀差異與主觀局限性;第三,改進腐敗測量方法。原有的主觀測量法與客觀測量法均具有較大主觀偏差的局限性,后期應當加強探究新的腐敗測量方法,或改進傳統方法,比如采用主觀測量法與客觀測量法相結合的方式,多方法、多數據進行循環驗證以規避傳統單一方法的局限性。
總的來說,貝塔斯曼指數可以為我們提供一個國際視角,以評價我國的腐敗情況與反腐敗程度。但同時也必須認識到由于在題目測量主觀性與換算邏輯等方面的缺陷,貝塔斯曼指數存在著內生邏輯缺陷及對中國評價的不平等對待,因而不能盲目地將其作為反腐敗研究和實踐的科學依據,后期也應及時更新改進腐敗測量方法及數據源。
3.亟待加強對腐敗程度測量方法的研究。腐敗程度測量作為一個基礎性理論問題,迄今為止都未得到很好的解決。主觀測量法普遍存在著因評分者的主觀性以及個人信息的局限性而帶來評價結果上的較大偏差。客觀測量法存在著系統誤差,也難以測量出真實的腐敗程度①。總之,這兩種腐敗測評方法都存在著嚴重的缺陷,具有較低的結果信度,亟待研究并開發新的測量方法②。
在當前學術界認可的測評方法中,行為測量法相比于前兩種方法,能夠更為可靠地測量出腐敗程度。行為測量法雖然也使用問卷調查法,但不是基于個人的主觀感受,而是個人的客觀經歷或行為。該方法選擇能代表各行各業人員的樣本,通過調查他們親身經歷的腐敗行為而生成腐敗程度數據。因為使用的是被調查者本人或親友的經歷信息,從而確保所獲得的腐敗程度數據是真實可靠的。雖然個體的腐敗經歷或接觸都是不同的, 但從邏輯上可以證明,個體的“腐敗接觸率”(Encountering Rate of Corruption,ERC)與“實際腐敗率”(Actual Rate of Corruption,ARC)之間存在著確定的因果關系。這意味著,從ERC就可以推斷得出ARC,從而獲得可靠的腐敗程度數據①。
行為測量法可以很好地克服前兩種主流腐敗測量方法的缺點,具有良好的信度,可以準確地測量到真實的腐敗程度。不足之處是針對該方法的研究和測量實踐都還比較缺乏,均有待加強。
總之,從腐敗程度測量方法研究現狀來看,要準確測量腐敗程度或反腐敗成效還是難以實現的,在測量方法方面還需要更多的研究與探索,以獲得具有較高科學性、公信力和普遍適用性的測量方法。
責任編校"" 張煜洋
Subjective Measurement Methods and of Corruption Degree and
Their Analysis
——Taking Bertelsmann Transformation Index as an Example
CUI Guanyun1, REN Jianming2(1. School of Public Administration and Policy, Renmin University of China, Beijing 100872, Beijing, China; 2. School of Public Administration, Beihang University, Beijing 100191, Beijing, China)
Abstract: Measurement of corruption degree is fundamental in evaluating the effectiveness of corruption governance and conducting high-quality empirical research. Nowadays, there are two main methods for measuring the degree of corruption: subjective measurement and objective measurement, the most influential subjective measurement method being the Corruption Perceptions Index. Exploring the process of measuring the degree of corruption in the Corruption Perceptions Index, analyzing its limitations and reasons for inaccuracy, is of great significance for the innovation and development of corruption measurement methods. The Bertelsmann Transformation Index is an important data source for Corruption Perceptions Index. It mainly evaluates the degree of corruption prevention and punishment in the form of a 10-point system for the two dimensions of “Democracy” and “Governance” through five steps of national assessment, preliminary review, regional review, mutual inspection in different regions, and proofreading, together with two specific corruption measurement questions, its reliability and validity high. However, the index has always had limitations and measurement inaccuracies due to issues such as expert selection bias and western values bias. In the future, the quality of subjective corruption measurement methods should be improved by updating corruption measurement methods and improving the representativeness of scoring experts.
Key words: Bertelsmann Transformation Index; Corruption Perceptions Index; corruption degree; measurement method
收稿日期: 2023-11-03
基金項目: 國家社會科學基金項目(23ZDA130);泰州市廉政研究與教育中心重大課題(23ZD01)
作者簡介: 崔冠云(1999— ),男,山東濟南人,中國人民大學公共管理學院博士研究生;任建明(1965— ),男,山西鄉寧人,北京航空航天大學公共管理學院教授,博士生導師,廉潔研究與教育中心主任。
① 汪波:《當代中國腐敗測量與雙重嵌入剖析——基于違反中央八項規定精神問題查處的實證分析》,《社會科學戰線》2017年第5期。
② 倪星、王立京:《中國腐敗現狀的測量與腐敗后果的估算》,《江漢論壇》2003年第10期。
③ 袁柏順、萬洋:《腐敗感知指數缺陷及其意識形態偏見解析》,《文化軟實力》2021年第6期。
④ 鄭燕、廖曉明:《開放政府數據與地區腐敗:來自省級面板數據的實證檢驗》,《統計與決策》2019年第17期。
⑤ 岳磊、劉乾:《腐敗治理如何影響公眾的反腐敗參與意愿——腐敗程度感知與腐敗容忍度的鏈式中介效應》,《廣州大學學報(社會科學版)》2022年第6期。
⑥ 韓琳、鄭朝陽:《什么樣的地區更易于腐敗——基于PEST框架的腐敗與反腐敗路徑的組態分析(fs/QCA)》,《北京航空航天大學學報(社會科學版)》2021年第3期。
⑦ 董娟:《界定、測量與控制:國外腐敗研究的主要維度和問題》,《深圳大學學報(人文社會科學版)》2020年第4期。
⑧ Kristyna Chabova:“Measuring Corruption in Europe: Public Opinion Surveys and Composite Indices”,Quality amp; Quantity, no.4(2017):1877-1900.
① 任建明:《廉政風險水平測量方法的研究》,《北京航空航天大學學報(社會科學版)》2013年第1期。
② 徐國沖、朱江、華峰:《腐敗的測量方式與影響因素:一個文獻綜述》,《公共管理與政策評論》2019年第3期。
③ 過勇、宋偉:《腐敗測量:基于腐敗、反腐敗與風險的視角》,《公共行政評論》2016年第3期。
④ 何增科:《中國轉型期政治腐敗的類型、程度和發展演變趨勢》,《北京行政學院學報》2000年第2期。
⑤ Snyman, Roan Alexander,“Games of Truth in the Age of Transparency: International Organizations and the Construction of Corruption”, Journal of Business Ethics,no.1(2017):1-14.
⑥ 袁柏順、萬洋:《腐敗感知指數缺陷及其意識形態偏見解析》,《文化軟實力》2021年第1期。
① 7個區域分別是亞洲和大洋洲(區域1)、蘇聯后歐亞區域(區域2)、中東歐和東南歐(區域3)、中東和北非(區域4)、拉丁美洲和加勒比區域(區域5)、南部和東部非洲區域(區域6)、西非和中非(區域7)。
② 歷年評估中包括的國家樣本數量可能會有所變化,此處引用的是2020年報告中的樣本數。
① 王叢虎:《政府公信度與腐敗認知度的關系——兼評透明國際CPI排名方法》,《教學與研究》2014年第6期。
① Guangjun Qu,“Explaining the standard errors of corruption perception indices”,Journal of Comparative Economics, no.4(2019).
① 王潔、丁琪:《正確認識中國反腐成績的國際評價——以“透明國際”排名為切入點》,《中國黨政干部論壇》2015年第10期。
② 數據來源:透明國際官網歷年清廉指數得分,鏈接:https://www.transparency.org/en/cpi.
③ 數據來源:世界正義指數(WJP)官網,鏈接:https://worldjusticeproject.org/rule-of-law-index/global.
① 黎瑞:《完善公民監督公共權力的效能保障機制——以群眾監督對接和助推反腐機關組織監督為視角》,《求索》2017年第6期。
② 斯達芬·安德森、保羅·海伍德、肖俊奇:《感知的政治學:透明國際腐敗測量方法的運用和濫用》,《經濟社會體制比較》2010年第4期。
① 朱琳、宮伏佳:《腐敗主客觀測量結果差異性研究》,《經濟社會體制比較》2015年第5期。
② 袁柏順:《公眾腐敗感知與腐敗的民間傳說——基于C市城區公眾腐敗感知調查的一項研究》,《公共行政評論》2016年第3期。
① 朱琳、宮伏佳:《腐敗主客觀測量結果差異性研究》,《經濟社會體制比較》2015年第5期。