[丹]斯文-埃里克·斯坎寧( Svend-Erik Skaaning)(奧胡斯大學政治學系,丹麥)游騰飛編譯(華東政法大學政治學研究院,上海201620)
?
如何測量法治
[丹]斯文-埃里克·斯坎寧( Svend-Erik Skaaning)
(奧胡斯大學政治學系,丹麥)
游騰飛編譯
(華東政法大學政治學研究院,上海201620)
摘要:現有的西方主流法治指數在測量規模、法治概念化、測量手段、數據聚合以及相關分析等方面均存在顯著的不同,這些不同之處導致了法治指數評估形式的差異。雖然西方法治指數研究已經取得了比較豐碩的成果,但是這些法治指數仍然在法治概念化、數據來源、數據編碼以及數據聚合過程等方面存在缺陷,這使其對同一個國家的法治測評難以得出相近的測量結果。因此,在構建和使用法治測量指數時,學者們必須采取一些預防措施來避免出現上述弊端。
關鍵詞:法治;法治指數;法治指數測量;法治數據集
文章開頭,作者首先就法治的發展史做了簡單回顧。促進法治的努力經常與提高治理水平密切聯系,20世紀90年代末,卡羅瑟斯( Carothers)認為,“如今,如果不將法治視為解決世界性難題的方法的話,那么,外交政策的爭論就無法達成一致。”[1]因此,國際金融機構、援助機構和政府經常在涉及公民福利、社會穩定和經濟增長的改革方案中強調法治的關鍵作用。
此外,在當前的社會科學研究中,關于法治因果聯系的研究已經受到學者廣泛的關注,許多研究者已經使用法治數據集( data set)的方法來促進其研究。作者秉持一種基本觀點,即定量方法可以提升學者的研究能力。這種研究能力既指監測差異性國家在不同時期提升治理水平的能力,也指通過系統性比較發現各國法治的差異和缺點的能力。然而,研究者要達到這個目的并不簡單,如果只關注數據的可靠性、有效性和等價性,那僅僅只是學術發展的一小步。因此,近年來,學界對法治指標的研發過程、質量高低和方法運用展開了激烈的討論。雖然這些學術爭論提供了寶貴的知識和建議,但是幾乎沒有學者重新系統性地審視現有的主流法治測量指數。
為此,作者從五個方面來對7個法治指數(詳見文末表1)進行了比較分析,即測量規模、法治概念化、測量手段、數據聚合以及相關分析。通過對這五個方面的比較分析,作者認為這些法治指數存在明顯的弊端,還有很大的改善空間。

表1 開發者、數據集和法治測量的規模
作者首先對這7個法治指數的測量規模提出了批評。他認為這7個法治指數的數據測量規模各不一樣,但是,沒有一個指數的數據來自于1984年之前,而且大多數指數的數據只覆蓋了4年左右的時間。此外,這7個法治指數所覆蓋的國家規模也存在不足。除了自由之家的全球自由指數和世界銀行的世界治理指數勉強覆蓋了世界上大部分的國家和地區之外,其他幾個指數所測量的國家數量明顯不足。雖然貝塔斯曼轉型指數和世界各國風險指南測量的國家數量過百,但是這兩個指數只關注經濟大國,而忽略了一些相對重要的發展中國家和地區。自由之家研發的兩個指數——“十字路口國家”和“轉型國家”關注的國家數量就更少了,主要涉及歐亞大陸的前社會主義國家和其他一些轉型中國家(如蒙古國)。
最后,作者總結說,這些指數的數據搜集在測量規模和來源上均存在明顯的限制,不能及時、準確地反映所測量國家后續法治的發展情況;這種弊端導致這些指數不宜直接用于傳統民主大國或小國間的比較分析,其科學性和客觀性也受到了其他研究者的激烈批評。因此,法治指數的研制者應在數據搜集年份和數據規模上不斷擴展,不僅要包括民主政體的經濟大國,而且要涵蓋那些威權政體的經濟小國。
在進行法治的指數化評估之前,指數研發者首先需要對法治進行概念化操作。作者認為,目前學術界缺乏對于法治的精準定義,現有的法治定義存在將法治內涵過于擴大化和縮小化的問題。法治概念極為復雜且富有爭議,作者為此提出了“形式法治”和“實質法治”的區別。形式法治要求法律的明確性、統一性和普遍適用性;實質法治要求法律必須體現公平、正義、自由和尊嚴的要求。但是讀者仍可以發現學者關于法治的定義存在高度重疊的內容(詳見文末表2)。

表2 不同學者關于法治原則的比較
此外,在大多數法治指數中,研制者對理論概念化所做的基礎工作并不扎實。這些法治指數在將“法治”理念概念化的過程中,涵蓋了許多不恰當的原則和要素,卻將法治的基本原則排除在外。作者進一步指出,現有的法治測量指標一方面并沒有完全涵蓋形式法治的所有方面,另一方面卻超出了實質法治的范疇。前者造成法治概念的縮小化,后者則導致法治定義的擴大化。雖然大多數法治測量指標強調司法獨立和官員遵守規則的責任,但其難以評估法律的公開性、明確性、全面性、一致性和穩定性。上文提到的7個主流法治指數都沒有完整地涵蓋表2中相關學者關于法治原則的界定。因此,作者認為,法治測量指標的選取應包括對權威的服從性、公共秩序、法律平等性、個人自由和商業環境等領域的測量。
在法治指數的測量過程中,研制者對法治指標的編碼十分重要。編碼本( codebook)可以記錄并公布編碼規則和處理流程,進而保障法治測量過程的一致性、透明性和可復制性。
如文末表3所示,這7個法治指數的數據來源渠道多元,種類多樣。其中,世界治理指數是對各種既有數據的聚合,而其他幾個法治指數則是通過測量指標得分來對法治進行的評估。作者對這7個法治指數的編碼方式進行了說明。他認為,自由之家的幾個法治指數( FW、CC、NT)和貝塔斯曼轉型指數( BTI)下的法治指數只對編碼過程進行了敘事性的簡單說明,全球廉政指數( GI)下的法治和正義指數對編碼過程的描述較為詳細,而世界各國風險指南( PRS)下的法治和秩序指數則缺少此種必要的編碼說明。作者最后指出,這些法治指數的編碼本并未隨著時代發展而及時更新,這可能導致數據測量的偏差性。

表3 數據來源和編碼者
此外,作者認為,法治指數的編碼者同樣重要。所謂的編碼者,就是對指數各個指標進行打分的學者或專家。雖然這些專家打分受到評估委員會的審查,但是,這種專家打分方式缺少統計學意義上的信度檢測[2]。總的來說,由于數據來源的不可靠性和專家打分的隨機性會產生測量誤差,導致這些法治指數所運用的主觀測量方式受到了學者的強烈質疑。
數據聚集( Aggregation)是指研究者將各級指標的得分匯總起來并計算最終得分的過程。在作者看來,由于這些法治指數沒有使用任何系統方式測試其數據集的客觀性,導致這些指數所使用的數據并不能精準地反映出指標之間的相關性。因此,此種法治指數研制中的數據聚集方法并不具備理論或實證的合理性。作者對CC、BTI 和GI三個法治指數進行了因子分析,并得出了因素負荷量的分析結果(詳見文末表4)。

表4 法治指數的測量維度
通過表4的因子分析結果可知,貝塔斯曼轉型指數( BTI)和十字路口國家( CC)的法治指數的相關性是頗高的,這說明兩個指數所測量的對象與指標設計高度一致。然而,全球廉政指數( GI)的“法官的安全保護”這個指標因子負荷是“.40”,這說明此指標與測量法治并沒用太高的相關性,不能測量出法治的程度。此外,由于指標設計的抽象化程度不夠,轉型國家( NT)的法治指數的測量效度也相對較低。全球自由指數( FW)中的法治指數和世界各國風險指南( PRS)的法治指數則由于來源數據的低測量效度,導致數據聚集的最終得分可信度不高。總之,這幾個法治指數的指標間相互關系存在共線性的問題,導致其數據聚集需要考慮加入適宜的權重。最后,作者總結說,這些法治指數既缺乏對測量指標的深度分析,又難以對數據進行有效聚集。
這7個法治指數在概念化、指標設計和測量方式等部分存在較大差異,作者嘗試通過簡單的二元變量回歸分析來厘清這些測量結果的異同。
在文末表5中,世界治理指數( WGI)與其他幾個指數的相關性頗高,這說明世界治理指數的測量結果與其他法治指數類似。但是,其他指數間的相關關系并不十分理想。比如,十字路口國家( CC)和世界各國風險指南( PRS)兩個法治指數之間甚至呈現出負相關關系。簡言之,十字路口國家( CC)、轉型國家( NT)、世界各國風險指南( PRS)、全球廉政指數( GI)和其他指數的大部分指標之間表現出相對較低的統計相關關系;全球自由指數( FW)、世界治理指數( WGI)和貝塔斯曼轉型指數( BTI)與另外幾個指數的指標之間則表現出相對較高的相關關系。正如研究者預期的那樣,貝塔斯曼轉型指數( BTI)和自由之家的系列法治指數之間存在高度相關關系;世界各國風險指南( PRS)和世界治理指數( WGI)之間也存在類似的正相關關系。

表5 不同法治指數指標間的相關性分析
此外,作者還使用“曼—惠特尼U檢驗”( Mann-Whitney U test)來比較和檢測英美法系國家與大陸法系國家的法治水平。文末表6的檢測結果說明,如果使用世界治理指數( WGI)和全球自由指數( FW)兩個法治指數分別對英美法系和大陸法系進行測量,所得出的結果存在顯著差異。

表6 平均比較:英美法系與大陸法系
作者通過對7個具有代表性的法治指數進行比較分析,得出如下三個結論。
第一,這7個法治指數在測量規模、法治概念化、測量手段、數據聚合以及相關分析等方面均存在顯著不同。第二,評估表明,這些法治指數存在的問題看似合理。比如,指數研發資金不足導致數據搜集難以深入,但這不能解釋為何指標體系的理論構建存在弊端。全球自由指數( FW)、貝塔斯曼轉型指數( BTI)、十字路口國家( CC)和全球廉政指數( GI)這幾個法治指數最大的缺陷在于測量規模有限。除貝塔斯曼轉型指數( BTI)外,其他法治指數的構建缺少完整的理論體系支撐。世界各國風險指南( PRS)和世界治理指數( WGI)兩個法治指數注重測量公眾遵守法律的程度,而全球自由指數( FW)、十字路口國家( CC)、轉型國家( NT)和貝塔斯曼轉型指數( BTI)等法治指數則將測量焦點集中在法律面前人人平等和民主權利兩大方面。此外,世界治理指數( WGI)的評估指標并不能真正反映出評估的目的。第三,交叉比較的相關分析結果說明,這些法治指數的測量結果并不一致。對一個國家來說,采用不同的法治測評標準將會得出差別顯著的測量結果。
基于此,作者在文末提出了幾點改進意見。第一,需要重新設計測量指標和數據集。比如,擴大測量樣本數量和增加客觀數據。第二,學者應該重新審視現有指數存在的缺陷并采取更加具有針對性的措施加以改進。總的來說,雖然這些法治指數存在許多問題,但是作者仍認為不能夠放棄對法治的量化測量方法,應該不斷改進并尋求新的法治測量方法。
參考文獻:
[1]CAROTHERS T.The Rule of Law Revival[J].Foreign Affairs,1998,( 77) : 95-106.
[2]HAGGARD S,MACINTRE A.The rule of law and E-conomic Development[J].Annual Review of Political Science,2002,( 11) : 205-234.
[責任編輯:鞏村磊]
作者簡介:斯文-埃里克·斯坎寧,男,教授,從事民主理論、政治學方法論和法治研究。 游騰飛( 1985—),男,助理研究員,政治學博士,從事比較政治學方法、國家治理研究。
基金項目:國家社會科學基金重點項目“全面推進依法治國與國家治理現代化研究”( 14AZD133) ;“華與羅世界文明與比較政治研究項目”
收稿日期:2015-11-08
中圖分類號:D0
文獻標志碼:A
文章編號:1002-462X( 2016)02-0048-05