張永健
內容提要:量化法律實證研究方法在兩岸都日益盛行,但大多數文章仍在尋求精準描述與發現相關性。但與此同時,對于英文的量化法律實證研究,學界已經邁向以因果推論為中心的研究范式。本文扼要介紹六種因果推論的研究范式:實驗、斷點回歸、雙重差分、工具變量、配對、事件研究法;并以法律相關的量化法實證研究文章為例。本文目的不在于完整介紹方法或指導統計軟件操作,而在于提示入門實證研究者因果推論的研究設計方式。
本文旨在扼要介紹量化法律實證研究1關于量化法律實證研究的定義,參見張永健、程金華:《法律實證研究的方法坐標》,載《中國法律評論》2018年第6期。范式下,發現因果關系的六種主要研究設計。
量化法律實證研究范式剛經歷了因果革命:如果研究無法作因果推論(causal inference),只能發現相關性(correlation),或只是作描述統計(descriptive statistics),就很難登在美國第一流的期刊。這對我國大陸和臺灣地區的法學研究者都有影響。
一方面,如果法學研究者想用英文在國際法律實證期刊發表實證研究成果,必須要遵守美國學界的游戲規則,跟上最新的研究脈動。雖然像Journal of Empirical Legal Studies這樣的頂尖SSCI期刊,并不要求因果推論,還可以接受研究者以高質量的數據與分析,作描述統計,或者發現相關性,但完全不宣稱發現因果關系——只要論文有七分證據不說八分話。2入門的法律實證研究方法論文獻,參見白建軍:《法律實證研究方法》(第2版),北京大學出版社2014年版;黃國昌、林常青、陳恭平:《法學方法與實證研究(一)——信息、變項及關聯性(上)》,載《臺灣法學雜志》2011年第183期;林常青、黃國昌、陳恭平:《法學方法與實證研究(二)——信息、變項及關聯性》(下),載《臺灣法學雜志》2011年第187期;林常青、黃國昌、陳恭平:《法學方法與實證研究(三)——關聯性與回歸》(上),載《臺灣法學雜志》2012年第191期;林常青、黃國昌、陳恭平:《法學方法與實證研究(四)——關聯性與回歸》(中),載《臺灣法學雜志》2012年第199期;林常青、黃國昌、陳恭平:《法學方法與實證研究(五)——關聯性與回歸》(下),載《臺灣法學雜志》2012年第207期;黃國昌:《法學實證研究方法初探》,載《月旦法學》2009年第175期。而如果要投稿到實證法經濟學(empirical law and economics)的期刊,則大部分的編輯或評審人比較有興趣知道因果關系。這是因為,在美國的法律實證研究,經過了大約20年的發展,許多該做的描述研究已經完成;而在統計學界,因果推論的數學理論或統計工具也已經發展完備。數據越來越多,只是單純描述已經無法滿足法律與社會科學的研究者,他們想要知道因果關系。知道因果關系并沒有錯,但是做起來當然并不簡單。
掌握了因果關系,就是掌握了筆者和王鵬翔的文章所說的 “差異制造事實”(difference-making facts)。3王鵬翔、張永?。骸督涷灻嫦虻囊幏兑饬x——論實證研究在法學中的角色》,載《中研院法學期刊》2015年第17期。差異制造事實就是因果關系:一旦知道A會導致B,或者是P的出現會增加Q上升或下降的機率,就可以在制定政策或法律時,用為推論的基礎。換言之,差異制造事實,或因果關系,具有規范性(normative)的意涵。4參見 Peng-Hsiang Wang and Linton Wang. 2015. Rules as Reason-Giving Facts: A Difference-Making-Based Account of the Normativity of Rules. pp. 199-213 in Problems of Normativity, Rules and Rule-Following, edited by M. Araszkiewicz et al. Berlin/Heidelberg/ New York: Springer。譬如,一個很經典的刑法學研究題目:警察人數增加是否會降低犯罪率,還是多聘警察無助于減少犯罪。這個看似非常單純的問題,卻不容易有簡單清楚的實證答案。統計相關分析的結果,往往是警察人數上升跟犯罪率或犯罪人數的上升有正相關。其背后的原因可能是犯罪率先上升,而警察就被調到犯罪率上升的地區來防治犯罪,或者是有新的警察被聘用來防治犯罪。但是也有可能是《莊子》所說的 “圣人不死,大盜不止”,即警察的來臨刺激了犯罪的出現。后者或許有一點無稽,但是即使相信前者,警察人數上升對于打擊犯罪的效果如何,仍不得而知。到底應該增加警力,還是降低貧窮,或是提供社會福利,才是打擊犯罪最有效并低成本的手段?此時就需要好的因果推論。
但另一方面,華文法學通行之處,法律實證研究才剛開始發展;法律實證研究的學者還在摸索,也還在與其他法學者溝通、磨合。一開始就跳過其他法學者能接受、理解的描述統計,直達
* 張永健,臺灣地區“中央研究院”法律所研究員、法律實證研究數據中心執行長。筆者感謝蔡孟昕、朱明希、張凱評的研究協助。感謝劉莊、蔣侃學、王鵬翔的寶貴意見。因果推論,在各方面都不容易。5蘇凱平:《再訪法律實證研究概念與價值:以簡單量化方法研究我國減刑政策為例》,載《臺大法學論叢》2016年第45卷第3期。所以,或許華文法學世界的法律實證研究者,需要 “兩面手法”的寫作策略,以中文和英文下筆時,針對不同的閱讀受眾寫作不同內容與取向的文章。6唐應茂:《編輯手記——中國法律人的實證研究》,載吳志攀主編:《北大法律和金融評論》(2016年卷),法律出版社2018年版,第1—7頁。
要作因果推論,有六種方式在行內比較被接受,7還有一種可以作因果推論的方式是 “結構方程式”(structural equation model),這種方式在教育學界、管理學界常用,但實證法經濟學界少人使用,因此在本文不多作說明。其應用可參考張永健、李宗憲:《身體健康侵害慰撫金之實證研究——2008年至2012年地方法院醫療糾紛與車禍案件》,載《臺大法學論叢》2015年第44卷第4期,第1785—1844頁;張永健、何漢葳、李宗憲:《或重于泰山、或輕于鴻毛——地方法院車禍致死案件慰撫金之實證研究》,載《政大法學評論》2017年第149期。最近英文文獻對應用結構方程式于因果推論的重要辯護,See Judea Pearl and Dana Mackenzie, The Book of Why: The New Science of Cause and Effect, Basic Books, 2018。以下分別介紹之。在法律實證研究的方法論文獻中,此種 “研究設計”(research design)的妥當與否,被認為是法律實證研究的關鍵。8Lee Epstein and Andrew D. Martin, An Introduction to Empirical Legal Research, Oxford University Press, 2014.如果讀者在英文文章中讀到 “識別策略”(identification strategy)一詞,就是指研究者認定因果關系的研究設計。
我們可以做自然的現場實驗(natural fi eld experiment)或者是實驗室中的實驗(lab experiment),這兩種實驗的重點都是,將接受檢驗的人隨機分為兩組,使這個實驗組與對照組里的人,在各個能夠觀察到并可能影響人類行為的各種特征分布都一樣,例如性別、年紀,甚至宗教、居住地區等特征。當然可以有不同的實驗組去實驗不同的刺激(stimulus;在實驗情境中可以指涉treatment),是否會造成不同的行為反應;此時仍然要將受試者隨機分為不同的群組。在實驗中,因為實驗組跟對照組只有刺激不同,由實驗設計者所操控,所以要知道行為的結果是否源自實驗的刺激,就非常容易,甚至只需要比較行為反應的平均差異即可。
自然的現場實驗在經濟學界以約翰·利斯特(John List)的研究最為知名。利斯特和史蒂文·萊維特(Steven Levitt)等教授,用自然的現場實驗來探究提升學生學習成果的較佳方式。9See Roland G. Fryer, Steven Levitt, John A. List and Sally Sadoff, "Enhancing the Efficacy of Teacher Incentives through Loss Aversion: A Field Experiment", NBER Working Paper No. 2147, 2018; Steven Levitt, John A. List, Susanne Neckermann and Sally Sadoff, "The Behavioralist Goes to School: Leveraging Behavioral Economics to Improve Educational Performance", American Economic Journal: Economic Policy, 2018 forthcoming.之所以稱為自然的現場實驗,是因為研究就在教育現場(學校教室)完成,并不是將老師和學生放到經濟學實驗室答考卷?,F場實驗的參與者,基本或完全不會感覺自己在參與實驗,但其身為實驗組或控制組又是隨機分派的結果。實驗結果發現,無論是要給老師教學激勵,還是給學生專心或努力的激勵,在 “不給錢”(控制組)、“先給錢,考不好收回”、“考得好給錢”(后兩者為實驗組)之間,“先給錢,考不好收回”在美國的中學最有效,原因是行為法經濟學的 “損失厭惡”(loss aversion)理論——同樣金額的金錢誘因,損失的痛苦大于獲得的快樂,所以“先給錢,考不好收回”較為有效。
年輕學者劉莊,最近在法經濟學最頂尖的期刊,發表了一篇精彩的論文,討論了實驗室中的實驗。10See Zhuang Liu, "Does Reason Writing Reduce Decision Bias? Experimental Evidence from Judges in China", Journal of Legal Studies, Vol. 47, No. 1, 2018.劉莊以現任的中國法官做實驗受試者,案件爭點是傷害罪的被告身懷巨款遭搶時奮力反擊。該被告行使正當防衛是否阻卻違法。實驗組的法官在發下的材料中得知:刑事被告防衛時所奪回的錢是賄款;控制組的法官沒有獲得此種信息。兩組法官又各被分到三種情形:直接決定刑度、先說理再決定刑度、決定刑度再說理。直接決定刑度的法官,實驗組法官判決刑度顯著高于控制組法官;先說理再決定刑度的法官,實驗組與控制組的法官所宣判的刑度在統計上沒有顯著差異。因為是否為賄款與是否為正當防衛無關,劉莊的實驗說明了,要求法官先說理再決定刑度,有助于幫助法官驅除下意識的道德偏見。
斷點回歸(Regression Discontinuity)是比較兩群團體之表現是否不同;而團體之界分是某個外在、武斷的區分標準造成。一個公司法上的經典例子是美國知名的公司法律實證研究學者伯納德·布萊克(Bernard Black)等人對于韓國公司的研究。11Bernard S. Black, Woochan Kim, Hasung Jang and Kyung Suh Park, "Why Does Corporate Governance Affect Firm Value:Evidence on a Self-Dealing Channel from a Natural Experiment in Korea", Journal of Banking and Finance, Vol. 51, 2015.韓國的公司法在1999年強化了資本額兩兆韓元之上公司的董事會獨立性。兩兆韓元是恣意決定的結果(如果立法者刻意為了避開管制某間公司而設定此標準,則斷點回歸就失靈了),很多公司的資本在兩兆韓元之上與之下,也不當然跟治理機制選擇有關,但是就因為資本額的差異使標準之上的公司受管制,標準之下的公司不受管制。這個方法的重點是,研究者必須比較資本額剛好是在兩兆韓元上下的公司,不能去比較九百兆韓元或者是比較一百萬韓元的公司,因為那些公司本來就跟其他公司差異很大。
另一個例子:瑞恩·巴布(Ryan Bubb)想探究政府政策或法定制度是否影響人民行為,于是比較非洲加納和科特迪瓦兩國邊界的人民。兩國邊界在20世紀初劃定時,有約一半是依據武斷的直線,將不少同一種族的人劃分到兩個不同國家。研究當時,兩個國家、同一種族的人的習慣物權法仍然相似,但法定的財產權制度以及農業政策卻大不相同。利用武斷國界造成的不連續,即可探究農業政策是否影響農民的人力資本投資,以及立法制定的財產權制度是否影響實務(前者答案為是,后者答案為否)。12See Ryan Bubb, "The Evolution of Property Rights: State Law or Informal Norms?", Journal of Law and Economics, Vol. 56,No. 3, 2013.
雙重差分(difference in differences)的研究設計中,通常有兩個地區,一個地區受到某種管制或外生因素的影響,另外一個地區沒有;而受管制的地區又分為管制前和管制后,所以一共有四個區塊(表1的1、2、3、4)。研究者在乎的區塊是受管制的地區(2)受影響后的轉變;而其他三個區塊(1、3、4)則是比較的基準。所謂雙重差分,就是指[(2-1)-(4-3)]之差。此種方法背后的預設,必須要滿足的基本條件是:受管制地區跟未受管制地區在受管制前(1、3)其實是基本相似的,至少兩者的趨勢即便不同也要平行。

表1 雙重差分示意
雙重差分可以用筆者最近的一篇文章來說明。13Yu-Hsin Lin and Yun-chien Chang, "Does Mandating Cumulative Voting Weaken Controlling Shareholders? A Differencein-Differences Approach", International Review of Law and Economics, Vol. 52, 2017.該文觀察我國臺灣地區2011年“公司法”修法,改變董事選舉投票規則的影響。在2011年之前,“公司法”的默認規定(default rule)是累積投票制(cumulative voting),但容許公司可以選擇別的投票方式;一共有20家公司改采了多數決(majority voting)。在2011年的時候,立法機關突然通過了新的法案,只修正這個制度,將累積投票制又改回強制規定(mandatory rule);有18家公司受到了外生沖擊(2家在修法前自行改回累積投票制),但其他八百多家公司卻沒有受到影響,因為他們本來就采用累積投票制。研究者要區別的就是在修法前、后,受影響的公司與不受影響的公司之間,是否可以看出強制要求對少數股東有利的投票方式,增加少數股東的董事、監事席位。該文發現,只有立法之后第一次的董事、監事選舉季節,控制股東掌握的席次比率降低,但在之后的3年則沒有產生統計上顯著的影響。
“工具變量”(instrumental variable)在經濟學領域里面非常常見,但是工具變量可能也是最不容易掌握、讓人“自我感覺良好”的一種方法。14關于工具變項與因果推論,參見 Stephen L. Morgan and Christopher Wiship, Counterfactuals and Causal Inference: Methods and Principles for Social Research, Cambridge: Cambridge University Press, 2007, pp.187-217; Julian Reiss, "Causal Instrumental Variables and Interventions", Philosophy of Science Vol. 72, 2005。伯納德·布萊克就曾經回顧既有文獻,批評了知名學者仍使用了錯誤或不夠精致的工具變量方法。15See Vladimir A. Atanasov and Bernard S. Black, "The Trouble with Instruments: Re-Examining Shock-Based IV Designs",http://ssrn.com/abstract=2859113, 2017.
工具變量為實證研究解決 “雞生蛋、蛋生雞”問題的方法,例如前述相關性研究發現高犯罪率地區有比較多的警察,但高相關性無法告訴我們是警察多導致高犯罪,還是罪犯多的地方會加強警力。要知道孰為因孰為果,就需要借助工具變量。舉例而言,好的工具變量可以影響警力變化,但不會直接影響犯罪多寡,只會借由警力的變動而影響犯罪率。在林明仁的研究當中,他選擇了“美國各州的消費稅率變化”作為工具變量。他的邏輯是消費稅率些微增加,不太可能直接影響殺人放火的頻率;但州政府稅收增加往往就會多聘警察、維持治安。故若發現消費稅率上升,犯罪率就下降,則可證明警力增加有助于打擊犯罪。而林明仁教授的發現是:大概百分之十的警力增加可以減少10%的犯罪率。16See Ming-Jen Lin, "More Police, Less Crime: Evidence from U.S. State Data", International Review of Law and Economics,Vol. 29, 2009.
林明仁的指導老師,芝加哥大學知名的經濟學家史蒂文·萊維特則是用工具變量研究此問題的先驅。17Steven D. Levitt, "Using Electoral Cycles in Police Hiring to Estimate the Effect of Police onCrime", American Economic Review, Vol. 87, No. 3, 1997. 后續批評與響應,參見 Justin McCrary, "Using Electoral Cycles in Police Hiring to Estimate the Effect of Police on Crime: Comment", American Economic Review, Vol. 92, No. 4, 2002; Steven D. Levitt, "Using Electoral Cycles in Police Hiring to Estimate the Effect of Police on Crime: Reply", American Economic Review, Vol. 92, No.4, 2002。他使用美國每四年的選舉周期作為工具變量。因為在選舉之前,現任的州長會有誘因要提升警力,降低犯罪率,以增加連任機率,因為選民都很關心治安問題。四年一次的州長選舉應該不會直接影響到犯罪率,除非有人因為看太多政論節目而被逼上梁山或憤而鋌而走險,否則選舉和犯罪率理論上沒有關聯。但是州長選舉會跟警力增加、治安變好有關,前者是后者的驅動原因。這個研究也發現,警力增加確實降低犯罪率。
簡言之,工具變量與研究者有興趣的解釋變量有密切關系,但工具變量和被解釋的變量理論上無直接關系。透過這兩重關系,使用“兩階段最小平方法”(Two-stage Least Squares),就可以使用工具變量以得到好的因果推論(警察出、天下平)。
第五種因果推論的方法是“配對”(matching)。18對此方法論的介紹,參見Christina L. Boyd, Lee Epstein and Andrew D. Martin, "Untangling the Causal Effects of Sex on Judging", American Journal of Political Science, Vol. 54, No. 2, 2010; Daniel E. Ho, Kosuke Imai, Gary King and Elizabeth A. Stuart, "Matching as Nonparametric Preprocessing for Reducing Model Dependence in Parametric Causal Inference", Political Analysis, Vol. 15, No. 3, 2007; Daniel E. Ho, Kosuke Imai, Gary King and Elizabeth A. Stuart, "MatchIt:Nonparametric Preprocessing for Parametric Causal Inference", Journal of Statistical Software, Vol. 42, No. 8, 2011。配對背后的思維是:沒有辦法做實驗,也沒有外在突然發生的沖擊(exogenous shock)使研究者可以做斷點回歸分析,或雙重差分。研究者就只剩下大千世界給的各種現象與數據,這些數據中可能有潛在作為實驗組和對照組的研究對象,但是他們并不是被隨機分配去獲得實驗組的刺激,或被分配到沒有受到刺激的對照組。也就是說,實驗組和對照組可能有很多影響刺激本身是否導致結果的其他的 “干擾因子”(confounding factor)?!半S機控制實驗”(randomized controlled trials)是因果推論的黃金標準,無法做到黃金標準的實證研究,也會希望鍍金,K數越高越好,務求逼近隨機控制實驗。
舉例來說,筆者正在研究律師代理對于當事人的影響。19Yun-chien Chang, Kong-pin Chen and Chang-ching Lin, "Knowledge in Youth Is Wisdom in Age: An Empirical Study of Attorney Experience in Torts Litigation", https://ssrn.com/abstract=2628171, 2018.研究者想要分析,有律師代理和沒律師代理的案件,其訴訟結果有無不同;或者有資深律師代理和有資淺律師代理的案件,結果是否有差異。但研究者無法通過直接了當比較這兩種案件的判決結果,就直接算出律師代理的效果。原因是當事人是否有律師代理,或者是否聘請資深律師代理,并不是隨機分配的結果,而是自己選擇(self-select)所致。例如比較有錢的當事人,會聘請資深的律師,20關于有錢人是否因為可以請律師而更可能勝訴,參見Kong-Pin Chen, Kuo-Chang Huang and Chang-Ching Lin, "Party Capability versus Court Preference: Why Do the "Haves" Come Out Ahead?-An Empirical Lesson from the Taiwan Supreme Court", Journal of Law, Economics & Organization, Vol. 31, 2015; Xin He and Yang Su, "Do the “Haves” Come Out Ahead in Shanghai Courts?", Journal of Empirical Legal Studies, Vol. 10, No. 1, 2013。當原告可以使用 “勝訴分成”(contingent fee)方式聘請律師時,窮人就不會擔憂沒錢不能聘請律師,就不能打官司,參見 Eric Helland and Daniel Klerman, "Contingent Fee and Access to Justice", Working paper, 2018?;蛘弑容^有經驗的當事人知道要聘請律師,或者比較嚴重的、涉及金額比較大的案件的當事人會聘請律師。而案件大小、嚴重程度、當事人經驗等,都可能會影響訴訟的結果,所以如果只看(資深)律師代理的效果,就會不當忽略其他因素的干擾。而配對方法就是刪除這兩群案件當中無法互相匹配的案件,或者調整權重。例如有律師代理的案件有幾億元訴訟標的之訴訟,而沒有律師代理的案件最高的爭訟金額卻只有幾百萬元,則前者就必須調整權重,或排除在分析外。
更精確言之,整個配對方法的分析步驟,是把可觀察到的、刺激出現前就已經確定下來的變量(observable, pre-treatment variables), 用 于邏輯斯回歸模型(logistic regression model),實驗組=1,控制組=0。此回歸模型可以計算出“propensity score”傾向指數,即每一個觀察值(observation)成為實驗組的機率。當然,實際上研究者已經知道哪些是實驗組,哪些是控制組。此種作法的邏輯是:雖然有些觀察值受到刺激,有些沒有,但在刺激出現前,兩群觀察值各自接受刺激的機率分布應該一樣,才能逼近隨機控制實驗,把受試者隨機分成兩組的結果。排除極端案件或減低權重,有助于將實驗組與控制組的“propensity score”分布調整成越近越好。最后再跑一個(加權的)回歸模型,以計算出 “實驗組接受刺激的平均效果”(average treatment effect on the treated’ ATT)。
最后要再次強調,要做配對,必須只能選擇刺激產生影響之前的變量,而不能選刺激產生后還會變化的變量。例如以研究律師代理效果而言,如果案件是與車禍有關,則在請律師之前確定下來的案件特征,譬如說車禍受傷嚴重程度,原告的年收入、被告的年收入等案件的特征可以拿來作為配對的變量。但如果是原告主張多少錢,或者是被告作出如何之抗辯,則可能就已經受到了原告是否請律師和請什么樣律師的影響,所以不適合也不應該拿來做配對的變量。
事件研究法(event studies)使用股票價格、債券價格的變動來量度法律變化或其他事件的效果。事件研究法假設市場有效率,股市、債市會反應所有信息的影響。因為假設市場有效率,所以信息會在短時間內就被反映到股價和債券價格中,所以事件研究法通常只觀察幾天內的價格變化。和前述其他因果推論方法一樣,受影響者被稱為實驗組,未受影響者是控制組。21See Sanjai Bhagat and Roberta Romano, "Event Studies and the Law: Part I: Technique and Corporate Litigation", American Law and Economics Review, Vol. 4, No. 1, 2002; Sanjai Bhagat and Roberta Romano, "Event Studies and the Law: Part II:Empirical Studies of Corporate Law", American Law and Economics Review, Vol. 4, No. 2, 2002.
舉一個歷史事件研究為例。22See Daniel M. Klerman and Paul G. Mahoney, "The Value of Judicial Independence: Evidence from Eighteenth Century England", American Law and Economics Review, Vol. 7, No. 1, 2005.18世紀初,英國有若干法律給予法官職位保障或提高薪資,因而提升了司法獨立與司法質量。更好的司法,是否如理論所預測,可以借由保障合同、產權,敦促政府還債,從而促進經濟發展?如果有此種效果,股票和債券市場應該會歡迎此種立法(提案)而應聲上漲。在18世紀初時,有股價的公司只有幾家,包括英格蘭銀行、東印度公司等;而諸如英格蘭銀行是大英帝國的大債權人,所以會樂見司法獨立。研究者以英國的股價作為實驗組,在荷蘭阿姆斯特丹交易的英國公司股價作為對照組,23荷蘭的股價是好的對照組,是因為在當時,大英帝國國會的議案討論消息,需要好幾天才能到達荷蘭,因此,如果司法獨立是好消息,會先反應在倫敦的股市,幾天后才反應在阿姆斯特丹的股市。計算相關司法獨立法案的消息,是否產生 “非尋常的股價”(abnormal return)。研究發現,某些司法獨立議案,確實產生統計上顯著的正影響。
本文是因果推論方法的快速梳理。實證方法的技術一直持續演進,什么才是有效、可靠的因果推論,都有發生范式移轉的可能。希望法律實證研究的入門讀者能由本文盡量深入淺出的介紹中,獲得啟發;但讀者千萬不要認為方法僅止于此。
或許不少本文讀者并不準備親自從事法律實證研究,而只是想多了解一種法學方法論。對這些數量更多的讀者,本文最大的啟發是:因果推論并不能從兩個事實的前后發生順序就推知,而必須透過嚴謹的研究設計和數據分析才能獲得。日常口語中,大量法學規范論證中,充滿了許多不假思索或想當然的因果推論。有任何法律實證研究概念的讀者,必須時時謹記在心:不要把他人缺乏因果推論架構的因果宣稱為真理,而自己在分析目的與手段關聯時,也不能以“腦補”方式蓋棺論定。