白建軍
(北京大學法學院,北京 100087)
實證研究就是經驗(Empirical 而非Positive)研究。經驗研究的重要功能是發現事實真相和客觀規律,問題是,什么是一個可靠的實證發現,實證發現承擔著什么樣的學術功能,這在我國目前的刑事法學研究甚至整體的法學研究中都是一個存在爭議的問題。到底該怎樣理解實證發現,有些問題需要澄清。所謂實證發現,就是運用實證研究的方法,描述、解釋大量事實材料背后理論與實際之間的關系。實證發現包括“發現什么”和“怎么發現”兩個方面:前者如發現應然與實然之間的距離,發現法學理論通說的邊界與局限;后者如發現所需要的工具理性和程序理性。不做實證研究,依然有許多已知。不過,人們以為知道的許多內容,有的其實原本就來自某個實證發現,有的其實未必恰如人們所知,有的可能被一個實證發現所證否。既然實證發現在不斷豐富各種知識,就不必因各種已知而排斥進一步的實證發現。作為自己從事經驗研究的一點經驗之談,筆者擬以刑事法學研究中的若干實證研究為例,討論實證發現的類型與內涵。①作為學術心得,為避免過多自引,涉及部分研究實例的解析順序為:在SOCIAL SCIENCES IN CHINA 2004 年春季版發表的“QUANTITATIVE ANALYSIS OF CRIME AND PENALTY”一文,在《法學研究》2010 年第6 期發表的《裸刑均值的意義》一文,在《中國社會科學》2013 年第1 期發表的《司法潛見對定罪過程的影響》一文,在《中國法學》2013 年第6 期發表的《論具體犯罪概念的經驗概括》一文,在《中國法學》2017 年第5 期發表的《犯罪圈與刑法修正的結構控制》一文,在《法學研究》2016 年第6 期發表的《基于法官集體經驗的量刑預測研究》一文,在《中國法學》2010 年第6 期發表的《犯罪輕重是如何被定義的》一文,在《中國法學》2003 年第3 期發表的《同案同判的憲政意義及其實證研究》一文,在《中國社會科學》2017 年第1 期發表的《中國民眾刑法偏好研究》一文,在《中國社會科學》2006 年第5 期發表的《死刑適用實證研究》一文,在《中國社會科學》2010 年第2 期發表的《從中國犯罪率數據看罪因、罪行與刑罰的關系》一文。
“我知道,何必實證”這一說法中的“知道”,可能是指認為、相信理當如何。如糾紛處理,理當公平、公正。應當如何,可能與實際經驗的所知不是一回事。更何況,在很多情形下,應然并不等于實然,理應如此的許多認識,實際上甚至恰恰相反,即所謂知其應然,未必知其實然。對應然的了解,的確不必依賴實證方法。要了解實然,要知道實然與應然之間的實際距離,實證研究就可能更有優勢。從這個意義上說,實證發現是按照一定的檢驗邏輯,以應然理論為假設、以實然為檢驗標準的探索過程及其結果。其中,沒有理論研究所給定的待檢驗假設,任何所謂實證研究都不完整,充其量只是某種現象描述。與此同時,沒有實證研究,也沒有人知道理論在多大程度上得到貫徹,甚至無從確證一個理論是真是假,抑或只是某種理想。
例如,盡管罪刑均衡或曰罪責刑相適應是我國刑法的基本原則之一,即罪刑關系理應均衡相稱,但實際上,學者早就發現我國刑法中實際存在的“刑罰攀比”現象,包括縱向攀比和橫向攀比。②參見周光權:《法定刑配置的合理性探討——刑罰攀比及其抗制》,《法律科學》1998 年第4 期。其實,罪刑關系的錯配最簡單的分類就是重罪輕罰和輕罪重罰兩種。例如,我國《刑法》第三百九十八條規定的故意泄露國家秘密罪和過失泄露國家秘密罪,其法定刑上限均為七年以下有期徒刑。故意犯罪重于過失犯罪是刑法常識,而這里到底是故意泄露國家秘密罪配刑輕了,還是過失泄露國家秘密罪配刑重了?又如,我國《刑法》第三百五十九條規定了引誘幼女賣淫罪,法定刑為五年以上有期徒刑,第一百零三條規定了煽動分裂國家罪,其法定刑分為兩檔,一檔是五年以下有期徒刑、拘役、管制或者剝奪政治權利,另一檔是對首要分子或者罪行重大的處五年以上有期徒刑。這兩個罪名的法定刑上限是一樣的,是否意味著兩個罪的嚴重程度或不法量相等呢?煽動分裂國家罪還配置了基本和加重兩檔法定刑,下限為拘役、管制。很顯然,盡管兩種犯罪都是采用欺騙性語言操控信息接收者的行為,以達到其不法目的,但畢竟,一個是有傷風化破壞社會管理秩序,另一個則是危及國家安全,不應該具有相等的不法量。配置了相同的法定刑上限,不是引誘幼女賣淫罪配刑過重,就是煽動分裂國家犯罪配刑過輕。由此也可看出,盡管對法律適用而言,法律條文的規定是應然的規則,但對法學研究來說,法律條文其實也可以視為一種實然。據此,筆者曾以均衡為假設,對中國刑法典中的罪刑關系進行過實證研究,該項研究成果以《罪刑均衡實證研究》為題于2004 年在法律出版社出版。該研究發現,對1997 年我國《刑法》來說,犯罪的嚴重程度只能解釋不到一半的刑罰的嚴厲程度的變化。刑罰的輕重配置,應該另有原因。
應當承認,說明應當如何的確是法學理論研究的基本要求,甚至是主要形式。至少,對法學教育來說大致如此。然而,學者不能據此形成某種錯覺,以為理論工作位居實然、實際、實踐之上。回顧現代刑法學最偉大的著作之一《論犯罪與刑罰》一書的形成過程便不難看出,書中提出的罪刑法定原則、罪刑均衡原則、法律面前人人平等原則和刑罰人道主義原則都離不開作者對實然的充分了解。在貝卡里亞寫作《論犯罪與刑罰》之前,他參加了一個名為“拳頭社”的團體,參加該團體的成員還有一些年輕的數學家、法學家、經濟學家。其中,韋里兄弟是貝卡里亞青年時期的摯友,他們同在“拳頭社”中學習,韋里兄弟為貝卡里亞提供了大量關于監獄中犯人悲慘狀況的資料,對貝卡里亞構思《論犯罪與刑罰》起了很大的作用。③參見黃風:《貝卡利亞及其刑法思想》,載[意]切薩雷·貝卡利亞:《論犯罪與刑法》,北京大學出版社2008 年版,第126~131 頁。正是對封建刑事司法種種黑暗的充分了解,才催生了關于現代刑法原則的深刻論述。可見,人們不應滿足于知其應然,而應自覺往返于應然與實然之間的觀察、思考,不斷用新的發現完善、豐富法學理論研究。
“我知道,何必實證”的說法中還有一種可能:某項研究正好證實了原有的某個猜想或意向,讓人們事后意識到原有的這個猜想或意向果然如此。這時,讓人印象深刻的往往是結論而非該結論如何得到強化的過程。不過,經驗—新的發現—再經驗—更新的發現的循環往復,是知識生產的自身規律。不能因為原有知識得到了印證,便忽略了印證過程的必要。從這個意義上看,所謂實證發現就是經得起反復印證的事實觀察過程及其結果。如果某個觀察結果不可重復,其科學性必然會受到質疑。
例如,2009 年,在最高人民法院支持下,筆者從21 個省市的77 家法院提供的39143 份刑事判決書中提取了71653 個樣本,形成量刑研究的最小分析單位。結果發現,過濾已從輕從重的樣本以后,絕大部分常見犯罪的平均量刑水平都低于法定刑幅度中間線大約十幾個月。以盜竊案件為例,盜竊罪基本犯罪構成的法定刑幅度中間線為21 個月,而大樣本的實際“裸刑均值”為9.36 個月;加重構成的法定刑幅度中間線為78 個月,而大樣本的實際裸刑均值為51.58 個月;再加重的法定刑中間線為150 個月,而大樣本的實際裸刑均值為134.09 個月。其他幾類常見犯罪案件的情況也大體如此,實際刑期均值都比法定刑中線低大約十幾個月。恰好,來自德國馬普研究所的阿爾布萊希特教授用大量實證數據證明,在德國和奧地利,刑罰裁量的普遍水平位于法定刑幅度的三分之一以下。④[德]漢斯·約格·阿爾布萊希特:《重罪量刑》,熊琦等譯,法律出版社2017 年版,第322~324 頁、第523 頁。這三個國家的數據背后可以看出一個共同點:法定刑下限是法官量刑的基本起點,既非法定刑中線,更非法定刑上線。這種相互印證的背后,隱約可見中、德、奧三國法官異曲同工的職業實踐,不謀而合的共同選擇,讓人似乎能觸摸到某種超越犯罪論體系、超越意識形態、超越國界的集體理性、實踐理性、自然理性。
關于觀察的相互印證問題,一個有趣的學術現象值得一提:美國學界關于死刑適用效果的多個實證研究之間往往相互矛盾,有的支持死刑保留論,有的則支持死刑廢除論。于是有人認為,這說明實證研究這種方法本身不可靠。⑤參見[英]羅吉爾·胡德:《死刑的全球考察》,劉仁文、周振杰譯,中國人民公安大學出版社2005 年版,第453 頁。其實,如果因為一種方法得出的結論相異便認為這種方法有問題,那最該被質疑的應該是在各種“我認為”之間來回對照的研究。學術觀點、結論的多樣化,才是學術生活的常態,并且,對實證研究來說,從樣本、假設檢驗、概念操作化和分析工具的選用以及結果的分析,有一整套科學性的判斷標準。反倒是某些理論研究,其科學性的最終判斷還需求助于實踐檢驗。其實,不需要擔心研究結論之間的差異,真正需要在乎的是理論學說之間的比較和競爭有沒有科學的評判機制和標準。正是由于缺乏這種機制,身份、地位、字數、引證率、項目經費數量等因素才不得不成為人文學社科學術評價的實際根據。
學生或學者的確知道很多知識,而其中的許多是亞里士多德的、孟德斯鳩的、貝卡里亞的、羅克辛等學者本人的“我認為”。在人類認知的歷史中,這樣的學者的這種經得起時代考驗的觀點并不多。對包括筆者在內的不少學者而言,所生產的各式“我認為”很快就會被人遺忘。因為許多“我認為”、“你認為”、“他認為”都對認知活動的推進沒有太大意義。與其如此,不如把有限的精力投入到諸如觀察歸納的發現、建設可學習的數據庫、建設可持續跟蹤研究對象的測量機制、數據分析結果、算法模型、田野調查等成果形式上。至少,幾十年甚至更久以后,當人們問起現在的學者都做了些什么時,還能看到這個時代法律世界的一些真實記錄。如果一個學科的大多數學者都熱衷于或只會從事各種觀點之爭,對個體來說可能“性價比”較高,總有一定數量的產出,但這個學科貢獻的增量知識其實有限,因而整體“性價比”并不高。從這個意義上說,實證發現的意義在于做出些能留得住的東西。
所謂能留得住的東西,一個基本要求就是樣本可靠。對經驗研究來說,當樣本等于或接近總體時,抽樣誤差為零或接近零。這意味著,研究者不應對小樣本抱有過分自信,甚至夸大小樣本的作用。在方法論上,這個問題叫作小樣本風險:個別事件或想象出來的實例可以用來解釋某種已有的理論,但如果某種新的學說建立在這些個別事件或小樣本基礎上,就是一種學術冒險。用大樣本做研究,結論不一定是科學的,科學的結論也不都出自大樣本研究,但負責任的學者不可能不在乎研究樣本的可靠性。因為說得通,未必行得通。真理往往藏在大量事件背后,不僅說得通,而且行得通。是否行得通的一個決定性因素,就是看一個理論能否被大樣本的反復觀察所驗證。因此,實證研究就是觀察、挖掘、篩選、運用樣本的藝術,就是用可靠樣本說故事的藝術。與此不同,某些口水之爭也以事實為根據,但是,僅僅為了自圓其說而用人為挑選的事實說話,當然會支持某種預設的結論,不足為信。
或許有學者說,費孝通的《江村經濟》、孔飛力的《叫魂:1768 年中國妖術大恐慌》、朱曉陽的《小村故事》,只聚焦某個點從事研究,難道說也是在學術冒險?其實,如果仔細研讀過這些大師的著作,就會發現這些經典雖然從一個點切入,卻以海量的事實數據作為基礎,正是運用樣本說故事的典范。始于1768 年春的浙江“剪辮案”持續了大半年時間,所引發的恐慌蔓延大半個中國,使得整個國家陷入動蕩不安。美國漢學家孔飛力由此入手,在中國第一歷史檔案館收集研究了海量的文獻,如《朱批奏折》《宮中上諭》《宮中廷寄》《附錄奏折·法律·其他》《上諭檔方本》,以及圖書集成局1886 年版的《刑案匯覽》、薛允升的《讀例存疑》、臺北故宮博物院的《宮中檔乾隆朝奏折》、1899 年版的《大清會典事例》、光緒年間編輯的《大清十朝圣訓》等等,最終寫出了《叫魂:1768 年中國妖術大恐慌》一書。作者詳細觀察百姓、官僚、皇帝三個層面在叫魂案中的不同反應,發現每個群體都基于自身利益重新詮釋了叫魂事件,經他們各自重塑后的模樣已經遠離了叫魂事件本身。可以說,叫魂事件是中國放大版的“羅生門”。從中既可以看到各種犯罪定義者如何從自身利益出發,對某一社會事實進行符合自身利益的再定義,也可以觀察到專制權力如何凌駕于法律之上,以及官僚機制如何試圖通過操縱通訊體系來控制最高統治者。
由此也可看出,樣本是否可靠,與樣本的分析單位有關。按照上述質疑,大師們的分析單位只是他們著手觀察的“點”。其實,在這些學者看來,這些“點”內部的大量事實、數據、信息才是更基本的分析單位。因此,一個省的全樣本可謂數量不少,但不能直接推論到全中國;一個村落百年來政治、經濟、文化、人口、民俗的大量數據也可能是大時空跨度的典型代表。筆者曾參與三峽移民資金使用專項研究,收集了重慶、湖北兩地所有涉該項目的幾百個貪腐案件做實證研究。雖然只有幾百個案件,但也是該專項研究的全樣本。研究刑事司法,有“案”、“人”、“罪”三個層次的分析單位。因為一個案件中可能有數個被告,一個被告可能有數個犯罪行為。在研究過程中,不能在這三個層次之間來回跳躍。可見,樣本的可靠性與許多因素有關,不能簡單地說樣本越大越好。反過來說,如果研究者隨機詢問三個北京市民對死刑存廢的態度,回來便據此得出結論說,中國民眾支持廢除死刑的占比百分之幾,反對廢除死刑的占比百分之幾的話,大概連該研究者本人都會覺得不科學。總之,樣本的可靠性、代表性、可推論性是實證研究成果能否留得住的基本保證。
“因為我知道所以無需實證”的邏輯還可能掩蓋一種可能性:人們自以為知道的東西,很可能只是某種誤解、偏見。因為,人的認知能力都是有限的,現有的大多數理論、知識都不過是尚未證否的假設。現階段認為是真理的東西,隨著社會的發展,可能就會被認為不再是正確的,而推動人們不斷推翻已知去發現新知的,就是實證研究。因此,實證發現往往是對通說、常識的證偽和批判。
波普認為,科學的標志就是可證偽性。例如,人們曾經認為,天鵝是白的,當發現一只黑天鵝以后,便證否了原有的知識。各種宗教信條就無法被證偽,因而不屬于科學范疇。甚至,隨著天文科學、醫學的不斷發展,像“日出東方”、“人皆會死”這樣的判斷也可能有一天被證否。因此,現在無法證偽的通識,將來未必也無法證偽,此即從相對真理走向絕對真理的認識過程。波普把科學知識看作是一個不斷增長的動態過程,提出了一個理論成長的四段圖式:“Pl—TT—EE—P2……”其中Pl 表示問題,TT 表示試探性理論,EE 表示嘗試排除錯誤,P2 表示新問題。波普的知識增長理論倡導了一種與教條主義截然不同的理性批判態度,他反對把任何理論尊為教條或權威。⑥參見王婷:《淺析波普的科學知識增長論》,《前沿》2007 年第10 期
后來,庫恩用“釋疑傳統”取代波普的“可證偽性”。例如,他們兩人都認為占星術是偽科學。波普的理由是,占星術不科學是因為其理論含混模糊,缺乏可檢驗性。庫恩則認為,占星術曾有過許多失敗的預言,按照波普的可證偽標準,占星術也是科學。人們從未認為天文學、氣象學是偽科學,因為它們和占星術的重要不同是,天文學家如果預測失敗,他可能懷疑數據有問題,于是審查所得數據,進行重新測量,也可能懷疑儀器出了問題,甚至他還可能懷疑理論本身出了狀況,并試圖加以改進。⑦參見謝江平:《從劃界問題看庫恩的科學觀——兼談庫恩與波普劃界之爭》,《前沿》2011 年第1 期。由這個“釋疑”過程可以看出,釋疑和檢驗、證偽的內核都是理性的批判精神,都是對某些“當然如此”的質疑態度。總之,每當提出對一個問題的解法時,應該盡其所能地去試圖推翻之前的解法,而不是去保護它。⑧參見前注⑥,王婷文。
回顧筆者所經歷的法律實證研究,也常常感受到這種證否過程的樂趣。例如,按照一般理解,所謂金融安全應該是指銀行金庫安全、運鈔安全、投資理財安全,總之,金融安全是有形的資產安全,但筆者曾經在一項銀行犯罪大樣本實證研究中發現,以銀行資金安全為直接侵害對象的簡單騙局的既遂率不到50%,而以銀行信用安全為直接侵害對象的復雜騙局的既遂率則高達90%左右。這個發現,就證偽了一些人關于金融安全的簡單理解。
還有一項質疑“罪為因刑為果”的研究發現,無罪與有罪的司法決定不完全取決于案件基本事實是否符合實體定罪條件,還與刑事訴訟過程中的某種司法潛見有關。司法潛見源于證據信息不對稱、實體性暗示、控辯力量對比懸殊、控方對案件的初選等四類背景信息,這些背景信息使司法人員對案件是否有罪的最終結果早有心理準備和預期。司法潛見包括無罪潛見和有罪潛見。由于司法潛見的存在,一些有罪判決其實是實體定罪條件與有罪潛見的綜合產物。因此,追求零無罪率的口號不符合司法規律。
通過反例證偽通說的另一個例子是關于法律經驗定義的研究。一般認為,搶劫罪是暴力當場奪取他人財物的行為。然而,筆者收集了幾乎全部一審以搶劫罪指控而終審以其他罪名定罪的案例進行逐一分析后發現,這些案例都符合當場施暴當場取財的特征,但最終都未被認定為搶劫罪。例如被告人劉某等人因購買的推土機質量不合格,遇到來自同一地方的推土機推銷商,便以暴力手段逼迫其“賠償損失”。被害人因其產品確屬拼裝機而懼怕見官,當場交付了財物。控方以搶劫罪指控,而法院以敲詐勒索罪認定。又如被告人在酒席中被人打斷一顆牙,遂糾集多人對打人者進行毆打并當眾將其帶走拘禁,要求其家屬支付6000 元的補牙費用。控方以搶劫罪指控,法院以非法拘禁罪認定。再如被告彭某嫖娼后以做法不符合要求為由持刀強行要回嫖資30 元,并將阻止其逃跑的人刺成重傷。控方以搶劫罪指控,法院以故意傷害罪認定,等等。這些案例雖然都有兩個“當場”的特征,但又由不同的前因后果所引起。于是,可以對搶劫罪的三段論稍作修訂:其大前提為“搶劫罪是暴力當場劫取他人財物的行為”,大小前提之間加入一個來自大樣本的經驗概括“但有些發生在一定前因后果中的除外”,然后才是基于經驗概括的小前提“某被告的行為是發生在一定沖突背景中的暴力當場取財行為”,最終得出“所以,該被告的行為(很可能)不是搶劫罪”的結論。筆者將這種類型化案件事實法律性質的否定性特稱判斷稱為“小但書”。這種實證觀察的樣本越大,在司法實踐中越具有普遍性,借助這種經驗之知對具體案件做出判斷時,犯錯誤的風險就越小。可見,三段論的大前提其實是被人們事先放進一些東西的盒子,法律解釋實際上是在“猜”盒子里曾經裝有什么。既然是“猜”,就會有不同的結果。法的經驗定義不能告訴人們,盒子里肯定有什么,但至少可以通過歸納大量的反例告訴人們,盒子里其實(很可能)沒有什么。
總之,批判、證否,是實證發現的基本形式。只不過,這種批判不是靠極端語言來表達異議,而是靠數據、經驗事實、反例等表達對通說的質疑,因而是一種更溫和而有根據的批判。其實,除了實證研究以外,其他學術爭鳴也避免不了對另一種理論學說的批判、否定。并且,證否“天鵝都是白色的”說法其實就在證實“存在黑色天鵝”的說法,否定與肯定也是相對的。實證發現的特別之處在于說出事實的方法,按照這種方法,證否和批判都是抽樣、概念操作化、假設檢驗、分析工具選用等一整套規則運行的結果。強調實證發現證否的一面意味著,學術上沒有永遠的教條,因而,研究意向之間也不應存在仰視鏈或鄙視鏈。
對于許多正確的結論,確實可能沒有必要再去做實證。然而,知道結論未必知道結論止于何處,也未必知道如何用現有結論去預測未來法律現象的范圍、規模、水平、出現概率。獲取一個結論的同時,不去注意該結論的邊界,是某些領域人文社科教育的一個缺憾。道理雖然有對錯之分,但也要考慮其起因、條件、范圍和局限。真理的邊界問題,與真理的相對性有關。所謂真理是相對的,不僅是指人類認識過程新舊知識的更替、原有知識不斷地被證否,而且意味著真理都有它的成立條件和適用范圍。超越邊界條件,真理多走一步就是謬誤。因此,所謂發現,就是找到某種理論學說的有效條件、解釋范圍和局限。缺乏這些界說,則只是一些意見而非嚴格意義上的理論。
遺憾的是,有的學術研究就缺乏這種邊界意識,以至于生出各種無謂的爭論。比如,我國1997 年《刑法》頒布施行至今20 余年來,圍繞著多次刑法修訂是否已經超越合理的正當性界限問題,肯定說認同多年來的修法成果,認為基本上不存在超越犯罪圈合理邊界的問題,否定論認為,刑法的擴張已經超越了正當范圍,甚至會造成惡果。看上去,好像不同意見持有者各自認為的合理適度的犯罪圈是同一個,只不過肯定說認為刑法修正尚未超越這個范圍,而否定說認為刑法修正已經或者正在超出這個范圍。然而實際上,并不存在這個公認的犯罪圈。假設存在一個公認的犯罪圈,如果這個犯罪圈原本就很大,對刑法修正的過程和結果自然持肯定態度;同理,如果這個犯罪圈本身就很小,對同樣的刑法修正當然可能持否定態度。因此,與“犯罪圈大一點好還是小一點好”這種似是而非的命題相比,討論刑法修正的一個前提性問題是,犯罪圈的真正范圍到底有多大,其實際邊界到底在哪里。
法學引進實證研究方法以后,為理論邊界的發現提供了方法。例如,司法解釋規定的法定量刑情節應該是法官量刑活動的主要根據,然而其中尚存的問題是:“主要根據”到底是什么意思?人文社科研究中,常用“基本上”、“主要”、“決定性”、“一般來說”等等詞語表達某個因素的重要性,而“基本上”與“其他情形下”、“主要”與“次要”、“決定性”與“其他相關性”、“一般來說”與“特殊情況”這些表述之間的界限何在呢?正因為無法明確這些界限,法學才沒能區分什么是科學理論,什么是意見、見解。
以量刑預測研究為例可以說明實證研究是如何解決這類問題的。司法實踐中,雖然某個罪名下各種法定量刑情節在具體個案中有多種可能的組合,但是對于多情節案件如何量刑卻無明確的法律規定,導致此類案件的量刑結果不確定。筆者認為,法官的集體職業實踐經驗中,包含著某種集體理性、實踐理性。這種理性是司法客觀規律的反映,也會指導更大范圍的司法實踐。然而,這個理論也是有其作用范圍的。以十四萬余交通肇事罪案件為樣本,對其量刑進行確定性檢驗發現:通過限縮量刑情節的裁量幅度,可以將此類案件的量刑確定性由原來的30.5%提高到51.1%;在此基礎上控制樣本離散性程度,又可以將量刑確定性由51.1%進一步提高到73.4%。據此建立的量刑模型還可用于量刑預測,促進司法公正,提高審判管理水平。
這幾個百分比其實就是多元線性回歸結果的回歸系數。在多元回歸分析中,每個變量的系數是測量在所有其他自變量都保持不變的情況下,某一給定自變量一個單位的變化導致因變量期望值的相應變化。⑨Dona l d J.Tr ei ma n:《量化數據分析:通過社會研究檢驗想法》,任強譯,社會科學文獻出版社2012 年版,第100 頁。也就是說,能夠在保持其他變量效果不變的情況下,將某個變量的效果分離出來。10參見[美]查爾斯·惠倫:《赤裸裸的統計學》,曹檳譯,中信出版社2013 年版,第218 頁。因此,這種觀察可以弄清三件事。第一,所有有效變量的共同作用能在多大程度上解釋并預測理論假設的作用范圍。如果回歸結果的確定系數R 為0 或接近0,就意味著法定量刑情節基本上無法解釋量刑結果的輕重差異;如果確定系數R 為1 或接近1,就意味著法定量刑情節是量刑結果的主要解釋,且量刑的合法性、確定性程度較高,非法律因素的影響得到了控制。第二,在法定情節中,有多少情節的影響滿足統計顯著性要求,以及滿足顯著性要求的情節的標準化回歸系數是否接近1。第三,多少個案較好地被該理論假設解釋并預測,多少個案其實更多受其他未知因素影響。這里,總體上的回歸系數、具體變量的標準化回歸系數以及被較好解釋的個案規模,其實都不可能達到百分之百的理想效果,這就是理論的邊界。在這之外,一定會有程度不同的未知因素影響著司法實踐,因而一定會有某個理論無法解釋的個案。實證研究不可能窮盡所有可能性,不可能對所有現象給出確定性解釋。實證研究可以比較確切地明確其研究邊界及優勢與劣勢。知與不知相伴而生,是實證研究的基本特征。
以上筆者從五個方面討論了實證研究“發現什么”的問題。接下來,筆者將從四個方面討論“怎么發現”的問題。學術研究中,知道某些結論,未必知道研究始于何種問題,以及如何發現、提出一個值得研究的問題。問題才是科學研究的精髓所在,好問題的價值有時甚至勝過結論。提出問題的方法有很多,如許多法律規則的制定,始于某個新型個案的出現及對其的觀察,即許多問題都來自經驗觀察。自從實證研究方法被引入法學研究領域以來,人們就有可能在更大視野內進行觀察。于是,發現、提出問題的路徑更多了。因此,從發現的方法角度看,所謂實證發現是指問題的發現,即提出并科學描述一個值得探索的問題。法律實證研究的問題發現,一般具有三個特點。
第一個特點是,一個適合實證研究的問題,往往藏在大量事件背后。當然,非典型個案則并不適合做實證研究。比如,除河北衡水的信用證詐騙案涉案金額高達百億美元以外,其他地方的信用證詐騙案一般不會達到這個規模。因此,信用證詐騙是否應規定死刑就不一定是個正確的問題。以筆者個人經驗來說,取得一定案件數據信息后,應先觀察哪類案件的發案規模較大。一種案件的出現規模越大,頻次越高,挖掘出來的問題才越可能具有普遍性。即使對這樣的問題仍會有不同回答,但不同的結論至少具有更一致和可靠的事實根據和經驗原型。例如,對死刑有兩種基本立場,保留死刑或廢除死刑。筆者的一項實證研究發現,死刑國家的平均人口為一億七千八百多萬人,而非死刑國家的平均人口僅為兩千六百多萬人,前者大約是后者的6.7 倍。可以說,死刑國家基本上是人口大國。為慎重起見,筆者又測量了有死刑國家的人口總數與刑法中死罪個數之間的相關性。結果是,其皮爾遜相關系數為0.46,“P 值=0.04”,說明死刑的有無以及死罪罪名的多少都在一定程度上與人口因素有關。這個發現雖然不能直接支持或不支持死刑的存廢理論,但至少為該問題的思考提供了新的數據信息。基于這一信息,人們會進一步思考,為什么人口越多越難以廢除死刑,是因為人口越多的國家犯罪就越重,還是因為人口大國更需要刑罰威懾。接下來,人口與犯罪的關系、人口與公權力的關系等,一系列值得深入探討的問題都會連帶出現。
第二個特點是,實證研究的問題發現,往往有賴于現象的科學描述。例如,筆者曾經按地理區劃四分法將全國法院分成四組,然后對四組法院判決的搶劫罪案例大樣本進行觀察,結果發現:四組法院對搶劫罪的量刑輕重水平有顯著差異。A 組法院的罪刑均衡率為86.9%,位居第一位。D 組法院的罪刑均衡率為81.5%,位居第二位。B 組法院的罪刑均衡率為80.9%,處在第三位。C 組法院的罪刑均衡率最低,僅為77.9%。并且,D 組法院的偏輕或者過輕的概率較大,兩者相加共有l3 個百分點。C 組法院偏重和過重的機會都名列第一,偏重率為12.2%,過重率為5.3%。應當認為,不論量刑過輕還是過重,這都意味著不公平。為什么有的地方法院量刑較重,有的地方則量刑較輕?到底是不同地方的犯罪嚴重程度不同,還是不同地方法官掌握的標準不同?如果不是量化分析的精準描述,大家也知道量刑失衡現象的存在,但不可能知道它的實際規模、分布、程度,更無從提出為什么存在這些差異的問題。并且,如果不告知四組法院的實際地理分布,即使是具有大量審判經驗的法官,對D組和C 組分別是哪個地區的法院也有不同猜想。可見,實證發現既可能展現某個有懸念的問題,也可能在精準描述的同時提出新的問題。
第三個特點是,能夠成為實證研究問題的,往往來自實踐中解決疑難問題的需要。與為了滿足某種理論體系的完整性而提出的問題不同,實證研究的問題往往具有一定的對策意義。例如,按照《最高人民法院、最高人民檢察院關于辦理內幕交易、泄露內幕信息刑事案件具體應用法律若干問題的解釋》第六條的規定,在內幕信息敏感期內從事或者明示、暗示他人從事或者泄露內幕信息導致他人從事與該內幕信息有關的證券、期貨交易,具有下列情形之一的,應當認定為“情節嚴重”的內幕交易:證券交易成交額在五十萬元以上的,或者獲利或者避免損失數額在十五萬元以上的。該解釋第七條規定:具有下列情形之一的,應當認定為“情節特別嚴重”的內幕交易:證券交易成交額在二百五十萬元以上的,或者獲利或者避免損失數額在七十五萬元以上的。筆者曾對全部內幕交易刑事案件和證監會公布的全部行政處罰案件進行分析后發現,交易額超過50 萬的案件,定罪率僅為25.9%,移送率僅為15.4%。獲利額超過15 萬的案件,定罪率僅為34.0%,移送率僅為17.6%。交易額超過250萬的案件,定罪率僅為28.6%,移送率僅為14.6%。獲利額超過75 萬的案件,定罪率僅為44.6%,移送率僅為21.5%。值得注意的是,交易獲利和情節雙嚴重的案件,定罪率僅為34.7%,移送率僅為20.0%。交易獲利和情節雙特重的案件,定罪率僅為40.2%,移送率僅為21.2%。這組數據意味著,大部分符合定罪標準的案件都沒有定罪或移送刑事司法。
這就提出了一個問題:為什么這么多符合定罪標準的違法案件沒有進入刑事司法程序?是司法解釋規定的起刑點有問題,還是證監會另有某種未公開的移送標準,或是刑法上的罪量要素概念需要重新詮釋?更具體地說,構成犯罪的內幕交易與行政處罰的內幕交易在證明標準上到底有何不同?何時需要符合排除合理懷疑的標準,何時只是達到優勢證據或合理根據即可?是否需要仿照貸款詐騙罪證明難的解決辦法,新增一個騙取貸款罪?對那些僅有買入沒有賣出而缺乏實際獲利(僅賬面獲利)的情形,是否可以借鑒盜竊罪既遂判斷標準的控制說按犯罪未遂認定?很顯然,這些問題都具有很強的實踐意義。如果不是采用實證研究的觀察方式,就很難發現類似問題。即使感覺到類似問題的存在,也很難作出精確描述,為進一步的科學研究創造條件。
認為對某些觀點已經了解而不需要進行實證研究的邏輯,往往是由于對人類抽象思辨能力的過于自信,或者是暴露出某些所謂實證研究在方法選用上的敷衍。其實,如果不借助正確的認識工具,則很可能會知其一不知其二。自然科學對認識工具的依賴毋庸置疑,即使是人文社科領域,認識工具的作用也越來越不容小覷。筆者曾經利用詞語分析工具觀察刑法典文本,發現刑法中出現頻率較高的動詞共有800 個左右,是犯罪行為構成要件要素的載體。根據其基本涵義及其在具體法條中的特定語境,這800 多個動詞至少可以歸納為三類:“放火”、“破壞”、“持械”、“殘害”等動作的共性是暴力;“盜竊”、“貪污”、“盜掘”等動作的共性是偷竊;“騙取”、“煽動”、“謊報”、“騙購”、“引誘”等動作的共性是欺騙。據此,刑法規定的多數罪名可以被還原為暴力、偷竊、欺騙三類犯罪。在此基礎上,法條文本的實證研究和多視角理論思考成為可能。
可以說,法律實證研究是交叉科學的產物。學科間交叉、合作的前提是各個學科自身的足夠成熟。一個學科成熟到一定程度時,也會表現出對其他學科的開放心態,而非身陷學科壁壘。目前,法律實證研究更多的是法學、統計學、信息技術三者的交叉融合。其中,法學是內容本體,統計學是分析方法,計算機信息技術是事實數據處理工具。面對海量的法律信息,如果沒有這三者的高度融合,很難想象法律實證研究能走多遠,而三者融合的本質,就是法學研究的工具變革,使法學研究方法變得更客觀、理性,從而減少主觀性、人為性的影響。較少任意性的法學研究,才不大容易誤導決策。
從這個意義上看,實證發現的基本特征是研究過程中工具理性的追求和彰顯。所謂工具理性,就是盡可能地借助科學探測、分析工具透視法律世界。尤其是面對大量事件、樣本、數據時,科學分析工具可以幫助人們延展自身的感官,看到內在的關系、規律。強調工具理性,不等于說直接觀察、抽象思辨等傳統方法不理性,更不意味著研究結果是研究方法的產物。因為,這里強調的工具理性,主要針對那種把法律實證研究簡單化為單變量描述的做法。這種做法的信度、效度都十分有限,所得結果才更可能是典型的主體性產物。近年來不少法律學者開始選用實證研究方法進行研究,這同時帶來一喜一憂。喜的是,相比二十年前人們還在用“幾個盜竊等于一個殺人”這樣的問題來質疑法律實證研究來說,至少法律可不可以量化已經不再是主要問題了。按照轉換原理,人文社科領域中的許多現象都可以將看似不可量的事物轉換成若干可度量的事物,從而間接測量,實現量化。刑法典已經顯示出,法律已經把那些性質各異、量綱不同的各種犯罪轉換成刑期不等的犯罪。尤其是近年來在大數據浪潮推動下,許多法學院逐漸開始做起法律實證研究,法律可以量化已經形成一定的共識。
然而,令人擔憂的是,許多冠名以法律實證研究的論著中所選用的研究方法,仍以單變量描述、頻次分析、餅圖、某某率等簡單分析工具為主,以為只要有圖有表有數據就是實證研究了。這導致有人認為,法律實證分析和治安形勢報告差不多。雖然,對法律實證研究而言,方法選用的基本原則是能簡則簡,但其前提是,不論繁簡,都要解決問題。法學研究中需要采用實證研究方法解決的問題至少有兩類。
一類問題是,諸如有罪還是無罪、判不判死刑、上訴不上訴、是否屬于再犯、是否減刑假釋等,到底與哪些因素的影響有關。很顯然,這些定性的結果都不可能是單一因素作用的結果,而是多種因素共同影響的結果。在各種可能的影響因素中,有的人們以為有影響的因素可能實際上無關,有的不認為有關的因素卻實際上有關。在有關的因素中,有的是主要因素,有的是次要因素。其中存在的問題是如何對這些因素的實際影響做出區分。這就不能指望單變量描述方法,而要靠各種多元分析工具。
其中,Logistic 回歸分析就是解決這類問題的有效方法,在其他人文社科研究中被廣泛使用。Logistic 回歸分析對變量層次要求不高,可同時展開多個、多種自變量對一個二元定性因變量的量化分析。以是否適用死刑為例,運行該程序后,便可以知道,各種自變量的共同作用大概能解釋百分之幾的因變量的變化,還可以知道,對是否判處死刑具有顯著影響的多個因素中,具體某個因素每上升一個單位,出現死刑結果的機會將是原來的多少倍,進而為不同因素解釋力大小的比較創造了條件。
另一類問題是,如何解釋、預測諸如刑期多長、罰金多少、判賠多少、涉案金額多大、退贓比的大小、賠償數額多少、犯罪率的高低等不同結果,以及如何找出其影響因素并預測法律后果。與前一類問題不同,構成這類問題的都是連續變量。對此,在滿足一定統計學要求的前提下,最好選用多元線性回歸分析的方法。例如,受賄犯罪中的退贓比對刑期長短的影響較大。所謂退贓比就是受賄犯罪案發后,退賠的贓款在所有受賄金額中的占比。退贓比越高,說明認罪態度越好,造成損失可控。然而,作為一個連續變量,受賄犯罪的退贓比又受哪些因素影響呢?這個問題的回答不僅對量刑預測有意義,而且對解釋受賄犯罪的原因、預防控制此類犯罪有一定價值。為此,筆者以中國裁判文書網2014 年全部受賄罪判決書為數據來源,選其中一人一罪為最小分析單位共計4205 個樣本進行研究。因變量即退贓比,自變量有是否索賄、官職級別、單位層次、所在地區、受賄數額、是否自首、是否坦白、是否立功等等。運行多元線性回歸程序后發現,最明顯的因素是受賄數額,其標準化回歸系數為-0.13,說明受賄數額越大,退贓比越小。自首、坦白的影響也很顯著,回歸系數分別為0.12 和0.11,說明自首或坦白的,一般退贓比會較高。官職級別的大小的影響并不顯著,其P 值大于統計顯著性要求的水平,盡管其回歸系數顯示為負值,即官職級別越高退贓比越低。
換個角度,從自變量角度看,與積極的作為犯罪相比,應為、能為而不為的不作為犯罪畢竟是一種消極的不法行為,其危害往往具有間接性,因而似應輕于積極的作為犯罪。如不履行報告說明義務、不履行財稅義務、拒絕撫養義務、不服從命令等不作為犯罪,其法定刑理應較輕。然而,最近的一項實證分析發現,單獨看,我國《刑法》中38 個法定不作為犯的平均刑量的確低于其他罪名的平均刑量,但是,與其他變量一起進行回歸分析的結果卻表明,是否為不作為犯對總體刑量的影響完全不滿足統計顯著性要求。因此,認為不作為犯罪普遍輕于作為犯罪的想法是不能成立的。這里的工具理性就體現在,不僅不能輕信個別罪名的觀察,就連單獨觀察法定不作為的平均刑量都不足以說明問題,只有將多個因素放在一起進行多元回歸分析,才可能科學解析多個因素共同作用下法定不作為對配刑結果的實際影響。
在法律世界中,這種單獨看似乎不難理解而放在一起便必須借助科學分析工具才可能得到較好解釋的現象還有許多。用此方法分析法律現象,能解答許多問題,如回歸決定系數R2 可以顯示因變量的變化被自變量的變化解釋的程度,還可以比較不同有效自變量各自的解釋力大小,甚至可以用來預測個案公正的程度。之所以提倡走出單變量分析的局限,盡可能選用多元分析方法,是因為法律世界本身就是綜合的、復雜的。單變量分析可能人為切割或扭曲研究對象的本來面貌,造成各種錯覺。科學選用多元分析工具,才能更好地還原對象的內在結構。所以說,問題的關鍵不在于是否量化,而在于是否在乎真相。
雖然有很多正確的結論,但學者未必知道其如何而來,雖然無需對外公布每個定理、理論的推導過程,但并非每個科學結論都可以不證自明。更重要的是,假設不能建立在假設的基礎上,這應該是科學研究的基本規則。一個假設被證實還是證否的概率各占50%,如果另一個假設建立在一個未經檢驗的假設基礎上,其被證實的概率則為25%,如果又有一個假設建立在這個假設基礎上,最終被證實為真的概率就更小了。然而,反觀法學研究就會看到,完全不問一個結論是怎么來的就假定其為真,然后一個結論接著另一個結論的論證下去,最終得出一個預設的結論,這種論證模式并非罕見。
與此不同,在實證研究看來,發現是對認識過程的如實呈現。因此,實證發現是追求程序理性的結果。這里的程序理性,是對研究者的某種限制,以免過于隨意。其實,所有學術活動都包括“說什么”和“怎么說”兩個方面。每個學者都可以自由表達學術觀點,但怎么表達學術觀點,就要遵守一定規則。人們常常以觀點對錯無從評判、隔行如隔山為由,將學術評價的標準確定為一些外在的非學術指標,原因之一就是缺乏“怎么說”的公認規范。依據這種規范,即使不同領域的專家學者也可能對其他領域的學術成果做出評價。實證發現就有自己的關于“怎么說”的規范,具體體現在研究過程和寫作過程兩個方面。研究過程的程序理性主要強調認知順序上的“拿腳找鞋”而非“拿鞋找腳”。所謂“拿腳找鞋”,就是從現象觀察、個案歸納、實踐問題開始,找到解釋現象、解決問題的答案和方法。所謂“拿鞋找腳”,就是從概念、理論、規則、應然或預設結論出發,尋找恰好適合這些概念、理論及預設結論的事實、事件、證據。兩者相比,后者成功的概率較大,幾乎沒什么懸念,前者則不一定,從現象、事實能導出什么結論事先很難預料。對后者來說,做到自圓其說即可。對前者來說,少量的成功是靠大量試錯、失敗堆出來的結果,同時,寫作過程的程序理性,主要體現在呈現實證研究過程和結果的幾個必備要素,即問題、已有學術成果中的競爭性理論、樣本、核心概念的操作化、假設、因變量和自變量、假設的檢驗邏輯、分析方法、結果與發現、討論、新的理論與問題等等。這個模式為研究者提供了一條“軌道”,嚴格按這條軌道前行的,未必有出色的實證發現,但未能滿足這些要素要求而偏離軌道或跳躍某個環節的,就不大可能得到一個像樣的實證發現。
例如,寬與嚴是刑法的一個基本維度,而民眾對刑法的寬嚴偏好常常成為刑事政策決策的重要依據。近年來我國有許多受到各方關注熱案,人們往往會看到法院最終不同程度地順從了輿論。問題是,輿論是否等同于民意?中國民眾到底偏好重法還是輕法?對此,首先要將“刑法寬嚴”的概念進行操作化處理,分解為犯罪圈大小、刑罰輕重以及罪刑關系排序等幾個方面,并具體化為問卷問題。然后,由于刑法的寬嚴輕重理應先從犯罪本身尋求解釋,犯罪越多、越重,犯罪危險與民眾切身感受之間的關聯就越密切,越應該引發相應較重的刑法偏好,所以研究的理論假設被確定為:民眾的刑法偏好應該是犯罪被害感受的結果,犯罪被害感受越強烈,刑法偏好則越重。假設中的因變量就是中國民眾的刑法偏好系數,自變量就是民眾的被害感受。然后,研究確定以CFPS(China Family Panel Studies)即北京大學中國社會科學研究中心的中國家庭跟蹤調查項目為樣本來源。該樣本覆蓋25 個省級區劃,代表中國95%的人口。由438 名受訓的正式訪員,對42590 位個人進行入戶調查,并對調查結果進行一系列質量監控。該項目是國內第一個如此大規模的、綜合性的、以學術為目的的社會跟蹤調查項目。在此基礎上,對回收的問卷采用多元線性回歸分析方法進行假設檢驗。結果發現,中國民眾的刑法偏好系數低于0 到1 之間的中間線,為0.36,這說明大樣本研究的證據并不支持中國民眾普遍偏好重法的說法;有無傳統犯罪的被害遭遇,對刑法偏好的輕重并無顯著影響;中國民眾的刑法偏好其實另有原因。如個體的沮喪感越強,越可能偏好更重的刑法;自認為在本地收入越低者,越可能偏好重法,相對收入越高者,越可能偏好輕法;對身邊干部的信任度越低,則刑法偏好系數越高;對貪腐的潛在數量估計越高,越可能偏好重法;對社會保障滿意度越高,越可能偏好輕法,等等。據此得出結論:應理性對待輿論、民意,對其做出有限響應,而不應以民意的名義濫用民意。這項研究耗時三年,投入大量人力物力,可謂“性價比”很低的“非理性”研究活動了。然而,從問題到結論之間全過程的每個環節都展現在讀者面前,成本再大也值得嘗試。
實證研究讓一些理論法學家不以為然還有一個重要原因,就是不少實證研究存在一個通病——事實數據與理論分析之間沒有內在聯系。怎樣避免這種問題,恰恰是實證研究最難的部分。程金華教授認為,實證研究中,理論要素和經驗要素之間轉換非常重要,沒有從理論世界向經驗世界的轉換,就不構成實證研究;如果只有純粹的經驗探索,沒有對此進行抽象的理論歸納,那通常也不會有太好的“理論故事”。在兩者的論證銜接方面,通常是理論論證回答理論問題,經驗探索回應經驗問題。11參見程金華:《邁向科學的法律實證研究》,《清華法學》2108 年第4 期。的確,一些研究中,有數據信息,有圖有表有回歸,也有理論學說、對策建議,就是無法看出前面的數據圖表與后面理論闡釋之間的內在聯系。似乎拿掉前面的實證部分,后邊的理論分析也獨立成章。數據描述被生硬地掛在文章中的某個部分,為實證而實證的痕跡比較明顯。這種做法無益于知識增長,反而破壞了實證研究的優勢。
筆者認為,法律實證研究中的“我發現”與“我認為”不可分割。因此,筆者不太理解那種實證法學、規范法學的區分標識。12參見張永健、程金華:《法律實證研究的方法坐標》,《中國法律評論》2018 年第6 期。法律實證研究只是用實證的方法研究法學,并非獨立的學科,也并非與規范法學相并列。從這個意義上說,沒有實證研究的法學,是法學的缺失,不是實證方法本身的不足。也因為這個原因,實證發現的核心在于數據分析與理論創新之間的內在聯系。如何發現這種聯系,如何讓事實與理論之間形成聯系,筆者認為有以下幾種方法。
其一,直接證明。例如,關于盜竊罪既遂與否的判斷標準,學界有控制說與失控說兩種理論。按照控制說,只有被告人最終實際控制了所盜物品才是既遂。按照失控說,只要被害人失去了對財物的控制,犯罪行為就屬既遂。如某甲在公交車上行竊得手,汽車行進中被害人發現被盜,司機立即將車開到公安局。對此,如果按照控制說,被告行為只成立盜竊未遂,而按照失控說,被告行為構成既遂。顯然,兩種認定對量刑影響很大。到底哪種學說代表了司法實踐的主流做法,不得而知。于是,有人收集了大量的以是否構成既遂為爭點的盜竊罪案例進行實證研究。結果發現,95%以上的類似案件以未遂認定,說明絕大多數法官認同控制說。不難看出,數據與理論的銜接十分明顯、直接,操作起來簡單易行。不過,遇到此類情形的機會不多。
其二,操作化。所謂操作化,即根據轉換原理,通過抽象層到經驗層的多維、多次下降操作,將看似無法直接測量的抽象概念、理論具體化、標準化為可感知、可測量、可比較的經驗指標。在此基礎上,抽象理論、概念得以測量,經驗數據也獲得了理論內涵。例如,筆者于本文中提到的中國民眾刑法偏好研究中,研究者們將刑法的寬嚴這一抽象概念先拆解成犯罪圈大小、刑罰輕重、罪刑關系均衡性三個基本維度,然后對受訪者進行問卷測量。那些贊成將應否劃入犯罪圈有爭議的幾種行為規定為犯罪的受訪者,一般偏好重法,反之則偏好輕法;那些贊成“中國每年執行死刑的數量太多了”說法的受訪者,很可能具有輕法偏好,反之,則可能具有重法偏好,等等。在此基礎上,便可大規模實測受訪者的刑法偏好。盡管與直接證據法不同,操作化是一種發現事實與理論之間關系的間接方法,但是,這種方法同樣十分有效,且被廣泛應用。可以說,未經轉換,絕大多數法律現象都無法進行實證研究。不用說“公正”、“平等”、“均衡”這些宏大的表述,就連“損失”、“人身危險性”、“被害過錯”這些相對比較具體的法律概念,如果不進行操作化處理,都無法發現大量案件中事實與理論的關聯。
其三,根據理論組織事實。比如,在死刑適用實證研究中,人們的理論切入點是法律解釋學。其中,哈特將法律解釋學分為形式主義與規則懷疑主義,13參見陳弘毅:《當代西方法律解釋學初探》,載梁治平編;《法律解釋問題》,法律出版社1998 年版,第11~12 頁。陳興良將其分為主觀主義與客觀主義,14參見陳興良:《法的解釋與解釋的法》,《法律科學》1997 年第4期。陳金釗將其分為法律決定論與法官決斷論。15參見陳金釗:《法律解釋學的轉向與實用法學的第三條道路(上)》,《法學評論》2002 年第1 期。在此基礎上,筆者將其歸納為真理論的法律解釋觀與價值論的法律解釋觀。16參見白建軍:《死刑適用實證研究》,《中國社會科學》2006 年第5 期。問題是,哪種學說能更好地解釋普遍的司法實踐呢?為回答這個問題,筆者觀察梳理了死刑樣本中所有控辯爭議焦點問題共兩千多個,并將其分別歸入動刑、除刑、量刑、用刑這樣一個分析框架。所謂焦點問題通常是對同一法律問題的不同理解,而正是這些不同理解之間的交鋒當中才蘊藏著豐富的法律解釋學資源,以及案件與規范之間的種種聯系。然后,以是否適用死刑、死緩為因變量,以這四類焦點問題為自變量,進行回歸分析。結果發現,在死罪階梯的較低層次上,真理論的法律解釋觀的確統御著大多數法官的釋法活動,法律上的區別是多數罪與非罪、死罪與否的唯一解釋,對這些界限的判斷,法官基本上沒有太大的自由空間。然而,在死罪階梯的較高層次,價值論的法律解釋觀是法官們釋法活動的某種客觀反映,法官的自主判斷對死刑圈、死緩圈的把握具有較為顯著的影響。這樣,案件中的爭點數據與理論資源之間的關系就不顯得十分生硬。由此也可看出,根據理論組織事實不同于“拿鞋找腳”的關鍵之處就在于“組織”。以本例看,把案件控辯爭點分別歸結為動刑、除刑、量刑、用刑四類問題,就是組織事實的過程。盡管都離不開某種主觀選擇,但這種組織過程中,理論與事實之間由某個分析框架相連,其結果到底怎樣并不確定。不同于“拿鞋找腳”,實證研究的魅力就在于其結果的不確定性,使研究有樂趣,有風險,有成敗標準。
其四,根據事實組織理論。例如,按照“罪為因刑為果”的常識,犯罪率的上升理應導致刑罰資源的加大投入。然而,筆者曾用中國1988 年至2007 年20 年間的縱向犯罪率數據與1998 年、2003 年、2007 年31 個省(市、區)橫向的犯罪率數據,以及同期同地十幾項社會經濟發展數據與幾百個最高人民法院示范性案例數據進行交叉印證性考察,結果發現,中國20 年間毛犯罪率總體上升趨勢明顯。然而,社會用刑罰對犯罪做出的反應卻表現出適度克制和輕緩,五年有期徒刑以上刑罰的適用相對比較審慎,即重刑率不升反降。怎樣解釋這種明顯的不均衡呢?筆者回顧了芝加哥學派的社會解組論、莫頓的社會異常論、布勞夫婦的相對剝奪論、犯罪定義學理論等,發現伴隨著經濟的高速增長,非正式社會控制的減弱和資源分配結構的失衡是犯罪增多的重要原因。重刑率與犯罪率之間的負相關關系,正是法官群體依法對犯罪做出合理反應的結果。因此,說這種不均衡背后蘊含著更加深刻的均衡,就變得不難理解。
完成上述討論,實證發現似乎被帶進了一個更大的誤解:實證發現往往是保守的、回顧的、現實的、呆板且無創新活力的。的確,實證發現不一定導致理論創新,理論創新更是不都來自實證發現。但實證發現確實蘊含著理論創新的可能性。因為除了繼承、比較和綜合以外,實踐也是理論創新的重要源泉。17參見于樹元:《試論理論創新的思想方法》,《黑龍江社會科學》2006 年第5 期。筆者的上述討論,基本上是從方法論角度回顧筆者所經歷的實證研究。換個視角看,這些刑事實證研究中的具體發現,它們實際上從不同方向走向一個共同的理論問題:犯罪定義學問題。
犯罪定義學的基本問題是,犯罪是被發現的還是被發明的,以及犯罪定義到底是犯罪現象的客觀反映,還是犯罪現象的客觀性以及犯罪定義者的主體性的共同反映。從前述實證發現可知,如果犯罪定義完全取決于犯罪現象本身,為什么人口總量、密度等因素還會影響死刑的有無——作為犯罪定義的一種形式,死刑不可能完全歸因于犯罪的輕重不同。如果犯罪定義完全取決于犯罪現象本身,全國各地法院對同一罪名下犯罪案件的量刑輕重可以有所不同,但不應在均衡性程度上有過大差異。如果不是中國國情以及不同時期立法者內心的不同價值偏好起作用,刑罰資源的分配就不會出現刑法各次修訂前后的變化。對法官量刑是否以法定刑中線為參照,法律并無規定,但是法官群體的職業實踐選擇的法定刑中線以下十幾個月不等的位置,就不能全用犯罪本身的客觀性來解釋。如果罪為因刑為果,那被害人的被害感受就應當對其刑法的寬嚴偏好構成顯著影響。然而,為什么不僅沒有實測到這種影響,反而,各種心理、收入、福利、教育、反貪力度等因素的影響更大呢?如果犯罪行為本身是定罪量刑的全部解釋,為什么有職業律師辯護案件無罪率是沒有這種律師服務案件的幾倍之多?如果犯罪現象的客觀存在完全不以人的主觀意愿為轉移,那么,其范圍大小就應當也是客觀的,可為什么還會有犯罪圈應該大些還是小些的討論呢?如果犯罪是刑法的唯一解釋,為什么二十年全國刑事司法數據證明犯罪率高速增長的情況下重刑率不升反降呢?如果犯罪定義者完全被動地反映犯罪現象,為什么死刑適用的某個階段中由法律決定論主導,另一個階段中就成了法官決定論主導呢?所有這些,都指向一個結論:犯罪定義不可能是犯罪定義對象的原貌復制,定義者或多或少,或積極或消極,都會將自身的主體性投射到犯罪定義中。
犯罪定義學是刑事一體化思維的必然結果。從意大利實證派犯罪學理論中可以引申出客體決定論的主要思想,而從現代犯罪學,如標簽論、文化沖突論、社會異常論中可以引申出主體決定論的基本思想。客體決定論認為,犯罪定義的決定性因素當然是被定義的行為、現象本身,客體性是犯罪定義的決定性因素。主體決定論認為,行為被賦予犯罪意義的決定性因素是定義者,其主體性是犯罪定義的核心屬性。按照主體決定論,把何種行為定義為犯罪是一個對象化過程。然而,正如顏色和視神經本身都不能單獨說明視覺一樣,任何一個犯罪定義都不可能完全還原為客體或主體本身。犯罪定義是主客體間不斷往返交互的中介,包括主體(被)客體化和客體(被)主體化兩個方向上的過程。這一解釋可以說是刑法學和犯罪學之間交叉部分的一點理論創新。
應當說明,實證發現的結果當然不只是這一種理論創新。況且,這一理論對現有刑法、犯罪學研究有何意義還不明顯。如果行為本身不是被犯罪化(規定為或判決為)的唯一解釋,那么,對定義者自身或者社會控制的控制,也許更值得研究。可見,有了一個實證發現,研究可能剛剛開始。