999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

統計相關還是真實因果?
——基于“因果推斷”的新興研究范式

2018-09-06 01:57:34王舒鴻姚守宇
金融與經濟 2018年8期
關鍵詞:效應實驗

■王舒鴻,崔 欣,姚守宇

一、引言

相關關系和因果關系既有相似又有不同,而在經濟學研究中,我們更加關注的是變量間因果關系的識別,而非統計上相關關系的判斷。因此,清楚地辨析統計上的相關關系或者真實的因果關系,是進一步研究分析的前提。舉例來看,假設通過觀察,我們發現,中國股市近20年來的大盤走勢與非洲兒童平均身高的變化趨勢有著高度一致性,通過對二者進行回歸,并利用統計推斷中的假設檢驗原理,或許可以真的發現二者間的回歸系數具有高度的統計顯著性。然而,這是否真的能夠說明中國股市的發展狀況與非洲兒童的平均身高確實存在著真實的因果關系呢?答案必然是否定的。

大量使用回歸分析等統計推斷方法來探究各變量間因果關系的文獻,忽略了一個重要前提。即在進行統計推斷前,我們首先要通過模型推導或文獻推演來辨析變量間的內在邏輯關系。只有在滿足上述前提的情況下,我們才可以利用統計推斷方法進行參數估計,進而識別兩者的因果效應。因此,單純的統計推斷并不能幫助我們直接識別因果關系。所以,在探究中國股市大盤走勢與非洲兒童平均身高關系時,即使兩者在走勢上有著高度的相關性,但并沒有經濟理論或內在邏輯可以證明其因果性,那么二者間的關系便只能代表簡單的統計上的相關關系,而非真實的因果關系。在這種情況下,其利用統計推斷的方法來識別二者間的因果關系自然是沒有意義的。

進一步深入分析,假設在進行統計推斷前,我們可以獲取足夠多的經濟理論支撐,現在我們考慮如何使用統計推斷的方法來探究大學教育和個人收入間的因果關系?通常,大多文獻會使用虛擬變量方法,即將接受大學教育的個體定義為1,而未接受大學教育定義0,然后進行回歸分析,估計參數,進而識別因果關系。那么在確保變量間擁有內在邏輯的前提下,上述統計推斷的方法一定可以幫助我們識別最為準確的因果關系嗎?答案同樣是否定的。仔細分析可以發現,即使我們可以通過虛擬變量方法來刻畫個體是否參加大學教育這一活動,但是由于個體間巨大的差異性,其還存在著眾多影響個體收入且難以觀測的變量,如性格、遺傳等因素。然而上述難以觀測的遺漏變量不可避免的會引發模型解釋變量與隨機誤差項相關等內生性問題,從而影響統計結果估計的一致性,進而影響因果關系的識別。另外,即使在我們所有遺漏的變量都得到控制的情況下,也有可能會出現由于變量測量誤差①如果解釋變量測量不準確,其測量誤差項也被納入到隨機干擾項當中,從而造成估計結果不滿足一致性。或樣本選擇偏差②由于個體是否參加項目存在自我選擇,故參加項目者和未參加項目者可能存在系統差異,導致OLS估計結果不滿足一致性。而產生的內生性問題,從而影響因果關系識別的準確性。

對于上述研究而言,在探究接受大學教育和不接受大學教育這一活動對于個體收入的影響時,只有通過探究同一個體接受大學教育和不接受大學教育兩種情況下收入的差距,才能準確識別出大學教育對個人收入影響的因果關系。但是,正如人不能同時踏進同一條河流一樣,一個人同時既接受大學教育也不接受大學教育的反事實現象無法觀測。因此,為克服上述傳統統計推斷中的內生性弊端及反事實的不可觀測性問題,巧妙利用反事實理論框架和隨機化實驗思想的因果推斷研究范式開始興起。

Panhans&Singleton(2016)稱近年來經濟學的研究范式正在經歷一場由統計推斷到因果推斷的轉變,越來越多的研究開始討論如何更加科學地識別變量間的因果關系,而非集中于估計量的統計顯著性問題。不同于經典統計推斷利用樣本信息去對總體進行參數估計,進而依靠假設檢驗以判斷估計結果統計顯著性的研究思路,因果推斷的關鍵特征是通過引入潛在結果框架去清晰地定義因果關系、利用隨機化實驗的思想(克服不可觀測因素造成的影響)作為有效識別因果關系的基礎。這種從統計推斷到因果推斷的研究范式的轉變被Angrist&Pischke(2010)稱之為經濟學經驗研究的“可信性革命”。

相比傳統的統計推斷,因果推斷的一個重要特點是強調實驗設計,其以隨機化實驗為基礎,對潛在結果進行建模,而不是對觀測結果建模,通過科學的實驗設計,使數據自動呈現因果效應,盡量避免模型設定或函數形式之類的假設,從而更好地識別因果關系,計算出因果效應。由于因果推斷主要借助的是隨機化的實驗思想,故而新的研究范式有時也被稱為計量經濟學的“實驗學派”(Angrist&Pischke,2017),其主要代表人物有Card&Krueger(1994)、Card(2015)以及 Angrist&Pischke(2017)等。

借助于上述研究范式轉變的背景,本文以統計推斷與因果推斷為主線,主要闡述了以下三個問題:(1)相關關系與因果關系的聯系與區別。(2)回歸分析得到的是否一定是因果關系,而其因果關系又是否可靠。(3)什么是基于隨機實驗思想的因果關系推斷新風尚。在分析以上幾個問題的同時,使讀者進一步理解內生性問題,以及為什么社會科學研究強調的一定是因果關系的識別,而非統計相關的判斷。

二、相關關系與因果關系的聯系與區別

為更好地理解后面兩個問題,首先要明確相關關系和因果關系間的區別。相關關系和因果關系是一對十分相似的概念,但它們之間卻又有著巨大的不同。總的來說,有相關關系卻不一定有因果關系,但有因果關系就必定存在相關關系。相關關系指的是二者在變化趨勢上存在著某種程度的一致性,而因果關系強調的則是一種前和后的關系,是因為某個變量發生變化而導致了另外一個變量隨之發生改變,其強調的是二者之間存在某種理論邏輯上的關聯,需要去確定二者間具體的依存關系。具體來說,對于A導致B發生變化的因果關系的確立,其必須滿足以下三個條件:(1)A和B相關;(2)A必須發生在B之前;(3)所有其他的因素C都已經被排除。只有同時滿足上述三個條件,才可以說A和B之間確實存在著某種程度上的因果關系。

盡管從定義上可以把二者的區別說得十分清楚,但是當面對具體問題時,區分相關關系和因果關系并沒有那么簡單,非常容易掉入相關陷阱中,那些看似合情合理的例子,卻并不存在因果關系。例如:每年溺水兒童數量和雪糕銷量成明顯的正相關關系,但是二者間卻不存在因果關系。是由于溺水兒童數量的增加,才導致的雪糕銷量的提升嗎?或者是因為雪糕銷量增加了,從而導致溺水兒童數量增加?其實都不是,兩者之間呈現正相關可能是由其共同原因——天氣導致的。由于天氣炎熱,人們渴望用雪糕消暑,雪糕銷量會增加;同樣地,在炎熱的天氣中,選擇游泳的人增多,溺水兒童也相應增多。溺水兒童數量和雪糕銷量并沒有因果關系,只是共同受天氣因素影響,從而表現出簡單的統計正相關而已。

類似的例子:攜帶打火機與肺癌發病率之間可能有相關關系,但二者間的因果關系也不成立。并不是因為攜帶打火機才導致肺癌發病率上升的,而是使用打火機抽煙,煙草中的有害物質導致了肺癌發病率上升。攜帶打火機和肺癌發病率相關是因為有著共同的原因就是抽煙,因為抽煙,所以攜帶打火機,同樣因為抽煙,所以肺癌發病率上升。導致肺癌發病率上升的原因并不是因為攜帶了打火機,所以兩者之間并不是因果關系,只是因為有共同原因而體現出的統計上的相關關系而已。

一個更加模糊且看起來合情合理的因果關系,但卻也有可能只是相關關系的例子是:某案例表明,閱讀科學博客越多的人,其科學素養水平就越高,那么二者間是否具有因果關系?這是一個看似合乎情理的例子,所以許多人可能就會誤認為二者間一定存在因果關系,但實際上二者間可能僅存在著某些雙向因果關系。我們無法區分是閱讀科學博客越多的人,其科學素養水平就越高,還是科學素養高的人本來就喜歡讀博客。那么在此模棱兩可的情況下,二者間因果關系的判斷可能并不穩健。

因此,從上述分析中可以看到,因果關系與相關關系,這兩種情況是很容易被混淆的,一旦混淆,就會影響我們的判斷,從而做出錯誤的決策。所以,搞清楚因果關系和統計相關是非常有必要的。

三、回歸分析與因果關系

社會科學研究強調的是因果關系的識別,而非統計上相關關系的判斷,我們希望借助計量、統計等技術工具幫助我們對于因果關系進行有效識別。然而,在沒有任何理論假設的前提下,統計學是不可能幫助我們識別出因果關系的,借助統計學等工具做出的回歸分析結果僅僅代表了變量背后的相關關系,所謂的OLS只不過是一種系數估計方法罷了,而因果關系的識別則需要理論和技術兩方面的嚴謹論證。所以說,單純的回歸分析得到的參數估計結果充其量只能稱之為二者間的相關關系而非真實的因果關系。

想要對于因果關系進行有效識別,就要求我們在回歸之前需要用經濟理論去建立模型,真正的分析兩個變量間的內在邏輯關系,或者即使無法建立數學上的理論模型,也需要我們用文獻來推演出想要研究的變量間到底存在何種內在邏輯,進而提出研究假設。只有先進行上述理論分析,再帶著目標去做回歸來驗證我們的邏輯推演正確與否,接著利用得到的回歸結果去識別其因果關系才是有意義的。上面論述的也就是我們傳統意義上的統計推斷,當進行完理論分析之后,我們可以借助統計學模型,利用樣本信息去對總體進行參數估計,進而依靠假設檢驗以判斷估計結果統計顯著性,進而去識別所謂的因果關系。

我們暫且不討論,我們的理論推導過程是否正確、假設的推演是否真實可信,假設我們上述過程沒有任何問題,那么進行理論分析后做回歸進行的因果關系識別,其結果又一定是真實可靠的嗎?經典的計量經濟學為保證參數估計量具有良好的性質,在進行回歸之前通常會對模型提出若干假設,如高斯—馬爾可夫假設(CLRM)。當然,在實際研究中,上述理論假設條件無法全部滿足,因而又衍生出“單方程計量經濟學放寬基本假設的模型”,其主要討論了異方差、序列相關、多重共線性等問題。上述三個問題其實并不會影響因果關系的識別,我們只需要利用White(1980)的異方差一致性標準誤差或Newey&West(1987)的序列相關及異方差一致性標準誤差進行修正即可。

“單方程放寬基本假設”后的四大問題除以上三個外,還有內生性問題,即隨機解釋變量問題。談到因果關系的有效識別,則繞不開內生性問題,內生性問題是我們處理起來最為棘手的問題,但卻也是審稿人最喜歡問的問題。上述的異方差、序列相關以及多重共線性問題,我們可以通過一些技術手段處理掉,但處理內生性問題卻并不容易。一旦內生性問題沒有辦法得到很好控制,那么我們的參數估計結果將會有偏且非一致,利用這種有偏的回歸結果做出的因果關系推斷并不能讓我們信服。所以,人們完全有理由去質疑利用存在內生性問題的回歸結果做出的因果關系的識別。

上述所謂的內生性問題,其實就是計量經濟學上的隨機解釋變量問題,要解釋清楚內生性問題還是需要從經典計量經濟學對于模型做出的假設談起。計量經濟學的一個經典假設是,解釋變量是確定性變量而非隨機性變量。何謂確定性變量和隨機性變量,我們一般把外生變量稱之為確定性變量,其外生于整個模型系統,與整個模型系統無關,所以不論整個模型系統如何發生改變,它都是不受影響和不發生改變的,因而它相對整個模型系統而言具有一定確定性。相反,我們一般把具有某種概率的隨機變量稱之為內生變量,內生變量內生于整個模型系統,其既受模型系統的影響,同時也對整個模型系統有影響,所以其不能滿足上述確定性條件,因而存在著某種程度上的隨機性。

關于另一個計量模型的經典假設,即解釋變量與回歸方程隨機干擾項無關。一般而言,外生變量是確定性變量,其外生于整個模型系統,所以其自然與回歸模型的殘差不會相關。而內生變量內生于整個系統,其是隨機性變量,既受模型系統的影響,又會影響整個模型系統,所以其很可能會與回歸方程的殘差項相關(殘差可以代表很多因素,其中就包括整個模型系統無法量化的那些變量因素)。我們把這種內生性變量或者說隨機性變量與回歸方程殘差相關的問題,稱之為內生性問題或者說隨機解釋變量問題。

一般而言,產生內生性問題的原因主要有三種:遺漏解釋變量、解釋變量測量誤差和雙向因果關系。正如上述所說,內生性問題會使得參數估計結果有偏且非一致,進而導致因果關系的識別結果不可靠,所以在傳統思路下,我們一般會使用工具變量法(IV)去解決上述問題,當可以找到多個相互獨立的工具變量時,就可以使用常說的廣義矩估計方法(GMM)。

總之,簡單的回歸分析得到的不一定是因果關系,只有先進行理論分析,帶著目標進行回歸,消除異方差、序列相關性等問題,并進一步克服內生性,才有可能有效的識別因果關系。

但是,在因果關系識別時,面對某些外生沖擊,例如接受大學教育和不接受大學教育、高速公路收費和高速公路不收費等,想探究其對結果變量的影響,傳統的統計推斷只是根據可以觀測的數據進行估計研究,受個體異質性等影響,很難獲得真正的因果效應。于是,基于隨機實驗思想的因果關系推斷新風尚逐漸興起,新的研究范式更好的解決了統計推斷無法準確識別因果關系的問題,為因果關系的有效識別提供了新方法。

四、基于隨機實驗思想的因果關系推斷新風尚

上文闡述了關于因果關系識別的問題,其主要思路仍是我們傳統意義上的統計推斷,即當我們進行完理論分析或者假設推演之后,可以借助統計學模型,利用樣本信息去對總體進行參數估計,進而依靠假設檢驗以判斷估計結果統計顯著性,然后去識別所謂的因果關系。但是,由于我們無法確定進行的理論分析或者推演的假設的完全正確性,且我們利用回歸結果進行的因果關系識別也很有可能受到所謂的內生性問題的影響,從而使其識別結果不牢靠。是否存在一些更新的方法可以對統計推斷方法進行補充、完善、拓展,并能較好的識別“統計推斷”無法準確識別的因果效應呢?

正如前文所言,經濟學的經驗研究正在經歷一場由統計推斷到因果推斷的研究范式轉變,新的研究思想和研究方法正悄然出現。相比于傳統的統計推斷,因果推斷的思想主要基于反事實理論框架。所謂反事實理論框架就是和我們能夠觀測到的現實情況相反的一種狀態(Rubin,1980)。變量X與變量Y因果關系可以表達為,當X成立時Y的結果與X不成立時Y的反事實結果之間的差異,如果這種差異存在且在統計上顯著,則稱變量X對變量Y是有因果關系的,否則二者之間就不存在因果關系。這一思想最早來源于Mill(1974)的差異法(Method ofDifference),通過比較某一現象出現和不出現的情況,如果在這兩種情況中,只有一點不同而其他條件都相同,那么這一點就是造成兩種情況的原因,而兩種情況的差異就是這個原因的因果效應(Holland,1986)。

在利用反事實理論框架去清晰定義因果關系后,因果推斷將利用隨機化實驗的對照思想去進行因果關系的識別。隨機化實驗的思想最早是由Fisher(1935)提出的,他用女士品茶判斷其是否具有鑒別能力的例子說明,除了先加奶還是先加茶這一條件變化外,實驗時杯子等器具在各方面的完全相同是不必要的。在任何實驗中,不可能將可觀測的和不可觀測的差異都控制住,而隨機化實驗的好處就是不需要控制其他的潛在影響因素,我們關注的是原因變量選取的隨機化,其他可能影響因素間的差異都是偶然的、隨機的,可由隨機定律控制而不會影響估計結果(簡單來說,由于實驗的隨機性,其他非主要因素間的影響可以總體抵消掉)。因此,隨機化的關鍵作用在于平衡除原因變量外的其他影響因素,故隨機化是實驗得到可信因果效應的關鍵(趙西亮,2017)。在因果關系的實證分析中,最優選擇當然是隨機化實驗,但基于倫理道德的考慮,加之隨機實驗的時間、經濟成本較高,所以隨機實驗在現實中的實施處處受限。在隨機化實驗不可以進行的情況下,借助自然條件的擬隨機化實驗方法的應用得到了關注和重視。

利用反事實理論框架,隨機化實驗的思想進行因果關系識別,我們首先定義一個處理效應的二元變量,Di={0,1}。其中:當Di等于1時,代表個體i接受了處理;當Di等于0時代表個體i沒有接受處理。是否接受處理是由原因變量Xi決定的,所以Xi也稱為“分組變量”,故而處理變量可以表示為:

同時,我們也要定義潛在結果變量Y,其中:Y0i表示個體i沒有接受處理的結果變量;Y1i表示個體i接受處理的結果變量:

那么基于反事實理論框架,這個處理的因果效應就可以通過簡單差分得到:

然而,在現實生活中,我們不可能同時在同一個個體i上觀測到上述兩個潛在結果的值。結合上文例子,我們無法同時觀測到一個人接受大學教育與不接受大學教育所帶來的兩個收入結果,其中:當接受大學教育時,可以獲得確定的潛在結果Y1i的值,但是同一個體不接受大學教育的潛在結果Y0i的值將無法知曉;同樣,獲得了個體不接受大學教育時的潛在結果Y0i時,就無法得到其接受大學教育后的潛在結果Y1i。

事件一旦發生,就無法得知其不發生時的反事實情況,這種現象被稱為反事實的不可觀測性,是因果推論中的基本問題(Holland,1986)。我們只能觀測到接受了處理的個體和沒有接受處理的個體的結果變量,而接受了處理的個體若不接受處理時的情況和未接受處理的個體若接受處理時的情況我們無法獲得。所以為了更加精確地識別因果關系,克服選擇性偏差問題,我們只能將重點放在實驗組和對照組的選取上,精心挑選出一個控制組與實驗組進行比較從而識別因果效應。

在接受大學教育和不接受大學教育對個體收入影響的因果推斷中,最好的研究對象就是一對雙胞胎,雙胞胎的年齡、性別、父母學歷、成長環境等都是一致的,其中:一個接受大學教育設為實驗組,得到潛在結果Y1i;另外一個不接受大學教育設為控制組,得到潛在結果Y0i。最終,兩人的收入差距Y1i-Y0i就是大學教育對個體收入的因果效應。確實早有學者Krashinsky(2000)采用過同卵雙胞胎數據,在控制各種差異的情況下研究受教育年限、婚姻狀況等因素對工資收入的影響。

并且近年來,基于反事實理論框架和隨機化實驗思想的因果推斷在政策評估方面得到了廣泛應用。過去學者在研究政策效應時,往往只是通過定性分析。倘若在定性分析的基礎上可以加入基于經濟數據的實證研究,我們便可以有效提高政策評估的科學性,并進一步揭示變量間的因果效應。而因果推斷則為政策評估提供了基于經濟數據的新方法,從而可以幫助我們更好地識別政策效應。從現有文獻看,巧妙的因果推斷方法大概有傾向值匹配(Propensity Score Matching,PSM)、雙重差分(Difference in Difference,DID)、斷 點 回 歸(Regression Discontinuity Designs,RDD)等。這些方法在近兩年的經濟學頂級期刊上占據了半壁江山,掀起來一股因果推斷識別的新風尚。

(一)斷點回歸

斷點回歸方法最早是由美國心理學家Campbell(1958)設計出來,Thistlethwaite&Campbell(1960)正式發表了關于斷點回歸分析的文章,在其提出非實驗條件下,斷點回歸是處置處理效應的一種有效方法。Lee(2008)提出,在隨機實驗不可得的情況下,RDD可以避免統計推斷中參數估計的內生性問題,從而真實反映變量間的因果關系。RDD的主要原理是:存在一個關鍵變量,當該變量大于某一臨界值時,接受處理效應,作為實驗組,而當變量小于臨界值時,則不接受處理效應,可以視作對照組。如圖1所示,當結果變量y和原因變量x的線性關系在x=c處存在一個斷點,變量x由小于臨界值c到大于臨界值c,結果變量y出現了一個跳躍,且個體在x=c附近時,其他影響因素沒有差別,那么造成y在c處跳躍的唯一原因就是由x導致的處理效應。所以,這個跳躍就可以視為在x=c處Di對y的因果效應。

圖1 斷點回歸示意圖

用斷點回歸方法識別政策效應時,當個體的某一變量的值大于臨界值時,個體接受政策干預,當其小于臨界值時,個體不接受政策干預。一般來說,同一個體接受政策干預和不接受政策干預的結果無法同時獲得。而在斷點回歸方法中,就可以把小于臨界值的個體看為一個很好的對照組來反映不接受政策干預時的結果。特別是在變量連續的情況下,在臨界值附近的實驗組和對照組樣本的差異可以較好地反映政策干預對結果變量的影響。經典案例有Chen etal.(2013)觀察到的一條天然的分割線——秦嶺淮河線,即以秦嶺淮河線作為臨界線,其中:淮河以北地區,政府用燃煤的方式提供暖氣,視為接受政策干預;而淮河以南地區,并沒有供應暖氣,視為未接受政策干預。淮河兩岸十分接近的兩個地區,理論上其他各變量可以看作是連續的,也就是說其他的影響變量在南北兩岸沒有較大差異,而南北兩岸唯一的區別就是有沒有通過燃煤供暖,所以淮河以南可以作為很好的對照組,通過與實驗組比較,識別政策干預效應。

Trochim(1984)綜合了前人的理論和方法,又將斷點回歸分為兩類:一類是確定型(Sharp RDD),個體在臨界值一邊接受處理效應的概率為1,在另一邊接受處理效應的概率為0;另一類是模糊型(Fuzzy RDD),個體在臨界值附近,接受處理效應的概率則是單調變化的。斷點回歸雖然是擬隨機化實驗,但其結果與隨機化實驗結果的相似性卻極高(Lee&Lemieuxa,2010)。特別是近年來,在Hahn etal.(2001)對斷點回歸策略的識別條件、估計方法等進行理論證明后,斷點回歸方法逐漸成為評估政策的重要方法,并廣泛應用于教育領域(Chiang,2009)、社會保障(雷曉燕等,2010)、政府選舉(Ferreira&Gyourko,2009)、政 府 轉 移 支 付(Buettner,2006;Dahlberg et al.,2006)、房屋升值(Greenstone&Gallagher,2008)和空氣質量評估方面(Almond et al.,2009;Fu&Gu,2014;曹靜等,2014)。

(二)雙重差分

雙重差分最早出現在經濟學領域是在20世紀70年代(Ashenfelter,1978),Heckman&Robb(1985)最早提出使用雙重差分法評估政策實施績效,隨后,DID便開始廣泛應用于政策評估。Card(1990)用DID評估了移民政策對工資和就業的影響。Puhani(2000)評估了波蘭1991年實施的失業救濟政策對失業持續期的影響。而在我國,周黎安和陳燁(2005)則首先引用雙重差分法,對農村稅費改革政策效果進行了雙重差分的實證檢驗。李科等(2014)將雙重差分應用于金融市場,研究融資融券制度是否有利于矯正被高估的股價。陳林和伍海軍(2015)梳理了從周黎安開始的、國內使用雙重差分的文獻,對國內的研究成果進行分類和評述,并指明使用雙重差分時必須要注意的問題。梁權熙和曾海艦(2016)運用DID研究獨立董事制度是否有利于降低公司股價崩盤風險。劉瑞明和趙仁杰(2017)研究了匿名審稿制度是否推動了中國經濟學進步。王庶和岳希明(2017)評估了退耕還林工程的實施對農民增收、非農就業等方面的政策效應。錢雪松和方勝(2017)運用雙重差分研究了擔保物權制度對民營企業負債融資的影響。

雙重差分法就是將兩個虛擬變量及其交乘項加入到回歸方程中,既能控制樣本間不可觀測的個體差異,又能控制隨時間變化的不可觀測的總體因素影響,從而可以無偏地估計如政策效果等因果關系。

下面舉例簡單說明雙重差分在政策評估方面的應用。在美國,勞動者加入工會的現象比較普遍。假設:(1)在某一政策出臺前就已經加入工會的個體Di=1,而沒有加入工會的個體Di=0;(2)在某一年政府出臺了一項政策,政策出臺前Tt=0,而政策出臺后Tt=1。現在,我們要探究政府出臺的政策對勞動者收入的影響。如圖2所示,在政策實施前(pre)勞動者個體之間就存在加入工會(Di=1)和不加入工會(Di=0)的差異,其收入的條件期望函數分別為E(Y10)和E(Y00)。在政策實施后(post)勞動者個體間是否加入工會的個體差異仍然存在,新收入的條件期望函數分別為E(Y11)和E(Y01)

圖2 不同個體在政策前后的作用效果圖

通過以上分析,構造雙重差分最基礎的回歸方程式為:

結合上圖,在A、B、C、D四點的期望結果變量依次為:在A 點:E(Y00)=β0;在B點:E(Y01)=β0+β2;在C點:E(Y10)=β0+β1;在D點:E(Y11)=β0+β1+β2+β3。

則要求的雙重差分估計量為:

由于不同的個體在政策實施前的收入水平就有差距,所以雙重差分的主要思路不是直接對比樣本在政策前后均值的變化,而是對個體的數據進行回歸,從而對比兩類個體在政策前后的薪水變化率有無區別(第一次差分是同類個體前后自己差分將數值變為增長率,第二次差分則是兩類個體的增長率進行差分),以達到判斷政策對結果變量的因果效應。

但是雙重差分在評估政策時也存在局限性,其前提條件是接受政策干預的實驗組和未接受政策干預的對照組的結果變量隨時間變化的路徑是平行的,也就是說兩組實驗結果的時間趨勢應該一致。如圖2,對照組結果變量在政策干預前后的變化趨勢為由C點到B點,如果實驗組和對照組一樣,在不接受政策干預時,那實驗組的前后變化趨勢應該是由A點到E點。線CB和線AE平行才能確切評估由E點到D點的政策干預效應。若兩者的變化趨勢不一致,再應用DID方法就會出現誤差,但現實生活中,無法根本保證對照組和實驗組結果變量時間趨勢上的一致性。

(三)傾向值匹配

傾向值的概念最早來源于Rosenbaum&Rubin(1983),是指在控制其他影響因素的情況下,個體被某個變量影響的條件概率。一般情況下,在探究原因變量和結果變量關系時,會受到許多其他因素的影響,很難測度原因變量對結果變量影響的凈效應。例如,探究上大學和不上大學對未來收入的影響,年齡、性別等其他因素也會影響到是否上大學對未來收入的影響。這些其他因素的影響被稱為“選擇性偏差”(Selection Bias),通過將其他因素納入到一個logistic回歸模型中,就可以得到一個預測個體受原因變量影響的概率,也就是傾向值(Rosenbaum&Rubin,1983)。而此處的匹配是指將受原因變量影響的個體和不受原因變量影響的個體進行配對。

“傾向值匹配”就是將有相同或相近傾向值的兩組是否受原因變量影響的個體進行配對。傾向值匹配的主要思想就是將實驗組和控制組中具有相同或相近傾向值的個體進行配對,其他影響因素已經在傾向值匹配的過程中被控制起來,所以實驗組和控制組之間的差異只能是由原因變量引起,從而可以用控制組中個體結果變量的結果估計實驗組個體的反事實結果。通過傾向值匹配,可以控制或消除選擇性偏差,從而保證研究結果中因果關系的可靠性。例如,探究上大學和不上大學對未來收入的影響。傾向值匹配就是根據傾向值將上過大學的人和沒有上過大學的人一一配對,傾向值相同或相似保證了個體上大學的概率是相同或相似的,從而保證了匹配的個體除是否上大學這一變量外,其他條件如年齡、性別等因素都被控制起來。進行匹配后,未來收入的差異就只能歸于是否上大學,從而得到是否上大學與未來收入因果效應的凈效應。

Rosenbaum&Rubin(1983)最先提出可以利用傾向值匹配消除混雜因素引起的偏差,但是并沒有得到重視。近幾年,傾向值匹配才被廣泛應用各個領域,并成為政策評估的常用方法。Michael(1999)對德國東部實施的旨在使勞動力適應社會轉型的脫產培訓項目進行了PSM評估。Gilligan&Hoddinott(2007)用PSM評估了2002年在埃塞俄比亞實行的應急食物救援政策的效應。國內學者同樣用傾向值匹配的方法進行政策效應的評估,例如:陳飛和翟偉娟(2015)利用傾向值匹配法研究農戶土地流轉決策的福利效應;孫文凱和王乙杰(2016)基于微觀面板數據,將傾向值匹配和雙重差分法結合,研究父母外出務工對留守兒童健康的影響;張天華和張少華(2016)在研究國有企業偏向性政策對資源配置效率的扭曲時,運用傾向值匹配法構建與國有企業特征類似的非國有企業對照樣本;王庶和岳希明(2017)同時運用了雙重差分和傾向值匹配的方法研究退耕還林工程的政策效應;杜興強和譚雪(2017)在研究國際化董事會對公司現金股利分配的影響時,用傾向值匹配的方法控制了國際化董事會與現金股利之間的內生性問題。國內還很多其他學者對PSM進行了應用(周康,2015;劉亞洲等,2016,張耀杰等,2017)。

傳統的統計推斷,即當我們進行完理論分析或者假設推演后,借助統計學模型進行參數估計,進而依靠假設檢驗判斷估計結果的顯著性,從而識別所謂的因果關系。首先,我們無法確定進行的理論分析或者推演的假設的正確性。其次,由于內生性等問題的存在,使因果識別的結果變得并不可靠。而興起的基于隨機實驗思想的因果關系推斷新風尚,運用反事實理論框架清晰定義因果關系,利用隨機化實驗的對照思想進行因果關系的識別,可以有效克服內生性問題,消除選擇性偏差,從而得到無偏的估計因果關系。而且因果推斷的新方法如RDD、DID、PSM等在政策效應的評估方面得到了廣泛應用。

五、結論

清楚辨析變量間是相關關系還是因果關系是進一步研究的基礎,而用傳統的統計推斷方法識別因果關系時,存在著模型設定、內生性等問題,致使統計推斷對變量間因果關系的識別很可能并不可靠。于是新的研究范式興起,因果推斷以隨機化實驗為基礎,對潛在結果建模,通過科學的實驗設計,使數據自動呈現因果效應,盡量避免模型設定或函數形式之類的假設,從而更好地識別因果關系,進而計算因果效應。

本文以統計推斷和因果推斷為主線,主要闡述了兩者間的聯系與區別、由傳統的統計推斷得到的因果關系是否可靠以及什么是基于隨機實驗思想的因果關系推斷新風尚等問題。本文認為:

(1)隨著經濟學的研究范式由統計推斷向因果推斷轉變,結合具體問題來分清相關關系和因果關系顯得尤為重要。其中:相關關系僅指二者在變化趨勢上存在著某種程度的一致性,而因果關系強調的是二者之間存在的某種理論邏輯上的關聯。如果混淆這兩個概念,則會影響我們的判斷,從而做出錯誤的決策。

(2)傳統意義上的統計推斷是當進行完理論分析后,借助統計學模型,利用樣本信息對總體進行參數估計,進而依靠假設檢驗以判斷估計結果的統計顯著性,從而識別所謂的因果關系。但是,這種統計推斷由于內生性等各種問題,其對因果關系的識別并不可靠。

(3)目前經濟學界的研究范式正逐漸興起一股因果推斷新風尚,其通過引入反事實理論框架清晰地定義因果關系,利用隨機化實驗的思想識別因果效應,并逐步將斷點回歸法、雙重差分法、傾向值匹配法等引入經濟學各領域中,并進一步識別各類具體問題中的因果關系,以期求得求因果關系的凈效應。

此外,因果推斷的方法在政策評估方面得到了廣泛應用,其基于經濟數據,通過反事實理論框架和隨機化實驗的思想彌補了傳統政策研究時只是定性分析的不足,可以進一步揭示變量間的因果關系,從而可以幫助相關研究有效識別政策效應,提高政策評估的科學性。相信在以后的外生沖擊和政策評估類的研究中,RDD、DID、PSM等方法會作用于更多領域并發揮更大作用。

希望通過以上幾個問題的分析,本文想要強調的是:社會科學研究強調的一定是因果關系的識別,而非統計相關的判斷。不論是經典的統計推斷,還是如今熱門的因果推斷,只要實驗設計得好,都可以發揮巨大作用,關鍵是我們需要搞清楚問題背后的癥結所在,理解問題的本質,進而選用適當的方法進行科學的探索研究。

猜你喜歡
效應實驗
記一次有趣的實驗
微型實驗里看“燃燒”
鈾對大型溞的急性毒性效應
懶馬效應
今日農業(2020年19期)2020-12-14 14:16:52
場景效應
做個怪怪長實驗
應變效應及其應用
NO與NO2相互轉化實驗的改進
實踐十號上的19項實驗
太空探索(2016年5期)2016-07-12 15:17:55
偶像效應
主站蜘蛛池模板: 亚洲一区网站| 91区国产福利在线观看午夜| 黄色网站在线观看无码| 91九色国产在线| 亚洲精品人成网线在线 | 成人亚洲天堂| 国产精品xxx| 日韩人妻少妇一区二区| 欧美日本不卡| 国产免费精彩视频| 久久久久久久蜜桃| 91亚瑟视频| 国产一级精品毛片基地| 亚洲AV无码一区二区三区牲色| 日韩高清欧美| 国产JIZzJIzz视频全部免费| 高清免费毛片| 中文成人无码国产亚洲| 亚洲欧美另类日本| 青青草国产精品久久久久| 国产精品永久不卡免费视频| 亚洲最大情网站在线观看| 国产青青草视频| 国产经典免费播放视频| 毛片三级在线观看| 久久精品嫩草研究院| 最新精品国偷自产在线| 成人无码区免费视频网站蜜臀| 99成人在线观看| 精品亚洲国产成人AV| 亚洲IV视频免费在线光看| 97在线国产视频| 国产极品美女在线| 亚洲资源站av无码网址| 视频在线观看一区二区| 伊人无码视屏| 亚洲欧美人成人让影院| 亚洲一级毛片在线观播放| www.亚洲色图.com| 囯产av无码片毛片一级| 欧美在线三级| 亚洲AⅤ无码日韩AV无码网站| 亚洲男人的天堂视频| 在线观看国产小视频| 欧美午夜视频| 日韩国产欧美精品在线| 性激烈欧美三级在线播放| 国产精品免费p区| 亚洲一级毛片免费看| 999在线免费视频| 欧美综合区自拍亚洲综合绿色| 午夜精品福利影院| 亚洲一区色| 国产av剧情无码精品色午夜| 伊人久久久久久久| 欧美α片免费观看| 国产精品国产主播在线观看| 台湾AV国片精品女同性| 国产综合精品日本亚洲777| 999精品在线视频| 九九热精品免费视频| 亚洲精品大秀视频| 久久国产精品麻豆系列| 欧美笫一页| 亚洲综合婷婷激情| 国产精品综合久久久| 国产精品天干天干在线观看 | 色综合久久久久8天国| 任我操在线视频| 久久一色本道亚洲| 欧美成人精品一区二区| 免费人成在线观看视频色| 久久久噜噜噜久久中文字幕色伊伊| 亚洲中文字幕日产无码2021| 日本91在线| 无码网站免费观看| 亚洲av片在线免费观看| 欧美日韩国产成人高清视频| 国模沟沟一区二区三区| 精品综合久久久久久97| 久久久受www免费人成| 欧美视频在线不卡|