鄭秋紅 李婧華 吳燦
“格蘭杰因果檢驗”及其應用
——基于文獻計量的分析
鄭秋紅 李婧華 吳燦
“格蘭杰因果檢驗”由2003年諾貝爾經濟學獎得主克萊夫·格蘭杰(Clive W. J. Granger)在20世紀60年代末提出并經過逐步完善。該方法的基本著眼點,是兩個自由變量呈高度相關,并不能說明它們之間一定存在因果關系,可能有別的因素存在,使之顯示出協同變化趨勢,因此,須對相關變量進行因果關系檢驗。“格蘭杰因果檢驗”作為一種歸因分析的方法,實現了跨學科的推廣,特別是近年來,從社會經濟學科被成功引入自然科學,尤其難得。
簡單的因果關系檢驗認為:如果事件A的發生改變了事件B發生的概率P,即P(B|A)≠P(B),則可以認為事件A與事件B之間存在因果關系。但事實上,A可能并不是B的原因,可能有一個共同因素C影響著A和B,造成了A與B之間的聯系,也可能存在A除了直接影響B,還通過影響C來間接影響B等更為復雜的聯系。
“格蘭杰因果檢驗”運用了信息集的概念,且強調事件發生的時間序列。要檢驗A和B之間的因果性,設Ωn為到時間n為止宇宙中有恒定時間間隔(t=1,2,…,n)的所有信息的集合(亦包含除A和B以外的信息),Bn為到時間n為止所有B的信息,Bn∈Ωn,則Ωn―Bn為到時間n為止B以外的所有信息。Bn和Ωn均為多元變量,且為隨機變量。假設:(1)現在和過去可以影響未來,但未來不能影響過去;(2)Ωn不包含任何冗余信息,如果某變量Zn與其他一個或多個變量在功能上相關,則需將其從Ωn中去除。如果有:P(An+1|Ωn)≠P (An+1|Ωn―Bn),則認為變量B是變量A的因,Bn包含一些獨有的信息影響接下來An+1的發生。
“格蘭杰因果檢驗”的思路與簡單因果關系檢驗類似,但它集信息集的概念,把需要考慮的因素拓展。要得出B是A的原因的結論,理論上必須全面考慮論域中所有的變量,但實際操作中,不可能獲得宇宙中所有的信息,而在有限的信息集中保證不遺漏重要的相關變量是非常關鍵的。目前很多采用“格蘭杰因果檢驗”的研究是在兩個變量之間進行檢驗,很容易出現遺漏重要信息的情況。例如,觀察到氣壓計變動(A),下雨(B)的概率就會增加,即P(B|A)>P(B),顯然氣壓計變動并不是下雨的真正原因,而氣壓計變動和下雨背后有一個共同的原因,即氣壓的降低,如果把氣壓降低(C)納入信息集,A就不再是B發生的原因了。
時間序列因果檢驗是該方法的核心,即如果B對A構成格蘭杰因果性,則Bn會影響An+1的概率分布。傳統因果關系的一個缺點是沒有考慮事件發生的先后,導致有時從統計上無法區分原因和結果,從公式推導上,如果P(B|A)>P(B),則P (A|B)>P(A)一定成立,即:如果A是B的原因,則必然可以推導出B是A的原因。例如,如果P(關節痛|陰天)>P(關節痛),即陰天導致關節痛的概率增加,那么按照公式一定可以推出P(陰天|關節痛)>P (陰天),關節痛導致陰天的概率更大,這顯然是不合邏輯的。“格蘭杰因果檢驗”通過考慮時間發生的先后順序來解決類似問題。時間序列分析是格蘭杰對經濟學界做出的偉大貢獻,諾貝爾獎評委會認為,格蘭杰的工作改變了經濟學家處理時間序列數據的方法,對研究財富與消費、匯率與價格以及短期利率與長期利率之間的關系具有非常重要意義。
如果P(關節痛|陰天)>P(關節痛),即陰天導致關節痛的概率增加,那么按照公式一定可以推出P(陰天|關節痛)>P(陰天),關節痛導致陰天的概率更大,這顯然是不合邏輯的。“格蘭杰因果檢驗”通過考慮時間發生的先后順序來解決類似問題。
1. 數據來源及統計方法
of Science中,選擇SCI-E數據庫和SSCI數據庫,采用檢索式為:主題=(“Granger caus*”),年限選擇所有年,文獻類型限定研究論文和綜述,共檢索命中文獻2362篇,其中有中國作者署名的文獻310篇(包括臺灣) (檢索日期為2014年5月5日)。
2. 文獻年代分布
圖1給出了各數據庫“格蘭杰因果檢驗”主題文獻隨年代的分布,從圖中可以看出,該方法的發展應用可分3個階段:1981—1989年,屬于起步階段,SCI-E和SSCI中文獻總量18篇,CAJD中0篇;1990—1999年,屬于發展階段,在文獻數量上比前一階段有了實質性的增長,SCI-E和SSCI中文獻總量288篇,CAJD中14篇;2000年以后為跨越式發展階段,文獻數量直線增加,SCI-E和SSCI中文獻總量2056篇,年均140篇以上, CAJD中高達8000多篇。
檢索到中國最早引入“格蘭杰因果檢驗”方法進行研究的學者為西安交通大學管理學院的孫林巖,他于1996年在英文期刊Journal of Environmental Management發表題為Global warming and global dioxide emission: An empirical study的文章,通過格蘭杰因果檢驗證實,全球地表溫度與二氧化碳排放之間確實存在因果關系。同年,他在中文期刊《系統工程理論與實踐》發表題為《我國教育投資對國民收入的影響分析》一文,用格蘭杰因果檢驗法檢測證實,1950—1988年我國國民收入與國家對教育的投資之間存在著長期穩定的關系,且教育投資與國民收入互為因果。此后直至2000年,SCI-E和SSCI中沒有檢索到中國學者的相關文獻,CAJD中也僅有10多篇。中國學者對該方法的大量應用是在2004年以后。
3. “格蘭杰因果檢驗”由社會經濟學科向自然和工程科學領域的引入
“格蘭杰因果檢驗”仍然以經濟學及相關領域應用為最多(表1)。在SCI-E和SSCI庫檢索到的文獻中,有一半以上論文屬于經濟學相關領域。在CAJD檢索到的8000多篇文獻中,更有95%以上與經濟學和管理學相關。隨著學科研究的發展,格蘭杰因果檢驗方法也在不斷的改進和創新。由于金融時間序列數據大多是非平穩、非線性的,為適應不同情況,格蘭杰因果檢驗模型也逐漸從傳統的線性平穩領域的分析逐漸發展到線性非平穩領域和非線性平穩領域,常用的檢驗方法包括針對線性平穩的基于向量自回歸的WALD檢驗,針對線性非平穩的協整檢驗和MWALD檢驗,以及針對非線性平穩的修正的Baek Brock檢驗。針對線性非平穩和非線性平穩領域的檢驗方法的發展是格蘭杰因果分析在經濟學領域應用發展的重要里程碑。
國際上,經濟學以外的領域廣泛引入“格蘭杰因果檢驗”發生在20世紀90年代以后。SCI-E(代表自然和工程科學)和SSCI(代表社會科學)中,1980—1989年的18篇論文均在社會科學領域,且僅有1篇屬非經濟學領域,由美國學者Freeman于1983年將該方法用于政治關系的研究。1990—1999年,已經有40個學科領域(根據SCI-E和SSCI類別,下同)引入該方法,但288篇論文中的95%以上仍然在社會科學范疇, SCI-E中僅檢索到41篇文獻,占比14%,且其中34篇屬于自然科學和社會科學交叉領域。此時期,經濟學以外的其他領域開始逐步引入“格蘭杰因果檢驗”,如:1991年,美國學者Enders和Sandler將格蘭杰因果檢驗用于跨國恐怖主義與旅游的關系研究;加拿大學者Weersink和Tauer用該方法檢測了加拿大各州乳品農場規模和生產率之間的因果關系;1992年,美國學者Wood以美國環保署和50個州實施《清潔空氣法案》為例,用該方法分析1977—1985年美國政府的政策執行效力,結果表明,單獨區分聯邦執行的效力是不容易被理解的,國家和地方層面的輸出是互相依存,交織在一起的。
2000—2009年,共檢索到來自98個領域的778篇文獻,SCI-E庫檢索到331篇,占比43%,其中117篇屬于自然和工程科學和社會科學的交叉領域,醫學、環境科學、數學、計算機、生物化學等成為應用該方法進行研究的突出領域。2010年以后僅3年多的時間,SCI-E和SSCI中已能檢索到應用和討論該方法的文獻1200多篇,其領域進一步延伸, SCI-E庫檢索到750多篇,占比50%,雖然其中仍然有300篇左右屬于自然和工程科學與社會科學的交叉領域,但可以看出自然科學領域對該方法的應用正呈突飛猛進式增長。
當前,非經濟學相關領域中,以醫學相關領域(包括神經科學、醫學影像等)對該方法的應用最多。截至檢索時間,SCI-E和SSCI庫“格蘭杰因果檢驗”主題引用頻次最高的前10篇論文中,有9篇都在醫學相關領域(詳見本期P3頁榜單)。但CAJD庫在“醫藥衛生科
技”大類下僅檢索到11篇文獻。中國作者在醫學相關領域發表的論文大多是與國外專家或海外華人聯合發表在國際期刊上。

圖1 “格蘭杰因果檢驗”主題文獻的年代分布
CAJD中,其“基礎科學”類別下檢索到相關文獻2000多篇,其中大多是與經濟學管理學的交叉領域,98%以上的文獻在數學類別下,其次是資源科學,有14篇,海洋學有11篇。

表1 “格蘭杰因果檢驗”主題文獻產出較多的領域
4. “格蘭杰因果檢驗”在地學和大氣科學領域的應用
“格蘭杰因果檢驗”在地學相關領域的應用相對較少。在SCI-E和SSCI中,共檢索到地學相關領域應用格蘭杰因果檢驗的文獻56篇,其中大多數在氣象學及氣候變化領域(47篇)。氣象學領域最早應用格蘭杰因果檢驗方法的是 Triacca于2001年發表在Theoretical and Applied Climatology雜志上的“On the use of Granger causality to investigate the human influence on climate”一文 ,采用格蘭杰因果檢驗研究了人類活動對氣候的影響,指出人類活動對氣候的影響并不十分顯著。同年, Reichel等采用格蘭杰因果檢驗研究北半球平均地面氣溫與太陽活動周期的關系,檢驗通過99%的信度水平,指出二者之間存在因果關系。
氣象學領域被引頻次最高的是美國波士頓大學地理系的Wang Weile等2004年發表在Journal of Climate上的“The relation between the North Atlantic Oscillation and SSTs in the North Atlantic Basin”一文和英國學者Mosedale等2006年發表在Journal of Climate上的“Granger causality of coupled climate processes: Ocean feedback on the North Atlantic oscillation”一文,兩篇文章均被引用35次,都是在研究北大西洋濤動與海面溫度的關系中采用了格蘭杰因果檢驗。Wang Weile等通過研究指出格蘭杰因果檢驗比簡單的滯后相關性更為嚴格和可靠。Mosedale等則使用格蘭杰因果關系時間序列,在耦合大氣環流模式中定量診斷北大西洋濤動中每日海面溫度的反饋。從研究內容看,當前研究主要集中在北大西洋濤動、厄爾尼諾、南方濤動的原因及影響、人類活動和自然因子引起的氣候變化等方面。
CAJD中共檢索到地學領域(自然地理學和測繪學+氣象學+海洋學+地質學+地球物理學+資源科學)應用格蘭杰因果檢驗的論文36篇,其中氣象學領域8篇。地學領域應用該方法最早的論文為傅開道于2006年發表于《科學通報》上的“瀾滄江干流水電開發的下游泥沙響應”一文。氣象學領域最早的論文為曹鴻興等于2008年發表于《氣候變化研究進展》上的“氣候檢測與歸因的格蘭杰檢驗法”,該文對格蘭杰因果檢驗法進行了介紹,并通過格蘭杰檢驗解釋我國氣溫變化由滯后到同步于全球氣溫的現象。引用頻率最高的是孫慧宗和李久明2010年發表于《人口學刊》的“中國城市化與二氧化碳排放量的協整分析”一文,共被引26次。
地學氣象學領域的大多數研究都是直接利用格蘭杰因果檢驗研究不同變量因子之間的關系,而對該方法在地學氣象學領域的適用性研究很少。2005年,Triacca發表論文討論格蘭杰因果檢驗在檢測大氣二氧化碳濃度和全球溫度因果關系的適用性,認為應用格蘭杰方法檢測二者之間的關系并不合適。因此,格蘭杰方法在地學及氣象學領域的適用性和方法論還有待進一步的研究。
5. 國家和機構產出和影響力分析
SCI-E和SSCI庫中,“格蘭杰因果檢驗”主題文獻產出量最多的國家為美國,占總文獻量的33%,中國排在第2位。從他引總次數和h指數兩個影響力指標來看,美國仍然遠超其他國家,排在第1位。英格蘭雖然在文獻量上不及中國,但影響力比中國高。中國排在第3位。德國、澳大利亞、意大利、荷蘭等國雖然文獻總量不多,但影響力均相對較高(表2)。
表3給出了“格蘭杰因果檢驗”主題文獻產出較多的機構。國際機構中,以佛羅里達大學產出最高,中國科學院排在第7位。從表中可以看出,機構的國別很分散,排在前10位的機構中,只有2個機構同屬于美國,其他機構分別隸屬于不同的國家,還有一個國際機構“東地中海大學”。巴基斯坦、馬來西亞等
雖然論文產出總量不高,但均有在該領域權威的機構,尤其是巴基斯坦的COMSATS信息技術學院,總排名位列第2。SCI-E和SSCI中國文獻的機構以中國科學院產出最多,前11位的機構中包括6個臺灣和香港機構。CAJD庫發表該主題文獻較多的機構集中在大學系統,以中南財經政法大學產出最多,東北財經大學和中國人民大學分列第2和第3位。

表2 “格蘭杰因果檢驗”主題文獻產出較多的國家/地區及其影響力(SCI-E和SSCI)

表3 “格蘭杰因果檢驗”主題文獻產出較多的機構
文獻計量結果表明,“格蘭杰因果檢驗”正被加速引入各領域的研究中,2000年以后國內外該主題文獻的產出呈穩步增長趨勢。該方法由經濟學向社會科學其他領域,及由社會科學向自然和工程科學領域應用經歷了一定的歷程,呈現出由經濟學為主(1980年代)→社會科學其他領域或社會科學與自然和工程科學交叉領域為主(1990年代)→自然和工程科學領域占相當比例(2000年以后)逐步引入,各領域共同增長的趨勢。
“格蘭杰因果檢驗”方法學及應用發展最為成功的仍然是在經濟學領域,國際和中國文獻數據庫中,分別有超過50%和超過95%的文獻都在經濟學和管理學相關領域。國際上,經濟學以外的領域應用該方法最多的是醫學相關領域,但國內在醫學領域的應用還相對較少。
地學氣象學領域引入“格蘭杰因果檢驗”開展研究是在2000年以后,國際上的研究主要集中在氣象和氣候變化領域,“格蘭杰因果檢驗”為人們理解不同氣象和氣候因子之間的聯系提供了有用的線索。國內該方法在地學氣象學領域的應用還剛剛起步。目前研究中,大多都是直接利用該方法進行不同變量之間的因果關系檢驗,其在地學和氣象學領域的適用性和方法論還有待進一步發展。
近年來,我國雖然在該領域已發表了8000多篇中文論文,但國際表現力較弱,僅有310篇(其中大陸209篇)文獻發表在國際期刊上。我國相關領域研究地位與英國、德國相當,與美國相比還存在較大差距。我國在該領域的權威學者也較少,且主要集中在經濟學、管理學領域,中文發文最多的作者也僅有14篇論文。
需要說明的是,文獻計量方法本身尚存在一些局限性。例如,雖然前述的孫林巖的文章是研究溫度與二氧化碳排放之間的關系,但由于作者本人從事的是管理學研究,且論文發表在管理類期刊上,數據庫沒有將其歸為氣象學類別。盡管如此,文獻計量法能夠幫助研究者從總體上把握學科發展現狀和動向,是信息研究中常用且可靠的方法之一。
(作者單位:中國氣象局氣象干部培訓學院)
深入閱讀
Covey DB. 1992. Testing for granger’s full causality. The Review of Economics and Statistics, 74(1): 146-153.
Freeman JR. 1983. Granger causality and the times series analysis of political relationships. American Journal of Political Science, 27(2): 327-358.
Granger CWJ. 1969. Investigating Causal Relations by Econometric Models and Crossspectral Methods. Econometrica, 37(3): 424-438.
Granger CWJ. 1980. Testing for Causality:a personal view point. Journal of Economic Dynamics and Control, 2: 329-352.
Reichel R, Thejll P, Lassen K. 2001. The cause-and-effect relationship of solar cycle length and the Northern Hemisphere air surface temperature. Journal of Geophysical Research: Space Physics, 106(A8): 15635-15641.
Sun LY, Wang MH. 1996. Global warming and global dioxide emission: An empirical study. Journal of Environmental Management, 46(4): 327-343.
Triacca U. 2005. Is Granger causality analysis appropriate to investigate the relationship between atmospheric concentration of carbon dioxide and global surface air temperature? Theoretical and Applied Climatology, 81(3-4): 133-135.
Wood B D. 1992. Modeling federal-implementation as a system - the clean-air case. American Journal of Political Science, 36(1): 40-67.
曹鴻興, 鄭艷, 虞海燕, 等. 2008. 氣候檢測與歸因的格蘭杰檢驗法.氣候變化研究進展, 4(1):37-41.
曹永福. 2006. 格蘭杰因果性檢驗評述. 數量經濟技術經濟研究, (1): 155-160.
知網學術期刊
總庫(CAJD)和ISI Web of Science平臺數據庫,檢索國內外有關“格蘭杰因果檢驗”主題文獻。在CAJD中,采用檢索式為:SU='格蘭杰因果' OR SU='granger因果' OR SU='格蘭杰檢驗' OR SU='granger檢驗' OR SU='格蘭杰因果檢驗' OR SU='granger因果檢驗',精確匹配,時間不限定,學科不限定,共檢索命中文獻8337篇(檢索日期為2014年5月5日)。在ISI Web
Advances in Meteorological Science and Technology2014年3期