○鄧慧
(山東省統計局 山東 濟南 250100)
基于狀態空間模型的GDP與用電量數據協調性評估
———以山東為例
○鄧慧
(山東省統計局 山東 濟南 250100)
本文以山東省為例,嘗試使用狀態空間模型對動態數據協調性進行評價。首先通過分層聚類選擇參照系,分別利用整體偏離系數、變異系數和時點偏離指數等參數對數據的整體偏離情況、整體波動情況和時點偏離情況進行協調性評估,并得出基本結論:山東省電力消耗系數明顯高于全國平均水平,二者總體變動趨勢具有相似性;以七省市聚類數據作為參照系,則山東省與新參照系的電力消耗系數整體差距有所縮小,但系數差本身波動較大,協調性不夠理想。
數據評估 協調性 狀態空間模型
近年來,人們對統計數據的需求與日俱增,大量統計數據用于政府宏觀決策、企業生產經營,以及公眾生產生活上,社會各界對統計給予了越來越多的關注,了解統計、應用統計、監督統計的意識不斷增強。隨著關注度的提高,部分統計數據也引起了廣泛質疑,特別是在1998年亞洲金融危機期間和2008年全球金融危機爆發以來,國際研究機構從數據協調性的角度對中國GDP等數據提出了質疑。中國及各地區統計數據的協調性究竟如何,采用什么樣的方法可以對各地區數據進行客觀評估并找出不協調的數據等等一系列問題亟待解答,對統計數據的協調性和準確度做出客觀評估具有重要的現實意義。
國內外學者采用多種方法評估中國經濟數據協調性,并得出了不同結論。Rawski(2001)指出,中國經濟增長率與能源消耗數據之間、生產數據之間以及生產數據與投資數據之間存在數據不匹配,并由此質疑中國統計數據造假。Klein和Ozmucur(2002)選取對中國經濟有廣泛代表性的15個指標進行了主成分分析,結果表明,各指標的變動與中國官方數據的變動是一致的。任若恩(2002)考察了德國、英國、日本和韓國的經濟增長與能源增長數據,發現這些國家都曾經出現過二者不同步的現象。闕里和鐘笑寒(2003)借鑒Klein和Ozmucur的思想,使用1984—2001年的中國省際面板數據開展研究,為中國GDP數據真實性的討論提供了地區一級數據的檢驗,結果表明,從整個時期來看,各地區的若干基礎經濟變量(包括能源消費量)相對于各自GDP的變化趨勢是符合基本經濟規律的,年度特殊影響也不嚴重,地區特殊影響雖然較大,但可以從地區經濟結構及其變化等方面的差異上得到解釋。周國富和連飛(2010)選取了9個主要經濟指標,提取其主成分,并考慮地理空間因素對經濟增長的影響,采用空間面板數據模型對中國地區GDP數據的真實性進行經驗分析,結果表明中國地區GDP同各經濟指標的協調性較好,分年份來看也沒有被系統高估的跡象。
以往學者的研究往往偏重于經濟數據的靜態分析。對宏觀經濟數據而言,由于經濟改革、各種各樣的外界沖擊和政策變化等因素的影響,經濟結構會逐漸發生變化,在相似的外部環境和內在因素下,指標間的相互關系具有相似性,通過同時期數據關系演變趨勢的對比可以在一定程度上反映和評估數據的協調性。考慮到使用固定參數模型難以反映數據關系的動態變化,在數據評估方面難以體現靈敏性和動態性,因此本文選擇狀態空間模型(Harvey 1989,Hamilton 1994)這一變參數模型反映指標間的動態關系,并通過參數變化趨勢的對比進行數據協調性評估。
以GDP為被解釋變量,用電量指標為解釋變量,構建模型如下:
量測方程:gdpt=powertβt+ut,…,T (1)
狀態方程:βt=+φtβt-1εt,t=1,2,…,T (2)

式(1)中,可變參數βt是電力消耗系數,為不可觀測變量。式(3)中ut和εt相互獨立,且服從均值為0,方差為和協
方差矩陣為Q的正態分布。

圖1 1995—2010年電力消耗系數對比

表1 1995—2010年山東省和參照區域電力消耗系數對比
將1995—2010年全國及山東省GDP和用電量數據代入,利用EViews 5.0軟件計算出時變的電力消耗系數結果如圖1所示。
從電力消耗系數的變化趨勢看,山東省與全國的電力消耗系數總體趨勢具有相似性,除2004年等個別年份外,多數年份的系數差相對穩定。從電力消耗系數時點值的比較看,1990—2010年山東省電力消耗系數均明顯高于全國平均水平,但考慮兩者的經濟發展狀況差別較大,山東作為東部沿海城市,以全國作為參照具有較強的不可比性。因此我們選擇人均地區生產總值指標對全國各省市做聚類分析,并將山東省所在的包括北京、江蘇、浙江、廣東、遼寧、福建、山東等七個省市大類的GDP和電力消耗數據加總,以此作為參照系進行數據評估。通過狀態空間模型求得參照區域電力消耗系數,對比情況如圖1和表1所示。
可以看出,與以全國為參照相比,山東省與新參照系的電力消耗系數整體差距有所縮小,但系數差本身波動較大,尤其是1997年、2001年等年份,協調性不夠理想。山東省與參照區域電力消耗系數差如圖2所示。

圖2 1995—2010年山東省與參照區域電力消耗系數差
通過電力消耗系數差可以從整體偏離、整體波動和時點偏離三個角度進行數據協調性評估。
1、整體偏離評估
從整體偏離的角度,可以通過整體偏離系數對數據做出評估和判斷,其表達式為:

其中,Δ ̄β ̄表示待評估區域與參照區域電力消耗系數差均值,β ̄0表示參照區域電力消耗系數均值。整體偏離系數反映待評估區域相關數據整體偏離的程度。我們可以結合實際情況和相關省市整體偏離系數的大小設定警示標準,例如可以將該警示標準設定為0.1,小于警示標準值視為數據整體基數較為客觀,超過警示標準則視為相關年份數據整體匹配度偏低,或基數偏大。計算可得1995—2010年山東省整體偏離系數為0.114,如果假定警示標準為0.1,則可以據此對數據質量做出整體評估,或在此基礎上引導調整。
2、整體波動評估
從整體波動的角度看,可以使用變異系數法對一個省市數據的協調性做出評估,其表達式為:

其中,S表示電力消耗系數差值的標準差。變異系數值能夠動態反映待評估區域相關數據的穩定性。我們可以根據需要設定變異系數的警示標準,例如可以將該警示值設定為10%,低于警示值表示相關年份數據基本穩定,或協調性較好,超過警示值則表示數據波動偏大,并可將此標準作為數據評估調整的參照。計算可得1995—2010年山東省電力消耗系數差的變異系數為22.5%,依據10%的參照標準,該省數據波動偏大,匹配度不理想。
3、時點偏離評估
從時點偏離的角度看,可以通過時點偏離指數對具體年份數據的異動情況做出評價,其表達式為:

時點偏離指數以參照系為基礎能夠直觀反映某一年份數據的異常波動情況。我們可以結合實際需要設定警示標準值,例如可以將警示值設定為0.2或0.3,低于警示值視為該年份數據基本穩定,超過警示值則表示該年份數據出現異常波動。計算可得山東省各年份的電力消耗系數差的偏離指數,如果以0.2為警示值,則山東省1997年、1999年、2001年、2004年數據出現異常;如果以0.3為警示值,則山東省1997年和2001年數據出現異常波動,表示相關年份數據不夠協調。
研究發現,1995—2010年,山東省電力消耗系數明顯高于全國平均水平,二者總體變動趨勢具有相似性,除2004年等個別年份外,多數年份的系數差相對穩定;若以北京、江蘇、浙江、廣東、遼寧、福建、山東七省市聚類數據作為參照系,則山東省與新參照系的電力消耗系數整體差距有所縮小,但系數差本身波動較大,尤其是1997年、2001年,協調性不夠理想。
[1]盧二坡:統計數據質量評估方法述評[J].工作視點,2006(12).
[2]孟連、王小魯:對中國經濟增長統計數據可信度的估計[J].經濟研究,2000(10).
[3]張新、蔣殿春:中國經濟的增長——GDP數據的可信度以及增長的微觀基礎[J].經濟學(季刊),2002(1).
[4]任若恩:中國GDP統計水分有多大—評兩個估計中國GDP數據研究的若干方法問題[J].經濟學(季刊),2002(1).
[5]Rawski Thomas G.:近年來中國GDP增長核算:目前的狀態[J].經濟學(季刊),2002(1).
[6]許憲春:中外經濟學家對中國經濟增長率的評論[J].財貿經濟,2003(2).
[7]闕里、鐘笑寒:中國地區GDP增長統計的真實性檢驗[J].數量經濟技術經濟研究,2005(4).
[8]周國富、連飛:中國地區GDP數據質量評估—基于空間面板數據模型的經驗分析[J].山西財經大學學報,2010(8).
[9]高鐵梅:計量經濟分析方法與建模[M].北京:清華大學出版社,2009(5).
[10]陳強:高級計量經濟學及Stata應用[M].北京:高等教育出版社,2010.