朱飛飛
(浙江省統計局,浙江杭州 310012)
GDP數據質量評估方法研究*
朱飛飛
(浙江省統計局,浙江杭州 310012)
GDP數據質量備受關注。本文介紹了邏輯關系檢驗法等幾種統計數據質量評估辦法,指出目前國家統計局針對地區GDP數據質量的評估辦法中存在的問題,并提出了改進思路。
GDP數據質量;評估;改進
統計質量是統計工作的生命線,是統計工作永恒的主題。隨著經濟的發展,社會各界對GDP數據質量的要求也越來越高。盡管國家統計局有一套相對規范的GDP核算方法,但由于受到各種因素的影響,各地區的GDP數據質量還是有區別的,一些地區的數據還會經常引起社會各界的質疑。那么,如何提高GDP數據質量呢?本課題認為加強GDP數據質量評估是提高GDP數據質量的有效手段。
統計數據質量評估就是對已經獲得的統計數據進行驗證、分析和評價。目前關于統計數據質量的評估辦法實質上仍然是圍繞統計數據的準確性而展開研究的,主要有以下幾種方法:
1.邏輯關系檢驗法。邏輯關系檢驗法是以統計指標之間存在的包含、恒等以及相關等內在邏輯關系為判斷標準,實現對統計指標數據的可信度的粗略檢驗。如果在檢驗中某一組統計指標數據違背了它們之間所存在的特定關系,則表明這組數據存在可信度問題,有可能是其中的一個或一部分數據不可信,也有可能是整組數據均不可信,需要進行進一步的分析與核查。按照檢驗所依據的邏輯關系的不同,該方法可分為基于平衡關系的邏輯檢驗和基于相關性的邏輯檢驗。
基于平衡關系的邏輯檢驗是由統計指標內涵口徑以及核算方法決定的,如資本形成總額應大于固定資產形成總額;全國GDP應為國內各地區生產總值的總和;支出法GDP應為消費、資本形成總額以及凈出口之和等等。多數學者和公眾媒體都是憑此方法質疑統計數據,一個典型的例子就是我國各地區生產總值的總和顯著大于全國GD以及各地區生產總值增長率的加權平均數顯著高于全國GDP增長率。基于平衡關系的邏輯檢驗普遍應用于各級統計部門的數據審核工作。它既可用于原始調查資料,也可用于匯總數據。
基于相關性的邏輯檢驗是以統計指標之間的高度相關關系為判斷標準,這種相關關系是由社會經濟客觀現象決定的統計指標之間的高度相關關系。一般地,一個社會經濟變量變動會導致另一個社會經濟變量隨之變動,并且在一定的生產技術條件下這種變動關系保持相對穩定,即一些統計指標間存在穩定的相關性,它主要有兩種表現形式:一是總量指標本身之間存在比較穩定的比例或比率關系,即由此計算的相對指標應在特定的范圍里取值,如增加值率、財政收入占GDP比重、三次產業間的比例、固定資產投資完成額與施工項目計劃總投資等均應比較穩定;二是總量指標的變動趨勢之間存在相當程度的同向或反向一
致性,亦即各自的增長率之間應該在方向上相符、在幅度上一致,如工業增加值增長率與工業用電量增長率、貨物周轉量增長率與GDP增長率等。
2.計量模型分析法。計量模型分析法是指以建立計量經濟模型為基礎、對相關指標的數據質量進行評估的一類統計數據質量評估方法。由于社會經濟統計指標之間的相關關系十分復雜,相關邏輯檢驗法在評估統計數據質量時經常失效,一些學者便嘗試借助于計量經濟模型等一些功能更為強大的工具來評估統計數據質量,從而形成了統計數據質量評估的計量模型分析法。該方法的基本思路與步驟是:首先,通過深入的分析,依據相應的經濟或統計理論建立計量經濟模型,因變量通常為待評估的指標;其次,選取樣本數據對所構建的模型進行參數估計,并對估計結果進行初步檢驗,得到具體的模型;第三,對所得到的具體模型進行分析,再根據相應的理論或假設得出待評估的統計數據是否可信的結論。
將計量經濟學模型應用于統計數據質量評估,是國內近年來比較普遍的做法。但實際上,在諸多國外涉及政府統計數據質量評估方法的指導手冊或者科研文獻中幾乎從未涉及這一方法。其根本原因在于計量經濟學模型和統計數據準確性評估之間存在一個無法解決的邏輯悖論。這一邏輯悖論可以表述為:統計數據準確性評估基于正確構建并估計出反映真實關系的計量經濟學模型,而正確的計量經濟學模型的估計依賴于統計數據的準確無誤。事實上,我們進行數據質量評估的出發點,就是懷疑數據本身是不準確的。那么,用假定不準確的數據對模型進行回歸估計,得到的回歸模型本身就是不可信的。基于這一不可信的回歸模型再進行數據評估也就毫無意義。因此,在這種方法下,對整個樣本期內的歷史數據進行追溯評估是不現實的,而對當期數據進行評估則需假定歷史數據正確以及經濟結構穩定,這樣的假定顯然也是純粹主觀的。
3.統計分布檢驗法。在社會經濟統計領域,統計總體中的各個個體的標志值在理論上會服從某一特定的統計分布。鑒此,通過對各個個體的標志值進行特定的統計分布檢驗,可初步判斷出各個個體的標志值是否正常、可信。
統計分布檢驗法的過程是:第一,通過對待評估指標進行深入的理論分析或對其歷史資料展開翔實的經驗研究,找出其服從的具體的統計分布;第二,檢驗待評估指標在各個個體上的取值的經驗分布是否與分析得出的理論分布一致,若檢驗通過,則說明待評估指標在各個個體上的取值總體上是可信的,否則說明待評估指標在個體上的取值存在較大的誤差,還需進一步分析原因;第三,以分析得出的理論分布為基礎,應用Grubbs準則、Dixon準則等識別待評估指標在各個個體上的取值的異常值,并對異常值進行認真審核,判斷其是否可信。引發異常值的原因一般有兩種:一是客觀因素,如統計指標值因外部經濟環境突變或者其他未知因素造成的極端表現;二是主觀因素,既包括有意造假的虛報、瞞報,也包括日常工作過程中的數據錄入、計算和匯總錯誤,還包括對調查方案執行不力,如樣本框選擇不當或不完全、違背抽樣原則等等。從原因看,異常值并不一定是質量有問題,只有人為因素導致的異常值才是質量有問題,因此,統計數據質量評估還要對異常值的產生原因做進一步的分析和判斷。
統計分布檢驗法的缺陷也較為明顯:一方面,所應用的前提條件是待評估指標服從某一特定的概率分布,但在許多情況下卻很難獲得這種理論分布;另一方面,對于各個個體數據中出現的一致性偏差還尚無法估計,即使得到肯定的檢驗結果也無法排除在各個個體數據中存在系統性偏差的可能性;而對于非一致性偏差其探測能力也受到各個個體所處的位置影響,那些處于理論分布中心位置附近的個體,即便出現較大的統計偏差也不一定會表現為數據異常點而被探測到。
4.核算數據重估法。核算數據重估法是指從統計核算的角度重新估計特定的統計指標數據為基礎,以實現對相關統計指標的數據質量進行評估的一類統計數據質量評估方法。評估的基本思路是:第一,以待評估統計指標的統計核算規范或方法為依據,通過分析找出待評估統計指標在核算實踐中存在的具體問題,并對其展開詳細的分析;第二,根據具體的分析結果,最大限度地挖
掘現有資料,有針對性地采用一些替代數據或者運用規范的方法來重新估計待評估統計指標數據;第三,以重新估計得到的統計指標數據為參照標準,對官方公布的統計指標數據進行準確性評估。運用該方法進行統計數據質量評估的關鍵是如何重新估計待評估的統計指標數據。核算數據重估法是對于邏輯關系檢驗法的另一拓展,多用于評估GDP及其構成項目的現價水平數據和增長率數據的準確性。
從核算的角度重新對統計數據進行估算,也存在不少問題。比如采用不同的估計方法,即使采用的是相同數據,估計結果也可能相差甚遠,而且這種差距難以解釋。又如,由于所需要的基礎數據難以獲得,因而估算必須建立在很強的假設之上,這將導致估算結果出現偏差或可靠性受到質疑。盡管如此,通過嚴格規范的方法重新對有關指標進行估算,不但是對官方統計數據強有力的檢驗,同時也為指標計算提供了更為豐富的統計依據。當然,由于宏觀統計數據特別是國民經濟核算數據的估算是非常復雜的系統工程,且數據的收集異常艱難,因此,這種方法的應用也僅限于專門的機構和研究人員。
盡管統計數據質量評估方法有很多,但真正要對GDP數據的準確可靠程度做出判斷也非易事。國家統計局也一直致力于GDP數據質量評估方法的研究,但目前推出的GDP數據質量評估方法,還僅供內部使用。現將國家統計局核算司制定的地區GDP數據質量評估方法做一簡要介紹。
國家統計局核算司制定地區GDP數據質量評估辦法的目的是為了提高地區GDP數據質量和地區之間GDP數據的可比性。目前所采用的地區GDP數據質量評估方法主要是差異比較法,即將各地區的評估指標與其標準值進行比較,按照差異大小來判斷地區GDP總量和增長速度數據質量。各地區的評估指標是利用GDP與各項稅收、全社會用電量、客貨運周轉量、存貸款余額以及城鎮居民家庭人均可支配收入和農村居民家庭人均純收入之間的相關關系來確定的。評估指標的標準值是依據各項評估指標的地區平均值確定的一個區間值(下稱“標準區間值”)。如果某一項評估指標高于標準區間值的上限,則得分較高,表明GDP與該項相關指標匹配性較高,GDP數據質量和協調性較好;如果某項評估指標低于標準區間值的下限,則得分較低,表明GDP與該項相關指標匹配性有待于改善,GDP數據質量和協調性需要進一步提高。再利用各項評估指標的得分乘以其相應的權重進行加權,得到各地區的綜合得分,并依此評判各地區GDP數據質量和協調性。
從國家統計局目前所使用的GDP評估方法來看,主要還是采用邏輯關系檢驗法。這是由于邏輯關系檢驗法在操作性和及時性上能基本滿足對季度GDP數據評估的要求。但目前國家統計局針對地區GDP數據質量的評估辦法還是存在一些問題。
1.邏輯關系檢驗法本身有缺陷。邏輯關系檢驗法可以分為基于平衡關系的邏輯檢驗和基于相關性的邏輯檢驗,該方法具有操作簡單、通俗易懂等優點,但也存在一些缺陷。比如基于平衡關系的評估辦法即使滿足平衡關系也只是統計數據準確的必要而非充分條件,因為即使數據通過檢驗也不能證明被評估數據一定真實可靠,況且當數據違背平衡關系時,該方法也不能指明是哪個或哪些數據不準確。基于相關關系的評估辦法采用的是用已知準確的指標(我們稱之為判別指標來對被評估指標進行評估,如果指標間數量關系超出正常范疇,則可以初步判定被評估指標存在一定的質量問題。該評估辦法的檢驗依據雖然從整體與部分的關系擴展到社會經濟現象中普遍存在的相關關系,可以將統計部門之外的第三方數據作為參照對象納入評估體系中來。但問題是如何衡量判別指標的準確性,如何測定指標間數量關系是否超出正常范疇,這些都是有一定難度的。在當今復雜多變的經濟形勢下,指標之間的相關關系可能是不穩定的,穩定的高度相關性往往并不成立。
2.判別指標的代表性問題。國家統計局在制定GDP數據質量評估辦法時更多地是站在全國的角度選取判別指標的,在評估地區一級的數據質量時就會帶來一些問題。比如國家統計局在評估GDP數據質量時,其中選用了客貨運周轉量發展速度來評估GDP速度的合理性。從全國角度來看,客貨運周轉量與GDP之間確實存在著比較高的相關關系,但對地區來說,相關關系就不一定表現得那么明顯。根據交通部的統計制度規定,客貨運周轉量是按照注冊地統計的,如果某一地區注冊車輛增長不快,就會推導出這一地區的客貨運周轉量也一定增長不快,但這并不代表這一地區實際營運的客貨運周轉量也增長不快。因為交通運輸單位的注冊地和經營地常常是分離的,注冊車輛增長不快并不代表營運車輛也增長不快。實際上,由于種種原因,這幾年進入浙江省營運的外省登記車輛不斷增加,而本身注冊車輛增長不快,由于這些外省車輛在浙江營運的周轉量不能計入其客貨運周轉量統計數據中,導致這幾年浙江省按注冊地統計的道路運輸客貨運周轉量增長速度一直在個位數徘徊,從而導致浙江道路運輸客貨運周轉量統計數據不能客觀真實地反映其實際情況。如果用此指標來評估浙江省的GDP增長速度就會帶來代表性不足問題。如果用此指標來評估地市的GDP數據,代表性問題將會更突出。
3.判別指標的口徑問題。由于某些判別指標的口徑問題,在對被評估指標進行評估時會對各地區帶來結果的較大差異。比如財政收入一般可以分公共財政預算收入(以前為地方一般預算收入)和財政總收入。而公共財政預算收入又可以分稅收收入和非稅收入,一般來說,公共財政預算收入的大小不僅受上劃中央“四稅”收入的影響,也受非稅收入的影響。因此,如果用公共財政預算收入來評估GDP就會受到某一地區非稅收入以及上劃中央“四稅”比例的影響。如果某一地區非稅收入在公共財政預算收入中所占比重越高,用它來評估GDP的數據質量效果就越差;同樣,如果某一地區上劃中央“四稅”比例越高,用它來評估GDP的效果也越差。此外,財政總收入各地的口徑也是五花八門,比如浙江的財政總收入僅包括公共財政預算收入和上劃中央“四稅”收入,江蘇的財政總收入在浙江所包括的范圍基礎上還包括基金收入和社保收入,廣東的財政總收入在江蘇所包括的范圍基礎上,再包括國有資本經營收入。因此,如果用財政總收入來評估GDP數據質量,也會帶來很多問題。又如利用稅收收入這一指標來評估GDP也會受到指標口徑的影響。比如目前國家統計局要求上報的全部稅收收入是包括全部國稅收入和地稅收入,但全部國稅收入中有國稅部門組織的稅收收入和包括了海關代征的增值稅和消費稅的國稅稅收收入兩種口徑,若某一地區海關代征的增值稅起伏較大,就會對全部稅收收入的增長率帶來較大的影響,從而影響對被評估指標的評估。
4.判別指標本身的數據質量問題。目前國家統計局評估GDP數據質量所采用的判別指標大多為統計部門之外的第三方數據,這雖然有一定的客觀性,但第三方數據由于種種原因也存在一些質量問題。比如前面提到的道路運輸客貨運周轉量,雖然交通部有一套道路運輸統計調查方案,但各地在執行過程中數據質量很難有保證,比如有些地區是運管部門在統計,有些地區是委托科研機構在統計等等。又如利用全社會用電量來評估GDP時,由于工業用電量受線損的影響較大,在評估時也會帶來一些困惑等。
由于國家統計局目前出臺的GDP數據質量評估方法基本還是采用邏輯關系檢驗法,為了保持與國家局評估方法的一致性,我們的改進思路是在國家統計局已經出臺的評估方法基礎上,結合浙江實際情況,提出浙江省的GDP數據質量評估辦法,在選取判別指標以及分析評估結果時需要考慮以下因素:
1.判別指標的選取與被評估指標要有一定的相關性。我們在制定各市GDP數據質量評估辦法時,首先要考慮判別指標是否能收集到,其次要考慮收集到的判別指標是否與被評估指標有一定的相關性。比如鐵路貨運量在評估GDP時是個很好的判別指標,在克強指數中也運用到它。但如
果用鐵路貨運量來評估地市一級的GDP數據可能就會帶來問題。一方面,目前的鐵路運輸統計是按照大區統計的,浙江的鐵路運輸是在上海鐵路局統計的,上海鐵路局無法提供浙江各市的鐵路運輸情況,那么我們就很難用各市的鐵路貨運量來評估各市的GDP數據;另一方面,有些地區鐵路運輸線路還沒有覆蓋到,比如舟山,那就更無法用鐵路貨運量來評估舟山的GDP數據了。因此,我們在選取判別指標時一定要關注它的可得性以及相關性。
2.判別指標在全省范圍內盡可能要做到口徑一致。選取的判別指標在評估各地的GDP數據質量時至少要在各地具有可比性。比如前面提到的公共財政預算收入由于受到非稅收入以及上劃中央“四稅”的影響,就不是很適合作為判別指標來評估GDP的數據質量,因為可比性相對較差。全部地稅和國稅稅收收入由于受到海關代征的增值稅和消費稅的影響,也不是很適合作為判別指標。因此,我們應采用地稅的稅收收入加上劃中央的“四稅”收入作為評估GDP數據質量的判別指標之一。總之,若要評估各地的統計數據質量,選取的判別指標在各地要有可比性非常重要。
3.加強與相關部門的溝通與合作,盡量提高判別指標的數據質量。由于我們選取的判別指標大多為統計部門之外的第三方數據,因此,我們要加強與相關部門之間的溝通和合作。比如客貨運周轉量是一個很好的判別指標,但由于統計制度以及數據質量等原因而導致使用效果不理想,那么我們就要加強與交通部門的溝通與合作,盡量在源頭上(即交通部)提出改革交通運輸統計制度的建議;其次多加強與省級交通部門的溝通,在業務上幫助省級交通部門提出適合我省實際情況的交通運輸統計制度改革。此外,也要與其他相關部門溝通與合作,盡可能多地了解相關判別指標在口徑、范圍、含義等方面的變化,以方便我們及時修正或調整相關判別指標。
4.加強對評估結果的分析與研究。我們建立評估辦法,目的就是要讓評估結果能基本反映各地的實際情況,從而促進各地統計數據質量的提高,但由于種種原因,有時也會有不盡如人意的地方。比如我們按照GDP數據質量評估辦法,對2013年上半年和1-3季度各市數據進行試算,發現評估結果還是能大致反映各市的數據質量,對各市具有參考意義,但也存在一些問題。比如用全社會用電量來評估11個市的GDP數據,我們發現舟山得分特別低,分析其原因,原來舟山經濟的發展對用電的需求要大大低于其他市;又如我們用城鎮單位從業人員來評估11個市的GDP數據,發現金華得分特別高,分析其原因,金華由于2013年年度以來建筑業的從業人員在統計口徑上發生了一些變化。因此,盡管我們制定了評估辦法,但還是要加強對總體評估結果以及分項評估結果的分析研究,以便更好地反映各地的統計數據質量。
5.加強對GDP以及與GDP相關的統計指標計算方法的研究。為了提高GDP數據質量,我們除了要研究GDP數據質量評估方法,更要加強對GDP以及與GDP相關的統計指標計算方法的研究,形成兩條腿走路。比如在現行的季度GDP核算方案中,信息傳輸計算機服務和軟件業增加值是采用電信業務總量的速度來推算的,這與近幾年浙江互聯網和相關服務、軟件和信息技術服務業的高速發展是極不相符的,為此,我們就要建議國家統計局改進信息傳輸計算機服務和軟件業增加值的核算方法,以便在源頭上提高統計數據質量。又如現行的規模以上月度工業增加值是按上年的增加值率來推算的,若兩年之間企業經濟效益變化比較明顯,采用上年工業增加值率來推算本年工業增加值就會帶來數據失真,從而影響GDP數據質量,因此,就要建議國家統計局考慮改變本年工業增加值的計算方法。總之,只有不斷改進GDP核算方法以及與GDP相關的統計指標的計算方法,不斷跟進GDP數據質量評估方法,我們的GDP數據質量才能不斷提高。
課題負責人:朱飛飛
課題組成員:王啟金、金良家、汪維薇、王娟張序旦、張琦、莫樂平
課題執筆人:朱飛飛
(責任編輯:牛域寧
*本文榮獲2013年度浙江省統計學術類課題二等獎。