□文/王亞敏 朱 勝 谷 峰
(成都信息工程學院統計學院 四川·成都)
統計數據可靠性的高低決定著統計數據的可信程度,而包括社會消費品零售總額等在內的統計指標的數據可靠性,直接影響到以此為依據的國家機關決策的科學性和政策實施的有效性,所以無論是國際組織還是各國的統計機構都十分重視統計數據質量可靠性的評估與管理。
目前,我國針對統計數據方面的研究較多,但專門針對統計數據可靠性的研究卻較少,專門針對社會消費品零售總額數據可靠性的研究就更少了。國涓(2001)針對統計信息失真進行了博弈分析;丁志盈(2004)認為基層統計數據質量影響了整體統計數據質量;張志華等(2007)認為局部的可靠性數據往往具有波動性,利用順序約束模型研究早期可靠性數據的統計處理方法;朱海平(2008)認為我國統計資料的可靠性很大程度上受到外部因素的影響,而不僅僅與統計本身有關;方大春(2009)認為統計數據的不可靠如統計數據不全面、不準確和造假等現象,主要是統計制度的設計未能構成納什均衡造成的,而數據可靠性是決定國家政策制度制定成功與否的關鍵;朱愛群(2001)認為統計數據質量問題的產生原有其實質的根源;夏品儉(2003)提出應對統計數據的真實性進行理論評價;徐淑榮(2003)則從統計環境的角度對統計信息質量的影響進行闡述;楊清(2000)從誤差的角度探討統計數據的質量問題;余芳東(2002)認為統計理論越來越重視數據質量的管理研究,分析了外國統計數據質量管理的經驗,提出改進我國數據質量管理的建議。
國外最早對統計數據質量監理調查模型的是Hansen、W.H.Hurwitz,于1946年提出了無回答問題(1946),并于20世紀60年代首次提出完整的調查誤差模型。1980年聯合國統計局在《統計組織手冊》中超越了統計數據準確性,對統計資料提出了八項要求。Richard Y.Wang(1998)提出了全面數據質量管理方法(TQDM),開創了對數據質量進行全面評估的先河。Yang W.Lee 等(2002)提出了包括評估模型、測量問卷和分析技術的信息質量評估方法(AIMQ),填補了信息質量全面評估和改進方法上的空白。Leo L.Pipino 等(2002)將主觀和客觀數據質量評估方法相結合,通過把數據質量的主觀評估結果與客觀評估結果標記,以主觀評估和客觀評估為坐標軸的圖上來反映數據質量。Carlo Batini 等(2008)綜合了原有數據質量研究方法,提出了全面數據質量(CDQ)方法,在實際應用中,它相比其他方法更加全面、靈活、簡單。Carlo Batini 和Cinzia Cappiello 等(2009)對TDQM、AIMQ、CDQ 等13 種數據質量評估與管理方法進行了系統的闡述與比較。
除了專家、學者的研究以外,各國際組織也制定了各自的數據質量評估與管理體系。其中,為提高成員國的統計數據質量,IMF 于1996年和1997年分別制定了數據公布特殊標準(SDDS)和數據公布通用準則(GDDS),二者強調的是數據公布過程規范性和透明度。為對數據質量進行評估,2001年IMF 頒布了《數據質量評估框架》(DQAF),為各成員國提供了定性評估數據質量的方法。ESS 建立了《ESS 質量保證框架》(QAF),它從全面質量管理的角度將統計活動質量劃分為統計機構環境質量、統計過程質量、統計產品質量三個部分,并提出了與之相對應的1、4、5 個質量維度。OECD 于2003年首次公布了《OECD 統計活動質量框架和指南》(QFGOSA),它將統計活動分解為七個階段,針對每一階段提出了具體的質量要求和成本效率狀況。
國內關于統計數據可靠性方面的研究較多,但探討的側重點各有不同。統計數據可靠性的理論與實證研究在一定程度上豐富了我國統計數據的方面的相關研究,彌補了統計數據質量研究過程中的不足。
在數據可靠性方面,不少專家、學者從異常值診斷的角度出發進行了研究。其中,朱文杰(2007)從異常值診斷的角度介紹了投影尋蹤法,并以GDP 增長——消費增長的二維數據進行了實證研究。劉孝新等(1997)介紹了事后預測及反常結果判斷法。盧二坡和黃炳藝(2010)介紹了基于穩健MM 估計的異常值診斷法對我國GDP 統計數據進行了質量評估。許永洪和曾五一(2009)引入了Hamilton-Costa 方法來估計CPI 的偏差。楊海山(2001)對實際經濟問題中非平穩的時間序列建立了確定性加隨機性的組合模型,并運用誤差控制法和估計區間判斷法來判斷統計數據是否存在質量問題。劉洪和黃燕(2007)運用趨勢模擬評估法對我國GDP 數據質量進行了評估。
國內學者對統計數據可靠性的評估包括數據準確性、可比性、可獲取性等方面。沙方芳(2007)從有關統計數據公布的國際準則出發,從數據可獲取性、及時性等方面進行研究,從而科學地反映我國政府統計數據質量狀況。許滌龍和葉少波(2011)從理論的角度介紹了包括用戶滿意度調查法的四種多維評估方法的評估過程,并研究了各自的優缺點。張芳(2004)、周光洪(2009)、葉少波(2011)在建立統計數據質量評估指標體系的基礎上應用模糊綜合評價方法對我國政府統計數據質量或GDP指標進行了多維數據質量評估。王華、金勇進(2009)從統計數據準確性的評估方法入手,對總量或個體指標統計數據的準確性進行評估,從而更有效的建立統計數據可靠性測度方法。
在統計數據可靠性評估方法的研究方面,楊海山(2001)利用誤差控制法和估計區間判斷法對統計數據質量進行評估;朱勝等(2006)從相關指標之間的變動趨勢出發,選取相關統計指標對GDP 統計數據質量進行甄別;成邦文等(2001)從研究統計數據的分布規律入手,提出對異常數據進行識別和定量檢查的方法,比如對數正態分布檢查法;博德印(2000)提出通過比較分析法、探索性數據分析等,構建系統規范的統計數據質量控制體系。
社會消費品零售總額是我國特有的統計指標,是我國貿易統計的核心指標,對其數據質量進行研究,在一定意義上也就是對我國貿易統計核算體系的研究。
對于社會消費品零售總額統計數據質量存在的問題,樓偉為和張莉(1998)、何海龍和楊陽(1999)、秦鎮林(2000)、陳立財(2011)等人從理論的角度進行了深入分析和總結,并提出相應的對策建議。其中,所存在的問題主要有基本單位數不明確、數據收集困難、統計方法不規范等。較具代表性的對策建議包括:陳立財提出了完善貿易統計指標體系和抽樣調查方法,強化對統計數據質量的評估,何海龍和楊陽(1999)提出了組合式統計調查模式。此外,趙戎驊(1999)通過抽查核實,并與相關指標進行對比,對浦東新區的社會消費品零售總額進行了研究分析,認為其與實際情況基本符合。
雖然以上研究提出了很多改進的建議,但是大多只是對社會消費品零售總額統計工作中存在的問題進行了分析或核實,并沒有從實證分析的角度對社會消費品零售總額進行研究。李庭輝和許滌龍的研究則填補了這一空白,構建了自回歸動態滯后模型,從匹配性的角度對社會消費品零售總額進行了數據質量評估,研究發現我國社會消費品零售總額數據誤差在允許的5%范圍內。不過,這一研究主要評估的是社會消費品零售總額統計數據的準確性,具有一定的局限性。
以上這些學者均從不同角度對外國統計數據可靠性進行了相關理論和實證研究,但不同程度上都具有局限性,而對社會消費品零售總額數據可靠性方面的研究更是相對匱乏。■