鄭 莉付瑞全劉少博趙 執彭 星
(1.國家海洋信息中心,天津 300171;2.中國海洋大學 經濟學院,山東 青島 266100)
隨著海洋經濟的持續快速發展,海洋經濟在國民經濟中的地位日益提高,據初步核算,2017年全國海洋生產總值77 611億元,海洋生產總值占國內生產總值的9.4%。20世紀80年代以來,盡管我國海洋統計逐步制度化、規范化,為海洋經濟宏觀調控提供了重要依據,但是也存在著部分統計數據質量管理機制不夠健全等不足,新時期海洋經濟統計機遇與挑戰并存?!度珖Q蠼洕l展“十三五”規劃》提出了“加強海洋經濟監測評估”要求,“十三五”以來,通過建立涉海企業直報制度,開展涉海部委數據共享等方式,海洋經濟監測內容日益豐富,監測評估能力逐步提升,但各級領導對海洋經濟統計數據的準確性和可靠度要求也越來越高,高質量的數據能為海洋經濟管理決策提供可靠的參考依據。
當前,我國海洋經濟統計數據的質量控制主要集中在數據產生過程,對于后期數據使用過程的質量評估方法較少涉及。雖然我國海洋經濟統計建立了數據審核、溝通反饋流程,形成了完整性、邏輯性、準確性等審核,但是使用的審核方法較為簡單,審核方法與工作機制有待完善。為進一步提高海洋經濟統計數據準確性和可靠性,需要擴充海洋經濟統計數據質量評估方法并逐步推進業務化工作??紤]到針對海洋經濟統計數據質量評估方法的文獻較少,本文擬分析當前主要宏觀經濟數據質量評估方法在海洋經濟領域的適用性,得出結論并提出相關工作建議。
統計數據是對經濟活動的記錄,也是進行社會經濟問題研究的基礎,數據質量對數據使用者具有極其重要的作用。為充分發揮統計信息在政府決策中的作用,國外特別是發達國家如英國、加拿大、瑞典、荷蘭等國家統計機構建立了比較健全的數據質量綜合評價和管理體系;此外,國外也建立了對單個統計項目如國民核算、消費價格指數、國際收支、住戶調查等數據的質量管理機制。國外統計質量評估方法分為兩個層次,一個層次是國際數據質量評估框架,如國際貨幣基金組織(IMF)的數據質量評估框架(DQAF)、歐盟統計局(ESS)的數據質量評估框架(Dat QAM)、聯合國統計署的通用國家質量保證框架(NQAF)等;另一個層次是不同學者從不同角度提出的評估方法,如Alexander等(1999)提出了評價網絡數據6個評價標準,即權威性,準確性,客觀性,及時性,可覆蓋性,可交互性[1]。Gauch(2000)則認為應從及時性,便捷性,有效性,權威性,普及性和一致性6個方面評估數據質量[2]。
國內對于宏觀經濟統計數據質量評估的研究起步晚于國外研究,國內研究側重理論探索統計質量的含義、管理和評估體系。如盧二坡(2006)歸納總結了統計數據質量的邏輯評估法、異常值評估法、誤差角度質量評估、核算角度質量評估四大類方法的特點及應用場合[3];王華等(2009)評析了邏輯規則檢驗、經驗參數比對、相關指標變動趨勢比對、基于模型的異常數值識別與參數穩定性分析等幾類數據準確性評估方法[4];王華等(2010)針對統計數據質量開展了用戶滿意度測評,并建構了統計用戶滿意度測評的方法論框架[5];郭越等(2010)指出可用邏輯判斷法、增長率法、結構法、關聯系數法、抽樣調查法等方法監控海洋統計數據質量[6];許滌龍等(2011)詳細討論了邏輯關系檢驗法、計量模型分析法、核算數據重估法、統計分布檢驗法、調查誤差評估法以及多維評估法6個類別統計數據質量的評估方法各自的評估過程、適用性及其優缺點[7]。
隨著近30年海洋經濟統計工作不斷發展完善,通過制度統計、企業直報系統、調查等傳統渠道及大數據等新興渠道獲取的海洋統計數據日益豐富,且海洋經濟統計數據具有覆蓋內容廣、來源多且可信度不一等特點,在這種情況下保證報送數據的準確性和可靠性政府和相關統計部門的迫切需求。特別是在當前大數據發展背景下,國內學者從最初研究統計數據調查誤差逐步向研究統計數據綜合質量轉變發展。具體可分為以下三個階段:
第一階段(1988-1998年),初步發展階段。該時期海洋統計工作初步開展,統計數據主要來源于各涉海部委,數據的可得性是當時評估評價海洋統計數據質量的唯一標準。
第二階段(1998-2013年),迅速發展階段。隨著統計工作的深入開展,依次創建了《海洋統計綜合報表制度》 《海洋統計快報制度》 《海洋生產總值核算制度》等,并出臺了《全國海洋統計數據審核辦法》 《全國海洋統計工作考評方法》等規范化管理辦法,在這個階段準確性成為評價海洋統計數據質量的出發點。
第三階段(2013至今),拓展完善階段。隨著統計調查體系的完善、信息化的推進和標準體系的構建等,在新時期大數據背景下,海洋經濟統計數據質量評價標準由單一化逐步向多維化發展,評價方法也呈現出多樣化復雜化趨勢。
隨著我國海洋經濟統計工作的日益完善,我國海洋經濟統計數據質量評估方法也不斷發展完善,統計數據質量也在不斷提高,但仍存在審核方法簡單、效率低、范圍窄等不足。主要表現在以下4個方面。
2.2.1 數據質量標準化管理較薄弱
雖然我國出臺了海洋經濟數據審核辦法,但在具體的業務化工作中并未實現全面實施推進,且近年來隨著海洋經濟監測高頻數據日益豐富,形成的統計數據存在數據來源多且可信度不一等問題,而針對這些統計數據的質量標準管理工作也并未及時更新推進,海洋經濟數據質量的標準化管理總體較為薄弱。
2.2.2 審核集中在數據生產環節且使用方法較簡單
目前,我國海洋經濟統計數據的質量控制主要集中在數據產生過程,且多采用增速法、圖形法、目測法等較為基礎的審核方法,對于后期數據使用過程中的質量評估較少涉及,對于有些數據,在采集過程中可能難以發現數據異常,而在使用過程中可能會發現與其他指標變化趨勢不一致等情況。
2.2.3 數據審核信息化水平相對滯后
現階段海洋經濟統計數據審核的效率低,還沒有全部實現系統化,雖然部分統計制度數據初步實現了系統審核,但是系統審核方法較為簡單,還需輔以人工做進一步審核判斷,數據審核信息化水平還處于相對滯后的發展階段。
2.2.4 數據質量評估范圍較窄
我國海洋經濟統計數據質量評估目前主要是針對數據的完整性、邏輯性、準確性等,且多基于指標本身的質量評估,對于相關指標、用戶層面的質量評估較少涉及,為與國際接軌,需要不斷擴展質量評估維度。
當前,宏觀經濟統計數據質量評估常見的方法有邏輯規則檢驗法、計量模型分析法、核算數據重估法、統計分布檢驗法、調查偏差評估法、多維質量評估法六大類。其中前三種是針對總量統計數據的評估,統計分布檢驗和調查偏差評估是針對個體或分類數據的評估,多維評估法用于評估統計數據質量的多個維度,在國外統計數據質量評估中較為常見。為進一步豐富海洋經濟統計數據質量評估方法,結合海洋經濟統計數據質量評估現狀,下文分析各類主要統計數據質量評估方法在海洋經濟數據質量控制領域的適用性。
邏輯規則檢驗法是針對宏觀總量數據質量的一種評估方法,即根據統計數據中各個指標之間的包含、恒等以及相關等內在邏輯關系來粗略檢驗數據的可信度。若待評估統計指標數據之間不滿足特定的邏輯關系,則需要做進一步的核查與分析。邏輯規則檢驗較多基于傳統的社會經濟統計理論,因其具有通俗易懂、可操作性強等特性,較廣泛應用于政府統計工作中。但是,這種評估方法依據的檢驗規則過于單一,通過邏輯關系檢驗也無法確保數據的可信度,此外,當被檢測統計數據違背特定邏輯關系也無法確定哪個數據有問題,因此僅以通過邏輯關系檢驗作為判定數據可信度的標準,較為粗略草率。
目前,我國海洋經濟統計指標數據之間存在大量邏輯關系,如增減平衡關系,指標間相對比例關系、分項指標間的結構比重關系等,可以將邏輯規則檢驗作為初步評估海洋經濟總量數據質量的方法,并結合其他方法,更好地得出統計數據的可信度的檢驗結論。
計量模型分析法也是一種針對宏觀總量數據質量評估的方法,在統計指標之間難以簡單判定存在確切的邏輯關系的情況下,可通過建立計量經濟模型,檢查數據是否出現異常情況。在具體質量評估中,首先,需要依據相應經濟或統計理論建立計量經濟模型,該模型要能準確有效反映統計指標之間的相互影響關系或內部發展規律;然后,選取一定時期樣本數據進行參數估計;最后,基于模型結果,通過分析參數估計值的時期穩定情況或預測值與實際值的差異情況等,得到數據質量評估結論。
由于海洋經濟統計指標之間存在錯綜復雜的邏輯關系,增減邏輯檢驗和相關邏輯檢驗在評估數據質量時可能失效,此時需要借助傳統回歸模型、經典時序模型、面板數據模型等計量經濟模型做進一步判定。當通過構建模型發現變量存有異常值或參數異常變動,則須確認是由于外部沖擊等因素造成,還是統計數據準確性問題。此方法作為邏輯規則檢驗的補充,需要建模者有較強的經濟或統計理論基礎,能根據模型結果做進一步評估分析,雖然在政府統計工作中較少應用,但在大數據背景下,隨著海洋經濟統計數據的日益豐富,此方法將作為深度評估海洋經濟數據質量的方法并逐漸得到廣泛應用。
統計分布檢驗法,是針對分類數據的一種質量評估方法。這種評估方法首先需要確定評估數據統計分布特性,然后驗證待評估數據統計分布與理論分布情況是否一致,進而得出統計數據質量評估結果。在社會經濟統計領域,統計個體的數據在理論上會服從某一特定的統計分布,通過對個體數據進行特定統計分布檢驗,可初步判斷各個個體標志值是否異常,此處的異常值是指在數據集中與眾不同的數據,使人懷疑這些數據并非常規隨機偏差導致,而是產生于完全不同的機制(總體或分布)。該評估方法在實際操作中最難之地在于如何確定統計數據的分布形式,主要可通過理論分析和調查研究實現。
對于海洋經濟統計數據,在確定其理論分布形式后,需要對比理論數據與待評估數據的分布是否一致,若發現異常點則需進一步驗證分析其具體誤差情況,從而判斷海洋經濟統計數據質量。根據宏觀經濟統計數據質量評估相關研究成果,在理論上可認為反映規模大小的海洋經濟統計數據(如產值、增加值等)近似服從對數正態分布,通過驗證待評估試驗數據是否符合對數正態分布數據達到檢測數據質量的目的。
核算數據重估檢驗法是從核算角度對數據進行評估,是對邏輯規則檢驗法的拓展。該方法通過分析現有指標核算中存在的問題,挖掘現有資料重新估算指標數值,并與官方估算值進行比對檢驗以實現質量評估。核算數據重估檢驗法的關鍵在于如何重新估計待評估統計指標,該方法的評估結果只能找出問題的大致方向未能呈現具體錯誤,其結果只能作為參考依據。在宏觀經濟統計中尤其適合用于評估GDP及構成項目數據、增長率數據的準確性。
隨著海洋經濟統計渠道的擴充,海洋經濟核算所需的數據參考資料不斷更新與發展,可利用偏差修正重估法估算現價的海洋生產總值,并與公布的海洋生產總值數據進行比對;可利用價格指數重估法估算海洋生產總值及其各構成產業增長率數據;可利用物量指數重估法估算海洋漁業、海洋交通運輸業等海洋產業增加值增長率數據。
統計調查有抽樣誤差和非抽樣誤差兩大誤差來源。抽樣誤差可通過數理統計方法進行度量并確定可接受范圍,并以此對調查所獲數據做出準確性判斷。非抽樣調查誤差可通過事后抽查等方法檢驗,即通過事后質量抽查來評估非抽樣誤差大小。因此,調查偏差評估的實際應用有限,主要適用于像人口普查等地區性普查統計數據的分析。
調查偏差評估法已在海洋經濟統計評估領域得到應用,如第一次全國海洋經濟調查工作中采用了事后質量抽查法檢驗全國及分省份數據質量,即按照一定的抽樣方法抽取沿海地區對涉海單位漏報的數量、比例及具體指標,以了解涉海單位真實性和調查對象源頭數據質量情況等。最后根據綜合差錯率,對第一次全國海洋經濟調查全國及分省數據質量進行定量評估。
在大數據時代發展背景下,統計數據內容將逐步向多樣性、多維化方向發展,那么對于統計數據質量的內涵也逐步由一維趨向多維,相應地,統計數據質量的評估方法也由一維的準確性評估向多維評估延伸。當前,多維質量評估法主要包括多維多級測量法、質量指標集法、用戶滿意度調查法、模糊綜合評價法等。
隨著海洋經濟統計數據非結構化特性彰顯和各級管理部門對統計數據質量的關注,海洋經濟統計數據多維化評估方法將逐步受到重視,海洋經濟數據準確性評估也將由一維延伸至多維。今后可通過對海洋經濟統計數據用戶進行問卷調查獲取基礎質量信息,然后進行綜合質量評估,以此達到對數據質量的分級。
本文基于國內外宏觀經濟統計數據質量評估發展背景,結合海洋經濟發展現狀,提出了主要質量評估方法在海洋經濟統計數據質量控制工作中的適用性,以期為今后海洋經濟數據質控工作提供更多方法參考。在當前互聯網大數據時代發展背景下,為進一步提高傳統海洋經濟和新海洋經濟統計指標的數據質量,促進決策部門能更敏銳地把握海洋經濟走向并制定實施科學合理的海洋經濟政策,現提出以下工作建議[8-10]:
(1)不斷擴充新形勢下海洋經濟統計數據質量的內涵。海洋經濟統計數據質量評估要順應海洋統計數據質量的內涵擴大而有相應的調整,今后不僅需要對海洋經濟統計數據的準確性進行評估,還應該對海洋經濟統計數據的及時性、相關性、可比性、可銜接性、可解釋性、可取得性、有效性等其他質量內涵進行多個維度的評估,逐漸把滿足用戶需求的程度作為評價數據質量的標準。
(2)逐步推進信息技術與數據質量控制技術方法應用的有效融合。充分利用信息化技術,將海洋統計數據質量控制各類方法逐步應用于海洋統計數據處理工作中,使海洋統計數據的處理全過程步步銜接,數據質量大大提高,更有效率地完成海洋統計工作,提高海洋統計服務水平。
(3)積極應對大數據環境下海洋經濟統計數據質量管理工作的技術挑戰。大數據時代背景下海洋經濟統計將面臨新的變革,文字、圖片、視頻、音頻等信息都將納入數據庫,從而增加數據維度,獲取高品質海量數據。由于具有規模大、多樣性高和更新速度快的特點,大數據存在數據質量問題的可能性更大,與傳統數據質量管理相比,大數據質量管理存在計算困難、錯誤混雜等方面的技術挑戰,亟待進一步研究。