王月恒+王晶+劉欣俠
[摘要]海關統計作為我國對外貨物貿易的官方統計,是海關四大工作職能之一,海關統計為非抽樣統計的特性決定了大數據的思想和方法在構建新型對外貨物貿易統計體系、提升對外貨物貿易統計水平中有著廣闊的應用前景。文章對大數據在對外貨物貿易統計的應用前景以及大數據理念在海關統計工作中的實現路徑進行了深入分析,以期提升大數據在政府統計中的應用。
[關鍵詞]大數據;對外貨物貿易;統計;海關
[DOI]1013939/jcnkizgsc201719101
近年來,隨著我國對外貿易的飛速發展,一方面國家和社會各屆對外貿數據非常關注,作用日益明顯;另一方面我國發布的進出口貿易統計數據,屢屢遭受社會的質疑,自上而下給外貿統計工作提出新的要求。處于蓬勃發展的大數據時代,對外貨物貿易統計管理部門既要面對大數據的理念和數據需求對傳統工作模式的沖擊,又在大數據時代帶來的統計改革和統計創新中充滿機遇,如何應用大數據的理念和思維,提升對外貨物貿易統計能力,提高對外貨物貿易統計工作水平,是擺在我們面前的一項課題。
1對外貨物貿易統計
對外貿易活動是指一國或地區同其他國家或地區之間進行的商品交換活動。對外貿易活動的定義有狹義和廣義之分。廣義的對外貿易包括貨物和服務的進出口,狹義的對外貿易僅指貨物的進出口。[1]本課題論述對象主要針對狹義的對外貨物貿易統計。
對進出口貨物貿易的統計是國民經濟統計的重要組成部分,可以全面地反映我國貨物進出口和對外貿易運行狀況,是研究我國對外貿易發展和國際經濟貿易關系的重要資料,同時也是國家制定對外貿易政策、進行宏觀經濟調控的重要依據。自1981年開始,我國對外公布進出口貿易情況正式使用海關統計數據,海關統計從此成為我國對外貿易的官方統計。《海關統計條例》規定:實際進出境并引起境內物質存量增加或者減少的貨物,列入海關統計。因此,列入我國海關統計范圍的貨物必須同時具備兩個條件:一是跨越我國經濟領土邊界的物質商品流動;二是改變我國的物質資源存量。
2大數據時代對外貨物貿易統計面臨的挑戰
21大數據的內涵和特點
對于大數據尚未有一個公認的定義。一般來講,大數據有“4V”的特征:首先,體量浩大(Volume),數據集合的規模已從GB 到TB 再到PB 級,甚至開始以EB 和ZB 來計數;其次,模態繁多(Variety),包括結構化數據、半結構化數據和非結構化數據;再次,生成快速(Velocity),大數據往往以數據流的形式動態、快速地產生,具有很強的時效性;最后,價值巨大但利用密度低(Value),大數據中蘊含高價值的信息,但其價值利用率往往較低。[1]
大數據的“大”并不僅僅在于數據量的多少,還是一種“以數據為大”的方法論。通過對個體行為的數據挖掘,使用關系分析、文本挖掘等方法來尋找有價值的信息,大數據能幫助人們更好地認識客觀事物。
22新時代對外貨物貿易統計面臨的挑戰
(1)準確性遭到質疑。在數據類型多樣化、數據源多元化的時代,政府統計受到的是全民解讀的高規格待遇,越來越可能遭受到準確性的質疑。中國海關統計數據具有準確、及時、國際可比的特征,但2012年以來的一段時期,港臺的貿易數字顯現,來自中國大陸的進出口額低增長甚至負增長,而我們對港臺的外貿數字顯示的卻是高增長。兩者數據的巨大差異必然遭受公眾的疑慮。海關統計數據發布往往局限于單一的總體數字,而缺少統計方法、中間指標、相關誤差、適用范圍的統計性闡述。在部分進出口貨物使用去向不明,被作為“套利”道具情況下就難以避免數據準確性的質疑。在這個人人都有麥克風的時代,甚至無須進行數據的比較,僅僅從有關部門、行業或民眾的自身感受也可以對數據提出疑慮,網絡相傳、口耳相傳,最后就有可能演變成海關統計的公關性危機。
(2)實效性較為滯后。在大數據時代,數據響應都是分秒必爭,海關統計的反應速度顯然不能滿足社會日益增長的及時性需求。目前海關各項統計工作基本以月為周期,海關統計需要經過人工審核、實際查問、數據匯總的過程,生產周期偏長,外貿進出口數據也在每月的9日才能正式發布。雖然理論上報關單日報數據電子化可以使得統計數據生產時限縮短到1~2日,但由于作業方式的傳統和對精確性的要求,海關統計數據的發布周期難以滿足社會的需要,除了旬報數據向政府有關部門報送外,更需要發揮統計數據的時效效益。
(3)應用性較為局限。海關統計將相當大部分的精力用于準確地采集數據,在數據應用方面著力較少。統計數據的最終目的是使用,沒有使用前途的數據也沒有生命前途。從廣義上說,統計數據質量也包括數據使用效益。如果數據本身準確性、時效性再好,但使用效益不高,數據生產的成本遠遠高于效益,這樣的統計數據也難言具有高質量。目前的海關統計數據,除執法評估和電子口岸通關信息外,往往以總體性數字(或商品、或區域、或全體)的發布展示為主要目標,適用性較低,只能對宏觀的總體狀態起到提示作用,甚至定性判斷或結構分析有時也難以
做到。這一方面是準確性和統計意義闡述不足;另一方面也是適用性不好,海關統計數據的應用效益總體上差強人意也就不難理解。
3構建新型對外貨物貿易統計體系的對策建議
(1)開拓外部數據來源,打通外貿各流程的數據回路。“大數據”時代,數據來源多樣化,海關統計需要充分利用好互聯網、社會傳媒和移動設備的作用,果斷將大數據作為海關統計的重要數據來源。一方面對內建好“數據統一采集上報平臺”,目前海關的數據統計經常出現“數出多門”的現象,基于業務運行網及管理網的數據經常被重復提取、重復統計,從提高行政效率、規范數據標準、嚴格數據發布口徑等方面考慮,構建海關內部統一的數據上報平臺是十分必要的;另一方面對外建好“數據發布及交換平臺”,容納所有采集到的數據信息,將歷史和現有原始數據文件整理歸集到系統中,使海關進出口動態數據能夠及時被需要的企業與行業機構所掌握,同時加快與工商、稅務、外管、國檢等部門間的信息交換,從而有利于這些數據得到更廣泛的應用并轉變為具有價值的信息,為社會及廣大企業帶來實際的經濟效益。
(2)強化數據挖掘,更好服務宏觀決策和經濟管理。在數據的采集和獲取途徑暢通之后,數據的挖掘和處理將成為重中之重。目前海關統計中的統計分析僅將分析對象特點呈現,但是對現象產生的根源缺乏深入剖析,更缺乏科學的預測,分析功能比較單一,因此,對數據進行深層次的挖掘十分必要,選擇合適先進的軟件,結合海關管理、國際貿易以及企業生產經營數據等開展專項分析,從中發現問題,更好地為國家宏觀決策和海關管理服務,更好地發揮海關統計的監督、服務和輔助決策作用。首先是充分利用自有的專業的技術力量和成果,對巨量原始數據進行專業化處理;其次是善于運用專業的分析機構,社會經濟各領域的數據應用問題主要還是掌握在本領域的專家手中,海關起到整合資源和提供平臺作用;最后逐步提高數據開放能力,為大數據敞開大門,為上級決策服務、海關監管、打擊走私服務以及為社會經濟服務。
(3)注重人才儲備和培養,加強專業人才隊伍建設。大數據對數據的儲存、挖掘、分析和使用均提出了更高的要求,特別是涉及海量的數據挖掘和紛繁復雜的模型建立和處理,行業專家將逐漸被技術、數據處理人才所取代,就像被譽為“大數據時代的預言家”的舍恩伯格所說的那樣“大數據時代使得行業專家的重要性下降,集統計學家、軟件程序員、圖形設計師、作家于一身的數據科學家成為最為迫切需求的人才”。目前的海關統計系統不乏大量的行業專家、統計專家和數據分析能手,但是懂得各種數據存儲、處理、挖掘技術專才和計量統計方面的專才依然短缺,應根據大數據發展趨勢加強對相關人才的培養和儲備,建立一支專業的數據處理、挖掘、應用人才隊伍。
參考文獻:
全國統計專業技術資格考試用書編寫委員會統計工作實務[M].北京:中國統計出版社,2008:63.
[基金項目]2016年河北省統計局項目《大數據時代新型對外貨物貿易統計體系研究》(項目編號:2016HY20)資助。