國外學者對大數據的研究可以追溯到《Nature》于 2008 年推出的 Big Data 專刊,也就是說大數據概念在2008年就已經被提出。隨著社會對大數據的逐漸了解,維基百科給出了一個關于大數據的描述:大數據指的是所涉及的資料量規模巨大到無法透過目前主流軟件工具,在合理時間內達到擷取、管理、處理、并整理成為幫助企業經營決策更積極目的的資訊。大數據科學家John Rauser提出一個簡單的定義是,大數據是指任何超過了一臺計算機處理能力的數據。
近年來,在我國對大數據的研究和應用不僅引起了我國自然科學和人文社會科學界的廣泛重視,也受到我國中央政府的高度關注,并將大數據列入國家戰略?!丁笆濉眹覒鹇孕孕屡d產業發展規劃》明確提出支持海量數據存儲、處理技術的研發與產業化,《國民經濟和社會發展第十三個五年規劃綱要》中也提出了“實施國家大數據戰略”,這些都說明我國早在“十二五”期間就已經在推動大數發展,并配套出臺了一系列的文件,如國家先后頒布了《關于做好制定“互聯網+”行動計劃有關工作的通知》《大數據產業發展規劃(2016-2020)》《關于組織實施促進大數據發展重大工程的通知》《促進大數據發展行動綱要》等。
作為政府統計部門,國家統計局也在高度關注大數據在統計工作中的應用。2012年8月國家統計局科研所就召開了大數據應用研究座談會,提出了在大數據時代運用現代信息技術建立統計云架構的研究目標。2013年11月,國家統計局與上海鋼聯電子商務股份有限公司、山東卓創資訊集團有限公司、58同城信息技術有限公司、天云融創數據科技(北京)有限公司、中國聯合網絡通信有限公司、天脈聚源(北京)傳媒科技有限公司、百度在線網絡技術(北京)有限公司、阿里巴巴(中國)有限公司、紐海信息技術(上海)有限公司、昆明泛亞有色金屬交易所股份有限公司和南京擎天科技有限公司共11家企業簽訂了大數據戰略合作框架協議,共同推進大數據在政府統計中的應用。通過國家統計局的一系列動作可以看出,“大數據+統計”的大數據宏觀管理時代已經到來,并即將對未來的統計工作影響深遠。
目前來看,大數據已經引起了統計部門的高度重視,大數據的應用必將掀起全國統計系統的一場革命,面對“大數據+統計”,統計系統既要抓住機遇,又要迎接挑戰。
大數據促進了部門數據的共享。我國的統計體系分為政府綜合統計和部門統計兩大體系,大量的數據分布各個領域,由于沒有統一的數據規范,跨部門、跨行業、跨地區的信息很難實現互連互通,形成許多信息孤島,導致數據無法系統地進行整合,對數據的挖掘、分析造成了壁壘。在大數據時代,通過建立政府部門與應用平臺之間的統一數據交換接口,有效地規范和整合各部門、行業間的信息資源,來滿足各方面需求,進而提高工作效率?,F在的市場上的商用企業信息查詢系統,“啟信寶”、 “天眼查”、“企查查”等大數據平臺,就是充分利用了全國企業信用信息公示系統中的企業信息數據為基礎,再將中國裁判文書網、中國執行信息公開網、國家知識產權局、商標局、版權局等網上公開的企業信息數據進行挖掘和整合,而形成的大數據,這些數據對于社會公眾全面了解企業發展現狀具有很大的幫助作用。
大數據創新了數據的采集方式,提高了采集效率。 “一套表”聯網直報是目前統計信息化的重要工具之一,有利于統一業務流程,保證數據質量,但也存在平臺不完善,制度不健全,管理模式不合理等缺點。大數據時代將為政府統計部門提供一個更加完善的、開放的的信息系統,以便在相對統一的數據收集框架下開展數據采集工作,并及時解決數據存在的冗余、空缺和錯誤,以及更新不及時等問題,進一步提高統計數據質量。傳統的數據采集方式多是通過紙質報表和手工記錄來完成,數據采集過程中對人員的專業要求比較高,而在大數據時代,統計數據的采集是通過互聯網、計算機等工具來完成,只要采集人員能夠熟練掌握互聯網、計算機等新興的信息化技術即可。這些方式不僅能降低統計信息采集的門檻,還能吸引更多非統計專業人員參與到統計工作中來。另一方面,通過大數據也提高了數據采集效率,使統計數據能夠及時、準確地反映經濟社會發展現狀。
大數據對統計工作帶來了機遇也帶來了新的挑戰。在當前的政府統計工作中全面運用大數據進行統計分析還需要很長一段時間。在這個傳統與現代統計生產方式相互交織的過程中,對政府統計能力提出了新挑戰。一方面政府統計數據還要繼續使用傳統的統計調查方法、數據采集和數據處理方式來開展日常工作,以滿足國家當前宏觀管理和社會公眾需要。另一方面,政府統計系統還要超前謀劃,積極主動地投入大量的人力物力進行大數據的挖掘、處理和運用,否則將無法適應大數據宏觀管理時代和公眾社會時代對統計工作的新要求。
大數據對統計數據的權威性帶來了挑戰。過去提到數據不由自主地就會想到統計部門。但是,倘若現在再堅持這種的觀點,那就不是與時俱進了,而是逆潮流而退了?,F代社會,以電子商務、網絡社交、網絡游戲和在線搜索為主體的互聯網經濟日新月異,海量數據由統計部門掌控的時代已經一去不在復返。各個企業和國民經濟各個部門以及社會群體都擁有大量的可觀數據,只要對其進行數據挖掘,便可得到十分重要的“數據寶藏”。面對大數據時代,統計系統如果還沉浸在“法定數據”、“法定部門”的官本位思想中,并試圖繼續維護統計部門的權威性將越來越艱難。
面對當前大數據時代的到來,統計部門在開展各項調查、周期性普查工作中,不可回避大數據時代對統計工作的沖擊。2018年將開展“四經普”工作,如何充分利用大數據成果開展經濟普查工作,將是一個嶄新的課題,也是對新時代統計工作的一個檢驗。
2018年第四次全國經濟普查,是在十九大后習近平新時代背景下,開展的第一次全國大型普查,也為我國制定“十四五”規劃提供重要的基礎性資料,此次普查要全面調查我國第二產業和第三產業的發展規模、布局和效益,了解產業組織、結構、技術、形態的現狀以及各生產要素的構成,并摸清全部法人單位資產負債和新興產業發展情況,進一步查實各類單位的基本情況和主要產品產量、服務活動,全面準確反映供給側結構性改革、新動能培育、經濟結構優化等方面的新進展。可以看出經濟普查的指標多,涉及到單位的方方面面內容。而在商事制度改革后,各類經濟主體日新月異,每天都有大量的經濟單元“誕生”,這就要求摸清普查對象單位數據是一項重要的基礎性工作,如實填報普查對象的經營信息是普查最低要求。面對繁重的普查工作,如何利用大數據來提高普查數據質量和工作效率將顯得尤為重要。
1.充分利用商用企業信息查詢系統大數據,開展企業單位清查。根據《普查試點方案》要求,此次普查明確提出,在正式登記前進行全面的地毯式單位清查。2013年的經濟普查,由于沒有單獨地進行單位清查,在正式普查登記階段,耗費了大量的時間進行查遺補漏,而結果卻不是令人十分滿意。建議在現有名錄庫數據的基礎上,充分利用商用企業信息查詢系統對名錄庫數據進行全面的更新維護。首先,按照單位名稱信息剔除工商部、編制、民政等部門已注銷的單位名錄,然后利用企業2018年上半年工商企業年報信息對單位名稱和法人代表相同的單位進行全面的覆蓋式更新,進而解決名錄庫工作中的歷史遺留問題,凈化名錄庫數據。
2.充分利用編制、人社、民政部門大數據覆蓋更新機關、事業、社團等單位信息。根據社會統一信用代碼證辦理規定,2017年底所有的單位必須完成換證工作,同時結合機關、事業單位養老制度改革,充分利用部門數據實現全面批量覆蓋統計部門名錄庫中的機關、事業、社團單位名錄。通過上述兩種方式摸清轄區內的單位“家底”,減輕基層普查中的查遺補漏工作量。
3.充分利用稅務、財政、人社部門財務大數據,更新維護單位財務指標。企業的生產經營指標可以通過稅務的納稅記錄進行更新,機關、事業單位的非企業支出、從業人員可以通過財政部門和人社部門的數據進行更新,確保在清查階段開始前,能夠將一個精準、完整的普查單位名錄清單以及財務指標數據導入到PDA數據采集終端中,普查員只要利用PDA數據采集終端逐一上門核實、更新變動的相關數據信息便可。
4.充分利用大數據開展后期普查數據的開發利用。當今世界,大數據、云計算、人工智能等技術迅速發展,地理信息技術也開始擁抱大數據。統計地理信息系統是未來統計成果展示的發展方向,在“四經普”后期資料開發中要充分將普查成果進行可視化處理,并進一步整合人口普查、一套表數據、年鑒以及其他相關部門的資料,讓在數據通過各種圖表進行融合展示,使普查成果更好地服務社會大眾。地理信息技術與大數據結合將會產生非常神奇的效果,可以讓人做到“所見既所得”,使數據的展現更加直觀、易讀。
綜上所述“四經普”是2018年全國統計系統的一項重要工作,充分利用大數據是普查工作的必由之路。目前,不管是“大數據”依托統計工作,還是統計工作依托“大數據”,這已不是主要問題,但是統計工作如何充分利用“大數據”,做到“大數據”與傳統統計無縫銜接卻是目前統計工作需要解決的問題。在大數據時代下,統計的生命在于服務,統計部門應該順勢而為,充分挖掘、利用好“大數據”,進而提高統計信息服務水平,以適應國家宏觀管理和決策的需要。