張 鵬 劉建軍 尚文卿 田曉霞
(1.石家莊工程職業學院 河北 石家莊 050061;2.河北科怡科技開發有限公司 河北 石家莊 050000)
大數據技術的出現,給統計工作帶來了多方面的影響,要求統計工作不斷提升統計水平,使統計數據更加全面、真實和準確,發揮切實的作用。
大數據是IT領域的一個專業術語,英文全稱為Big Data,是指在一定時間范圍內,基于常規軟件工具無法實現捕捉、管理和處理的數據集合,需要全新的處理模式,才能完成這些數據集合的分析、處理、儲存和展示,從而體現出更強的決策力、洞察力,讓數據信息資源發揮出相應的資產價值。從大數據的結構來說,其包含了結構化、半結構化以及非結構化的數據,其中非結構化數據是大數據的主要來源。根據IDC的調查報告顯示,社會企業經營中產生的數據,80%都屬于非結構化數據,并且這些非結構化的數據,以超過50%的速度在每年增加。非結構化數據,就是不具備固定格式、標準和規律的數據,是隨機、散亂的數據。由于不存在內部規律,傳統的統計方法只能對這些數據進行搜集,難以實現分析和處理,就無法發揮出數據的作用。
從當前大數據技術的發展來講,其在很多行業都已經實現了運用。比如在交通領域,鐵路大數據已經基本形成,旅客信息已經全部匯總到大數據系統當中,并且和各種購票軟件形成對接,旅客可以在任意平臺下單購票,甚至可以在A平臺下單,再到B平臺支付。不僅如此,旅客信息數據還與進出站系統、手持驗票終端設備等實現了對接,形成了一套龐大的數據系統,并且多種終端設備實現了連接。除此之外,在電子商務、金融等方面,大數據的運用也較為深入,并且展現出了良好的效果。而針對大數據的運用來看,其也體現出了多個方面的特點:一是海量性。大數據擁有海量的數據,和傳統統計數據相比,呈現出幾何式增長。二是可變性。大數據系統中涵蓋的數據,并非是一成不變的,數據來源端可以對數據作出更改。三是真實性,大數據要確保數據真實可信。四是復雜性,大數據的數據量非常巨大,而且來源廣泛,這就導致數據非常復雜。
統計工作很多時候是由政府統計部門所開展的,其統計地位由國家法律賦予。對于社會大眾而言,在以前由于互聯網不發達,人們獲取信息的渠道有限,政府統計部門的統計數據成為核心來源,這就使政府統計數據具有很高的權威性。不過,大數據技術的發展,伴隨互聯網的快速發展,民間統計機構也開始出現,政府統計部門不再是統計數據發布的唯一主體,民間統計機構的參與,導致政府統計數據可能與民間統計數據出現差異。差異產生,就會動搖政府統計的權威性。而且一旦政府統計數據出現失真,那么就會進一步降低其權威性。比如近些年某些省份GDP統計數據“注水”,導致民眾對地方GDP統計數據的認可度下滑,政府統計權威性受到影響。
統計工作的開展,并非是隨意而為,而是需要立足具體的指標,圍繞指標展開數據統計,以服務于某些具體的統計目的。在傳統的統計工作中,統計指標數量有限,而且部分統計指標的合理性不高。統計指標不合理,這自然就無法反映真實情況,難以得到民眾認可。比如對于社會平均薪資的統計,統計部門往往是按照企業人力資源成本支出除以企業員工人數,計算得出平均薪資。然而企業人力資源成本,不僅包含了員工薪水,還涵蓋了個人所得稅、企業福利以及培訓成本。這就導致統計部門發布的平均薪資,高于民眾實際拿到手的薪水。而近些年一些民間機構針對民眾實際到手收入進行統計,發布平均薪水統計,這一數值低于統計部門的數值,更加受到民眾認可。這一現象的出現,就是統計指標設定不合理,以人力資源成本統計平均薪資,這和人們的實際收入并不一致,所以導致統計結果不被認可。
大數據技術發展給統計工作帶來的最大挑戰,部分傳統統計方法在大數據環境下失去了效力。比如抽樣調查,是傳統統計方法的典型代表。但是在大數據環境下,樣本范圍非常龐大,而且其中的有機聯系較為薄弱,甚至存在很明顯的行業隔閡,這就導致抽樣調查難以發揮出切實作用。另外,大數據時代,數據來源復雜、數據標準多樣、數據內容和形式也各不相同,這就進一步增大了傳統統計方法的難度。
大數據時代還非常強調數據信息共享,通過數據信息共享,可以排除很多重復性的調查統計工作,從而實現人力和物資的節省。但是,從目前實際來說,統計數據信息的共享不足,甚至存在人為性的數據隔閡。一方面,政府統計部門所統計到的數據,并沒有主動分享給其他有需要的部門。另一方面,民間統計機構將數據信息視為寶貴資源,并不愿意將其共享出來。這樣一來,統計數據的共享程度很低,存在隔閡,增加了數據統計的成本和資源消耗,而且阻礙統計大數據體系的建立。
在大數據時代下,對于統計工作方法的創新,并不是只關注到統計方法本身,還需要注意到制度建設。統計工作的開展,需要有完善、健全的制度作為依據,對統計工作形成指導,保證統計數據的真實性。具體來說,首先需要建立起統計工作規范,對于統計流程、方法選擇、統計口徑等做出具體的規定,要求統計部門和機構都嚴格依照制度來開展統計工作,要參照相同的制度推進統計工作。其次,要建立起監督機制。對于統計工作,需要加強監督,這就需要國家層面制定相應的制度,對地方政府統計部門、民間統計機構等,要構建起相應的監督機制,定期對統計工作展開監督,確保統計工作有序開展。最后,需要建立起處罰制度。尤其是針對統計數據造假、注水等現象,要嚴厲打擊,不論是政府統計部門還是對民間統計機構,在出現此類問題時,都需要予以嚴厲的處罰,對其他統計部門和機構起到警示作用,引導各個統計部門和機構統計真實可信的數據。
基于大數據的沖擊,民間統計機構的崛起,政府統計部門的統計權威性受到影響。要想讓統計工作取得民眾認可,那么就需要對統計指標展開優化,要構建起完善、合理的統計指標,統計全面、真實的數據,這樣才能讓統計工作發揮出理想的作用。首先,要進一步完善統計指標。在民間統計機構快速發展的背景下,出現了很多全新的統計指標。而且隨著經濟的發展,對于經濟的評價衡量,也需要從更多視角切入。因此,在這樣的背景下,就需要不斷引入、設立新的指標,讓統計指標體系更加完善和全面。其次,要對統計指標進行合理設計。除了增加指標之外,還需要注意單個指標的合理構建。比如對于社會平均薪資的統計,統計指標就是民眾薪水,在統計中,應該以實際到手、五險一金和個人所得稅這三項作為評判指標,而培訓成本、員工其他福利等,不應該納入平均薪資的統計范圍。在其他統計工作中,統計指標也需要合理設計,確保能夠反映出最真實的情況。
部門傳統統計方法在大數據環境下無法適用,這就需要對統計方法展開創新,構建起全新的統計手段,以適應大數據環境的根本要求。第一,要建立統計信息化系統。在《十三五統計信息化建設規劃綱要》中提出,統計工作需要將互聯網、大數據、云計算等技術運用起來。這就需要以這些技術為基礎,建立起統計信息化系統,依據統計需求,基于信息化系統自動采集數據,取代傳統的人力數據采集模式。第二,要立足新媒體渠道實現數據采集。大數據時代,新媒體的發展非常迅速,數以億計的用戶參與到新媒體中。因此,可以基于新媒體構建起統計方法。比如基于微信小程序,設計統計程序,讓人們通過微信小程序參與統計。也可以立足其他新媒體平臺,通過彈窗的方式,向數以億計的用戶推送統計調查問卷。用戶在線填寫,后臺就能收到上億份調查問卷,這比傳統抽樣調查要高效很多倍。
大數據時代的統計工作,還需要注意信息共享,減少部分重復性的統計工作,降低統計成本。從統計工作來講,統計內容五花八門,其中一些統計工作,需要統計相同的內容。因此,基于信息共享直接獲得這些統計數據,就可以省去部分工作。因此,這就需要國家層面牽頭,成立統計數據共享中心,引導政府統計部門和民間統計機構,將統計數據上傳到共享中心。同時設立版權保護機制,需繳納少量版權費用,就可以使用相應的統計數據。這比自行統計更加節省成本,也更加高效。
對于統計工作,大數據時代的到來,給統計工作造成了多方面影響。對于統計工作者來講,就需要對此予以理解,然后基于大數據視角下,推動統計工作方法的創新構建,讓統計工作的效率提升,真實性得到保證,成本實現降低。