◎文/杜曉紅
隨著科技不斷進步,大數據現象及理論對政府統計工作的影響滲透到各個工作層面。這要求政府統計向更友好、更快捷、形式更多樣化的方向發展。
現行的政府統計數據采集方式是以設定好的統計指標,有目的、有方向地向被調查者采集所需要的信息,這種按既定的思路、意圖設定好統計指標,是一種結果導向的采集方式,很可能會遺漏掉某些真正有價值的、能揭示重點的數據,因為數據很有可能從最不可能的地方提取出來。大數據時代的數據采集方式更加開放,收集到的數據更全面、客觀、多角度。如何改革傳統統計的信息采集指標、內容,以更加自由的方式來采集前期數據,成為政府統計順應大數據潮流必然面對的問題。
網絡數據、物聯網、行政管理記錄、企業銷售記錄和搜索記錄都是大數據來源,不同的組織以各自獨特的方式收集數據,反映事物的真相,這對于官方統計而言,無疑是一種強烈的沖擊。官方統計需要更加多樣化的數據采集方式,除了正式的報表、調查,是否存在第二條途徑,更客觀、自由地采集公眾數據,利用網絡來營造官方統計的新時代,這是大數據時代政府統計值得思考的問題。
大數據時代要求政府統計數據要豐富、高質。而豐富、高質的數據要求數據采集方式要更加友好,服務態度要到位。這種服務態度不僅體現在后期的數據公布與使用,尤其體現在前期的數據采集中。友好的采集方式要求政府統計的數據采集流程要盡可能簡單、采集數據的內容要盡可能地易于取得。對于被調查者而言,友好的采集方式讓他們的工作不再那么繁重;對于政府統計而言,友好的采集方式會收集到高質量的數據信息。
大數據較之傳統數據,不僅體現在數據量大,信息量多,還體現在數據的復雜性、數據結構多樣性等方面,政府統計的軟、硬件配置是否跟得上大數據處理的需求?如何采用合理的數據處理方式,將非結構化數據轉化成為可處理數據?大數據時代,政府統計需要提高處理信息的能力,數據處理方式越合理,結果越明確,指導性越強,越利于政策制定,這才能體現出政府統計真正的職能與價值。
大數據時代決定了大數據被處理、使用及體現的多種可能性,各種媒體、網絡及民間研究機構對數據的使用甚至超前于政府,更具有時效性。政府統計往往需要一個過程,官方統計在追求數據盡量精準時,對于時效性的要求常常就會降低。但是大數據時代讓每個個體對于信息汲取方式的多樣性、實時性的需要更加迫切,這種需求決定了信息傳遞必須具有時效性,才會更有價值。
隨著大數據資源的急劇增加和數據挖掘技術的日益成熟,政府統計作為公共統計數據信息主渠道的地位面臨一定的挑戰。面對大數據市場,越來越多的民間非官方機構開始利用大數據技術,挖掘各種潛在的市場價值。這種利益驅動使得許多非官方機構擁有更強大的數據處理分析技術,并在數據發布方面已經顯現出與官方統計分庭抗禮的苗頭。如TCPI(淘寶消費物價指數)與官方CPI相比是以更加實時、真實的數據為基礎的結果,更具時效性也更加客觀。
而政府統計數據與100%真實的數據是有距離的,如以企業組織的形式上報,涉及到企業商業機密的信息、以及因個人或其他組織原因所造成的數據問題,總是或多或少地存在,而且這種采集過程本身具有滯后性。如何應對各種機構的數據沖擊,強化官方統計的數據權威地位,成為大數據時代政府統計要做的一門重要的功課。
政府統計職能的性質,決定了政府統計數據價值的重心在于為領導和相關政府部門制定決策服務,而基層受調查企業或個人真正能享受到的服務并不是很多;而政府獲取數據的特殊方式,決定了政府數據利用的低效率。這種低效率的數據使用方式,使得最重要的數據獲取源,即受調查者本身缺乏積極主動性。如何最大化政府統計數據價值,讓每一個受調查者享受到付出勞動后的數據報酬,是政府統計跟上大數據潮流必須要解決的問題。
數據獲取渠道的多樣化,給政府統計的啟示在于應該向企業學習,在大數據的環境下盡可能地汲取數據能量。目前,越來越多的商業企業開始利用強大的搜索功能,數據庫存儲功能以及高級的分類推薦系統,將廣告以及想要傳達的信息精準地投放給目標人群。政府統計也可以充分利用這種技術,通過與各種媒體、網站、搜索引擎合作的方式,定向投放調查問卷。
政府統計的核心在數據,而數據來源于基層。要從廣度和深度上保證數據質量,政府統計調查設計必須要盡可能地友好,從而減輕基層受調查對象做無用功的時間,這也是提高數據質量的好途徑。
政府日常的統計調查工作,是為了解整體的、一般的情況而設定,政府統計調查指標的設置需要盡可能的具體,友好,便于受調查者取數。這樣的指標一方面節省受調查者查找數據的時間,使數據采集更及時;另一方面,簡便易得的數據,采集過程簡單,結果可能會更準確。
政府統計為保證數據質量,每年都有大量的督導檢查,而檢查名單的鎖定,基本依靠各專業統計人員在日常工作中的積累。如果能夠在數據審核過程中加入對受調查者的行為追蹤,則可以清楚地掌握常出問題的受調查者,準確鎖定督導對象。
在平臺審核流程中,準確追蹤常出錯的及頻繁修改數據的受調查者,并設置較高的級別標識,以標注這些受調查者很可能存在對調查內容認識模糊的情況,強化督導檢查的跟進,進而可以有的放矢,確保數據質量。對于級別標識較低的企業,適當放松監管,提高工作效率。
“工欲善其事,必先利其器”。挖掘統計數據價值,體現政府統計職能,最鋒利的武器就是人才。面對爆發的信息、復雜的數據形勢,改革政府統計人才隊伍,引進懂技術、善管理的復合型人才,運用先進的數據處理方式,可以最大化地、最具時效性地發掘數據價值,為政府、企業、個人決策服務。
如何將數據以一種更加合理、及時、開放的方式向公眾發布,實現政府統計數據價值的最大化?這就需要政府統計打破目前的“信息孤島”局面,建立數據資源共享平臺,將數據合理標準化之后向公眾發布(除涉及到個人信息、商業秘密、國家機密的信息外);同時出臺相關的數據使用標準及法律法規,保護受調查者的權益。最大化挖掘政府統計數據價值,既強化了政府統計的信息職能,又加強了公眾參與調查的熱情,促使政府統計工作進入良性運行狀態。