王麗萍 江西省萍鄉市蘆溪縣統計局
隨著信息技術發展,以大數據構建的社會形式將會無可避免的降臨?,F如今已經是生活數據化的初步社會。首當其沖受到數據流沖擊的便是經濟數據。政府需要從宏觀角度進行正確、有效的決策,其實施性取決于政府經濟的統計方式得到的數據能否達到當前社會質量需求。曾經的傳統方式已漸漸無法滿足需求,這時順應大數據時代對統計方式的改變,變革數據的處理、分析方式。不再局限于傳統統計工作,融合信息時代新思路,提高數據統計質量。
大數據事實上也稱為大量資料,其資料的龐大程度,是無法通過目前的主流軟件,在合理時間內進行分析、管理、處理并整理的。大數據并非使用隨機分析法進行抽樣調查的捷徑去對數據進行分析統計。它是使用一種普查的方式,將所有的數據通過集合凝聚在一起,組成一個具有龐大數據量的資料集。其中的內容需要統計部門自行篩查選擇,從而找到所需的數據,并對其進行具體分析。因大數據的誕生,演變出了云計算、物聯網和“互聯網+”等領域。大數據有五大特點,分別是大量、高速、多樣、低價值密度、真實性,是需要全新處理模式才能洞察、發現其多樣性資源的信息資產[1]。
現如今,信息網絡的運用已經完全融入到了每一位處于信息網絡建設社會形式下人員的生活中。所有個人的信息工具,信息處理終端,都將向平臺傳輸的數據和信息,這樣龐大的信息數據已然超出了傳統信息統計收集分析的能力,因此為了保障信息統計技術的穩定,也為能夠將這些重要的信息資源進行利用,展現出最大價值必須改變傳統的信息處理手段。從而誕生出了云端處理的方式,將個體終端的信息從終端剝離,使得信息資源集中于云端,信息的處理和收集變得更為簡單快捷高效,這是基于大數據下對于統計技術的基礎改革。
大數據事實上是一種現象,并非大多人理解的新興技術、產品。這是對于進行實時數據處理的一個龐大數據集的感官形式稱謂。因其數據量龐大,從而導致存在極多冗余資源,從而誕生了云計算。云計算這一單一個體并不能引起用戶的注意,但是一旦與大數據進行串聯,云計算的獨特運算方式就能夠迅速篩選有效數據,其高效、便捷的特點為云計算吸引了大量用戶。
行政記錄數據是政府部門遵循國家相關行業標準,在行政管理職能過程中對于大量審計、注冊信息的數據記錄。相對其他數據而言更有質量保障及連續性。政府部門所建立的行政記錄過程需遵循審計規章制度,從而使得數據標準化較高[2]。
商業記錄數據通過企業對其生產、管理等商業信息記錄,其中不乏經營、交易等重要數據。這些數據擁有及時性,數據量豐富、龐大,它們一般被詳細且及時地記錄于企業自身的數據庫中,對于企業的記錄、管理有重要價值。
互聯網與傳感器數據通過對于個人移動終端、網絡社交平臺的管理,產生大量、繁雜的數據信息。其數據保密級別低,易獲得,通常能夠在政府進行輿情分析時起到關鍵性作用。同時能夠將大社會的經濟形勢進行簡單分析[3]。
政府統計工作最為主要的原因是依據統計出的數據,為國家、為社會提供有效決策。在現今的信息化時代背景下,曾經通過調查部分樣本,并依據樣本數據對整體進行分析的傳統統計雖然依舊存在,但大數據統計能夠使人們在眾多領域進行更深層次的了解,獲得更加全面、完整、系統化的數據這一點是傳統統計方式無法比擬的。系統數據不再僅僅局限于宏觀展現,量身為不同個體定制數據實現更高的價值體現。這一點改變于政府統計工作而言不能再局限于局部數據,需要根據現今的大數據形式調整統計方式,更新統計內容,從而達到數據調查質量上的提升。
大數據時代下,統計工作所面對的問題不再是曾經的數據匱乏,而是各項數據的嚴重超標。在這一局面下,統計工作的重心由數據采集逐漸轉變為數據解析。通過對數據流的處理,使得到的休眠數據煥發新活力,發揮其應有的價值,通過對龐大數據流的分析推斷其關聯性。如今,我們的統計工作仍舊以采集為主雖然對于數據的分析也進行了解析,但這微小的關注點對于現今的大數據統計方式而言遠遠不足。政府統計部門的每一次對數據分析得出的結果,都對當今社會有極強的引導作用作為整個數據統計主體的統計部門,增強工作人員對于數據的分析能力,提高員工的綜合解析素質刻不容緩。數據搜集對于“大數據”社會極其便利,只需通過一定的操作方式即可獲取大量的所需資料,將所得相關數據的形成方式進行整理,其數據的分析方式由數據來源形成形式而決定。
由于大數據集中冗余數據占大多數,所以數據的分析難度更大,分析流程更為復雜。在整個大數據集中信息數據流規模龐大,而我們所需要進行專業分析的只是其中微小的一部分。如何將其從冗雜的數據中抽離,從而進行分析變更為日常統計出的成果已經成為了現今統計工作者們所面臨的嚴肅問題。如何便捷地進行數據的篩選已經成了分析數據的關鍵環節,這一點傳統的運算以及邏輯是沒有辦法解決的,只能夠通過系統性的將這些難以識別的信息轉化為能夠分析出邏輯結構的數據關系鏈,從而更深度地挖掘不同數據之間存在的邏輯關系,更大程度上得到高價值數據
現如今,統計部門已經不再是規模性數據的唯一擁有者及權威。在社交互聯網的大環境下數據的獲得變得更為方便快捷。通過其他非官方途徑依舊能夠獲得有效、有極高價值的數據信息這也就動搖到了統計工作的地位。群眾不再依賴于政府對于信息技術的收集、分析。從其他渠道獲得的信息同樣能夠達到專業的建設水準。
現今很多統計人員依舊使用傳統的統計方式對大數據下的數據流進行分析,通過簡單的搜集數據并對其進行分析,進而做出統計報表,這已經不足以應對大數據化下的數據流。通過使用計算機信息技術挖掘信息數據并對其進行更系統化的整理分析,能夠做到使數據的分析結果更加精細,數據更加專業化。挖掘不同數據之間存在的聯系關系是現如今數據處理的主要目的,提高應用信息技術的專業素養使用信息化對于數據進行深入挖掘是統計工作發展的方向。統計行業如今極度缺少復合型人才,這導致同期技術停滯不前對于數據的處理受限極大。
統計數據的平臺化、交互化是現如今時代所欠缺的各大統計機構依舊將自身的數據庫作為獨門信息,不互通,不共享,使得個數據流依舊成為數據孤體,無法達成數據互通數據資源對于信息需求者極不友好,也同樣不能達到有效共同發展的目的。現代化的數據共享平臺需要一個官方機構作為主導,通過機構保障使得各方的獨家信息資源能夠源源不斷地進入,從而使得信息的互通性,實時性,真實性能夠得到保障。
行政數據記錄、商業記錄,事實上是擁有系統化的數據。從結構化的數據中提煉不同數據模式之間的交互關系及影響趨勢,通過結構化數據分析及主要信息。數據挖掘是未來數據統計中最具競爭力的部分,為了在數據競爭中獲得最大的利益及動能,提高數據挖掘技術是必不可少的。通過不同的數據算法將大數據中的重要信息進行篩選并且分析,在大數據現在的影響下計算機技術延伸出了極多數據網絡算法,包括數據決策,數據遺傳等。對數據庫中的信息進行篩選,將通過要求的數據實行分類計劃,迅速、高效地在龐大的數據流中定位有用的信息數據,并在其中篩選出最為優質的信息源。通過挖掘數據中的執行標準,誕生緣由,從而了解其使用規則,對篩選過的數據流進行挖掘分類,通過進一步的統計及分析將龐大的數據轉變為精煉有效的分類型數據。
為了實現政府對于數據的管理控制及服務目的,行政記錄便誕生了,通過大量的登記以及國家層面對于證明的辦理,從而達到收集自然人個體信息的目的。包括但不僅限于戶籍、身份證等個人信息。政府的政治記錄并不是統計目的,但他們形成數據資料的方式是通過統計,從而達到信息資源的豐富,并對其進行深入挖掘。如此開發和利用行政得到的統計信息,將行政記錄得到的數據最高效利用,從源頭上使得數據源變得更為高質。
統計方法的大方向分為抽樣調查和普查,其中最需要進行數據分析的便是抽樣調查,因為普查事實上是全面完整性的得到了所有的用戶信息,已經真實明確地了解了信息個體的分布,但抽樣調查只不過是概率性的,通過物體理論抽樣,對于數據進行收集得到數值具體的實際情況還需要通過科學的統計技術分析才能得到。這兩種方式對于數據的調查都是以取得精確數據為最終目標。因此統計調查的對象不僅僅包括線下的數據,同時也應該將線上的生產經營數據進行統計,統計中以探尋原始記錄為主,已經經受過整理歸納的資料,不足以使我們獲得這些企業最為基礎真實明確的現實狀況。這樣不僅能夠將調查對象的負擔進行大幅度的減輕,同時也能夠使我們獲得最真實有效的數據,提高對于數據統計的質量化。將統計方式與調查模式進行與時俱進的改進能夠增強數據統計模式的效率以及增加提升統計工作的工作質量。
1.源頭數據采集設計是基礎
現如今,我國的主要數據整理采集方式是由基層人員對于企業進行資料收集,根據報表逐個說明填充逐級地上報,將具體數據會表總計,從而達到對企業的分析目的,同時也是在信息化時代來臨后,進行改進后的一表匯總收集形式。這種統計方式能夠將統計結果進行系統的匯總并且直接通過互聯網技術進行上報,將傳統數據轉化為信息網絡數據,及時有效是我國信息化統計進步的體現。這一方式并沒有更深入的研究,僅僅是浮于表面。如此,統計方式的設計是統計部門的基礎工作,同時也是最為重要的。通過手統計方式設計,采用最為科學的方式對信息以及行政記錄進行調查。
2.部門統計設計是關鍵
國家統計局的權力使用雖然在統計法中的規定范圍較大,但是通過實踐運用中實際存在的問題發現這一原因的根本現象,便是在于系統的統計設計管理工作中,政府并沒有能夠對部門的具體權利進行規定,并且對于審批權進行完整的職權分布設定,從而導致統計局,在統計數據道路上困難重重。
3.政府統計設計是靈魂
統計設計是否優質,關乎到統計工作能否正常的開展,并得到有效高質量的數據,其重要性相當于統計工作的根本基礎。在設計統計程序時,應從宏觀角度出發,明確信息的統計原則,為信息設計藍圖,全方位地提高數據質量。這項工作的要求極高,其科學性與可操作性并非常人能夠達到,所以將其交由國家領導下的各科研院或者高校是最為穩妥的措施。
在大數據時代下,各個數據統計平臺噴井式的爆發,不能夠再局限于對于數據的統計,將所有的數據形式進行全面覆蓋,并使得其有一定的規章制度能夠做到及時使用,這已經不僅僅能夠依賴原本的統計部門。將社會中的統計平臺聯合共同管理監控,方能得到這一社會性數據管理目標。
1.多渠道智能獲取統計數據
在大數據化時代上獲得統計數據的渠道變得更為多樣,同時這也增加了統計數據的難度,因此,提高統計對象的配合度,從而減輕統計工作者的負擔,令統計工作的進展更為方便、簡單、快捷。并且大大減少統計所需要的時間,對統計質量進行有效強化。此外,對于統計工作所注重的有兩個重要點,首先是有針對性地進行數據采集,其次是不為外物所動,保持統計能力水平的穩定。
2.建立統計數據管理平臺
統計平臺在面臨大數據時代是,數量上已經捉襟見肘,至少有以下兩個。其一,數據環境中對于數據整理、統計、整合管理的平臺;其二,進行數據開發、研究、將數據合理轉化為生產力的研究分析平臺。
3.體現統計大數據的價值
只有被使用的數據才有意義。在進行數據分析結果公布時,不僅需要公示最為基礎的原始數據形態,同時需要將統計部門的權威、透明的處理方式及時對外公布,這些數據形式都是該信息的分析成果。數據統計部門應該具備通過信息手段挖掘信息,將其分析的能力。將龐大數據庫中的原始數據進行專業化去雜質處理,變更為標準化信息統計數據,并且做好數據信息的基礎增值工作。
在大數據時代,統計人員最基本的專業技術需要包括:對于數據的分析、采集,同時需要對計算機信息挖掘技術擁有基本了解。曾經起到主要作用的單向性專業人才已經不足以應對如今信息流下的統計工作。創建新型復合型統計人才隊伍,將人員配置進行優化制定嚴苛的審核制度提高從業人員的專業素質。定時定期的對基層統計工作人員進行專業培訓,或者安排其進行實踐學習,增長專業理論、實踐水平,尤其是計算機方面的網絡通信和應用技術,這一點對于保證統計工作的順利開展的重要決定性作用。提高招聘人員時的評選標準,不僅局限于引進該專業的單項人才,增加多面性復合型人才更是重中之重。對于基礎建設需加強其配置,并且引入當下最為先進的管理模式,將信息水平與當前大數據水平共同建設,從而達到統計結果的完美轉化。
統計工作的開展,不僅僅局限于通過自身將得到的數據進行分析,并將其通過專業處理達到增值目的。在大數據背景下的其他采集者們,對于數據庫的貢獻同樣重要。數據共享平臺的建設是大勢所趨,而政府統計部門可以在這其中充當監察者的作用,通過數據庫搭建建設多維度的共享平臺,將有效且權威的數據進行分析并上傳,這一舉措能促進數據的跨部門共享趨勢。
大數據時代對于傳統統計工作而言,不僅僅是局限于是一種挑戰,同時也是不可多得的機遇。將曾經的傳統的數據收集統計法,轉變為將得到的數據進行解析的分析法。將自身原本的充沛資源數據進行利用,專項提高對于數據流的分析技能,將統計工作通過大數據方式進行革新,使其更高效、精準?!?/p>