尹士洋
摘 要:對經濟普查數據分析工作的開展特點進行了簡要分析,并深入研究了大數據技術在經濟普查數據分析方面的應用情況,以期為開展大數據經濟普查數據分析工作提供借鑒。
關鍵詞:大數據;經濟普查;數據分析;技術;應用
文章編號:1004-7026(2019)02-0156-02? ? ? ? ?中國圖書分類號:F270.7;F275? ? ? ? 文獻標志碼:A
隨著國家經濟社會發展水平持續提升,國家對經濟普查工作更加重視。經濟普查數據分析是經濟普查工作的一項重要基礎內容。當前我國經濟正處于新常態,各行各業都在進行轉型探索,整體經濟結構已經發生了很大變化,對經濟普查數據分析工作也提出了新要求。傳統的經濟普查數據分析模式已經不能滿足新形勢下的工作要求,需要借助大數據等進行數據深度挖掘和整合,才能更好地提升數據分析質量,不斷提高數據深度應用水平。加強大數據時代經濟普查數據的研究和探索,對促進經濟社會持續發展具有重要的指導意義。
1? 經濟普查數據分析工作的特點
經濟普查數據分析是整體經濟普查工作的一項基礎內容,工作量大,工作任務繁雜,涉及到很多類型的數據,需要從多個角度進行分析,并且數據分析也面臨很多挑戰。隨著國家對經濟普查工作的高度重視,對經濟普查數據分析也提出了新要求,既要注重準確性,又要強調分析的系統性、有效性等。
1.1? 準確性
基于準確性視角,經濟普查數據分析需要堅持準確、實事求是的原則,不能造假。在某一個特定的周期內,國家經濟、產業、人口等方面的數據始終是處于變動的狀態,所以要對這種變動的情況和規律等進行全面分析,要確保數據控制的精準性。在開展經濟普查數據分析的過程中,可以發現很多時間節點的經濟普查相關數據波動較大,這種情況下需要客觀分析數據波動的影響因素,避免產生較大的誤差。所以,需要對數據進行有效處理和分析,才能符合準確性的要求,這也是影響經濟普查數據分析質量的重要因素。
1.2? 系統性
經濟普查工作的系統性和繁雜性,決定了經濟普查數據分析工作的復雜性,不僅要求經濟普查人員全面掌握有關情況,還要加強對經濟普查人員的技能和素質培訓,加強科學管理,才能更好地發揮他們的優勢。要積極學習新方法,從復雜的數據體系中找出規律,摸索經驗,提高復雜數據的有效轉化能力,提升整體數據分析成效,這也是經濟普查數據分析工作需要關注的問題。
1.3? 有效性
從技術視角分析,經濟普查數據類型日益多樣化,很多內容缺乏關聯性,同時還要考慮經濟普查數據分析的效率和成本等因素,所以需要科學選擇恰當的經濟普查數據分析挖掘技術,才能更好地提高普查整體效度和信度,因此需要根據經濟普查工作的整體要求和普查數據分析的具體情況,不斷優化普查內容和方法。
2? 大數據時代經濟普查數據分析方法
大數據時代開展經濟普查數據分析,應當在把握經濟普查工作整體要求的基礎上,從構建相應的分析體系、選擇科學的經濟普查數據挖掘技術或方法及加強經濟普查數據科學系統管理等方面進行全面考慮,才能更好地將大數據技術和經濟普查數據分析工作有效融合起來,提高整體分析成效[1]。
2.1? 構建完善的經濟普查數據分析體系架構
經濟普查工作涉及面廣、開展周期長,涉及到多個環節。在具體開展過程中,應當有完善的經濟普查數據分析體系,制定具體的實施指導方案,才能確保經濟普查數據分析各項工作流程有效銜接,確保工作實效。所以要充分考慮需要對多方面的數據進行全面分析和統計的基本要求,在開展過程中根據數據收集和采集要求等,及時調整數據分析方式方法。如在開展數據抽樣與處理階段,需要采取科學的方式方法,根據具體的經濟發展情況及變動等情況進行分析。要從各個角度來進行調研和評估,充分考慮現實因素,形成完善的數據評估分析體系,對經濟普查數據分析過程中可能存在的問題或風險等進行全面排查,對統計過程和數據分析過程進行有效整合,從而更好地將數據采集、分析等銜接起來,提高整體普查效率。
從大數據時代發展視角,要對經濟普查數據分析工作的性質進行研究,根據經濟普查數據分析不同重點及具體目標要求等,充分考慮大數據不同技術的具體適用領域,從而選擇更加有效的技術支持手段。
此外,還要加強經濟普查數據分析的基礎管理工作,明確經濟普查數據分析的具體目標、開展流程,加強各個環節的溝通,明確職責分配,引導工作人員結合自己的崗位要求,充分運用大數據技術等做好數據基礎分析工作。要充分考慮經濟普查數據分析過程中各類要素的實施變動情況,并掌握大數據技術預測分析方法,借助大數據技術深入開展數據預測,從而更好地為下一階段經濟普查數據分析工作的有序開展提供指導。要積極借助大數據挖掘技術,通過多元化、靈活的方式開展數據分析,把握數據分析規律,從而更好地完善數據分析體系,促進經濟普查數據分析工作質量和效率全面提升[2]。
2.2? 合理選擇數據挖掘技術
有很多數據挖掘技術可以應用于經濟普查數據分析階段,每一種技術都有不同的適用領域和特點,在開展具體應用過程中需要考慮現實需要,有針對性地選擇具體的挖掘技術,才能提高分析效率。比較常見的數據挖掘技術主要有以下幾種。
一是SQL Server 2000 Analysis Services軟件。該技術是一種基礎的數據庫及數據分析軟件,可以提供電子數據倉庫,從而更好地實現數據的快速整合和分析,同時還具有良好的業務拓展性,使用比較方便,設計功能比較強大,性能良好,為用戶應用提供了很大便利。
二是SAS統計分析技術。該技術是一項系統化的管理體系,通過建立有效的數據訪問、管理、展現和分析體系,將數據之間的關聯性進行有效統計和檢驗,同時本身還具有較強的靈活性和拓展性,可以根據用戶需求進行深度統計分析,并通過直觀的形式展現,便于數據分析人員進行深度理解和應用研究。
三是Clementine數據挖掘平臺。該技術主要是通過構建具有一定預測能力的模型,進而改進具體決策方法和過程,提高數據整體挖掘能力。
四是Intelligent Miner技術。該技術是多種統計與挖掘算法的有效融合,既可以對結構化數據進行處理,還可以對半結構化和非結構化數據進行處理,在發現關聯、自動生成典型數據集、發現序列規律、可視化呈現等方面都有強大的功能,這樣可以實現從數據采集到轉換、挖掘及深度處理等方面的一體化應用。
五是決策樹技術。該技術主要涉及決策點、狀態點、結果點3個方面的內容,通過借助決策樹技術,可以對數據相關的發生概率等進行分析,進而幫助預測和判斷,便于更好地對數據進行關聯性研究。該技術便于理解、分析效率高,且測定模型比較方便,但分析比較粗略,精度不高。
3? 結束語
大數據時代經濟普查數據分析工作因為有大數據技術的支持,可以在數據采集、整合和深度分析與應用方面更加便捷、高效,在具體開展數據分析過程中,還需要考慮具體的要求選擇匹配的數據挖掘技術,才能更好地提高分析成效。
參考文獻:
[1]朱建平,章貴軍,劉曉葳.大數據時代下數據分析理念的辨析[J].統計研究,2014(2):10-19.
[2]金美琳.大數據時代的經濟普查數據分析與研究[J].科技傳播,2016,8(9):67.