楊勝衛 趙璐瑤 孟慧蕓
摘要:在經濟統計當中,因其涉及的數據量巨大,數據統計工作較為繁瑣,因此一直以來人們通常采用相關計算機軟件完成經濟統計工作。為了能夠進一步提高經濟統計結果的精準性與統計效率,本文將從數據挖掘的角度出發,在闡明數據挖掘技術基本內涵的基礎上,著重圍繞經濟統計中數據挖掘技術的應用進行簡要分析研究。
關鍵詞:數據挖掘技術 經濟統計 信息數據
引言:在以往經濟統計當中,采用傳統的數據處理方式,往往會因數據量較為龐大,而出現數據篩選誤差即在統計分析中篩選出虛假數據,故而使得最終的經濟統計結果缺乏較高的精準性,數據質量無法得到有效保障。因此需要在經濟統計當中,靈活使用數據挖掘技術,通過充分發揮其應有效用,以更好地完成經濟統計工作。
一、數據挖掘技術的簡要概述
數據挖掘技術簡單來說指的就是一種可以從海量信息數據中,快速、精準鎖定所需有用信息數據的技術。在未進行數據挖掘之前,雖然信息數據量較為龐大,但其中有許多信息數據并不完整,甚至存在諸多錯誤信息數據,而通過使用數據挖掘技術,則可以將其中新穎的、有價值的信息數據準確提取出來,通過對此類精心篩選出的信息數據進行深度處理,從而為信息統計工作提供真實可靠的數據支持。
在經濟統計當中運用數據挖掘技術,可以幫助統計人員快速從眾多未加工的經濟數據中,篩選出有價值的統計數據,并對其進行深入處理與再加工,為相關工作人員分析經濟形勢、判斷經濟走向、制定經濟決策決議等提供重要數據參考。此外,由于數據挖掘技術并不只是一種簡單的數據分析工具,其可以深入結合信息使用者的實際需求,特別是在我國經濟不斷發展下,經濟數據信息量驟增,其對于經濟統計的要求也越來越高。因此將數據挖掘技術運用在經濟統計當中,能夠有效保障信息評估的可靠性,實現數據處理成效的進一步優化。在運用數據挖掘技術完成對經濟數據的深入挖掘與分析處理下,建立起相應的數據庫,可以在更好地融合各種數據信息的基礎上,為經濟管理活動需求提供高質量服務,從根本上避免出現重復性的統計工作,以有效減輕統計人員的工作負荷。
二、經濟統計中數據挖掘技術的應用分析
(一)數據預處理。在將數據挖掘技術運用在經濟統計當中時,首先需要對現有的經濟數據進行預處理,這主要是由于在經濟統計中搜集得到的各種經濟數據,屬于初始數據,其中混雜著部分錯誤和虛假數據,以及不完整數據。對經濟數據進行預處理,其根本目的在于快速篩出存在于經濟數據集當中,與經濟統計工作無關的信息數據,只精準提取出經濟統計分析所需的重要數據。例如在某地區的經濟統計當中,在對該地區歷年企業上報的基礎經濟數據進行集中整理后,可以采用均值法進行經濟數據的預處理。即企業上報的基礎經濟數據中如果有數據點屬于空值或是噪聲數據,則通過對存在的噪聲數據、空值進行均值處理,使用數據庫當中該屬性全部已知屬性均值進行空缺添補,可以有效保障后續經濟基礎數據挖掘以及統計分析工作的順利進行,并由此獲得具有高精準性的經濟統計分析數據。
(二)建立決策樹。在完成經濟數據的預處理之后,需要建立相應的決策樹。具體來說,在經濟統計中運用數據挖掘技術,建立決策樹時,工作人員首先需要利用訓練集完成決策樹的初步建立,而后借助專門的決策樹算法對建立起的決策樹進行簡化。此時所建立的模型即為數據輸出分析模型,隨后經濟統計工作人員需要對建立起的決策樹進行充分利用,對相關經濟數據進行準確分類與深入分析。按照從決策樹根本開始逐漸延伸至決策樹各枝干部分的順序,直至數據與既定條件相符合后才可終止分割。值得注意的是,如果同時進行兩個分割,且分割點上的數據完全相同,此時將會自動終止分割,即順利完成決策。如果數據本身無分類屬性,但可以繼續分割輸入的經濟數據,則此時需要停止分割。在經濟統計當中,可以根據該地區歷年企業上報的數據,構建起與各企業相對應的序列模式,通過利用數據挖掘技術對企業預測值進行計算,將企業預測值與企業歷年上報的實際經濟數據進行對比,由此獲得差別率。此后統計人員可以對獲得的差別率進行一次分類,如按照差別率的占比大小,依次將其分成A、B、c三類,其中A類差別率在20%以上,B類數據中差別率在10%至20%之間,c類數據中的差別率則不足10%。
(三)進一步調查。在使用數據挖掘技術進行某地區經濟統計時,經濟統計人員在立足本地區企業歷年上報數據的基礎上,通過充分結合企業規模變化率以及是否有重大經營事件曾經發生于企業內部,判斷此時是否需要繼續進行先一步調查分析。具體來說,如果根據數據挖掘結果顯示,企業規模變化差異率較大,但并未超過合理范圍,則無需進行下一步調查從而獲取更加可靠的有效經濟信息。如果企業規模變化差異率超過規定值,或是企業規模變化差異率極小,且企業確實曾經發生過重大經營事件,此時需要經濟統計人員展開下一步調查分析,從而更加深入地了解企業及本地區存在的經濟問題,以便可以制定出更加具有針對性和有效性的經濟決策決議,在確保經濟統計結果的完整性與可靠性的同時,對企業規模變化差異率進行合理調整,達到幫助企業提高自身核心競爭力,擴大經濟效益規模,最終實現推動本地區經濟長效發展的目的。
結束語:綜上所述,在經濟統計中運用數據挖掘技術,不僅有助于實現經濟數據資源的有效擴展,同時也可以為判斷經濟局勢與經濟發展走向等提供真實可靠的數據支持。因此在實際運用數據挖掘技術進行經濟統計分析的過程中,相關工作人員需要有意識地對獲取的經濟數據進行預處理,并建立起相應的決策樹,在完成經濟數據科學分類并確定具體調查對象的基礎上,對挖掘提取出的有價值的經濟數據進行深入統計分析,從而更好地為經濟管理活動提供所需服務。