韓松 李新宇 丁雪
隨著電子政務的不斷普及和發展,越來越多的政務已經電子化,隨之帶來的是龐大的政府數據量,以及人們從海量數據中發現有用知識的難度。首先電子政務的數據具有數量大的特點,因此很多機關部門選擇應用數據挖掘解決這個問題。但是隨著各機關部門的數據不斷發展,數據分散,數據質量不一致的特點顯現,傳統的分布式數據挖掘已經無法解決現有數據處理瓶頸問題,急需一種新的數據挖掘的手段解決這個問題。而現如今云計算的發展為分布式數據挖掘提供了許多新的解決思路和方案。文中提出的基于云計算架構的分布式數據挖掘與傳統的分布式數據挖掘方法不同,它是基于云計算數據存儲架構設計的,它充分利用各個節點的計算能力并行完成數據挖掘過程,在低成本的情況下,可以更好地從大量且分散的政府數據中提供有效知識以供參考和決策。