孫曄,孫潔
(1.凌拓(上海)商貿有限公司 北京分公司,北京 100020; 2.華北理工大學 電氣工程學院,河北 唐山 063000)
?
基于改進K-means算法的商業用戶聚類分析
孫曄1,孫潔2
(1.凌拓(上海)商貿有限公司 北京分公司,北京 100020; 2.華北理工大學 電氣工程學院,河北 唐山 063000)
K-means聚類算法;云計算;商業用戶;網絡存儲資源
在競爭激烈的市場環境下,為了更好分析商業用戶信息,贏得更多的商業用戶,需要進行海量大數據分析。本文針對傳統K-means算法自身初始聚類選取的缺陷和單機串行聚類算法的局限性,提出了一種改進的K-means聚類算法。結合當前主流的開源云計算平臺Hadoop,把改進的算法并行化,克服了傳統串行聚類算法在海量數據處理時的不足,以某大型網絡存儲服務企業每日商業用戶網絡存儲資源使用量為實驗數據,驗證了算法的高效性和可行性。
隨著改革開放力度的進一步加大,大量外資企業的引入,使得國內商業競爭力急劇加大,商業用戶成為了競爭的焦點,誰擁有更多的客戶,就擁有更大的競爭力,隨著信息化時代的到來,人們已經生活在數據的海洋中,在日常眾多商業行為中,涌現出了大量的商業用戶數據,如何分析這些數據,挖掘出隱藏在這些數據背后的信息,從而制定出更好的營銷商業策略來贏得更多的商業用戶,成為了當前較熱門的研究重點[1]。
以往的商業用戶分析往往依靠簡單經驗和統計方法,顯然已經無法滿足當前的需求,數據挖掘是利用某種……