999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于改進K-Means聚類算法的移動5G手機用戶分類研究

2021-02-27 07:38:04毛建軍
網絡安全技術與應用 2021年2期
關鍵詞:分類特征用戶

◆毛建軍

基于改進K-Means聚類算法的移動5G手機用戶分類研究

◆毛建軍

(云想科技有限公司 江蘇 210000)

;隨著5G時代的來臨,為了對5G手機用戶提供更具有針對性的個性化服務,本文對當前移動5G手機用戶的消費使用情況進行了分析,數據經過清洗處理后,運用K-Means算法對移動5G手機用戶消費情況進行了分類,在科學分類的指導下,為營銷部門開展針對性地營銷提供了理論支持,為客戶提供更全面的服務,節省了服務成本,提升企業競爭力。

K-Means算法;聚類分析;移動5G

1 背景

當前,國內5G通信行業以移動、聯通、電信以及廣電為主要通信經營服務商。在劇烈的競爭現狀的背景下,對移動的服務水平、營銷專業度、服務內容、服務質量等方面提出了更高層次的標準。同時,客戶對通信服務的個性化要求越來越高,用戶的使用場景、通話使用時長,流量用量等多方面都有著較大地差異。本文通過改進K-Means聚類算法分析移動5G手機用戶消費情況從中發現不同用戶之間存在的消費共有特征,然后對同一消費情況特征類別下的5G手機用戶提供定制化服務,滿足用戶需求,降低企業的管理費用,提高企業核心競爭力。

2 數據展示

本文研究數據來自移動公司客戶經營管理數據庫,共提取5000條數據進行分析,通過分析結果指導經營活動評估實際的分類效果,從而應用到日常的數據分析工作中,原始數據的內容如下表1所示:

表1 5G手機用戶消費數據表

由表1可知,原始數據表中共有數據項8個,分別是月套餐費、本地通話費、長途通話費、5G數據流量費、短信費、彩鈴費、寬帶電視費以及訂閱費構成,原始數據中存在一定的不完整、信息缺失的個體樣本,需要對數據進行檢查。同時,在進行聚類分析之前需要數據的預處理。

3 數據處理

通過人工方式進行數據清洗、數據選擇等操作將信息異常的數據進行清除,以免對聚類分析造成分類影響。在對總數5000條樣本的檢查過程中,發現120條數據不符合分類要求,最后進行分析的樣本空間為4880條有效數據。在進行K-Means聚類分析之前,需要對樣本空間的每條數據的特征項做預處理,將無關特征項的影響降到最低。

3.1 數據標準化

通過z-score方法處理后的數據處在同一數量級且沒有單位的數值,此時的數據就可以進行K-means聚類分析。經過標準化處理后的屬性的數據處于同一量級,數據之間具有可比性,標準化處理的數據結果如下表2所示:

表2 標準化后的特征數據

由表2可知,經過標準化處理后的特征項的值,無法直觀的判斷分類情況,此時需要K-Means算法進行下一步的聚類的分析。

4 K-Means算法及分析過程

1967年,James MacQueen 在《Some methods for classification and analysis of multivariate observations》中提出“K-Means”。當前K-Means聚類算法主要應用有:文檔分類器、客戶分類、配合遺傳算法和無人機解決商旅車行車路線問題,乘車數據分析等。

4.1 K-means算法

傳統的K-Means聚類算法流程如下:首先,設置進行聚類的分類個數K,進行數據的初始化,隨機從樣本空間中的所有樣本中選擇K樣本作為聚類的中心;然后分別得到樣本空間中每個樣本到所有聚類中心的距離,將與每個中心最近的樣本歸為該中心的同類中;再次,將同聚類中的所有樣本數據的特征取平均值,將平均后得到的點作為新的聚類中心;最后,重復第上述步驟直到聚類中心不再改變即可。最后得到的分類結果就是最優的。在實際的計算代碼中,K-Means算法的計算樣本與分類中心的距離所使用的方法是歐幾里得距離,如下公式1所示:

其中x1,x2,…,xn是樣本x的n維特征項,c1,c2,…,ck是初始化的K個聚類中心,s1,s2,…,sm是樣本空間中的m個體樣本總數,計算樣本x到所有k個聚類中心的距離然后選取距離最小的中心,將該樣本x歸類為此聚類中心的同類中。但是這種距離計算方式并沒有考慮到樣本的特征維度的權重性,而是將個體樣本中的所有特征都對分類結果有同樣的權重效果,這樣的結果會導致分類結果的不準確性增大,即有的維度對分類結果影響大,有的維度對分類結果影響較小或幾乎沒有影響,對原有算法進行改進就十分有必要,改進的公式2如下所示:

其中rl是特征x的n維的權重向量,取值范圍在0-1之間,權重總和為1。通過對原有的算法的改進,使得原有的算法不支持多維權重的距離公式現在可以支持不同特征項的不同權重的距離公式,增加了算法的實用性和操作性,在面對實際問題時,能夠突出某些樣本中重要特征項的權重,減少弱相關特征項的干擾,保證了K-Means算法聚類分類的準確性。

4.2 K-Means聚類分析過程

原始數據表中共有數據項8個,分別是月套餐費、本地通話費、長途通話費、5G數據流量費、短信費、彩鈴費、寬帶電視費以及訂閱費構成,通過對比數據可知彩鈴費、寬帶電視費以及訂閱費對分類幾乎沒有區分度,設定的權重最小,而5G數據流量、短信費區分度較小,權重設定就大一些,月套餐費、本地通話費、長途通話費是消費主特征,所以權重設置最大,通過對不同的特征項設定不同的特征權重來確保分類的準確度,同時聚類個數K的選擇對聚類的結果有著重要的影響,所以數據的聚類一次無法完成訓練結果,需要根據不同的權重和不同的聚類個數訓練結果進行不斷的調整。本文通過調整權重參數和改變聚類的個數,分別進行了多次K-Means聚類訓練了2-9個聚類情況下,得到的不同的分類結果,利用肘部法則選擇最佳的聚類分類中心個數,如圖1所示:

圖1 K-Means不同聚類個數的情況

由圖1可知,通過對數據進行2-9個聚類的分析得到的肘部法則圖,只有在第4類的差異時較小,所有最佳分類聚類個數為4,同時確定最后的權重系數r=(0.2,0.2,0.2,0.15,0.1,0.05,0.05,0.05)。

4.3 聚類分析結果

選擇聚類個數為4個分類后,得到結果如下表3所示:

表3 K-Means分類結果

由表3可知,用戶總共被分為4類,其中第一類用戶的總數為112,占總樣本空間的2.30%;第二類用戶的總數為202,占總樣本空間的4.14%;第三類用戶的總數為1196,占總樣本空間的24.51%;第四類用戶總數為3370,占總樣本空間的69.06%。第一類用戶占比最少,月消費額最高,而且其月租費、長途通話費在占比中都是最高的,由此判斷該類用戶屬于商務人士且經常出差,是聯通手機用戶中的最優質客戶資源,是營銷人員重點服務對象。第二類用戶占比較一類用戶多,其月消費水平也處于第二位,其5G數據流量費用支出較高,由此推測該類用戶屬于高流量用戶,月流量消費很高,可對其提供偏向流量的套餐服務。

5 總結

本文利用改進的K-Means算法,通過改變算法中計算歐幾里得距離增加維度權重的方法,提升了算法的針對性和適用性,并應用在對移動5G手機用戶消費情況進行了聚類分析,比較不同聚類數量分類情況下的分類效果,成功實現了對當前移動5G手機用戶的分類,為營銷部門開展個性化營銷活動提供了理論支持,在科學分類的有效指導下,可以提高服務的準確度,為客戶提供更全面的服務。

[1]李敏. K-means算法的改進及其在文本聚類中的應用研究[D].江南大學,2018.

[2]李游. 基于校園網的用戶行為分析研究[D].云南大學,2013.

[3]吳斌. 基于數據挖掘技術的學生成績分析評價與研究[D].南昌大學,2009.

[4]Guo Xiaojie,Chen Liang,Zhou Hang,Huang Jun. An Improved K-means Algorithm and Its Application in the Evaluation of Air Quality Levels[A]. 東北大學、IEEE新加坡工業電子分會.第27屆中國控制與決策會議論文集(下冊)[C].東北大學、IEEE新加坡工業電子分會:《控制與決策》編輯部,2015:6.

[5]Youguo Li,Haiyan Wu. A Clustering Method Based on K-Means Algorithm[A]. Information Engineering Research Institute, USA.Proceedings of 2012 International Conference on Solid State Devices and Materials Science(SSDMS 2012 V25)[C].Information Engineering Research Institute, USA:智能信息技術應用學會,2012:6.

[6]史秀嶺. K-means聚類優化算法的研究[D].長沙理工大學,2011.

[7]馮超. K-means聚類算法的研究[D].大連理工大學,2007.

[8]陳敏,李雪峰. 一種選擇了初始聚類中心的改進K-means算法[A]. International Communication Sciences Association, Hong Kong.Proceedings of 2010 International Conference on Broadcast Technology and Multimedia Communication(Volume 2)[C].International Communication Sciences Association, Hong Kong:智能信息技術應用學會,2010:4.

[9]劉玥. 基于改進的K-means算法的銀行客戶聚類研究[D].吉林大學,2016.

[10]黃繼超. k-means算法若干改進和應用[D].中南大學,2013.

[11]Xian Liang,Fuheng Qu,Yong Yang,Hua Cai. A Highly Efficient Fast Global K-Means Clustering Algorithm[A].Information Engineering Research Institute, USA.Proceedings of 2015 2nd International Conference on Civil,Materials and Environmental Sciences(CMES 2015)[C].Information Engineering Research Institute,USA:智能信息技術應用學會,2015:4.

猜你喜歡
分類特征用戶
分類算一算
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
抓住特征巧觀察
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
主站蜘蛛池模板: 国产h视频免费观看| 中国毛片网| 国产免费网址| 免费国产好深啊好涨好硬视频| 国模视频一区二区| 国产美女在线免费观看| 国产99免费视频| 免费国产高清精品一区在线| 国产无遮挡猛进猛出免费软件| 成年午夜精品久久精品| a色毛片免费视频| 好吊日免费视频| 亚洲成人精品在线| 国产视频自拍一区| 无码不卡的中文字幕视频| 欧美精品二区| 丰满人妻久久中文字幕| 伊人久久大香线蕉影院| 国产精品久久久久久搜索| 国产精品制服| 国产白丝av| 亚洲无码四虎黄色网站| 精品国产免费观看一区| 国精品91人妻无码一区二区三区| 国产欧美日韩视频怡春院| 91小视频在线播放| 国产视频久久久久| 99re精彩视频| 中国一级毛片免费观看| 久久鸭综合久久国产| 大乳丰满人妻中文字幕日本| 亚洲开心婷婷中文字幕| 精品乱码久久久久久久| 又黄又湿又爽的视频| 美女扒开下面流白浆在线试听| 欧美一道本| 夜夜高潮夜夜爽国产伦精品| 久久久久国产精品熟女影院| 成人va亚洲va欧美天堂| 精品少妇人妻一区二区| 激情影院内射美女| 97在线视频免费观看| 免费大黄网站在线观看| 欧美激情二区三区| 午夜福利在线观看成人| 成人国产精品2021| 亚洲AⅤ波多系列中文字幕| 成年人国产视频| 国产毛片基地| 99中文字幕亚洲一区二区| 亚洲人成网址| 四虎永久免费网站| 国产精品成| 亚洲另类色| 54pao国产成人免费视频| 久久精品女人天堂aaa| 国产在线精品99一区不卡| 狠狠做深爱婷婷久久一区| 欧美一级夜夜爽| 国产无码制服丝袜| 国产成人精品一区二区秒拍1o| 一本大道香蕉高清久久| 看国产一级毛片| 国产人前露出系列视频| 国产精品入口麻豆| 欧美国产在线看| 日韩欧美在线观看| 亚欧成人无码AV在线播放| 国产欧美亚洲精品第3页在线| 97精品国产高清久久久久蜜芽| 日韩精品高清自在线| 亚洲乱码在线播放| 国产在线无码一区二区三区| 国产亚洲精品自在久久不卡| 老司机aⅴ在线精品导航| 欧美日韩资源| 国产av一码二码三码无码| 久久人人妻人人爽人人卡片av| 国产真实二区一区在线亚洲| 在线观看免费黄色网址| 黄色网站不卡无码| 国产91特黄特色A级毛片|