李睿穎 柳炳祥 萬義成
摘要:客戶投訴是客戶對企業管理和服務不滿的表達方式,是企業最有價值的信息來源,因此,如何分析處理客戶投訴的數據,掌握投訴客戶的基本特征,進而把客戶的不滿轉化客戶滿意,鎖定他們對企業和產品的忠誠,贏得客戶的信任,是企業核心競爭優勢所在。論文將K-means算法應用于移動客戶的聚類分析中,針對某企業某段時間的移動通信投訴數據進行聚類分析,目的是根據移動公司投訴數據進行聚類,找到對每個類別客戶應該采取的營銷策略,以提升公司對客戶的價值,改善客戶關系管理工作。實驗結果驗證了方法的可行性和有效性,為移動客戶聚類分析提供了一種分析的方法。
關鍵詞:K-means算法 移動客戶 聚類分析
中圖分類號:TP309 文獻標識碼:A 文章編號:1007-9416(2016)08-0157-02
1 引言
客戶投訴是每一個企業不可避免遇到的問題,它是客戶對企業管理和服務不滿的表達方式,也是企業有價值的信息來源,它為企業創造了許多機會。因此,如何利用處理客戶投訴的時機而贏得客戶的信任,把客戶的不滿轉化客戶滿意,鎖定他們對企業和產品的忠誠,獲得競爭優勢,已成為企業營銷實踐的重要內容之一。論文將K-means算法應用于移動客戶的聚類分析中,目的是根據移動通信公司投訴數據進行聚類,找到對每個類別客戶應該采取的營銷策略。
2 K-Means算法
K-Means算法,也稱為K-平均算法,是最常用普遍的基于劃分的聚類方法,是根據數據樣本中的屬性值之間的相似度來對數據樣本進行區分。它把最終分類的個數k隨機地選取k個初始的聚類中心而且不斷地迭代,直到取得目標函數的最小值或無法取得更進一步的優化,則生成最后的模型,即為聚類的最終結果。在K-means算法中,每一個簇當中都有一個中心,即為“質心”,k個簇同樣就會有k個質心。任何一個樣本被劃到哪個簇中,就看它和哪個質心的“相似度”最大。K-means算法當中,權衡相似度的標準就是“距離”。一個數據樣本為什么劃分到這個簇,就是看這個樣本是這個簇的質心的距離是最小,則是由樣本的每一個屬性的取值來共同參與決定。
K-Means算法的流程首先是選擇k個簇的質心,由用戶選定樣本中的簇的數量k,然后生成k個質心;其次是計算每一個樣本與k個質心的距離,把他歸納到距離最短的類別去;第三,計算出新的聚類質心,由于在指派樣本的過程中,一個簇的某些樣本可能會被劃分到另一個簇,同時也可能其他的簇中的樣本轉移到這個簇中,則需要重新確定新的質心;最后,制定算法停止規則,輸出最終結果。其中停止規則分為最大迭代次數和差異容忍度兩種,最大迭代次數是指算法將不斷重復“計算每一個樣本與k個質心的距離---計算出一個新的聚類質心”,直達到“最大迭代次數”。當到達了極限后,算法停止計算,產生新的簇。差異容忍度是在每一次迭代介紹后,計算出每個簇計算前后質心的距離差,小于預先設定的差異容忍度,則算法停止,否則繼續迭代。
3 K-Means算法在移動客戶投訴數據聚類分析中的應用
3.1 實驗數據集
實驗數據集包含2711個樣本,有6個屬性(投訴內容,故障行政區,使用網絡類型,責任原因,終端描述,客戶品牌)組成,如表1所示。其中投訴內容A1-A9分別代表wifi問題、短信問題、寬帶問題、國際漫游問題、手機上網問題、通話質量問題、網絡設備故障、網絡數據問題、信號問題。故障區B1-B20分別代表寶山區、崇明區、奉賢區、虹口區、黃浦區、嘉定區、金山區、靜安區、長寧區、閔行區、浦東新區、普陀區、青浦區、松江區、徐匯區、楊浦區、閘北區、其他區域、外省、國外。使用網絡類型C1代表2G網絡,C2代表3G網絡。責任原因D1代表客戶問題,D2代表網絡部門。終端描述E1-E15分別代表HTC、IPHONE、OPPO、步步高、華為、酷派、聯想、中興、小米、諾基亞、三星、索尼、其他。
客戶品牌F1代表全球通,F2代表全球通VIP,F3代表動感地帶,F4代表神州行。
3.2 實驗過程
選取移動通信公司投訴數據excel表格導入SPPS-Modeler軟件當中,首先選擇“源”下方“excel”確保數據導入軟件當中,其次選擇“字段選項”下方“類型”確定模型的類型,最后選擇“建模”下方眾多模型中的“K-means”算法,完整的數據流如圖1所示。
在實驗過程中,選擇模型使用分區數據時,確定選擇聚類為幾類,選取K-Means模型節點,分別選取k均值為2,3,4,5,6等多個參數進行實驗分析,經過一系列k均值比較,比較得出選取k均值為5,即聚為5類;選用專家模式,選取最大迭代數10,其余參數均為默認,聚類結果如圖2所示。
從圖2中看出,聚類-1占訓練集樣本62.6%,聚類-2占6.0%,聚類-3占2.3%,聚類-4占11.0%,聚類-5占18.1%。最大聚類(聚類-1)與最小聚類(聚類-2)的比例為1:26.95。
3.3 實驗結果分析
通過實驗結果可知,聚類1中,投訴內容大致為信號問題、短信問題、通話質量差,通常這個投訴點發生在2G網絡使用情況下,公司旗下每個品牌都有這些投訴現象。聚類2中,投訴點主要集中“神州行”用戶對短信接收問題,以及對短信計費問題。聚類3中,投訴點在信號以及wifi問題。這類的wifi問題指在無線熱點沒法連接或者信號微弱,以及無法登錄。聚類4中,在“神州行”品牌客戶中,2G的網絡手機網絡數據會出現問題,建議所有的使用2G網絡的客戶,可以到移動營業廳或者網上營業廳進行網絡免費手機,免費換3G卡的業務,并且資費不變。聚類5中,責任原因歸屬在網絡部門自己。移動客戶投訴所用的問題中,責任都出現在網絡部門沒有經常性的維護和發現問題。加強內部管理,加大檢修力度,將信號問題有效的解決掉,這樣客戶的滿意度才會增長。
4 結語
通過移動通信公司投訴數據聚類分析的實驗表明,K-Means算法表現出相對良好的聚類性能。經過k取值的不同進行不斷的比較,大大提高了聚類的優越性,從而實現良好的聚類性能。利用K-Means算法對移動通信公司投訴數據進行聚類,找到對每個類別客戶應該采取的營銷策略,提升客戶價值,改善客戶關系管理工作。
參考文獻
[1]劉堯坤.顧客投訴管理與處理技巧[M].廣州:廣東經濟出版社,2005.
[2]徐遠純,盛昭瀚.一種基于決策樹算法的客戶流失分析方法[J].計算機與現代化,2004 (8).
[3]趙小寧,李鳳霞.因子分析法和聚類分析法在網上銀行客戶滿意度研究中的應用[J].時代金融,2015(3).
[4]蔣斌.數據挖掘技術在客戶關系管理中的運用[J].云南大學學報(自然科學版),2006 (12).