丁學利 孫娓娓



摘? 要:為有效對商場會員價值進行分類研究,首先運用K均值聚類并結合Fisher判別分析對商場會員進行分類,然后根據各會員群的最近一次消費時間間隔、總購買數量、總消費金額、單筆最高消費金額、平均消費金額、會員關系長度等多項指標構建模糊綜合評價模型。通過計算相對偏差模糊矩陣及變異系數法構建的各指標的權向量對會員群進行了綜合評價,得到了會員群的綜合排序。該方法可有效地對大樣本數據進行綜合評價且評價結果更接近實際,也為商場運營商有效地對會員進行分類管理,實施針對性的營銷策略等提供了理論參考。
關鍵詞:K均值聚類;Fisher判別分析;模糊綜合評價法;商場會員
中圖分類號:O212? ? ? ? ?文獻標識碼:A? ? ? ? ? ? ?文章編號:1672-4437(2019)03-0081-06
在零售行業中,會員價值表現為不斷地為零售運營商帶來較好的銷售額和較高的利潤,也為零售運營商如何制定營銷策略提供了數據支持。零售行業會采取各種不同方法來增強會員的忠誠度,同時吸引非會員成為會員。當前電商的發展使商場會員不斷流失,給零售運營商帶來了嚴重損失。因此,運營商如何有效地對會員進行分類管理,以及根據會員分類有針對性地實施營銷策略來加強與會員的良好關系,成為商場運營商迫切解決的關鍵問題。
在對客戶進行有效識別方面,可通過聚類分析、判別分析等[1-8]方法進行分類,然后利用RFM模型[9]、客戶價值矩陣法[10]等對客戶進行價值分析。但在對大樣本數據的客戶價值進行評價時,往往評價指標具有不確定性或模糊性,這些方法較難客觀地對客戶群進行綜合評價。因此,本文運用K均值聚類法對商場會員進行分類,同時利用判別分析法對聚類結果進行判別,驗證聚類效果,在此基礎上利用模糊綜合評價法對會員群進行綜合評價。該方法可有效地對大樣本數據進行綜合評價且評價結果更接近實際。
1? 數據來源與分析
1.1 數據預處理
本文采用2018年全國大學生數學建模競賽C題[11]商場會員消費信息數據。商場會員消費信息共有911702條數據,其中包括異常數據(會員卡號出現科學計數法的數據,如會員卡號6.7738E+21,共計417條)、缺失數據(如有的會員只有消費時間,缺失會員入會時間,共計793個會員號)等。由于這些數據所占的比例非常小,因此可考慮直接刪除。由于每個會員的消費記錄不只一條,因此可用Excel透視表得到每個會員的總購買數量、總消費金額、單筆最高消費金額、平均消費金額。然后運用Access軟件對數據進行處理和提取,包括分離商場會員與非會員的數據、提取會員最近一次消費時間間隔和會員關系長度(會齡),最后得到43105條會員消費記錄。
1.2 指標選取
根據RFM模型[9]理論,反映顧客的價值包括三個指標:最近購買時間(R)、購買頻率(F)及購買金額(M)。R值越小,F和M值越大,顧客價值越高。除了RFM所代表的評價指標,本文還使用了其他特殊變量反映會員的購買行為,如單筆最高消費金額、平均消費金額,其值越大,顧客價值越高;會員關系長度越長說明會員越忠誠。因此,本文選取如下6個反映顧客價值的評價指標: ——最近一次消費時間間隔(天); ——總購買數量(件); ——總消費金額(元); ——單筆最高消費金額(元); ——平均消費金額(元); ——會員關系長度(會齡/天)。表1是將會員號按升序排列得到的商場會員消費統計結果(由于版面限制,僅列出部分會員消費的統計結果)。
2? 基于聚類-判別分析的會員分類
2.1 聚類和判別分析
聚類分析[1-5]的基本目標是按照一定規則把分類對象性質相似的歸為一類,而把性質差距比較大的對象歸到不同的類,其最終得到類內的對象會有很高的相似度,而不同類之間的對象具有較低的相似度。K均值聚類是一種適用于大數據且計算速度快的聚類方法,其算法的基本步驟是在給定數據的分類數K后,該方法會隨機選取K個聚類中心,計算每個樣本與這K個聚類中心的距離,依據距離最近原則將每個樣本分別歸到K個不同的類,然后重新計算這K個類的中心,繼續計算每個樣本與這K個中心的距離,并重新歸類,繼續上述操作直到達到設定的標準時,結束聚類過程。
判別分析[1, 2]是按照某種判別規則,對已經分類的研究對象,計算判別指標,確立判別函數,依據判別函數即可判定某一對象屬于何類。Fisher 判別法是判別分析中常用的一種方法,其基本思想是投影降維,即將K類n維數據投影到某一個方向,使得類與類之間的投影盡可能分開,而類內離差盡可能小,從而得到一種線性判別函數,最終將各個類進行很好的區分。
在眾多的聚類和判別方法中,K均值聚類和Fisher判別分析是適應性較強且處理大樣本數據效果較快的方法。針對43105條大樣本商場會員數據,選取K均值聚類和Fisher判別分析是比較合適的,因此本文選用K均值聚類和Fisher判別分析。其具體步驟如下:
Step1:以 , , , , , 為自變量,將樣本數據z-score標準化,計算不同類別數下的平均輪廓值,確定K均值聚類的最佳類別數K;
Step2:選取K個初始聚類中心,運用K均值聚類算法得到最終的聚類中心和聚類結果(每個會員的分類號及每個會員群的數量及均值);
Step3:繼續以 , , , , , 為自變量,用聚類分析的分類號作為分類變量,將所有樣本作為訓練樣本進行判別分析,得到判別函數系數,建立Fisher判別線性函數;
Step4:用判別函數對所有樣本進行判別分類,與聚類結果比較,檢驗聚類效果。
2.2? K均值聚類結果
為了確定K均值聚類的最佳聚類數K,首先計算分類數與平均輪廓值的關系,如圖1所示。平均輪廓值越大,表明聚類具有越好的效果。由圖1可知,當類別數為2時平均輪廓值最大,但分類數為2時,太籠統,效果不好。當類別數為6時,平均輪廓值較大,因此最佳聚類數可取6。使用SPSS 21.0軟件,選取6個初始聚類中心,得到最終聚類中心(標準化后的聚類中心,見表2)。根據最終的聚類中心,可將會員分成6類會員群,見表3。由表3可知,會員群1的會員數最多,最近一次消費時間間隔較長,總購買數量、總消費金額、單筆最高消費金額、平均消費金額較少,會員關系長度最短。其余會員群的詳細特征也可類似得出。雖然利用K均值聚類得到了聚類結果,但聚類效果如何,需進一步檢驗。
2.3? Fisher判別分析結果
以 , , , , , 為判別自變量,以聚類分析得到的分類號作為分組變量,使用SPSS 21.0軟件對所有樣本進行判別分析。SPSS 21.0自動選取具有會員分類號的數據進行訓練,得到判別函數系數,見表4。方差檢驗判別函數的p值小于0.001,表明判別函數對商場會員類別的區分差異顯著。SPSS 21.0利用判別函數可對每個會員所屬的會員群進行有效識別,判別結果見表5。由表5可得到,每個會員群的聚類結果與判別結果基本一致,總的一致率(兩者相同的樣本數除以總樣本數)達到96.2%。因此,K均值聚類得到的6類會員群是較合理的。雖然把商場會員合理地分成了6類會員群,但如何對每類會員群進行評價還需進一步研究。
3 會員群模糊綜合評價
3.1? 相對偏差模糊綜合評價
針對多個方案實施客觀評價時,待評價的指標因素一般較多且存在主觀判斷。因此,應根據多個指標進行綜合評價且考慮評價指標因素的模糊性。模糊綜合評價法[12-14]是一種有效克服模糊性的數學方法,其本質是最大隸屬度原則。在建立模糊矩陣時,隸屬度函數 可使用多種方式,如越小越優型、越大越優型等函數。但有些公式計算較繁瑣,而相對偏差模糊矩陣的隸屬度函數 計算簡單且可較好地反映評價結果。設有 個待評價對象集合 , 個評價指標集合 。如果用 中的每個指標對 中的每個待評價對象進行評價,那么可得觀測值矩陣 ,其中 為第 個評價對象關于第 個評價指標的指標值,具體的綜合評價步驟如下:
Step1: 設置理想方案
3.2 會員群模糊綜合評價結果
為更好地區分6類會員群的價值,以表3中 , , , , , 的均值作為評價指標,6類會員群作為待評價對象,進行模糊綜合評價。由于變量 的值越小越好,因此可作為成本型指標,而變量 , , , , 的值越大越好,因而可作為效益型指標。理想方案 可設置為:
= (10.34, 250.42, 453165.81, 37422.52, 20397.5, 2528.21)
相對偏差模糊矩陣計算如下:
根據F值可將6類會員群進行綜合排序,每類會員群的具體特征如下:
(1)會員群6綜合排名第一,占總會員數的0.42%, 屬于少數會員群。該類會員購買時間間隔最短,購買數量最多,交易金額最大,屬于商場重要保持的優質會員群。商場應加大對這類會員的資源投入,增大其為商場創造利潤的時間。
(2)會員群3綜合排名第二,占總會員數的1.29%, 屬于少數會員群。該類會員雖然購買時間間隔較大,購買數量也較低,但平均消費金額最大,屬于商場重要發展的會員群。對這類會員,商場應為他們制定相應的營銷策略,提升其忠誠度,使其逐步轉變成商場的高價值會員。
(3)會員群4綜合排名第三,占總會員數的4.96%, 屬于少數會員群。該類會員購買數量和購買金額較大,屬于商場普通保持的會員群。針對該類會員群,商場應及時了解會員需求,逐步提高其忠誠度和滿意度。
(4)會員群2綜合排名第四,占總會員數的19.79%, 各項指標一般,屬于商場普通發展的會員群。該類會員群當前可能對商場的貢獻一般,但其發展潛力巨大,應努力提升其價值。
(5)會員群1綜合排名第五,占總會員數的64.28%, 屬于多數會員群。該類會員購買數量和金額較少,會齡時間最短,屬于商場一般發展的會員群。對此類會員,商場應謹慎對其投入資源。
(6)會員群5綜合排名第六,占總會員數的9.25%。該類會員消費時間間隔最大,購買數量最少,消費金額最低,會員關系較長,屬于非活躍低價值老會員群。這類會員,商場可減少對其投入的資源。
4 結束語
本文運用K均值聚類法對商場會員進行了分類,再利用判別分析法驗證了K均值聚類效果,最后使用模糊綜合評價法對6類會員群進行了綜合排序。實例表明,該方法的分類和評價是有效的,可較好地對商場會員進行識別。本研究結果,為商場運營商有效地對會員進行分類管理,實施針對性的營銷策略以及如何加強與會員的良好關系等提供了理論依據。
參考文獻:
[1]趙銘,李雪,李秀婷,等.基于聚類分析的商業銀行基金客戶的分類研究[J].管理評論,2013(7):38-44.
[2]韓宏穩,張建磊.層次分析與聚類分析、判別分析在卷煙零售戶分類中的應用[J].中國煙草學報,2014, 20(6):119-126.
[3]姚思雨.改進蟻群聚類算法在零售客戶分類中的研究與應用[D].大連:大連海事大學,2018.
[4]左國才,楊金民.K-means算法在電信CRM客戶分類中的應用[J].計算機系統應用,2010,19(2):155-159.
[5]胡雷芳.基于聚類分析的C2C電子商務客戶價值服務營銷對策研究[J].成組技術與生產現代化,2007,24(3):34-41.
[6]王軼華.基于層次分析法建立客戶綜合價值分析體系[J].華東電力,2006(4):36-39.
[7]曹云忠.基于SOM和粗糙集理論的客戶分類研究[J].商場現代化,2009(1):43-44.
[8]黎晗.數據挖掘在客戶關系管理中的應用----以客戶分類為例[J].中外企業家,2015(36):82-84.
[9]徐文瑞.基于RFM模型的顧客消費行為與顧客價值預測研究[J].商業經濟研究,2017(19):44-46.
[10]陳明亮.基于全生命周期利潤的客戶細分方法[J].經濟管理,2002(20):42-46.
[11]2018年全國大學生數學建模競賽試題[EB/OL]. (2018-09-20)[2019-03-02.]http://mcm.ustc.edu.cn/ahmcm/.
[12]高順成.紡織服裝類高校科技創新能力評價研究----基于相對偏差距離最小法[J].武漢紡織大學學報,2013,26(2):23-26.
[13]許一新,楊鵬輝,汪兆霞,等.基于模糊綜合評價對購房影響因素的定量分析[J].阜陽師范學院學報(自然科學版),2017,34(2):96-99.
[14]彭清萍,付亞賓.基于模糊分析法的網絡評價體系建構與實施[J].阜陽師范學院學報(自然科學版),2018,35(1):96-100.