999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于模糊聚類的客戶分類評價方法

2021-04-20 06:34:16楊曉峰
電子技術與軟件工程 2021年3期
關鍵詞:可視化分類特征

楊曉峰

(山西建筑職業技術學院 山西省晉中市 030600)

1 引言

在競爭激烈的商業環境下,取得商業成功的方法之一就是研究客戶,通過客戶分類實現精準營銷。本文以某航空公司客戶分析為基礎研究商業客戶分類方法。

目前客戶分類經典方法多采用RFM 方法,其中R 表示客戶消費時間間隔、F 表示客戶消費的頻率、M 表示客戶消費能力。季杰[1],徐伶伶[2]基于Kmeans 聚類算法利用改進的RFM 模型對某航空公司客戶進行了價值分析并將客戶分為五類,篩選出了最有價值客戶。覃玉冰[3]使用Kmeans 聚類算法進行某公司客戶分析,通過對比INCA 指數將客戶優化分類為4 類。Kmeans 算法屬于硬聚類算法,任何一個樣本對于某個類別的概率只有兩種情況(0%和100%)。Kmeans 算法通過優化類內誤差平方和最小化,通常樣本間相似度采用歐拉距離計算。模糊C 均值聚類融合了模糊理論,將樣本屬于某個分類的隸屬度修改為[0,1]區間,隸屬度表示樣本歸于某一類別的概率,隸屬度可以很好的表示實際情況。因此,本文選用模糊C 均值聚類分析研究商業客戶。

2 數據準備

本文實驗采用開源某航空公司數據集,數據集抽取了某航空公司兩年內所有客戶乘機的62988 條記錄。記錄中包括第一次飛行時間、性別、會員卡級別等客戶基本信息,乘機次數、平均折扣率、飛行總里程等乘機信息,積分兌換次數、總會員積分、促銷積分、總累計積分等積分信息。

3 特征選取

本文實驗設計了RFM 的改進模型PRIFEMD,PRFMDIE 模型中的特征中包含七個特征:(1)P 表示乘客入會的時間長度,由時間窗的結束時間與入會時間的差表示;

(2)R 表示乘客最后未乘機時間長度,由時間窗的結束時間與最后一次乘機時間的差表示;

(3)F 表示乘坐飛機的頻率,由時間窗內總飛行次數表示;

(4)M 表示乘客總飛行里程,由時間窗內總飛行公里數表示;

(5)D 表示飛機倉位折扣系數均值,由時間窗內乘坐倉位對應的折扣系數的平均值表示;

(6)I 表示乘客消費間隔,由時間窗內乘機平均間隔表示;

(7)E 表示乘客消費總額,由時間窗消費累計表示。

從某航空公司開源數據集中提取PRFMDIE 模型的七種特征,并畫出分布圖,如圖1-圖7 所示。P 特征的分布如圖1 所示,R 特征的分布如圖2 所示,F 特征的分布如圖3 所示,M 特征的分布如圖4 所示,D 特征的分布如圖5 所示,I 特征的分布如圖6 所示,E 特征的分布如圖7 所示,圖中橫坐標和縱坐標分別表示特征值和特征值的數量。從圖1-圖4 以及圖6-圖7 中可以看出,P、R、F、M、I 和E 六個特征不屬于正態分布,因此P、R、F、M、I 和E 六個特征歸一化采用離差標準化,如公式1。從圖5 可以看出,D 特征近似正態分布,因此本文采用標準差標準化,公式2。PRFMDIE模型的七種特征歸一化后的數據如表1 所示。

圖1:P 特征分布

圖2:R 特征分布

圖3:F 特征分布

圖4:M 特征分布

圖5:D 特征分布

圖6:I 特征分布

圖7:E 特征分布

表1:部分PRFMDIE 特征歸一化數據

4 客戶分類

模糊C 均值聚類簡稱FCM,FCM 融合了模糊理論,使用隸屬度表示每個樣本的類別屬性。假設樣本集合為將樣本集X 其分成C 個子集,設為每個子集的中心,Jm是目標函數,如式3 所示。

其中m 是模糊因子,i 是樣本索引,j 是聚類中心索引,uij是樣本xi屬于聚類中心cj的隸屬度,|| ||2是樣本與聚類中心的距離。聚類過程是:在優化目標函數Jm過程中,計算每個樣本的所有類別的隸屬度,其中隸屬度高的類別就作為樣本的類別詳細過程描述如下:

(1)確定類別參數C,模糊因子m,隸屬度矩陣初始化,并滿足公式4。

其中s 表示迭代更新次數,

將PRFMDIE 模型中的七種特征組成特征向量d,d∈R7。所有乘客的PRFMDIE 特征組成特征矩陣其中N 表示所有乘客數量。將特征矩陣作為模糊C 均值聚類方法的輸入,可以得到乘客分類,乘客分類結果TSNE 可視化結果如圖8 所示,其中五類乘客由五種顏色表示,黃色表示最優質乘客。從圖8 中可以看出,聚類結果只有少數離群點,大部分同類型乘客被歸為一類,說明模糊C 均值聚類方法在解決乘客分類問題中有效,可以很好的將乘客分為5 類。本文實驗還對比了Kmeans 聚類結果,如圖9 所示。對比發現,Kmeans 聚類中不同類型的樣本混雜要高于模糊C 均值聚類的結果,如圖9 中實線標注區域所示。

圖8:模糊C 均值聚類結果可視化

圖9:Kmeans 聚類結果可視化

5 結論

本文對某航空公司乘客PRIFEMD 特征進行了可視化分析,確定了歸一化方法,D 特征采用標準差標準化,其他特征采用離差標準化。乘客分類采用了模糊C 均值聚類方法,將最有價值客戶分離出來,結果采用TSNE 方法進行可視化表示。

猜你喜歡
可視化分類特征
基于CiteSpace的足三里穴研究可視化分析
基于Power BI的油田注水運行動態分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
分類算一算
基于CGAL和OpenGL的海底地形三維可視化
如何表達“特征”
“融評”:黨媒評論的可視化創新
傳媒評論(2019年4期)2019-07-13 05:49:14
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
主站蜘蛛池模板: 国产女同自拍视频| 996免费视频国产在线播放| 99er精品视频| 99热这里只有免费国产精品| 色悠久久久久久久综合网伊人| 91在线一9|永久视频在线| 无码免费视频| 91福利在线观看视频| 专干老肥熟女视频网站| 99久久精品视香蕉蕉| 国产成人综合在线视频| 伊人成色综合网| 欧美精品另类| 亚洲AⅤ波多系列中文字幕| 国产资源免费观看| 国产丝袜无码一区二区视频| 成年A级毛片| 亚洲精品自产拍在线观看APP| 青青青国产视频| 亚洲无卡视频| 91无码网站| 国产理论最新国产精品视频| 亚洲欧美天堂网| 国产视频欧美| 影音先锋亚洲无码| 亚洲天堂视频网| 91久久偷偷做嫩草影院免费看| 欧美亚洲国产视频| 麻豆精品在线| 日韩欧美在线观看| 国产精品嫩草影院av| 色综合久久88色综合天天提莫| 亚洲人在线| 亚洲中文字幕久久精品无码一区| 71pao成人国产永久免费视频| 国产亚洲视频在线观看| 中文字幕亚洲电影| 99re热精品视频国产免费| 亚洲成人黄色网址| 亚洲系列中文字幕一区二区| 免费激情网站| 日韩中文无码av超清| 毛片在线播放a| 亚洲a级在线观看| 日本精品视频| 亚洲天堂在线视频| 激情无码视频在线看| 国产无吗一区二区三区在线欢| 午夜精品久久久久久久99热下载 | a毛片在线| 18禁高潮出水呻吟娇喘蜜芽| 天天干伊人| 国产成人免费观看在线视频| 色成人亚洲| 偷拍久久网| 国产精品久久久久久影院| 97se亚洲综合不卡| 操美女免费网站| 国产精品男人的天堂| 国产在线视频二区| 亚瑟天堂久久一区二区影院| 亚洲αv毛片| 国产AV毛片| 欧美成人a∨视频免费观看| 国产免费高清无需播放器| 国产精品护士| 精品国产香蕉伊思人在线| 免费国产不卡午夜福在线观看| 在线观看精品国产入口| 国产成人综合在线观看| 2020亚洲精品无码| 国产在线精品美女观看| 中文字幕无码av专区久久| 日本久久免费| 456亚洲人成高清在线| 天天综合网色| 日韩av无码精品专区| 国产性爱网站| 亚洲欧美自拍一区| 99一级毛片| 奇米精品一区二区三区在线观看| 久久久久久国产精品mv|