柳睿


航空市場競爭的加煎和航空業(yè)的發(fā)展,要求國內(nèi)航空公司必須利用大量數(shù)據(jù)中隱含的知識才能抓住時機。如此,客戶是企業(yè)至關(guān)重要的成功因素和利潤來源。將數(shù)據(jù)挖掘、機器學習技術(shù)應用于客戶關(guān)系管理,能夠為企業(yè)提供經(jīng)營和決策的量化依據(jù),使企業(yè)能夠把握重點,分輕重急緩,有效利用有限資源,拓展利潤上升空間。
針對客戶關(guān)系管理中客戶價值這一問題,通過對航空公司現(xiàn)有數(shù)據(jù)倉庫中客戶信息的分析,本文采用RFM模型得到必要指標變量,再運用Kmeans算法對RFM所褥出的指標進行聚類,將客戶群遜分為價值不同的五類客戶群,并對每個客戶群進行分析和總結(jié),提出了針對每類客戶群的營銷策略。
RMF模型客戶價值分析 Kmeans
背景介紹
航空公司同樣也面臨這樣的何如劃分客戶群的問題,而客戶細分就是能夠解決這種問題的關(guān)鍵。國內(nèi)某航空公司市場面臨旅客流失、資源為充分利用等經(jīng)營危機。因此本文的日標足利用某航空公司的會員檔案信息和其航班乘坐記錄,通過建市合理的客戶價值評估模型,對客戶進行分群,分析比較不同客戶群的客戶價值,并制定相應的個性化營銷策略。本文運用RFM模型對客戶分類。
數(shù)據(jù)描述與預處理
(1)數(shù)據(jù)統(tǒng)計分析
原始數(shù)據(jù)含有44個變量屬性,我們對原始數(shù)據(jù)有個初步的描述理解。由數(shù)據(jù)可知男性在觀測窗幾內(nèi)飛行次數(shù)遠超與女性。會員級別為4的客戶飛行次數(shù)最多,其次足會員級別為5的客戶,會員級別為6的客戶飛行次數(shù)最少,可以知道級別越高(4級最高,6級最低)飛行次數(shù)越多,可能是由于級別越高,得到的折扣率相對較高。
(2)數(shù)據(jù)預處理
在本案例中,以2014年3月31日為結(jié)束時間,選取寬度為兩年的時間段作為分析觀測窗口(也就是時間間隔為2012年4月1H至2014年3月31日),抽取觀測窗幾以內(nèi)有乘機記錄的所有客戶的詳細數(shù)據(jù)形成歷史數(shù)據(jù),并將數(shù)據(jù)分為三個維度,分別是客戶基本信息、乘機信息和積分信息,總共包含會員卡號、入會時間、年齡、工作地所在省份、觀測窗口的結(jié)束時間、乘機積分、飛行公里數(shù)等44個變量屬性。
首先對數(shù)據(jù)做預處理,因為總共有6萬多條記錄,而缺失值占比較小,所以面對有缺失值或異常值的情況,選擇贏接刪去。原始數(shù)據(jù)存在票價為0、折扣率最小為0、總飛行公里數(shù)大于0的記錄,票價最小為0的有可能,很有可能是折扣為0或是會員積分兌換,所以在此刪去票價為0、平均折扣率為0,總飛行公里數(shù)大于0的記錄和總飛行總數(shù)大于0的記錄。
再有一個是變量太多的問題,面對這個,選擇和RFM模型相關(guān)的變量,R、F、M分別代表消費時間間隔、消費頻率和消費金額。但是在航空公司這樣一個特殊的環(huán)境中,消費金額并不能代表客戶的消費能力與水平,因為某些積分兌換也同樣能夠使票價為0,所以選用總行程代替消費水平。最終決定以下5個指標。
R:最后一次飛行距離結(jié)束的月數(shù);F:乘坐飛機次數(shù);M:飛行總里程數(shù);C:折扣系數(shù)的平均數(shù);L:會員人會至觀測結(jié)束的月數(shù)。
通過計算可以得出除了F和M以外,其他變量相關(guān)性不高。當然這個也是可以理解的,隨著飛行次數(shù)的增多,飛行總里程數(shù)也會相應增多,但是為了構(gòu)建RFM模型需要這指標變量,多以便將F和M同時放入其中。
模型建立
價值分析模型最重要的是對客戶進行分群,這里根據(jù)以上5個指標對客戶進行分群。當然,在此之前為了排除量綱對模型的影響首先要將指標標準化。我們將客戶劃分為重要價值客戶、重要發(fā)展客戶、重要挽留客戶和一般價值、低價值客戶5類。為了得到這個結(jié)果,需要對客戶數(shù)據(jù)根據(jù)以上指標進行聚類分析,在此選用kmeans算法。
通過Kmeans算法,可以聚類出以上5類,并且個數(shù)幾乎相等,劃分比較鮮明。得到的聚類結(jié)果如下:
由上表,對聚類結(jié)果進行特征分析,其中客戶群1(類1)在M、F屬性上最大,在R的屬性上最小;客戶群2在L屬性上最大,在M、F上最小;客戶群3在R上最大,在M、F上最小;客戶群4在c上最大,在M、F上最小;客戶群5在各個屬性上相對都普遍偏小。因此我們可以對此分類。
營銷策略
由于每個類別都有顯著不同的表現(xiàn)特征,所以將其分為5類。
重要價值客戶:這類客戶的平均折扣率會比較高,因為所乘坐的艙位等級較高。同時他們的最后一次飛行距離結(jié)束的月數(shù)(R)應較低并且乘坐次數(shù)(F)或者飛行總里程數(shù)(M)較高,對于航空公司是重要價值客戶,是最為理想的客戶類型,對航空公司的貢獻最大。所以應該將資源優(yōu)先投放在他們身上,是這類客戶滿意度上升,提高其忠誠度與滿意度,盡可能延長這類客戶的高水平消費。
重要發(fā)展客戶:這類客戶的人會時間(L)較短,最近乘坐時間距離觀測窗口結(jié)束時間較短,但是F或M較低。他們是潛在價值客戶,有很大的發(fā)展前景,一旦把握住了這樣的客戶會為公司創(chuàng)造巨大的利益。航空公司要努力促使這類客戶增加在本公司的乘機消費。通過客戶價值的提升,加強這類客戶的滿意度,從而逐漸是他們成為公司的忠誠客戶。
重要挽留客戶:這類客戶的入會時間(C)較長,同時乘坐次數(shù)(F)和總里程數(shù)(M)較高,但是R很高,也就足已經(jīng)較長時間沒有乘坐過本公司的航班了。這類客戶若不注意挽留很有可能造成客戶流失。航空公司要做到隨時為他們發(fā)送相應的這家機票或者其他營銷信息,刺激消費,重點觀察這類客戶的最近消費時間、消費次數(shù)等的變化,及時對他們的營銷信息作出調(diào)整。
一般價值客戶:這類客戶縮成航班的平均折扣率(C)較低,較長時間沒有乘坐過本航空公司航班(R)較高,人會時間也短。這類客戶正常處理,在公司搞活動,打折促銷時對其發(fā)送營銷信息,來保持和客戶之間的聯(lián)系即可。
低價值客戶:這類客戶縮成航班的平均折扣率(C)很低,較長時間沒有乘坐過本航空公司航班(R)較高,人會時間也短。這類客戶對公司的貢獻很小,對他們的營銷策略同上一般價值客戶。
然后將客戶群5類與上述類別一一對應,可得到以下表。
[1]賀昌正.基于數(shù)據(jù)分組處理方法的聚類分析模型[J]系統(tǒng)工程學報,2008,23 (2),222-227
[2]曾玉.信息檢索的模糊聚類分析模型[J]情報學報,2004,23(4):433-436
[3]劉開第.上市公司殼資源質(zhì)量的聚類分析模型[J]數(shù)量經(jīng)濟技術(shù)經(jīng)濟研究,2002,19(9),72-75
[4]蘇瑛.聚類分析模型在房地產(chǎn)投資決策中的應用研究[J]西安建筑科技大學,2004