











摘 要:商業(yè)銀行在信用卡營銷的過程中,面臨著存量客戶流失的嚴峻問題。通過數(shù)據(jù)挖掘?qū)α魇У目蛻暨M行分析,不僅能挽留可能流失的客戶,也可以使商業(yè)銀行有針對性地優(yōu)化產(chǎn)品、提升管理。文章利用決策樹算法建立信用卡客戶流失預測模型,對信用卡流失客戶進行預測。經(jīng)過測試,模型運行效果良好,具有較好的客戶管理意義。
關鍵詞:信用卡;客戶關系管理;決策樹;流失預測
中圖分類號:F832.4;F224-3 文獻標識碼:A 文章編號:1005-6432(2022)08-0049-04
DOI:10.13939/j.cnki.zgsc.2022.08.049
近年來,不少商業(yè)銀行的業(yè)務重心已從公司業(yè)務向零售業(yè)務轉(zhuǎn)移。公司業(yè)務客戶集中,產(chǎn)品偏個性化,受宏觀經(jīng)濟、政策導向及個別客戶業(yè)務波動影響大;而零售業(yè)務小而分散,產(chǎn)品相對標準化,批量營銷、維護,行業(yè)分布貼近民生,周期性弱,受市場影響小,基礎客群較為穩(wěn)定。部分轉(zhuǎn)型的商業(yè)銀行中,零售業(yè)務創(chuàng)造的營業(yè)收入比重過半,已超過公司業(yè)務的營業(yè)收入,零售業(yè)務在商業(yè)銀行中的地位逐漸凸顯。
而信用卡作為零售業(yè)務的“排頭兵”,在銀行零售業(yè)務的發(fā)展過程中占有舉足輕重的地位。信用卡業(yè)務的前期推廣需要大量人力、物力的投入來占領市場,構建信用卡生態(tài)圈,同業(yè)間競爭非常激烈。
隨著互聯(lián)網(wǎng)金融的快速發(fā)展,各大網(wǎng)絡平臺也陸續(xù)推出了花唄、京東白條等類信用卡產(chǎn)品。這些互聯(lián)網(wǎng)平臺不僅有著天然的消費場景,而且結合大數(shù)據(jù)的優(yōu)勢,利用金融科技對消費客戶進行精準營銷,無論營銷的覆蓋面,還是精準度都大大優(yōu)于傳統(tǒng)商業(yè)銀行,使得信用卡市場競爭更加激烈。
1 背景
就商業(yè)銀行而言,信用卡新客營銷的難度和成本遠大于存量客戶的挽留成本。信用卡新客戶的營銷難度逐年加大,需要由專業(yè)的團隊發(fā)掘客戶需求、產(chǎn)品準確推送并做好相關的售后服務,同時還會面臨同質(zhì)產(chǎn)品的競爭,現(xiàn)在營銷往往還會借助場景的搭建。而信用卡的存量客戶已和銀行建立了業(yè)務關系,只需了解客戶流失的原因,設計有針對性的挽留方案,重新激活客戶需求(李偉等,2019)。
G銀行的信用卡銷戶概念包括兩類:銀行根據(jù)一定的規(guī)則主動銷戶和客戶主動銷戶。銷戶的原因很多,在整個信用卡業(yè)務周期的過程中都有可能產(chǎn)生銷戶行為。
G銀行對于停滯客戶會定期進行提取,然后給這批停滯客戶發(fā)短信進行觸動,如果沒有效果,會集中進行銷戶處理。如果客戶主動打電話要求銷戶,G銀行會安排銷戶挽留,通常客服人員會在電話中對要求銷戶的客戶進行挽留。
目前,G銀行每年信用卡的銷戶量超過5萬,G銀行只有在客戶提出申請銷戶,或者客戶滿足銀行主動銷戶規(guī)則的時候,G銀行才會安排銷戶挽留。由于無法對客戶是否流失進行預測,因此銷戶挽留沒有提前量。
2 理論基礎
2.1 數(shù)據(jù)挖掘理論
現(xiàn)今的信息化社會,數(shù)字生活已滲透各個角落,人們的生產(chǎn)、生活中留下了各式各樣的數(shù)據(jù)。數(shù)據(jù)挖掘就是將生活中的數(shù)據(jù)刪減、填補、清洗后,將參差不齊的信息整理為具備分析意義的基礎數(shù)據(jù),從中提取有價值的數(shù)據(jù),尋找內(nèi)部規(guī)律,發(fā)掘隱藏含義,作為決策或者預測的依據(jù)。
金融、電信、醫(yī)療等行業(yè)擁有龐大的客戶信息,具備數(shù)據(jù)挖掘的先天優(yōu)勢。特別是銀行業(yè),隨著金融科技的全面推廣,不少商業(yè)銀行已將大數(shù)據(jù)、區(qū)塊鏈、人工智能等科技手段融入到零售業(yè)務的管理中,及時在市場中搶占了技術優(yōu)勢。
2.2 客戶關系管理理論
客戶關系管理(簡稱CRM)原本是企業(yè)生產(chǎn)經(jīng)營中的一個概念,指企業(yè)不應僅以簡單的產(chǎn)品銷售為目的,而更強調(diào)以客戶為中心的一系列綜合服務方案。提出企業(yè)應通過現(xiàn)代的信息技術和科技手段,在生產(chǎn)、銷售和服務等方面提升自己的經(jīng)營管理能力,為客戶提供差別化的個性服務,提高客戶的滿意度,實現(xiàn)收益的最大化。
降低客戶流失率,更是客戶關系管理的基礎要求。提前對可能流失的客戶進行預測,根據(jù)不同客戶的特征,分別制訂個性化的客戶關懷和挽留策略。后臺服務創(chuàng)造的價值,可以超過前臺營銷,企業(yè)綜合管理能力的提升可以帶來“雙贏”的良好局面。
3 實證研究
3.1 樣本數(shù)據(jù)
樣本數(shù)據(jù)是指客戶主動聯(lián)系銀行“申請銷戶”或者銀行發(fā)起執(zhí)行“申請銷戶”的動作,即可定義為“流失”;對應的流失時間分別為客戶主動“申請銷戶”的時間或者銀行執(zhí)行“申請銷戶”的時間。流失客戶在樣本數(shù)據(jù)中定義為正樣本。
與流失客戶對照的是非流失客戶,取某個時間點上,其觀察期內(nèi)沒有流失,同時在表現(xiàn)期內(nèi)有完整的行為數(shù)據(jù)的客戶,即為非流失客戶。非流失客戶在樣本數(shù)據(jù)中定義為負樣本。
樣本數(shù)據(jù)從基礎數(shù)據(jù)中抽取2019年和2020年部分行為數(shù)據(jù),觀察期定為6個月,取2019年10月1日至2020年9月30日的流失客戶構成正樣本,取2019年10月1日的非流失客戶作為負樣本,構成整個樣本數(shù)據(jù)。
基于當前數(shù)據(jù),選擇6個觀察點來設定觀察期和表現(xiàn)期的時間窗口,6份正樣本的流失客戶在觀察期內(nèi)都沒有流失,但在表現(xiàn)期內(nèi)逐漸申請銷戶或者由銀行進行批量銷戶,見表1。通過觀察正樣本的消費、取現(xiàn)、還款、查詢行為的次數(shù)、金額、時間等趨勢變化,同時有條件的判斷客戶的投訴、違約、遲繳、爭議賬等行為來預測我行客戶流失(鄧致,2019)。
基于2019年10月1日至2020年9月30日的銷戶客戶數(shù)據(jù)統(tǒng)計個人流失客戶,剔除其中的高端卡客戶、測試客戶、銀行內(nèi)部客戶等
3.2 變量選擇
基于對本次業(yè)務需求,建模過程中需要用到信用卡客戶的屬性特征及價值特征,通過對G銀行信用卡中心客戶信息的分析,從數(shù)據(jù)源中選取的變量主要包括以下四類:①個人基本信息:性別、年齡、職業(yè)、學歷、戶籍、婚姻等;②卡基本信息:最高卡齡、持有卡數(shù)以及信用額度等;③客戶流失信息:是否流失標識、流失時間、是否主動流失等信息;④客戶行為信息:消費、轉(zhuǎn)賬、還款等行為信息,最近查詢間隔天數(shù)等信息。
對以上幾類的變量進行篩選,從中選取客戶畫像特征明顯、卡類信息差別性較大,具有典型客戶行為動作,對可能導致未來客戶流失關系較大的變量,剔除關聯(lián)性弱,不具備分析意義的維度。
精簡分析變量,盡量減少其他數(shù)據(jù)的干擾性,從中選取43個有代表性的寬表變量,作為模型分析數(shù)據(jù)。其中部分寬表變量如表2所示(程勇等,2019)。
3.3 確定算法
信用卡客戶流失預測模型的目的是在客戶提出申請銷戶或者滿足銷戶規(guī)則之前及早的預測到客戶流失,即可以將客戶服務與關懷提前,從而降低客戶銷戶率。故根據(jù)客戶屬性特征及過去一段時間內(nèi)的行為特征,預測信用卡客戶在未來一段時間內(nèi)流失的可能性是建模需求的核心。
在對特征變量初步分析后,用數(shù)據(jù)分析工具SPSS提供的模型進行訓練和測試,分別選擇決策樹和神經(jīng)網(wǎng)絡模型進行訓練,通過對其結果進行比較,發(fā)現(xiàn)決策樹具有較好的性能并且容易理解,因此選擇決策樹C5.0作為預測模型 (張宇等,2015)。
決策樹的圖形表示是一種倒樹形的結構,其中每個內(nèi)部節(jié)點表示一個屬性上的判斷,每個分支代表一個判斷結果的輸出,最后每個葉節(jié)點代表一種分類結果。通過學習樣本得到一個決策樹,這個決策樹能夠?qū)π碌臄?shù)據(jù)給出正確的分類。決策樹C5.0是基于C4.5算法的升級,更適用于數(shù)據(jù)挖掘。在模型建立階段使用代價矩陣調(diào)整置信率,同時使用Boosting技術多次迭代以調(diào)整樣本權重,提高了模型預測的準確性。
3.4 模型建立
基于確定的樣本數(shù)據(jù)庫,利用SPSS數(shù)據(jù)分析工具構建決策樹信用卡客戶流失預測模型,模型的應變量為“是否流失標識”,其定義如表3所示。
由于主動申請銷戶的客戶數(shù)量過少,因此在建模過程中不區(qū)分主動或者被動銷戶,只考慮流失客戶。另外,未來保證非流失客戶在觀察期內(nèi)有完整的行為數(shù)據(jù),因此非流失客戶需要成為信用卡客戶半年以上。
模型訓練前,先根據(jù)上述是否流失標識定義做樣本數(shù)據(jù)的選擇。選擇流失與正常的客戶如表4所示。
隨機選定70%的數(shù)據(jù)作為訓練數(shù)據(jù),剩余30%的數(shù)據(jù)作為測試數(shù)據(jù),分布如表5所示。
在進行模型訓練的時候,對數(shù)據(jù)進行了處理加工,先使用特征選擇節(jié)點進行特征選擇,然后使用不同的模型進行訓練并比較了模型訓練的結果。
對于分類模型,判定模型結果好壞的指標有精確率、召回率和F測度,其公式如下:
精確率=模型預測為正且實際為正的樣本數(shù)量模型預測為正的樣本數(shù)量(1)
召回率=模型預測為正且實際為正的樣本數(shù)量實際為正的樣本數(shù)量(2)
F測度=2×精確率×召回率精確率+召回率(3)
在實際業(yè)務開展中,特別是流失預測模型中,需要提高模型的覆蓋率,以盡可能的識別所有可能流失的客戶,同時需要提高模型的精確度。在模型訓練過程中設置不同的代價矩陣來獲得不同的模型性能。在默認設置下精確度達到0.76以上,但是只覆蓋0.43左右的可能流失的客戶。
對業(yè)務部門來講,可以在市場營銷活動的時候覆蓋盡可能多的可能流失的客戶。這時候,需要訓練模型進一步提高其召回率,通過調(diào)整模型的代價函數(shù),使模型的覆蓋率提升,而其精確率還滿足一定的條件。具體設置如圖1所示。
在該設置下,模型訓練后的變量重要性如圖2所示。
前十變量重要性依次是:最近消費間隔天數(shù)、最近查詢間隔天數(shù)、平均還款次數(shù)、消費是否校驗密碼、最近動賬交易間隔天數(shù)、平均還款金額、平均查詢次數(shù)、最高卡片等級、平均消費金額、年齡。
其訓練數(shù)據(jù)上的混淆矩陣如表6所示(0:未流失;1:流失):
測試數(shù)據(jù)上的混淆矩陣如表7所示(0:未流失;1:流失):
在測試集和訓練集上的增益圖如圖3所示。
其模型結果的性能指標如表8所示。
從模型結果可以看到,通過調(diào)整模型設置,隨著召回率上升到0.8以上,模型精確率下降到0.45左右,雖然精確率下降明顯,但覆蓋率也同步大幅提升,達到本次模型建立的目的,將預測范圍盡可能覆蓋到可能流失的客戶。F-測度值在默認參數(shù)時測試值為0.55,模型調(diào)整后F-測度值略有上升,說明實驗的有效性也有所提高。
從AUC和Gini系數(shù)的指標來看,原模型測試數(shù)據(jù)AUC值為0.868,Gini系數(shù)為0.736,調(diào)整后數(shù)值均有提升,并且在訓練數(shù)據(jù)上模型的表現(xiàn)更好。從這兩個指標來看,模型的預測能力均處于可以接受的范圍內(nèi),因此可以在實際應用中使用該模型進行預測。
4 模型應用
信用卡客戶流失預測模型主要結合信用卡業(yè)務開展,作為客戶挽留或者市場營銷等業(yè)務活動的參考依據(jù)。不同于其他模型,信用卡客戶流失預測模型應用需注意以下兩點。
第一,盡管流失預測模型能夠幫助銀行判斷可能流失的客戶,但是在流失真正發(fā)生前,銀行很難直接利用其名單進行客戶挽留。因此,需要將流失預測的結果與客戶關懷或者有針對性的市場營銷活動結合起來。
第二,信用卡客戶流失預測模型的建設,在流失客戶選取上傾向于選擇更多的樣本。在模型的實際應用中,由于流失客戶數(shù)量并沒有這么多,因此精確度會下降。故流失預測模型最為看重的是召回率,即盡可能的不要漏掉可能流失的客戶,以保障模型能夠幫助銀行盡可能的識別可能流失的客戶,從而通過客戶關懷或者營銷活動進行更多的接觸,以降低客戶的流失率。
信用卡客戶流失預測模型應參照市場營銷活動的應用場景,在制定和執(zhí)行市場營銷活動的過程中,借助模型的能力提高業(yè)績考核,改造和優(yōu)化現(xiàn)有業(yè)務流程。因此,信用卡客戶流失預測模型的應用建議落地在商業(yè)銀行的營銷管理中,成為整體營銷管理系統(tǒng)的一部分,對預測流失的客戶進行客戶關懷,或者開展有針對性的提前挽留、市場營銷等活動。
模型建設中以G銀行存量客戶為依據(jù),通過決策樹進行客戶分類預測,有較好的本地化效果。但是商業(yè)銀行的客戶結構是不斷變化的,故在模型后續(xù)的應用過程中需根據(jù)客戶數(shù)據(jù)進行動態(tài)調(diào)整,提高預測的精準度。
5 總結與展望
本文通過對G銀行存量信用卡客戶的數(shù)據(jù)挖掘,用決策樹C5.0算法進行建模,對信用卡流失客戶進行預測。經(jīng)過測試該模型運行效果良好,召回率在可接受范圍,下一步可將該模型投入到實際應用中。后續(xù)一方面將信用卡客戶流失預測模型應用到營銷管理過程中,對可能流失的客戶實施挽留策略,實時監(jiān)控流失率的變化;另一方面定期更新基礎數(shù)據(jù),修正、優(yōu)化模型,不斷提升預測的覆蓋面和準確性。
參考文獻:
[1]程勇,梁吉祥.基于數(shù)據(jù)挖掘的掌銀客戶流失預測建模方法研究[J].中國金融電腦,2019(8):51-60.
[2]鄧致.信用卡客戶流失預測模型研究[J].金融科技時代,2019(9):22-25.
[3]李偉,孫新杰,陳偉.基于數(shù)據(jù)挖掘的客戶流失預測研究[J].電腦知識與技術, 2019,15(10):7-8.
[4]張宇,張之明.一種基于C5.0決策樹的客戶流失預測模型研究[J].統(tǒng)計與信息論壇,2015,30(1):89-94.
[作者簡介]沈哲(1981—),男,漢族,浙江寧波人,研究生,供職于中國光大銀行股份有限公司寧波分行,研究方向:銀行金融管理。
1913500783331