[摘要] 隨著國內加息周期的到來,商業銀行過于依賴利差與公司業務的利潤增長模式將難以為繼。本文在商業銀行人民幣個人理財業務不斷發展的基礎上,探討了客戶群與人民幣個人理財產品(服務)之間的最優匹配規則與其算法設計,提出了一個基于商業銀行客戶服務挖掘的研究模式及其相關算法,為商業銀行客戶服務管理提供了一種新的思路。
[關鍵詞] 服務匹配;人民幣理財;客戶服務挖掘
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2011 . 14. 024
[中圖分類號]F830.33 [文獻標識碼]A [文章編號]1673 - 0194(2011)14- 0038- 05
1 引言
從2010年末到2011年初,央行連續三次的加息與提高銀行存款準備金率,標志著2011年的信貸緊縮周期正式開始。另外據北京銀聯信投資顧問有限公司2009年的統計數據顯示,信貸業務和公司業務占據銀行總體收入90%以上,因此銀行的利潤空間進一步縮小[1]。同時,銀行的人民幣個人理財產品存在同質化嚴重與供過于求的狀況[2]。本文認為,銀行可以通過提升人民幣理財產品的客戶服務水平,使其成為銀行新的利潤增長點,最終為銀行提供一種新的客戶服務管理思路。
隨著原有國有商業銀行的股份制改造和大量新興商業銀行的崛起,客戶服務管理已成為商業銀行經營管理的核心環節之一。例如,上海浦東發展銀行南京分行榮獲“2010年度金融服務最佳銀行”殊榮。它以“新思維 心服務”為宗旨,建立了以服務樹品牌的理念。但是人民幣個人理財產品在客戶服務領域依然存在較多的困難。目前在銀行內部,客戶服務管理的水平參差不齊,客戶服務管理信息化水平有限,且現有的商業銀行分級授權經營模式存在資源缺乏共享性的問題[3]。同時,“20/80”定律在銀行客戶管理中普遍存在,20%的優質客戶可以給銀行帶來超過80%的利潤,且這些優質客戶具有較強的動搖性。這一點在同質化嚴重的人民幣個人理財業務方面體現得尤為明顯。
本文以商業銀行人民幣個人理財業務為基礎,建立一個基于客戶行為分析的客戶群與服務之間的最優匹配規則模型與求解算法,在銀行客戶服務管理信息系統中建立一個從客戶群到服務之間的橋梁,同時為人民幣個人理財產品的市場營銷提供一種全新的思路,具體表現在銀行所推薦的理財產品能比較合適客戶當前的需求,進而提升理財產品的銷售業績,為銀行業過于依賴利差收入和公司業務收入問題提供解決方法。
2文獻綜述
2.1 銀行客戶服務挖掘現狀
目前,在銀行客戶服務管理方面,普遍基于客戶自然屬性來實現客戶劃分,并在此基礎上進行數據挖掘方面的研究;亦有部分研究是以客戶忠誠度為標準實現客戶群劃分[4],以此為基礎,主要研究客戶群與產品(服務)之間的匹配關系。但是這種研究存在一個比較現實的問題,即某一個客戶個體的具體行為可能與其自然屬性所對應的行為不一致[5]。經過多次實地調研發現,大部分銀行在實際運用中存在不同的局限性。例如,在客戶群與銀行各類產品服務的匹配上,匹配方法更多是從管理者的主觀認識出發,數據挖掘程度有限。同時,基于客戶自然屬性劃分的客戶群相對固定,在客戶的個性化服務方面較依賴支行客戶經理的經驗與知識儲備。在客戶個性化服務領域,招商銀行的水平在國內相對領先,尤其是它率先提出私人銀行的理念與應用[6],但其個性化服務依然是以客戶經理的經驗為主,輔以數據挖掘技術。
2.2 最優服務匹配在其他領域應用現狀
最優服務匹配相關算法研究在國內其他產業領域的應用水平在逐步提高。楊勝超、張瑞軍通過運用基于二分圖的Kuhn-Munkres算法,以學生的題目預選、自命題、未定題等多種情況增加學生對題目的整體滿意度,完成題目與學生的智能匹配[7]。呂巍利用K-means方法對中國移動市場顧客行為細分進行了研究,為顧客細分提出了一種比較適用的分析方法[8]。張紅梅、夏南強通過分析零售業應用數據挖掘的背景,給出了數據挖掘在零售業中的典型應用,并總結了實施數據挖掘項目的基本流程[9]。各領域對于最優服務匹配規則的應用與發展是參差不齊的,而適用性與精確性的限制導致最優服務匹配規則在銀行業中的應用一直處于嘗試階段,銀行業現階段距離理想化的客戶服務挖掘依然有很長的路要走。基于此,本文試圖為客戶服務挖掘在銀行領域的應用做一些嘗試與探討,特別是為基于客戶服務挖掘的客戶個性化服務做先導性研究與嘗試。
3基于客戶行為的客戶群劃分和客戶特征因子的提取
3.1 客戶行為指標體系與客戶信息庫
客戶行為指標體系是基于客戶行為分析而確定的,用來描述客戶行為特征的一系列指標。在客戶行為指標體系中,有兩類指標:一類指標是客戶的自然屬性,例如客戶的姓名、年齡、職業等;另一類則是客戶行為特征屬性。在基于客戶行為分析的指標體系中,客戶行為特征屬性是最主要的,而客戶的自然屬性較為次要。對于客戶行為的特征屬性,一般是從客戶的交易行為中分析統計得到,例如客戶的資產金額(本行)和風險偏好等。客戶指標體系建立的基礎是客戶的自然屬性與行為特征屬性的影響權重。只有確定了影響權重才能實現建立客戶指標體系,因為客戶指標體系并不是兩類屬性的簡單合并,而是從兩者中抽取某些權重比較大的作為指標體系的一部分。權重的確定是依據銀行的具體要求,要求越細致,權重選取下限越低。
客戶信息庫則是一個基于客戶行為指標體系而建立的數據庫,用于存儲客戶的自然信息與行為信息。在建立數據庫時,必須按照關系規范化理論來實現。
3.2 服務指標體系與標準服務庫
服務指標體系是用來描述服務或產品特征的一系列指標。服務指標體系中的各項指標應從每種服務的自身屬性中分析得出。由于服務是相對固定的,因此服務指標體系主要是基于服務的自然屬性。由于銀行的客戶服務是以客戶為中心的,因此服務指標體系的建立亦應以客戶的需要為中心,即基于客戶行為指標體系。否則,在后續模型建立中將無法實現客戶與服務的匹配。在客戶行為指標體系與服務指標體系的對應關系上,主要是在客戶行為與產品特征方面。例如與客戶行為指標體系的“風險偏好”對應的是服務指標體系的“風險程度”。
標準服務庫是存儲服務特征集的數據庫。因此,標準服務庫必須遵循數據關系規范化理論的要求。在建立時,依據銀行產品的物理特性、服務指南和所屬行業規則,演化出該類產品所有可能的元服務項目,建立元服務項目集。依據服務指標體系對元服務項目集進行演化,得到標準服務庫。
3.3 基于云模型的軟劃分方法
基于云模型的軟劃分方法,對指標化后的客戶信息與標準服務信息中的屬性值進行定性化處理。基于云模型的軟劃分方法最早由王虎于2009年提出[10]。與軟劃分方法相對應的是硬劃分方法。硬劃分方法,即人為地定義劃分標準,因此缺乏必要的模糊性。而軟劃分方法則將推理過程中的模糊性與隨機性結合起來,可以使得劃分更加合理,轉換更加自然。
在完成了客戶信息庫與標準服務庫的建立后,大量的數據通過各種手段的演化進入這兩個數據庫中。由于在客戶群劃分方法中需要對兩個數據庫中的定量數據進行定性化分析,因此通過前文所述的基于云模型的軟劃分方法來對庫中各屬性進行定性描述。
調用逆向云算法,對客戶信息庫中的各類定量數據,例如客戶年齡,進行求解,得出期望、熵、超熵,即(Ex, En, Hn)。基于(Ex, En, Hn),調用正向云算法確定各屬性的合理定性劃分上下限。基于已劃分的上下限,對數據進行定性化描述。依據定性數據的特點,對其進行離散數值描述。
3.4 基于K-means算法的客戶群聚類
目前已有大量的聚類算法,算法的選擇取決于數據的類型、聚類的目的和應用。本文利用K-means算法對人民幣個人理財用戶行為進行聚類分析。基于K-means算法的客戶群聚類如圖1所示。
在K-means算法中,K值的確定可以依據兩個數據不相似性閾值ε來進行求解。當ε的值為零時,每個數據點均作為初始中心,因此總能找出一個滿足條件的ε值 。確定ε的取值后,就可以確定聚類的數目和初始點的選取[11]。對于K值的確定與初始點的選取算法如下。
建立客戶集P{x1,x2,…,xn}并設定度量兩個數據不相似性閾值ε。從數據集P中取出一個點x1作為第一個類的中心:k=1,yk=x1。依據此,執行下列代碼,得到k個初始聚類中心Q{y1,y2,…,yk}。
for i = 2 to N
{
d(xi,ym) = min1≤j≤kd((xi,yj);
if d d(xi,ym)> ε then
{
k = k + 1;
yk = xi;
}
else
{
i = i + 1;
}
}
在完成K值和聚類中心的確定后, 為客戶指標體系中各個指標(除主鍵外)建立空間向量模型,將每個客戶的信息向量化,計算每一個客戶指標向量到K個初始凝聚客戶指標向量的空間距離,將每個客戶指標向量和最近的凝聚客戶指標向量分到一組,形成K個初始客戶群;計算這K個初始客戶群的重心(或均值),作為新的凝聚點,重新計算每一個客戶指標向量到初始客戶群重心的空間距離,將每個客戶指標向量和最近的客戶群重心分為一組,形成K個二次客戶群。重復進行步驟2和步驟3,直至每個新客戶群的重心與上一個客戶群重心之差收斂與零,即客戶群重心沒有明顯轉移為止,則完成客戶群聚類,否則重新確定客戶群重心,再求空間距離。
3.5 基于關聯規則的Apriori算法實現客戶群共性特征因子和客戶個性特征因子的提取
Apriori算法是發現關聯規則領域的經典算法,在本文中應用于客戶群共性特征因子和客戶個性特征因子的提取。Apriori算法將發現關聯規則的過程分為兩個部分。首先通過迭代,檢索出事務數據庫中的所有頻繁項集,即支持度不低于用戶設定的閾值的項集;再利用頻繁項集構造出滿足用戶最小信任度的規則。計算方法如下。
為找客戶群的頻繁項集Lk,通過Lk-1與自己連接產生候選k-項集的集合,將候選項集的集合記作Gk。設l1和l2是lk-1中的項集。記號li[j]表示li的第j項。假定客戶群中的各個指標按字典次序排序,執行連接Lk-1。其中如果客戶群中的前(k-2)個指標相同,則Lk-1的元素l1和l2是可連接的。算式表達即式(1)。
(l1[1]=l2[1])∧(l1[2]=l2[2])∧…∧(l1[k-2]=l2[k-2])∧(l1[k-1]=l2[k-1]) (1)
所以,連接l1和l2產生的結果項集是l1[1]l2[2]…l1[k-1]=l2[k-1],其中l1[1]l2[2]…l1[k-1]=l2[k-1]保證不產生重復。
Ck是Lk的超集,可以理解成Lk的擴充,但所有的頻繁k-項集均包含在Ck中。通過掃描數據庫,計算Ck中項集的支持度,并與最小支持度進行比較,確定Lk。在確定Lk后,Lk中的頻繁項即客戶群的共性特征因子,其與客戶群特征因子的差集即客戶個性特征因子。
4 最優匹配規則模型與修正方法
4.1基于二分圖的Kuhn-Munkres算法實現最優匹配模型
Kuhn-Munkres算法是Kuhn和Munkres分別于1955年和1957年獨立提出來。Kuhn-Munkres算法是求解二分圖最優匹配的經典算法。首先,先對二分圖進行定義。
定義1 如果圖G=(V,E)的頂點集合V可分為兩個集合X,Y,且滿足X∪Y=V,X∩Y=?準,則G稱為二分圖[12]。
其中,圖G的邊集用E(G)表示,點集用V(G)表示。由于在二分圖中邊集E(G)中存在多條邊,這些邊是點集V(G)中的某兩個點之間的關系,且每條邊均有其自身的權重。在此,可以通過運算求解出其中最優的匹配關系。下面是最優匹配的定義。
定義2有二分圖G=(X,Y,E),其中|X|=|Y|=匹配數,E中每條邊 (Xi,Yj)有權Wij≥0,若能找到一個匹配M(|M|=匹配數),滿足所有匹配的邊權和最大(或最小),則稱M為G的一個最優匹配。基于二分圖的Kuhn-Munkres算法示意圖如圖2所示。
由于Kuhn-Munkres算法可以實現對二分圖中最優匹配的求解(其中m=n),因此,可以將它運用到解決銀行中客戶群與服務之間的最優匹配問題。下面是利用Kuhn-Munkres算法實現客戶群與服務間最優匹配的計算方法[13]。
Gm,n=(Om,In,E)為一個二分圖,Om表示客戶群的集合,Ln是標準服務的集合,E是兩者邊的集合。其中,Om=(o1,o2,…,om),In=(i1,i2,…,in),E=(e11,e12,…,emn),Si,j(oi,ij)是任意邊的相似度,即eij=Sij(oi,ij)。eij=Sij(oi,ij)即某個客戶群與某個產品之間的相似度,即兩者的空間距離的相似度表示值。
步驟1:給出初始標號,l(oi)=,maxSij(oi,ij),l(ij)=0,其中i,j=1,2,…,t;t=max(n,m);
步驟2:利用Hungarian算法求解邊集Ei={(oi,ij)|l(oi)+l(ij)=sij(oi,ij)},Gi=(Om,In,Ei))及Gi中的完備匹配M;
步驟3:若M是Gi中的完備匹配,則M即是G的最優匹配,計算結束,否則進行下一步;
步驟4:在Om中找M的非飽和點o0,令以A←{o0},B←?準,A,B是2個集合;
步驟5:若PGi(A)=B,則轉步驟9,否則進行下一步,其中PGi(A)?哿In,是與A中結點鄰接的結點集合;
步驟6:找一結點i∈PGi(A)-B;
步驟7:若i是M飽和點,則找出i的配對點z,令A←A∪{z},B←B∪{i}轉步驟5,否則進行下一步;
步驟8:存在一條從o0到i的可增廣路徑R,令M←M?茌E(R),轉步驟3;
步驟9:按式(2)計算α值:
修改標號,根據公式(3),用l′求Ei,及Gi;
l′(v)=l(v)-α,v∈A,l(v)+α,v∈B,l(v),其他。(3)
步驟10:l←l′,Gl←Gi,轉步驟6。
通過Kuhn-Munkres算法可以實現對客戶群與產品之間的整體最優匹配效果,盡可能實現客戶群的最優匹配,為銀行的客戶群與產品之間建立一個準確的、能為銀行帶來更多利潤的映射關系。通過智能化算法更可以提升匹配效率,降低成本。
4.2 客戶個性特征因子與亞元服務項目集匹配修正方法
基于客戶群與服務的最優匹配建立的亞元服務項目集,可以嘗試利用客戶個性特征因子對其進行個性化修正,實現對客戶個體的個性化服務匹配。本文嘗試基于逆向選擇的遺傳算法來實現對亞元服務項目集的修正。遺傳算法的基本思路是對種群的不斷進化,實現對種群中個體的“優勝劣汰”,最終得到有最大適應度的個體作為最終種群。逆向選擇則是在完成若干輪種群進化后,選取“被淘汰”的個體組成待處理集。然后對待處理集中的個體與其他種群進行匹配分析,測試其適應度。若其適應度符合不被“淘汰”的要求則建立這些個體與新的種群間的映射關系。修正方法如下。
用某客戶群內的客戶個性特征因子來計算該客戶在該客戶群中的適應度。在客戶群進化過程中,采用排序選擇方法,將適應度低的客戶個體排除出該客戶群。在客戶群進化時不進行交叉和變異。經過若干輪的進化,將排除出原客戶群的客戶與其他客戶群進行匹配并測試其適應度。若適應度良好則建立該客戶與其他客戶群所對應服務的映射關系。若無法找到適應度良好的客戶群,則進行人工分析處理。
目前逆向選擇遺傳算法仍處于機制與模型研究階段,本文未提出與之相適應的具體算法模型。
5基于人民幣個人理財產品的實證研究
5.1 數據來源與數據統計分析
實證研究數據來自國內Z銀行某支行從2009年7月1日至2009年12月31日的人民幣個人理財業務交易數據和同時期的人民幣個人理財產品信息。其中包含客戶210人,分兩批進行實證分析。下文中以第一批數據為例,部分數據如表1、表2所示。為了方便描述,客戶與產品名稱均已編號。
對交易記錄進行整理,將產品名稱與產品信息進行關聯,再依據關系規范化理論處理數據表,令其符合規范化理論格式。然后對數據進行分類匯總,將零散的交易數據匯總成交易統計數據。
5.2 指標體系與數據庫建立
建立客戶行為指標體系和服務指標體系。客戶行為指標體系中有客戶編號、性別、年齡、風險偏好、持有時間和購買能力。服務指標體系中有產品名稱、風險級別、投資期限和投資水平。客戶指標體系中的風險偏好,通過對客戶購買各類產品的歷史數據,分析出其習慣性風險偏好;持有時間,即客戶發生買與賣兩次交易行為的時間差;購買能力,通過對客戶在半年時間內的交易行為進行統計,以客戶的平均交易額來評價。服務指標體系中的風險級別由銀行風險評級系統獲取;投資期限從產品信息中獲取;投資水平由初始投資額與追加投資遞增百分比加權確定。建立標準服務庫與客戶信息庫,并利用基于云模型的軟劃分方法,對數值屬性進行區間劃分。結果如表3、表4所示。
根據K-Means算法建模計算得到的客戶細分模型數據,我們對該聚類模型中的參數進行特征分析,最后得到14個客戶群。如表5所示。
在得到客戶群后,還要對數據進行挖掘,找出每個客戶群中的共性特征因子和個性特征因子。根據Apriori算法在銀行客戶群分析中的應用研究,挖掘出客戶群中客戶群共性特征因子與客戶個性特征因子,為客戶選擇不同的服務提供參考依據。結果如表6所示。
挖掘出客戶群共性因子后,進行元服務項目集與客戶群的共性特征因子的最優匹配。通過基于二分圖的Kuhn-Munkres算法來求解該問題。將客戶群共性因子與服務進行匹配測試,基于一個客戶群對應多個可能的產品,選擇其中相似度最大的作為最有匹配。
在使用Kuhn-Munkres算法時有一個條件,集合X的項點個數必須等于集合Y的項點個數(m=n),也即客戶群與服務的數量需一致。由于兩者之間無法保證一定相等,因此,可以增加一些空節點,與其相關的相似度也預先賦為0,實現m=n。在實證分析過程中,一共進行了兩次測試。第一次測試基于第一批數據,第二次測試基于第二批數據。相關匹配結果如表7、表8所示。
在這次匹配分析中,最優匹配和最大匹配剛好相等,但是不能證明最優匹配與最大匹配一定能同時達到。如果出現兩個匹配結果差距較大,則最優匹配結果不可取。同時,并非每個客戶群都能實現最優匹配,例如分類號為8的客戶群的平均相似度只有0.496,因此這類匹配不可取,需要進行人工分析。
6結束語
為提高銀行客戶服務管理水平,達到銀行服務產品與客戶的最優匹配,本文以商業銀行人民幣個人理財產品為研究基礎,嘗試將云模型、K-means算法、Apriori算法、Kuhn-Munkres算法等一系列數據處理規則與算法應用到銀行理財產品與客戶的服務匹配中,并得出以下結論:一是運用數據挖掘中的K-means聚類算法,并基于客戶行為分析劃分了客戶群,為銀行大規模定制服務提供了算法基礎,從而鎖定高端客戶;二是提取客戶群的共性因子與客戶本體的個性因子,利用二分圖的Kuhn-Munkres算法實現了客戶群的共性因子與服務的一一映射關系;三是將最優服務匹配相關算法移植到銀行業個人理財產品領域,實現了研究方法的創新。
主要參考文獻
[1]錢秋君,劉飛. 加息通道打開銀行謀個貸轉型[N]. 華夏時報, 2011-02-14(007).
[2]黃競儀. 2010年中國銀行業直面五大困局[N]. 北京商報, 2010-01-11(9).
[3]朱子云. 商業銀行如何破解矩陣困局[J]. 科技智囊, 2004(7): 54-56.
[4]張銘洋. 基于Apriori算法銀行客戶分類系統的設計與實現[D]. 大連: 大連理工大學, 2008.
[5]Wang Hu, Yu Li.Study of Service Mining Mechanism Based on Customer Behavior Analysis[C]. The Eighth Wuhan International Conference on E-Business,2009.
[6]楊勝超,張瑞軍. 基于二分圖最優匹配算法的畢業論文選題系統[J]. 計算機系統應用,2008,17(7): 14-17.
[7]呂巍,蔣波,陳潔. 基于K-means算法的中國移動市場顧客行為細分策略研究[J].管理學報,2005,2(1): 80-84.
[8]張紅梅,夏南強. 數據挖掘技術在零售業中的應用[J]. 經濟師, 2006 (1): 48-49.
[9]王虎,毛文婷. 基于云模型的電信客戶行為關聯規則研究[J]. 武漢理工大學學報:信息與管理工程版,2009,31(5):769-772.
[10]冷明偉, 陳曉云, 顏清. 一種基于影響因子的快速K-均值算法[J]. 計算機應用, 2007, 27(12): 3042-3044.
[11]屈婉玲, 耿素云, 張立昂. 離散數學[M]. 北京: 高等教育出版社, 2008.
[12]肖位樞. 圖論及其算法[M]. 北京: 航空工業出版社, 1993:134-142.
注:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文