段夢娟
(西安培華學院, 會計與金融學院, 陜西, 西安 710125)
隨著大數據時代信息技術的發展與更新,數據分析成為價值挖掘的基本手段。對于商業銀行來說,客戶是重要的無形財富,了解客戶的購買傾向、關注客戶的購買意愿是商業銀行提供優質產品及服務的前提,與此同時,結合客戶的關注點開發出更優質的理財信貸產品也是商業銀行實現利潤最大化的關鍵手段。因此,優異的商業銀行客戶關系管理系統不僅更利于追蹤客戶需求,也可以用更低的成本促成更多的交易,將帶來巨大的實際應用價值。
在商業銀行中,客戶關系管理更加側重于利用信息技術對銀行的業務流程以及營銷對策進行優化與改革,提供創新管理思路,為客戶和銀行利益最大化提供數據支持。管理客戶關系的終極目標在于降低銀行運營成本、提高收入及利潤、維系改善客戶關系、開拓新市場、提升客戶滿意度及忠誠度、合理進行客戶分類、根據客戶傾向為有價值的客戶分配資源。
客戶生命周期指的是某一客戶對于銀行而言存在類似生命周期的分階段的發展過程。主要包括識別、吸引、維系和發展4個生命階段,針對不同階段的客戶維護側重點不同,主要內容如圖1所示。通過對基本信息數據進行歸類、回歸等學習,挖掘客戶需求,制定維護策略[1]。

圖1 客戶生命周期維系流程
AJAX技術無需刷新當前頁面的信息即可實現客戶端與服務端的通信,應用于商業銀行客戶關系管理系統中可以實現用戶需求快速獲取,使銀行與客戶的通信更便捷。ADO.NET技術可實現數據訪問伸縮性,針對商業銀行海量的客戶關系數據,可實現高效訪問。
商業銀行客戶關系管理的最終目的是整理分析客戶信息,并根據數據結果提供有針對性的服務,提升客戶滿意度與忠誠度,因此在系統功能設計上需要涵蓋客戶、產品、服務等多方面的管理。普通用戶具備營銷管理、客戶信息查看、產品信息查看、服務管理、統計分析等權限;系統管理員具備客戶管理、產品管理、服務管理、配置管理、權限管理、系統維護等權限。系統功能用例設計如圖2所示。

圖2 系統功能用例
機器學習屬于多領域交叉學科,在推理、識別等領域應用廣泛,根據涵蓋經驗的多少可以分為監督、半監督、無監督幾類,最常見的學習方法包括回歸、分類、降維以及聚類。商業銀行客戶管理中最核心的產品營銷管理主要目的在于查找有購買意愿的客戶,在實現過程中首先要將問題標準化,然后獲取訓練數據進行預處理之后利用適當的學習算法進行模型的訓練,最終調整相關參數,篩選出有購買傾向的客戶群[2]。
訓練數據的預處理主要包括分析、清洗以及轉換3個步驟。首先,需要理解數據集中字段和屬性的關聯,提取基礎特征、短期內行為特征以及經濟環境特征。基礎特征包括年齡、職業、婚姻狀態、教育水平、信用度、是否有貸款等;短期內行為特征包括最后接觸日期、交流方式、距今天數、聯系次數、之前的營銷結果等;經濟環境特征包括物價指數、就業率等。其次,進行數據分析之后剔除重復、有誤的噪聲數據,補充缺失數據。最后,對數據進行標準化、歸一化處理,轉換為適用于機器學習的格式。選用scale函數實現數組數據標準化,選用quantile_transform函數對非數值數據進行線性轉換,選用sklearn平臺的Normalizer工具做歸一化處理[3]。整體處理流程如圖3所示。

圖3 數據預處理流程

利用GTB算法進行模型構建,主要通過2種方法實現樣本劃分:優化訓練數據集參數、評估特征的重要性。參數主要包括樹參數、Boosting參數以及其他調節模型運作的相關參數。選取加州大學歐文分校(University of California,Irvine)的UCI公開數據庫中符合要求的銀行數據41 188條,將其中70%作為訓練集,30%作為測試集[5]。先設置參數初始值:最小樣本數min_samples_split=900;葉子節點最少樣本數min_samples_leaf=75;最大樹深度max_depth=8;分類特征數max_feature=8。接下來進行參數調優,首先指定學習率為0.1,利用多次交叉驗證分析迭代次數需達到100才能得到最優解,因此調整學習率為0.15,只需60次迭代即可,因此n_estimators=60。然后,調節數參數,得到max_depth=11,min_samples_split=400,subsample=0.7。最后優化Boosting參數,為了避免過度擬合,降低學習率,增加決策樹的迭代次數,調整后逐步對比最終確定為學習率=0.005,n_estimators=1 800.使得準確率Accuracy達到0.911。得到最優參數之后,在推薦相似產品時即可利用分類器進行客戶篩選,假設預計可以對60%的潛在客戶進行營銷,那么:
隨機選取的營銷數量=總客戶數×60%;
基于機器學習后篩選出的營銷數量=總客戶數*總購買比例*預期銷售比例/準確率。
在準確率為0.911,總購買比例為14.53%時,營銷數量=總客戶數* 9.57%。即可將營銷數量從60%降低到9.57%,具備良好的分類效果,很大幅度的過濾了客戶、提升了營銷效率。
商業銀行客戶關系管理系統在整體架構上劃分為4層:數據層、支撐層、邏輯層和展示層。數據層采用關系型數據庫SQL Server實現數據存儲;支撐層主要為系統核心技術,包括AJAX、ADO.NET、jQuery、J2EE等;邏輯層主要完成系統核心業務邏輯處理,完成對數據的分析與計算并將結果返回給用戶;展示層作為人機交互界面,是用戶與系統的交互通道。系統整體組成結構如圖4所示[6]。

圖4 系統總體架構
根據系統的功能需求分析,結合商業銀行的客戶關系管理目標以及客戶生命周期的維系流程,在系統總體架構上設計功能模塊,將核心功能劃分為8個模塊,組成結構如圖5所示。

圖5 系統功能模塊組成
(1) 營銷管理:利用產品營銷分類模型,定位潛在具有購買產品意向的客戶群。查看訂單及合同信息。
(2) 客戶管理:客戶名稱、行業、性別、職位、聯系方式、地址等基本信息管理。實現客戶信息的增刪改查。
(3) 產品管理:實現對商業銀行的理財產品、信貸產品的編碼、描述、類別等基本信息進行管理。
(4) 服務管理:實現客戶的新需求、意見、投訴等的登記與處理。
(5) 統計分析:多維度統計分析,包括客戶的貢獻、構成分類、服務類別以及流失原因分析等,直觀展示數據挖掘結果。
(6) 配置管理:實現對城市、區域、部門、客戶職業、狀態、行業類型等分析功能所需的各類參數進行個性化配置。
(7) 權限管理:實現用戶權限設置,根據用戶或角色賦權,確保系統安全與數據安全。
(8) 系統維護:實現系統登錄、密碼修改等系統維護事項[7]。
根據系統功能模塊設計核心數據庫表如下。
(1) 客戶基本信息表:核心字段包括客戶名稱、證件號碼、賬號、行業、職位、性別、地址、聯系方式、學歷、月收入、產品編號、產品名稱、意愿等級等。
(2) 產品信息表:核心字段包括產品編碼、產品名稱、產品類型、風險分級、內容描述等。
(3) 服務信息表:核心字段包括投訴編號、用戶編號、客戶姓名、投訴信息、投訴時間、處理時間、處理結果等。
(4) 需求信息表:核心字段包括需求編號、客戶姓名、需求描述、提出時間、處理時間、處理人等。
(5) 營銷信息表:核心字段包括產品編號、客戶編號、客戶名稱、意愿等級、最后聯系時間、客戶狀態等[8]。
在系統測試過程中,秉承合理規劃測試事項、合理輸入異常輸入結合、發現漏洞修改后再次驗證等原則設計了系統功能測試用例,主要包括客戶、產品、服務信息的增刪改查;客戶、產品、服務信息的查詢與檢索;營銷類型的預測;用戶權限與角色的分配等。驗證結果均與預期相符且各類主流瀏覽器頁面展示正常,兼容性較好,整體功能滿足設計預期。
采用100個用戶訪問系統功能模塊,系統登錄平均耗時1 245 ms,信息查詢平均耗時3 927 ms,添加各類信息平均耗時2 732 ms,整體響應迅速,無卡頓崩潰現象,系統性能優異。
為了驗證系統營銷模型的預測準確性,采用國內某浦發銀行的1號理財產品作為樣本集,選取符合要求的247名客戶的銀行數據,收集客戶背景、參與活動次數、上次接觸后天數、聯系次數、之前營銷活動結果等營銷數據,聯合我國季度就業率、季度就業變動率、消費物價指數月指標、消費者信息指數等宏觀經濟變量構成20個混合變量,帶入系統設計的GTB營銷預測訓練模型,對樹參數、Boosting參數進行調優以及數據訓練,最終得到預測準確率Accuracy為0.900,極大程度的過濾了不相關客戶,為商業銀行的個性化營銷提供了十分重要的參考價值。
本研究從商業銀行客戶關系的管理目標為基點,通過機器學習設計了營銷預測分類模型,并設計了4層體系的管理系統,實例數據驗證系統功能完備,預測模型準確度高,為商業銀行客戶關系管理提供了技術手段。但建模參數還需進一步精確,納入更多影響因子以提升預測準確度。同時在使用過程中還需不斷完善系統功能,為商業銀行提供更精細的客戶價值挖掘手段。