矯世全
遼寧錦州渤海大學信息科學與技術學院
基于Java的信用卡數據挖掘系統
矯世全
遼寧錦州渤海大學信息科學與技術學院
隨著銀行信用卡市場在全球普及,信用卡在消費中占主導地位,大多數銀行信用卡業務都能為本行增加經濟收益,銀行嘗試在信用卡業務上創新或者優化信用卡管理,銀行信用卡原始數據量巨大,通過分析原始數據挖掘潛在的商機,本文基于決策樹算法實現銀行信用卡數據挖掘的功能,實現決策信用卡業務功能。信用卡的數據庫中存在大量數據記錄,通過數據挖掘建立信用卡客戶、業務功能模型,統計分析信用卡的業務模型以降低銀行信用卡的運營風險,該系統構建以業績統計分析、銀行收益分析、重點業務領域分析等綜合性數據挖掘管理系統,促進銀行信用卡業務良性發展。本系統因信用卡實現數據挖掘具有可行性,針對于信用卡的數據挖掘建立挖掘模型,信用卡數據挖掘分析系統的設計對銀行經濟收益具有實際應用意義。
Java 銀行 信息卡 數據挖掘 決策樹算法
銀行信用卡業務量不斷增長,基于數據庫統計分析、存儲錄入、業務辦理等功能,由于信用卡數據量大,數據組織存儲凌亂,根本無法預測或者挖掘數據之間關聯,更不可能根據某種規則挖掘信用卡未來業務的發展趨勢。信用卡管理缺乏基于原始數據挖掘數據之間的關聯,銀行信用卡業務為了奪得客戶和市場,實現銀行信用卡業務長遠的發展。銀行通過數據挖掘系統深入分析不同信用卡客戶的實際需求,尋找潛在客戶源,為其提供有針對性的信用卡業務服務,是銀行提高市場占有率的關鍵,因此,基于數據挖掘方式實現客戶關系挖掘、重點業務挖掘等便成為銀行研究的重點問題。
信用卡成為現今普遍的支付方式,代表著信用憑證。信用卡業務集成了“存、貸、消”三種常用的功能,這是實現無紙無現鈔時代,它促進社會經濟發展和各類商品銷售,拉動國內經濟增長,對社會發展起到促進作用。
由于信用卡性質,需要實施基于數據挖掘手段整合信用卡業務需求。另外,銀行信用卡業務種類繁多,可能存在信用卡種類與客戶群不對稱的現象,務必會影響到信用卡發展趨勢,銀行使用信用卡業務的風險和獲取利潤并存。因此,銀行有必要對數據庫中的原始數據進行整合,實施有效地數據組織操作,將數據挖掘后的原始數據進行分析和歸類操作,可以幫助銀行推行信用業務,同時能夠準確地預測未來發展。
2.1 系統功能性需求分析
本系統劃分為一級功能模塊和二級功能子模塊兩種。其中一級功能模塊賬戶管理、信用卡管理、數據挖掘管理、信用卡激活管理;二級功能模塊申請開卡業務、賬戶管理、開戶管理、信用卡管理、統計交易類型、統計交易金額、統計交易次數、統計客戶分布、統計查詢和激活功能。
①申請開卡:客戶通過銀行信用卡系統實現客戶資料填寫,完成信用卡開卡操作;
②賬戶管理:系統管理員實現對賬戶進行管理,修改信用卡狀態、管理信用卡業務;
③信用卡管理:實現對信用卡類型、額度、狀態等進行綜合性管理操作;
④數據挖掘管理:統計交易類型,實現信用卡不同類型的統計操作;統計交易類型,統計信用卡交易類型;統計交易額度,統計某個用戶一段時間內的交易額度;統計交易次數,統計銀行信用卡用戶表在一定時間內的交易次數;
⑤信用卡激活操作:系統的管理人員通過信用卡賬戶或者身份證號查詢或者激活操作,當信用卡開通之后必須進行激活才能進行后期的使用,包括:“存、貸、消”三種常用的功能。
2.2 系統非功能性需求分析
本文研究的信用卡數據挖掘管理系統的非功能性需求:
2.2.1 界面要求
要求該系統的功能界面按照統一界面風格設計,追求系統界面中控件布局合理、風格一致。
2.2.2 功能擴展性要求
系統的新功能擴展要求采用遠程服務器端進行功能擴展升級設計方案,其目的是當信用卡需求變更為新功能時,只在遠程的服務器端更新即可實現異步更新,使得系統新功能擴展的需求。
2.2.3 安全性能要求
為了保障系統安全性,避免系統在運行過程中受黑客惡意攻擊,當前的網絡環境下傳輸數據并不安全,如果對傳輸數據進行安全性保障,需要對傳輸的數據進行加密和解密操作。
3.1 系統的總體設計目標
信用卡數據挖掘系統實現的設計目標:
①系統資源整合操作,整合信用卡中心的原始業務數據,實現原始數據實時共享。
②方便辦理銀行信用卡業務。
③信用卡數據挖掘系統并不是直接傳輸數據,而需要對原始數據進行加密和解密操作,數據保密性較好。
④系統的新務功能進行擴展操作,例如:網上自助查詢與服務管理功能等。
⑤軟件界面簡單快捷,有利于客戶和管理者在實際信用卡管理過程中投入使用。
3.2 基于決策樹算法信用卡數據挖掘算法描述
本文基于決策樹算法來實現對銀行信用卡的原始數據進行數據挖掘操作,決策樹一度是數據挖掘實現的經典算法。算法巧妙的通過對已知訓練原始數據建立決策關系,再根據建好的決策樹模型實現對原始數據分析和歸類操作。建立決策過程可視為原始數據規則分類過程。
本文的基于決策樹構建數據挖掘系統的模型步驟如下:
①選擇經典的決策樹算法將銀行信用卡原始數據進行初步的分類與分析;
②經過預處理原始數據,由于銀行領域的數據特殊性和系統中存在大量的原始信用卡數據,如果想要通過對原始數據進行挖掘和應用,根據決策數據模型發現潛在原始數據匯總的重要的價值信息;
③基于決策樹算法訓練信用卡原始數據樣本,構建信用卡數據挖掘管理模型,而基于決策樹算法訓練獲取決策樹應用模型,更易于對數據挖掘的理解;
④根據應用模型獲取的關于原始數據分類結果,在本文的系統中存在功能模塊實現對原始數據的分類與評估操作,對信用卡的原始數據挖掘過程和挖掘結果進行排序,銀行信用卡中心工作人員根據數據挖掘模型所獲取關數數據集合;
⑤最后將數據挖掘得到的整合數據采用圖或者表或者圖標結合的方式展現給銀行信用卡中心管理人員,以一種直觀可視化的方法便于對現在的業務分析和對未來信用卡業務發展動向進行預測。
3.3 基于決策樹算法信用卡數據挖掘算法實現
在設計數據挖掘過程中,決策樹的決策路徑表示信用卡原始分類的路徑,對于給定的某個信用卡原始數據集合D而言,對于已經輸入的變量I值,表示輸入變量值表示要選擇的數據挖掘算法序號值,如果在原始數據中要獲取到N個數據分類路徑,由于管理人員輸入的變量存在不確定性,如果給定樣本數據集合D存在多種分類結果時,當分類結果視為數據增長的決定性因素,根據決策樹的路徑實現的對給定的樣本D進行數據分類,其評價值作為熵,為了下一步數據N的分類,定義分類函數F,其輸入參數為給定樣本數據集合D和表示數據挖掘算法序號I值,函數公式記作:F(Di,I),函數公式1表示為:

公式1中:i為n個數據樣本的第i個數據集合,n為總的數據集合總數,I表示序號,D給定樣本原始數據集合。

算法1 基于決策樹算法的信用卡數據挖掘過程input: D,I; //輸入D樣本原始數據和I序號,存在系統中的數據挖掘分類算法序號output: G//輸出對原始數據樣本的數據挖掘分類關系圖; 1:初始化 G←null,T←null; //初始化數據挖掘的分類圖和空值決策樹2:switch(I);//根據參數I值判斷使用數據挖掘算法,本文定義I=1為決策樹3:for i←0 to D.length;//根據循環預處理原始數據樣本4: D←P(D);//根據預處理函數還原給原始樣本數據5:end for; 6:T←decisionFunction(D,I);//構建一個以原始數據為準的決策樹7:List list←select data node and path on decision tree; //從決策樹的數據節點上選擇路徑作為本次挖掘數據結果8:for i←0 to list.size;//根據循環取出本次挖掘數據結果9: G←list.get(i)//獲取數據節點,將此節點添加到數據挖掘分類圖中10:end for 11:end switch 12:return G;//返回一個原始數據挖掘后的關系圖
算法1關于決策樹應用過程和算法偽代碼實現設計,實現了從樣本原始數據的構建信用卡決策分類數據,并將分類數據節點的路徑以圖或者表或者二者結合的形式表示,形成的數據關聯圖即直觀觀察,又便于信用卡中心對信用卡業務做出決策。
4.1 系統測試目標與測試原則
針對數據挖掘系統,可使用相關測試工具完成系統的測試工作,預期目標如下:
4.1.1 整體測試目標
系統業務功能按照最終的需求分析設計,無嚴重缺陷即可,系統性能指標核系統響應時間在允許的范圍內。
4.1.2 功能測試
功能基本實現,每個功能之間完整通暢。
4.1.3 性能測試
多用戶、高并發、多任務訪問服務器均能符合相關要求,并支持較大大數據并發量查詢性能,性能測試在允許的范圍內。
4.2 系統測試結論
4.2.1 系統優點
通過上面測試可以發現數據挖掘系統功能上符合前期需求,為信用卡中心提供了良好應用平臺,一是能夠實現信用卡數據挖掘管理,二是為信用卡業務提供科學決策依據。
4.2.2 系統不足
系統對外接口未實現預留,隨著銀行信用卡業務不斷增多,信用卡數據挖掘會帶來巨大方便,該系統某些實用性的功能還需進一步擴展,更好的為信用卡中心服務。
本文研究的主要工作:
①做出符合銀行信用卡管理的需求分析。
②通過研究信用卡數據挖掘的成功案例,再加上前人論文的借鑒基礎上,熟悉Java編程語言的開發工作,熟練掌握了關于面向對象編程基本思想。
③分析本文所開發系統涉及到的關鍵技術與軟件設計思想,其中包括:編程技術和數據庫技術。詳細設計完成了系統的基本功能模塊實現,并為未來的信用卡業務發展預留部分待功能擴展接口,方便該系統擴展升級操作。
信用卡數據挖掘的需求會隨銀行信用卡業務進行不斷更新,有變更需求的系統軟件功能也隨著發生改變,信用卡功能內容也隨著不斷豐富。信用卡數據挖掘管仍然存在一些不足之處,這些待改進的地方有望在今后研究中加以著重改進和完善的方面。
[1]沈阿強,陳潔,秦娟.大客戶關系管理流程與實務[M].北京:人民郵電出版社,2007
[2]杜麗英,趙秀菊.基于數據挖掘的銀行客戶關系管理系統的研究[J].計算機光盤軟件與應用,2014,1:18-19