曹雨濛


基于某商業銀行ATM應用系統某分行的交易統計數據,對ATM交易狀態的特征參根據圖像進行相關性分析數并利用因子分析對特征參數進行降維提取和分析出.再利用對所求的特征參數通過 K-Means 聚類分析的方法對異常值進行分析并確定異常值的判定標準。
1 引言
中國已成為全球第二大ATM市場,目前ATM還在快速建設發展中,各家商業銀行紛紛利用ATM來搶占自助渠道、擴大與延伸服務范圍。ATM機作為銀行業務電子化和自動化的一部分,它借助現代化的自助服務設備,為客戶提供方便、高效的金融服務。
2 模型的建立與求解
2.1特征參數的提取與分析
2.1.1 模型的分析
首先對數據預處理,選取數據中變量交易量,響應時間,工作日或非工作日,一天中的不同時間作為要分析的特征參數,通過因子分析降維后觀察哪個參數占所比重最大。再由Matlab生成響應時間-成功率,日期-成功率,時間-成功率,交易量-成功率的圖像進行函數分析,找出對成功率影響最大的參數后,將其設為特征參數,并對其與成功率的函數擬合近似圖像,另對數據進行篩選[1]后做出時間-日期-成功率的三維圖像,進一步進行觀察。
2.1.2模型的求解
通過spss進行分析后的數據如圖所示;
相關矩陣
其中V1表示日期,V2表示時間,V3表示交易量,V4表示成功率,V5表示響應時間;成分1,2,3分別代表V5,V3,V2;
從數據中可以觀察得交易量和時間對成功率的影響相同,遠大于其他因素(響應時間等),故交易量是一個特征參數;
通過Matlab對每個月各個參數與成功率的關系繪制圖像,其中時間-成功率的函數起伏最明顯且1-4月每天的起伏程度類似,可以近似成周期函數。
通過函數圖像的擬合函數曲線可知特征參數取時間,交易量和響應時間。
2.2 異常值的分析
2.2.1模型的求解
初始設置為三個類,然后利用K-MEANS算法進行迭代生成每個類的中心坐標,再根據圖中每個類的位置來取對應的范圍。
最終聚類中心
x軸表示響應時間,y軸表示交易量,z軸表示時間。
讀出坐標
這三個即為所求的類,
若數據中出現異常情況,則會超出此范圍,異常數據得到檢驗。
(作者單位:吉林大學數學學院)