吳越 張林翔 陳玉蘭 蔣偉
摘要:針對ATM交易系統產生的交易數據,對交易時刻、交易量、交易成功率和響應時間進行person相關性分析,提取ATM應用系統的交易狀態特征參數。對時刻-交易量進行方差分析并利用3σ準則提取異常點,對成功率-響應時間引入K-means聚類對異常點進行分級。由此找出交易量、交易成功率和響應時間的異常值,進而建立ATM 異常檢測系統。
關鍵詞:相關性分析;方差分析;K-means聚類
引言
ATM提供提款、存款、轉賬等銀行柜臺服務,提升了銀行的工作效率,給群眾帶來了很大的便利。但隨著商業銀行 ATM 業務的快速發展,銀行承擔的確保 ATM 交易系統穩定運行的壓力越來越大,ATM的維護管理和數據安全顯得十分重要,交易系統的性能管理成為一大關鍵問題。
因此,ATM交易狀態的故障發現與異常數據檢測成為我們的研究問題。本文的主要研究內容是根據匯總信息包含的四個指標(交易時刻,交易量,交易成功率,交易響應時間),選擇、提取、分析ATM 交易狀態的特征參數,并設計一套交易狀態異常檢測方案,以實現故障場景的正確判斷與及時報警。
1 數據來源與處理
1.1 數據來源
本文數據采用 2017 年“深圳杯”數學建模挑戰賽提供的從1月23日至4月23日某商業銀行 ATM 應用系統某分行的交易統計數據。
1.2 數據預處理
首先對每分鐘對各分行的交易信息進行匯總統計,包括交易時刻,交易量、交易成功率、交易響應時間 4個指標。其次對所給數據進行了缺失填補,并去除不符合實際的數據。
(1)數據分段處理
首先根據數據做出累計交易量與日期之間的關系,發現1月23日至1月27日,由于春節前夕導致ATM交易量明顯增長。1月28至2月5日,由于處在春節期間,銀行的日均累計交易量明顯低于平時。而其余時間段的累計日交易量波動范圍較小、較平穩,具有研究價值。因此本文主要對2月5日后的數據進行交易狀態特征分析。
(2)工作日與非工作日比較
根據數據分別繪制非工作日與工作日的時刻-交易量的關系,觀察發現交易量與時刻的圖像呈“雙峰型”分布。交易量在0-420 min處于較低水平,420-1260處于較高水平。根據實際情況分析,即在0:00-7:00時刻,由于夜間人流量少,故導致交易量較低。而在7:00-21:00時,該時間段為工作階段,人們活動量大,故交易量持續穩定的處于較高水平。
分析比較工作日與非工作日,發現工作日與非工作日的每一時刻交易量相差小,僅在某個高峰段的存在微小差異。從整體上看,工作日和非工作日的單日交易量不存在明顯差別,因此本文不對工作日與非工作日的數據進行區分。
2 交易狀態相關指標分析
對日期、時刻、交易量、成功率和響應時間進行Pearson相關性分析,進行初步的數據相關性觀察,為下一步提取特征參數做準備。利用SPSS,得出4個變量間的相關性:
1)交易量與時刻存在正相關;
2)成功率與響應時間存在負相關。即數據中心后端系統處理異常,導致交易失敗則響應時間加長。
3 交易狀態異常檢測方案
3.1交易量的聚類分析
由于春節后每天各時刻的交易量與平均值有較大的差異,求出每天的交易量平均值與各時刻的關系,觀察表明春節后每天各時刻的交易量與均值的差異近似服從正態分布,因此我們利用方差分析法,將差值較大的交易量定義為異常值。并引入 準則,將 作為其置信區間,從而判斷并提取異常點,通過以 為置信區間,將每天交易量與均值的差值在 之外的值標記為異常點,
即可對交易是否出現異常進行檢測。根據某一時刻算出理交易量,此時對應時刻的實際交易量若在置信區間內,則交易正常。否則,交易異常。
3.2基于K-means聚類分析的成功率和響應時間異常檢測
根據匯總成功率-響應時間的數據,通過SPSS,對三月份的成功率-響應時間的數據進行K-means聚類處理,可得三類聚類中心,如圖1
根據聚類結果,三類聚類中心分別為(0.83,142.95)(0.95,12288.29)(0.41,79947.34)。我們將這三類異常程度定義為 “穩定”“臨界異常”“異常”3個程度。分析最終的聚類結果,則可判斷出第一類紅色區域的點為代表交易處于臨界異常,第二類綠色區域表示交易異常狀態,成功率低且響應時間長。第三類藍色區域成功率較高且響應時間低,為正常點集中區域。
4 結論
本文首先對 ATM應用系統的交易狀態特征參數進行提取,探討ATM交易各指標之間的關聯性。進而建立了ATM交易狀態異常檢測模型。基于方差分析法以及 準則,能夠有效的找出交易量異常點。利用k-means 聚類分析可區分出數據交易成功率和響應時間異常點并對異常程度進行分級。本文設計的一套交易狀態異常監測方案,能盡可能實現對ATM交易系統異常的及時報警,減少虛警誤報,使ATM 交易系統的性能管理問題有了一定的突破。從而提高銀行自動系統的工作效率,保障系統的暢通,便利ATM的使用者,使得ATM的服務便利性發揮到最大。
參考文獻
[1]孫博,康銳,張叔農.基于特征參數趨勢進化的故障診斷和預測方法[J].航空動力學報,2008(02):393-398.
[2]楊志浩.聚類分析算法研究改進及其在ATM選址中的應用[D].鞍山:遼寧科技大學,2014.
[3]丁智國.流數據在線異常檢測方法研究[D].上海大學 ,2015
[4]李一,蔡禮淵.ATM交易狀態特征分析與異常檢驗[J].成都工業學院學報,2018.21(1).
作者簡介:吳越(1998-),福建人,本科生;
蔣偉(1982-),重慶人,副教授,研究方向:數學建模與圖像處理。