程建華,龐夢蘭
(安徽大學大數據與統計學院,合肥 230601)
隨著中國經濟的快速發展,信用卡市場規模也得到快速增長。截至2021年末,中國的信用卡發行量已達8億張。隨著交易次數的增加,利用信用卡進行欺詐行為不斷增多。盡管欺詐行為在整個信用卡交易中的比例很低,但一旦發生,將會給各商業銀行造成巨額經濟損失。據中國銀行業協會發布的《中國銀行卡產業發展藍皮書(2022)》數據顯示,截至2021 年末,信用卡逾期半年未償信貸總額達860.4 億元,較上年增加2.6%。鑒于此,如何迅速、有效識別信用卡欺詐行為以防范風險,已成為銀行風險控制領域的研究課題。
信用卡欺詐檢測領域存在兩個主要問題:首先,實際生活中,欺詐樣本的數據標簽獲取困難,人工標記數據成本較高,而且已標記的樣本數據量不足以反映真實的欺詐狀況,在大多數情況下,商業銀行面臨的是沒有標簽的數據集;其次,信用卡交易數據存在類別極端不平衡的現象,即欺詐樣本遠小于正常樣本。鑒于此,針對數據集中標簽缺失的情況,本文通過挖掘客戶特征中的潛在信息,對潛在風險較高的申請發出預警,識別“異常客戶”,旨在從授信審批方面把好關,以此降低欺詐風險。
國外在信用卡欺詐檢測方面起步較早,早期的檢測方法主要采用傳統的統計分析方法。20 世紀90年代以來,學者們開始探索基于數據挖掘的信用卡欺詐檢測方法,如決策樹、神經網絡、支持向量機等。隨著人工智能技術的發展,一些學者將深度學習技術應用到信用卡欺詐檢測領域:Jurgovsky 等[1]將欺詐檢測問題轉化為序列分類任務,使用長短期記憶神經網絡進行預測,從而有效提高檢測準確率;……