機器學習方法在消費金融反欺詐模型中的應用進展

2019-04-02 07:59:08

福建質量管理 2019年6期

(德勤管理咨詢北京 100738)

一、反欺詐技術是行業參與者的核心競爭能力

消費金融機構向個人提供信貸額度或資金。近年來，消費金融在全球范圍內蓬勃發展。在我國，消費金融市場規模(不含房貸)已由2010年1月的6798億元攀升至2018年10月84,537億元，占境內貸款比重由1.7%上升至6.3%[1]。由于消費金融以線上業務為主，申請人與貸款人之間的信息不對稱問題更為突出。加上客群下沉、業務準入門檻低等原因，欺詐成為妨礙行業發展的關鍵痛點。近年來，欺詐甚至呈現“團伙化、地域化、年輕化、專業化、產業化”趨勢。某普惠金融機構稱被其拒絕的客戶中，一半以上存在欺詐的可能。反欺詐技術是消費金融機構的核心競爭能力。

一筆正常的金融交易，是客戶本人以自己真實完整的身份信息及相關信息申請開立賬戶，由本人(或代理人)進行交易并愿意承擔對應義務的行為。雖然具體欺詐形式多、且易變，但可將其簡單概括為以下4種形式：1.欺詐者以虛假身份信息或通過虛擬技術(如機器人)申請賬戶開立。2.欺詐者盜取他人真實身份申請開立賬戶開立，這種欺詐形式在消費金融中占比較高。3.欺詐者本人以虛假個人信息、資產或財務信息等申請賬戶開立，例如隱瞞真實債務情況、提供虛假銀行資金流水等。4.欺詐者以騙取資金為目的的惡意借貸。消費金融機構進行反欺詐，需要充分收集各類數據，利用經驗與規則、借助于模型與技術，全面防堵上述各種欺詐行為。

二、數據驅動的反欺詐模型面臨五大關鍵挑戰

與其他機器學習問題相比，反欺詐模型的突出特點是其面臨著五大關鍵挑戰。

挑戰一：非平衡樣本(Class imbalance)[2]。數據中正樣本(欺詐)的比例過低，有時不足1%，絕大多數樣本屬于負樣本(非欺詐)。若不對非平衡樣本采取針對性處理措施，建模中將不可避免地導致分類器偏好數據集中占多數的一類，甚至產生單邊分類器，即使將全部樣本判定為“正常”，未能成功識別任何欺詐，該分類器的準確率還是超過99%。這是數據驅動欺詐偵測模型構建中最主要問題之一。

挑戰二：概念漂移(Concept drift)[3]。概念是一個模型要去預測的目標變量；概念漂移是指目標變量隨著時間的推移發生改變。正常客戶的行為習慣會隨時間變化而改變，欺詐者也會不斷變換欺詐方法和手段來躲避偵測，在反欺詐模型的動態數據流中表現為非獨立同分布。概念漂移導致的直接后果，是將訓練的模型應用于新數據時模型預測能力衰減很快，且很不穩定，泛化性能差，通俗說是“老辦法難以解決新問題”。

挑戰三：驗證延遲(Verification latency)[3]。通常情況下，從業務準入到欺詐發生需要較長時間(觀察期平均在半年以上)。在常規方法下，建模人員只能在欺詐實際發生后，才能將帶標注的數據加載到訓練數據集中重新訓練模型。在這段被動等待期間，欺詐模式可能也發生變化。建模人員擬通過更新數據集，重新或增量訓練模型的方法來解決概念漂移問題，其效果就大打折扣。

挑戰四：代價敏感(Cost-sensitive)、錯判損失易變(Variability in misclassification cost)[4]。反欺詐模型上線后，某筆業務被分類器錯判后的代價可能是不一樣的。具體到消費金融業務中，將正常客戶判定為欺詐客戶，錯判損失是該筆業務的預期利息收益(通常低于本金的10%)；而若將欺詐客戶判定為正常客戶，錯判損失是該筆業務的本金，數倍于預期利息收益。并且，對于不同客戶而言，可以申請到的貸款金額(本金)是不同的。

挑戰五：模式匹配(Pattern matching)困難[4]。欺詐者往往通過各種手段努力地偽裝成正常客戶，其行為特征與正常客戶的典型行為特征差異非常小。

三、基于多維數據的主動學習、實時反欺詐系統是行業領先的解決方案

基于多維數據的反欺詐系統可分為批量識別與實時掃描兩類。前者指在交易發生后對全體交易進行掃描，批量識別欺詐；后者通過基于數據流挖掘(Data stream mining)[5]構建實時偵測系統[6-8]，在線實時偵測欺詐行為。

(一)領先反欺詐系統的整體架構

當下行業領先的方案為實時掃描方案，具有場景化、事件驅動、多維度、專家經驗與數據驅動相結合等多個特點。下圖展示了一個典型的實時反欺詐模型架構(基于文獻[3]、文獻[9]的工作整理)：

圖1 反欺詐偵測模型整體架構示意圖

上圖所示的反欺詐偵測系統采用了概率遞減的決策規則。客戶的注冊申請或交易數據，首先通過基于終端設備(UKey,Token等)/生物檢測技術(人臉識別、虹膜識別等)的反欺詐偵測，然后進入黑名單匹配(犯罪人員名單、司法老賴名單、馬甲庫、黑中介、手機號碼欺詐庫、終端設備欺詐庫等)，專家if-then規則或組合規則(代理IP、IOS越獄/或Android root，安裝虛擬機、多個消費貸APP等)篩查環節。這兩個環節命中的客戶存在較高的欺詐概率，其注冊申請或交易會被系統直接拒絕。成功通過上述檢測的數據會進一步流到機器學習模型中，基于多維數據進行異常分析、分類評估。在這個環節檢出的客戶存在一定的欺詐概率，系統不會直接拒絕其注冊申請或交易，而是對該筆業務發出欺詐預警，提示進行線下個案審查。線下調查結束后，系統將更新標識后的數據添加到訓練數據集，在設定的時間窗內對模型進行增量訓練。雖然篩查規則多、且模型復雜，但反欺詐系統或服務的供應商稱完成上述篩查處理耗時不到1分鐘，甚至更短。

為了解決概念漂移和驗證延遲問題，上述架構中可嵌入主動學習(Active learning)策略[7]以及增量學習(Incremental learning)策略[10]。在處理不帶標識數據時，采用主動學習策略的學習器能主動選擇包含信息量大的、未標注樣本推薦給專家進行人工標注。一方面，僅將少量可疑交易提取交由線下專家審查，減少了人工標注量、縮短了欺詐觀察周期，驗證延遲的影響被減弱；另一方面，將與專家交互后的帶標識信息(上圖中的人工審查、打標識)更新到訓練集中重新訓練，可對分類器進行重新優化、調整，捕捉欺詐手法的新變化、新模式，提高模型的泛化性能。上述主動學習過程可表示為：AL=(C,L,U,Q,E)。其中，C是一個或者一組分類器；L是一組已標注的訓練樣本集；U是未標注的數據集；Q是查詢函數，用于在未標注的樣本中查詢信息量大的樣本；E是專家，對選擇的未標注數據進行標注。主動學習的過程，是首先利用C訓練L，得到一個訓練好的分類器，然后Q選擇U中的未標注數據給E進行標注，標注后再由C來進行訓練，不斷循環迭代直到達到預設的停止條件。

(二)反欺詐異常分析中采用的機器學習方法

可用于異常分析的數據包括：1.申請人提供的個人基本信息；2.移動端SDK采集技術獲取的申請人設備信息及行為數據；3.導入外部數據庫、或網絡爬蟲爬取的數據，如個人消費信息、社交網絡信息、地理位置信息等。這些數據聚合后，不但可描述申請者個人基本情況，還可以描述申請者的各類行為(網購行為、社交行為、上網習慣)，甚至個人使用設備的方式和習慣，例如使用設備的角度、按壓屏幕力度等。

這些看似和欺詐偵測沒有直接因果關系的大數據，在預測欺詐、群體欺詐上有一定的效果。例如有研究表明，可通過申請人打字速度和用鼠標瀏覽網頁的方式等行為特征進行在線反欺詐偵測。因為相較于真實用戶本人，欺詐者在填寫陌生人生日和名字等個性化信息時較慢，在填寫具有共性的信息時較快。再從群體欺詐上看，由于欺詐者往往團體作案，所以他們的行為呈現出高度一致性和聚集性。這與正常用戶分散的、不統一的行為模式明顯不同。在海量大數據的助力下，不斷優化的機器學習方法正逐漸減輕模式匹配困難對欺詐偵測的影響。

異常分析可從橫向、縱向兩個方面進行。橫向行為分析主要側重于與客戶相同的群體行為分析，根據群體共性來判斷個體行為的偏差情況；而縱向歷史行為分析主要側重于客戶自身行為比較，將客戶在不同時期行為進行對比。具體的機器學習方法，包括關聯分析/頻繁項集挖掘[11]、聚類分析[12]、圖異常檢測[13]等。例如，在文獻[12]中，李旭瑞提出一種基于流式聚類及增量隱馬爾可夫模型的實時反欺詐模型，根據特定賬戶的歷史交易模式判斷當前交易是否可疑。作者利用CLIQUE算法對賬戶交易特征進行網格聚類，并結合隱馬爾可夫(HMM)算法對賬戶交易行為建模，根據該模型進行實時欺詐偵測。

(三)反欺詐分類模型中采用的機器學習方法

分類模型是反欺詐系統的核心組成部分。異常分析通常以非監督學習為主，通過機器學習方法從多維數據中提煉正常、欺詐的多個模式，并通過數據可視化技術展示申請人與不同模式匹配情況，基于預設規則對客戶或交易進行分類。例如，申請人若匹配上任何一個正常模式，則判定為正常；否則判定為欺詐。而分類模型通常采用監督學習方法，從多維數據中提取特征，利用帶標記樣本訓練分類器。分類器能給出申請人欺詐的概率。

如上文所述，使用機器學習方法訓練反欺詐分類器時，會受到非平衡樣本、代價敏感等問題影響。近期文獻[3,6-10,12,15]中構建分類器時，對上述問題都進行了特殊處理，如使用SMOTE抽樣或通過正則化對誤判進行懲罰。在分類器的選擇上，邏輯回歸、支持向量機、隨機森林、神經網絡、集成學習方法等被廣泛使用，但目前尚無在任何數據集上表現都絕對占優的方法。在文獻[4]中，Aderemi概述了近年來代表性研究的創新點、模型局限性和模型結果。在文獻[8]中Hao Zhou在真實綁卡數據集上運用了多種機器學習分類算法，最終使用效果更好的XGBoost方法實現對移動設備支付中綁定銀行卡環節的欺詐偵測。在文獻[14]中，陳沁歆對比使用了邏輯回歸、決策樹、隨機森林、Ada Boost集成學習方法。其研究表明，雖然作為一種傳統方法，邏輯回歸在關鍵性能指標上與集成學習方法非常接近。在文獻[15]中，Jon Ander Gómez,et al.使用神經網絡構建了一個反欺詐深度學習模型，該模型在真實數據集上預測欺詐的準確率，十分接近其他分類算法。

四、結論及思考

欺詐是消費金融企業面臨的重大挑戰。不斷發展的機器學習方法應用到消費金融大數據中，使得欺詐風險得到一定的控制。但機器學習在反欺詐中的作用卻不能過于高估，即使是越來越好機器學習方法，也只能無限接近問題解的上限；高質量、多維度的數據才能促進問題的最終解決。在保護隱私的前提下實現跨行業信息共享和合規合法使用，配合不斷進步的機器學習方法，才能從行業整體層面上較好地解決欺詐問題。

【注釋】

①文章不代表所在單位觀點，文責自負。