中國農業銀行審計局武漢分局課題組


[摘要]加強員工行為審計是落實監管規定、有效管控員工行為風險、強化案件防控的重要舉措。商業銀行內部審計部門緊跟新形勢、新要求,探索運用大數據用戶畫像技術,建立全覆蓋、關聯式、長周期的員工風險畫像模型體系,實現對風險隱患的“早發現、早識別、早處置”,提升員工行為審計的覆蓋面、精準度,為商業銀行穩健發展賦能。
[關鍵詞]大數據用戶畫像? ?員工行為審計? ?案件防控
年來,商業銀行案件多發,內部員工涉案占
比持續走高,不僅給銀行造成了巨大的經濟損失,也嚴重損害了銀行的社會形象。為此,防范員工違法違規行為,從源頭上夯實內部控制案件防控基礎,始終是商業銀行各級行的重要課題,也給內部審計部門帶來了巨大挑戰。當前,大數據、云計算等技術飛速發展,用戶畫像技術逐漸被銀行業廣泛關注,為員工行為審計數字化創新提供了解決路徑。
一、傳統員工行為審計方法面臨的困境
以往內部審計揭示了不少員工的違規問題甚至案件風險,但傳統員工行為審計方法一般通過某些舉報線索、異常資金往來線索等進行選樣查證,面臨較大局限性。一是商業銀行員工數量龐大,傳統審計方法只能對存在疑點線索的極少數員工進行抽樣,很難掌握被審計機構員工的風險全貌。二是銀行員工違規形式日益多樣,手段更加隱蔽。以往審計針對信用卡套現、與客戶資金往來等傳統違規行為編制審計模型,難以涵蓋員工在各個領域的違規行為和業務風險。三是內外部數據挖掘、運用不充分。很多銀行擁有海量的信息數據,但內審掌握的員工信息不充分,缺乏對各系統員工相關數據的整體分析,對員工的整體特征、行為信息鏈接不足,工商、司法等外部信息的采集和運用更為有限。因此,員工行為審計覆蓋面、精準度、效率、效果都有待提升,存在較大審計風險。
二、在員工行為審計領域創新運用大數據用戶畫像技術的思路
(一)大數據用戶畫像概述
用戶畫像,即用戶信息標簽化,最初在電商領域得到應用。隨著互聯網、大數據、云計算的發展,用戶畫像被賦予新的內涵,具體來說,就是基于大數據分析和數據挖掘技術,廣泛收集與分析用戶的社會屬性、生活習慣和消費行為等信息,抽象出一個全景化的用戶模型,以幫助企業尋找潛在目標客戶、精準營銷、預測與決策。簡而言之,構建用戶畫像的核心工作就是給用戶“貼標簽”,而標簽則是通過對用戶信息分析得出的高度精煉的特征標識。
(二)大數據用戶畫像技術在商業銀行的主要應用場景
目前,用戶畫像在商業銀行前后臺均有一定的應用場景。比如,前臺客戶營銷系統中,基于客戶消費習慣,給其消費行為打上專屬標簽,進行有針對性的內容傳播和活動推送,最終實現精準營銷;信貸業務管理系統中,整合環保、法律、監管、征信、財務數據等內外部信息,對法人信貸客戶進行畫像,為信貸決策提供參考。
(三)在員工行為審計中引入大數據用戶畫像技術的思路方法
將全體員工當作“用戶/客戶”,作為審計的研究對象,多渠道全方位地獲取員工的相關信息,并將其中的風險信息進行標準化處理,抽象出風險特征標簽,搭建大數據員工行為風險評估體系,形成“員工風險特征畫像”,從而清晰呈現出全員風險狀況,發現潛在的高風險員工。根據員工風險特征值的高低,采取不同的審計策略和管理措施。在員工行為審計中引入大數據用戶畫像技術,可以打破傳統審計方法的局限,達到“全員覆蓋、多維分析、精準評估、立體畫像”的效果。
三、員工風險特征畫像體系的構建
以用戶畫像構建的基本流程為基礎,結合商業銀行員工行為管理信息渠道、審計目標與技術方法實際,構建員工行為風險特征畫像體系,概括為四個步驟。
1.確定風險特征維度。運用發散性思維,確定畫像建模所需要的特征維度。一般應包括基本信息、以往合規表現、賬戶交易特征、經辦業務風險狀況等。
2.內外部數據采集。打破條線系統間壁壘,匯聚整合銀行內部數據,并全方位采集外部信息。針對不同的數據來源和數據特性采取不同的采集策略。比如,員工基本信息一般來源于人力資源部的員工花名冊或相應人力資源管理系統;以往合規表現,來源于銀行內部各類系統、資料,如內外部檢查發現問題清單、責任追究臺賬、舉報投訴臺賬、業務系統預警等;外部數據,來自互聯網數據,包括裁判文書、失信被執行人信息、工商信息等,通過Python程序、爬蟲軟件等進行采集。還有一種重要信息是審計系統模型線索,即根據所需風險特征維度,在內部審計系統運行相關審計模型后得到的數據線索。
3.數據分析與標準化處理。對采集到的數據進行初步分析和標準化處理。畫像所需采集的內部資料數據多為半結構化數據,數據結構不統一、不固定、不清晰,往往包含大段文字,有價值的信息被大量冗余信息包裹,是數據處理的難點。以電話投訴信息為例,某行一年電話投訴信息達數萬條,需要從中篩選出與員工違規風險的相關信息,并處理成標準字段表,可運用NLP自然語言分析技術,按“民間借貸、借錢不還、冒名貸款”等關鍵詞,對投訴臺賬進行智能分詞,自動提取員工姓名、機構、時間、違規特征等標準字段,形成結構化數據(數據來源、采集及處理方式見表1)。
4. 對風險特征賦值并進行立體畫像。數據經過標準化處理后,形成各個維度的風險特征標簽,將特征標簽匹配至相應員工。構建員工行為風險評估體系,根據崗位、級別等重要性水平,設置不同的崗位風險系數;將來自內外部系統的風險特征標簽進行分類、量化、風險權重賦值和加總,得到員工的總體風險值。在我們設定的風險評估模型中,總體風險值的計算公式為:員工總體風險值=崗位風險系數*(合規信息風險值+模型信息風險值+外部信息風險值)。各類風險特征賦值可根據審計經驗判斷進行設定,見表2。后期在數據積累的基礎上,可引入貝葉斯機器學習智能算法,提供最優加權風險系數的推薦和動態調整,以提高風險評估的精準度。
四、員工風險特征畫像在審計中的應用實踐
筆者所在內審機構在對某省級分行開展審計過程中,以多維數據表形式初步構建員工行為風險特征畫像,整合近三年內外部相關風險信息,實現了對被審計分行1萬余名員工的初步風險評估,并在以下審計場景中進行了運用。
場景一:鎖定重點樣本。對全體員工風險特征值的高低進行排序,結合審計資源情況,選取一定比例高風險值員工作為重點審計樣本。利用RPA技術,批量生成各樣本的員工風險信息檔案,一對一地發送給指定審計人員,引導查證。從審計結果來看,選樣精準度較高,揭示了部分員工嚴重違規行為和少數案件風險。此外,全員畫像打破了傳統審計抽樣的局限性,對審計選樣外的潛在高風險員工線索可移交至被審計單位核查,強化全行員工行為排查。
場景二:確定重點區域。根據高風險值員工集中度分析,選取少數機構作為內控案防重點審計機構。比如,在審計分析中發現前100名高風險值員工中約1/3屬于某二級分行所轄機構員工,對該機構內控案防管理整體情況進行重點審計,最終揭示了該行在案防基礎管理、員工行為排查、員工輪崗、責任追究等方面的問題。
場景三:提煉管理問題。根據風險特征維度的聚類分析,查找員工管理和內部控制的薄弱環節。比如,在對歷史合規風險信息分析過程中發現,部分機構權證出借超期未歸還預警、ETC相關投訴信息較多,進一步開展審計查證,揭示了權證管理、ETC業務管理等方面的問題。
場景四:特定員工群體風險分析。可根據不同的審計項目、審計內容需要,增加提拔人員、離退人員、涉貸人員等標識,調整特征維度、權重,實現對某類人員的風險特征畫像。比如,在某審計項目中,需要對駐村扶貧干部選用情況進行審計,利用員工風險特征畫像表,增加扶貧干部標識,對高風險值人員進行重點審計,揭示了扶貧干部選用不審慎、“帶病上崗”等問題。
目前,商業銀行員工風險特征畫像還處于探索階段,風險特征標簽選取、權重設定等還需要在實踐中調整優化,內外部數據的挖掘和分析還要探索,還需要搭建系統平臺以實現數據積累和動態更新。通過建立全覆蓋、關聯式、長周期的員工風險畫像模型體系,將可用于審計、內控或業務部門開展員工異常行為的動態監測和預警,實現對風險隱患的“早發現、早識別、早處置”。員工風險特征畫像將在員工管理、案件防控、內部審計等方面大有作為,持續不斷地為商業銀行穩健發展賦能。
[作者單位:中國農業銀行審計局武漢分局,郵政編碼:430070,電子郵箱:18995599700@189.cn,
課題組成員:曹立珊 倪登漢 張進超 鐘珍(執筆)瞿斌]
主要參考文獻
[1]孫中東.金融科技賦能銀行的路徑與方式[J].當代金融家, 2019(7)
[2]魏雪嫻.數字化轉型背景下信用卡用戶畫像體系研究[J].中國信用卡, 2020(10)