徐建衛 張懿 周桐
[摘要]知識圖譜技術為商業銀行非現場審計提供了新工具。目前知識圖譜已在審計知識查詢檢索、業務主體關系識別、金融賬戶交易監測、金融欺詐風險防范等商業銀行非現場審計場景中得到運用,但數據治理能力不足、部門間協同程度較低、技術門檻制約以及內外部數據割裂等問題制約了知識圖譜使用范圍的擴大和作用的發揮。未來可從加強數據治理、升級應用平臺、強化信息技術運用等方面著手,推動知識圖譜技術在更多非現場審計場景中發揮其特有價值。
[關鍵詞]知識圖譜? ?商業銀行? ?非現場審計
非現場審計是在現代信息處理和傳遞方式下發展起來的一種遠程審計監督方式,它通過收集、整理和分析審計對象的業務經營管理數據資料,查找審計對象經營管理中存在的問題,評價其風險程度,為現場審計提供審計線索,為編制審計計劃以及安排審計資源提供依據。非現場審計作用的發揮取決于大數據分析與信息處理技術的運用。作為一種大數據分析技術,知識圖譜因具有強大的理解、推理和計算能力而受到關注,自谷歌公司于2012年推出基于知識圖譜的搜索引擎之后,知識圖譜逐漸在智能問答、輿情分析、數據挖掘和深度學習等領域得到運用。近年來,部分國內商業銀行開始將知識圖譜運用到非現場審計業務中。結合對部分銀行的調研,本文對知識圖譜技術在商業銀行非現場審計中的運用條件、運用場景、面臨的困境進行梳理和分析,并就如何推進知識圖譜在銀行非現場審計中的深度運用提出建議。
一、知識圖譜在商業銀行非現場審計中的運用條件
隨著智慧金融的不斷發展和圖譜技術的不斷完善,知識圖譜技術運用商業銀行內部審計中已經具備較好的基礎和條件。
(一)商業銀行具備運用知識圖譜的基礎環境
首先,銀行業因與數據的高度相關性,成為最先應用大數據技術的行業之一。中國商業銀行業在經歷了金融信息化、互聯網金融、金融科技等階段后,正向智慧金融階段邁進。作為智慧銀行的重要構成部分,內部審計的智能化逐漸受到銀行管理層的重視。銀行智能化發展趨勢為知識圖譜的運用提供了環境。其次,商業銀行支付結算和賬戶交易體系完備,在經營管理活動中累積了海量業務數據。這些數據為知識圖譜技術的應用提供了強大支撐。最后,作為實力雄厚的知識密集型傳統金融服務業,商業銀行具有大數據和人工智能運用的良好人員和技術儲備,在知識采集、數據的結構化處理、知識抽取以及算法開發等方面具有良好基礎,相對更容易接受和推廣知識圖譜技術。
(二)傳統非現場審計需要智能技術賦能
銀行業務復雜性的增強和數據體量的快速增長,使得傳統非現場審計方式難以適應內部審計工作的新要求。一是傳統非現場審計主要通過電子數據查找審計線索、發現審計問題,不利于進一步深入挖掘審計線索特征,進而通過審計線索追蹤到具有關聯關系的更為隱蔽的問題。二是傳統非現場審計模型的運行結果通常是表格化的數據,在易讀性和友好性展示上效果欠佳,也缺乏對風險業務的提前預判能力,風險預警響應慢。面對這些問題,傳統非現場審計亟需大數據技術賦能以提高審計工作質效。
(三)知識圖譜為商業銀行非現場審計提供了新工具
知識圖譜能夠運用可視化技術描述知識資源,通過繪制包含對象、屬性及關系的知識映射圖譜來挖掘和分析對象的相互關系。通過知識圖譜可以高效直觀地得到目標對象(如客戶,賬戶、事件等)之間的關聯網絡,實現從多維度對審計對象進行畫像。這為商業銀行提供了從“關系”的角度去發現問題、研判風險的新工具。比如,商業銀行通過構建知識圖譜可獲得企業客戶之間擔保和資金往來關系的可視化圖譜。通過追蹤圖譜節點,審計人員能夠快速抓取信息,為非現場審計的風險發現和信息檢索提供直接幫助。此外,知識圖譜是基于大數據分析的技術,理論上能夠實現可用數據范圍內審計對象關聯信息的全覆蓋,有效擴大了非現場審計的風險識別范圍,能夠避免傳統非現場審計的抽樣風險。
二、知識圖譜技術在銀行非現場審計中的應用場景
目前知識圖譜在商業銀行非現場審計中的應用主要集中在審計對象知識的查詢檢索、金融主體關系識別、金融賬戶交易數據監測以及金融欺詐風險防范等方面。
(一)審計對象知識的查詢檢索
查詢和檢索是信息評價的基礎。傳統非現場審計常常通過抽查來發現問題。由于審計對象涉及的知識領域較廣,加之缺乏完善的知識管理,導致審計查詢的效率較低,也無法進行關聯知識的深度檢索。目前商業銀行非現場審計的范圍主要包含對被審計行(機構)業務信息、會計信息、統計信息的真實性和完整性的檢索、測試和評價。知識圖譜技術在部分銀行非現場審計實踐中得到運用,實現了數據與檢索者之間的信息交互。利用知識圖譜技術實現了對審計對象業務數據的全樣本查詢和檢索,獲得對審計對象領域知識的全局認識。通過對檢索指令反饋信息的程序化處理,能夠解決多級并發訪問,實現查詢結果即時反饋,顯著提高了非現場審計查詢的效率。當知識圖譜的數據庫越來越大、內部關聯越來越多后,借助知識圖譜更容易展現知識的整體性與關聯性,更容易獲得需要重點關注的審計領域,提高非現場審計信息查詢和檢索的精準度。
(二)金融關聯關系識別
銀行傳統的風險管理主要通過對擬授信主體的資產負債、現金流量等指標進行準入審核,但這無法判斷主體間的關聯風險。而知識圖譜以圖形式反映數據結構,對于“實體”間“關系”的分析以及知識推理是知識圖譜的優勢。這種關聯關系的展示和推理能夠彌補傳統方法的不足,為識別金融主體間的非正常關系提供技術支持。目前在商業銀行審計業務實踐中,知識圖譜對關聯關系的識別主要體現為兩個方面。一是客戶主體關系識別。比如,某農商銀行利用知識圖譜技術對企業法人客戶的股權關系、上下游關系、黑名單關聯關系、集團關系、異常擔保等潛在關系進行穿透式分析,為非現場審計中的客戶風險識別提供支持。圖譜中出現的異常節點或鏈接成為現場審計的重點。二是企業間關聯交易識別。關聯交易具有隱蔽性強和連鎖反應快等特點,是金融風險控制的重要內容。某國有控股大型銀行在對公司業務的內部審計中,利用知識圖譜的大數據分析技術對審計對象的交易信息進行全方位畫像,實現了對隱性關聯交易的有效識別,發現了相互擔保、重復抵押以及資金串用等關聯交易行為。某股份制銀行將知識圖譜技術應用到企業關聯關系和客戶經理關系網絡分析中,為對公信貸和個人理財銷售提供精準服務,提高該銀行的數據使用效率、數據資產管理能力和反欺詐工作效率。D165DAAF-0E61-4D2D-872D-CD2ED27B9763
(三)金融賬戶交易數據監測
對業務經營的合規性進行監督以確保業務經營安全,是銀行內部審計工作的重要內容。商業銀行通過非現場審計對金融產品、賬戶及交易數據進行監測,為現場審計提供指引。部分銀行機構已經將知識圖譜運用到金融賬戶交易的數據監測中。比如,某國有商業銀行內部審計分中心團隊在非現場審計中采用自上向下方式構建知識圖譜,在金融賬戶交易數據監測上取得較好效果。一是賬戶交易風險監測。借助知識圖譜對多層關聯關系下的異常數據識別、知識推理和可視化展示的技術優勢,該行非現場審計人員對某線上貸款產品的銀行賬戶資金流向進行監測,成功識別出了向行內關系人違規發放貸款、借款資金通過支付寶渠道流向違規領域、關聯客戶惡意騙貸等問題。二是異常交易行為鑒別。該行內部審計分中心在一項針對所轄機構的專項審計中,利用知識圖譜對多筆個人貸款中異常的金融交易行為進行追蹤,揭示出了客戶交叉違約、關聯人關系、額度控制失效等問題。知識圖譜技術的運用顯著提升了該中心審計人員對金融賬戶交易的風險識別水平,有力推動了非現場審計從“抽樣獲取”到“智能識別”的轉型。
(四)金融欺詐風險防范
對金融欺詐行為的識別和防范是知識圖譜在商業銀行風險管理中的重要運用。在內部非現場審計中知識圖譜主要運用在業務真實性審查、貸款擔保關系甄別、反洗錢等方面。業務真實性識別方面,一個典型的運用是借助知識圖譜對海量數據進行程序化處理的便利,對個人金融業務中的詐騙、套現、“薅羊毛”以及盜卡盜刷等欺詐行為進行有效識別和風險提示。比如,某國有大型銀行內審團隊基于企業關聯圖譜構建貸前反欺詐模型,對客戶進行風險畫像,評估客戶欺詐風險。結果表明,使用隱含在關系圖譜中的信息比單純使用企業自身特征數據建模,更有助于銀行對企業申貸欺詐行為進行評估,提高風險識別的精準性。貸款擔保關系甄別方面,典型的運用是借助知識圖譜識別圈保鏈保關系疑點。實踐中擔保圈鏈內企業普遍存在融資杠桿率高、多頭授信以及對外投資房地產及股票等現象。如果有企業對銀行債務違約,將會引起多米諾骨牌效應。審計人員通過繪制擔保圈鏈的知識圖譜,可直觀展現可疑節點,結合數據追蹤,會更容易甄別可疑擔保行為。近年來反洗錢和反恐怖融資受到監管層重視,反洗錢場景下的大數據應用受到金融機構的關注。商業銀行在反洗錢管理中,利用知識圖譜建立反洗錢分析模型,對客戶交易數據進行挖掘,能夠更好地識別資金頻繁匯入匯出及聚集等異常情況,彌補原有反洗錢模型及黑名單管理模式的不足。
三、商業銀行非現場審計中知識圖譜的運用局限
商業銀行非現場審計領域涉及范圍廣,但受數據要素、業務架構、人員和科技支撐等多方面制約,當前知識圖譜技術在商業銀行非現場審計中的應用總體還處于嘗試階段,運用場景較為有限。
(一)數據管理質量不高制約著圖譜分析的精度
數據是構建知識圖譜的基礎,非現場審計中運用知識圖譜需要高質量的數據源。然而實際情況是大多數商業銀行內部數據治理能力并不強,海量數據信息沒有轉化為審計所需的數據資源,制約了知識圖譜的運用。一是對基礎數據缺乏有效管理。商業銀行積累的大量業務數據以Word文檔、Excel表格、PDF文件、圖像、視頻等形式分布于不同板塊的業務系統或數據終端里,數據資源未被整合利用,沒有形成有效的知識積累。這導致工作中往往需要大量的復制粘貼和手工錄入,造成審計資源浪費。二是數據質量達不到圖譜分析的要求。以大數據分析為特征的知識圖譜構建需要高精度和規范化的數據。但由于非現場審計涉及業務范圍很廣,不同業務部門對基礎數據的搜集和錄入不規范,數據的存儲和組織較為松散,數據中存在較多噪音和信息冗余,大量數據達不到圖譜分析的要求。數據質量問題有時候甚至比沒有數據更嚴重地制約知識圖譜在非現場審計中的運用。
(二)部門間協同程度不高制約了圖譜分析運用場景的擴大
非現場審計的目標是要通過數據分析與挖掘來發現審計對象可能存在的風險或問題,為后續現場審計提供方向。從涵蓋范圍看,這一過程幾乎涉及銀行所有經營管理業務,因此高質量的審計工作有賴于部門間的持續協作。部門間的協作包含了兩個方面的內容:一是內審部門與其他業務管理部門的協作,二是內審部門內部不同業務處室(模塊)之間的協作。實踐中多數銀行在這兩方面的協作性并不是很好。前者的協作性缺乏主要表現為業務部門的數據管理水平不高,存在對公與對私、負債與資產、線上與線下、營銷與管理等多維度的數據分隔,不能為非現場審計提供支撐。部門間協同的缺乏也給關聯知識的深度檢索帶來困難,導致對審計知識檢索的精度不高。后者的協作性缺乏主要表現為銀行審計機構內部對審計資源的組織和動員能力不強。精通計算機技術、大數據分析和金融實操的審計人員既存在總量不足,也存在結構性缺陷。這導致審計業務需求與圖譜分析技術無法實現有效融合,知識圖譜的深度知識推理無法運用到更多業務的非現場審計場景中。
(三)內外部數據割裂限制了知識圖譜在外部風險識別中的運用
知識圖譜的數據來源總體上分為從網頁上爬取和從數據庫等結構化的數據集合中抽取得到。銀行運用知識圖譜的數據大致來源有三部分,即行內業務數據、監管數據和行業數據。目前商業銀行非現場審計中知識圖譜分析使用的數據主要為行內業務數據,外部數據的運用存在著“獲取不足”和“整合失效”的雙重問題。一方面由于外部數據資源協作程度不高,銀行數據管理部門對來自工商、司法、稅務、海關、輿情以及第三方合作等外部渠道的數據獲取不足,無法實現行業數據的互聯與互通;另一方面受數據爬取、存儲及管理技術等限制,不同渠道的多源異構數據未能與行內數據完全相適配,形成內外部數據割裂。內外部數據割裂給客戶的外部風險識別帶來困難,使得知識圖譜對擔保、投資、控股等關聯關系以及多頭負債等情況無法給出準確判斷,限制了知識圖譜在外部風險管理中的運用。
(四)技術門檻影響了知識圖譜在審計領域的深度運用D165DAAF-0E61-4D2D-872D-CD2ED27B9763
知識圖譜技術在非現場審計中的有效運用主要取決于三個方面,即方法論、知識庫和審計模型構建。方法工具上,知識圖譜的應用涉及數據挖掘、自然語言處理、機器學習以及人工智能等多個方面。比如,自然語言處理技術決定了從爬蟲平臺獲取數據的能力以及獲取數據的質量,這些數據作為原料決定了知識圖譜的運用。只有讓技術門檻變低,審計才能回歸業務本身。較高的技術壁壘使得知識圖譜在大多數銀行還停留在解決技術問題層面,沒有被大規模運用到解決實際審計問題上。審計建模上,存在業務處室的審計人員不熟悉建模、模型開發人員不熟悉業務的普遍問題。業務人員所提的審計需求往往得不到技術部門的有效支持,審計模型構建需要反復溝通,效率很低。此外,從調研掌握的情況看,國有大型銀行由于數據倉庫建設較早投入較大,非現場審計具有一定技術基礎,知識圖譜在非現場審計中有了初步運用,但尚未深入數據挖掘和智能審計程度;大多數股份制商業銀行和區域性中小商業銀行還基本處于探索階段,短期內知識圖譜還很難在非現場審計工作中得到實質性運用。總體來看,技術門檻在很大程度上限制了知識圖譜在國內商業銀行非現場審計中的運用。
四、知識圖譜在商業銀行非現場審計中的應用展望
(一)加強數據治理,為知識圖譜的運用提供基礎數據支撐
加強數據治理,提升數據的審計分析價值,是當前商業銀行非現場審計知識圖譜運用需要解決的問題。首先,要確保基礎數據的規范性和可用性。各業務管理部門在基礎數據整理中要充分考慮數據存儲的可擴展性、業務人員的易用性以及技術開發的通用性。各業務模塊之間要采用一致的數據標準、口徑和技術規范,以確保多模塊數據在知識圖譜構建時實現融合。數據的顆粒度最好到最小業務單元(如賬戶或銀行卡),并以分布式方式存儲,以滿足數據擴容和不同場景分析的需要。其次,要實現內外部數據的融合。將來自多業務、多渠道、多系統的數據,抽離成符合知識圖譜構建需要的各類實體、關系和屬性,為知識圖譜構建提供數據基礎。最后,要打破數據治理的“部門墻”。產生數據的業務部門要做到“數據誰生產誰負責”,確保數據治理責任到位。總行各業務主管部門設置數據治理專職崗位,分支機構銀行卡業務、票據業務、個貸中心、小企業中心等業務較為集中、數據產生量大的機構要設置專職數據治理崗位,二級分行以上業務條線部門要設置兼職數據治理崗位,業務處理中心、后督中心等機構要設置專職數據治理崗位。內部審計總部要利用內部審計信息化契機,壓實各業務管理部門的數據治理責任,協調推進全行數據治理質量提升。
(二)升級打造全行級圖譜應用系統平臺
非現場審計的高效開展離不開審計業務系統的支持。相較于業務的快速發展,目前國內商業銀行內部審計系統建設普遍較為滯后,急需推動大數據和人工智能技術在內部審計系統建設中得到更深入應用。一是要打造能夠支撐高效在線分析和數據挖掘應用的審計系統通用平臺。依托新的審計系統平臺打通存貸、結算、匯兌、資管等多重關系,實現客戶的統一視圖,為非現場審計模型的構建提供完整視角。二是在審計系統平臺中實現內外部數據資源的有效整合。運用自然語言處理等手段,將來自互聯網及第三方的數據進行結構化處理,轉換成能夠滿足非現場審計建模要求的數據形式。通過建立審計對象標識特征庫,構建客戶關系全網視圖,從多維度呈現審計對象的真實屬性和復雜聯結關系。三是依托審計系統構建起以行業、客戶、產品為實體的知識圖譜數據庫。支持審計人員建立符合多機構和多業務場景審計需求的審計應用模型。通過系統平臺幫助審計人員快速梳理審計關系,確定審計思路,把握審計重點,助力非現場審計工作的高效開展。
(三)強化信息技術在非現場審計中的應用
隨著商業銀行內部數據治理和審計系統平臺建設的不斷完善,知識圖譜技術將會在非現場審計中發揮更為重要的作用,但這也對內審人員的數據分析和信息處理能力提出了更高要求。遺憾的是目前國內商業銀行審計人員這方面的能力普遍不高,技術門檻仍然是阻礙知識圖譜深度運用的重要因素。商業銀行需強化審計隊伍的信息化建設,更加重視復合型審計人員的選拔、培養和鍛煉。在人員入口關要加強對數據分析處理能力的考察,加強對其基層業務背景與內審崗位匹配度的考察。有條件的銀行在跨區域的審計機構中要引進專業IT人員組建大數據分析團隊,團隊人員應熟悉后臺數據基礎表結構,熟練使用統計分析工具,輔助非現場審計人員進行深度的數據分析與挖掘工作。對在崗審計人員要加強對自然語言處理、人工智能、大數據等技術的針對性訓練,不斷提升其數據分析、新技術使用以及審計模型運用能力,有針對性地安排內審人員到屬地分支機構業務管理和信息科技部門交流鍛煉。通過降低技術門檻促進知識圖譜技術在銀行非現場審計中的運用。
(四)推動知識圖譜技術在更多非現場審計場景中運用
目前知識圖譜在非現場審計中的運用主要集中在準入篩查、違約識別、貸款預警等風險防控方面。實際上知識圖譜在非現場審計中可以發揮更多作用。知識圖譜在知識管理、精準營銷、信用評估、適當性管理、內部控制等諸多業務場景中均能發揮作用,如利用圖譜畫像可以實現對業務營銷的審計督導。在業務營銷中客戶經理可建立銀行客戶社交網絡圖譜,根據交往方式和頻次定義圖譜的關系模型,挖掘具有相似行為的潛在客戶。審計人員利用知識圖譜可以判斷業務營銷部門是否掌握了重點客戶的資金、人員和上下游關系,是否有效挖掘潛在客戶,向其推薦相關的產品和服務,為對營銷部門的績效審計提供參考。在管理人員離任經濟責任審計中,對審計對象個人履歷、分管業務、監督檢查記錄等設置關聯規則,對其及關聯賬戶和資金往來進行關聯關系分析,可發現內外勾結和資金異常流動等違規行為。此外,利用知識圖譜的學習功能可以建立審計報告、具體風險點及制度依據之間的關聯,實現審計知識的高效管理。在此基礎上,利用知識圖譜技術可實現非現場審計報告工作底稿部分內容的自動生成,減少報告在不同人員之間的流轉次數,能夠有效提升非現場審計工作的效率。
主要參考文獻
[1]陳偉,居江寧.基于大數據可視化技術的審計線索特征挖掘方法研究[J].審計研究, 2018(1):16-21
[2]金磐石,萬光明,沈麗忠.基于知識圖譜的小微企業貸款申請反欺詐方案[J].大數據, 2019(5):100-112
[3]李濤,王次臣,李華康.知識圖譜的發展與構建[J].南京理工大學學報, 2011(1):22-34
[4]牛艷芳,薛巖,鄧雪梅.審計大數據關聯的網絡分析平臺構建及應用研究[J].審計研究, 2018(5):35-42
[5]萬丹,任昌鴻,楊星.非現場審計在銀行內審工作中的價值探索[J].中國農村金融, 2020(18):71-73
[6]王瑞萍,劉峰.審計知識圖譜的構建與研究:基于Neo4j的圖譜技術[J].中國注冊會計師, 2020(9):109-113D165DAAF-0E61-4D2D-872D-CD2ED27B9763