劉永星



【摘 要】基于知識圖譜的商業銀行內部審計風險分析框架以知識圖譜、圖數據庫及國際標準規范為基礎,將審計知識數字化,數字圖譜化,圖譜智能化,實現對被審計對象風險分布、風險特征、風險量化評價等的一鍵生成,并進行風險預測。解放審計人員用在繁瑣審計事務的時間,使得審前分析更加高效、審計抽樣更加科學、審計查證方向更加精確,大大提升審計質效。
【關鍵詞】商業銀行;內部審計;知識圖譜;風險分析
一、引言
近年來,隨著人工智能、大數據、可視化等技術的迅猛發展,促使社會各領域從數字化、網絡化向智能化加速躍遷,智能技術的大規模商用已成為必然趨勢。對商業銀行而言,金融科技已成為支持業務轉型發展的重要戰略,其產品制度、業務流程不斷創新,業務數據量快速增長。在此背景下,各類審計數據也爆發增長,內部審計必須緊跟業務部門技術創新的步伐、主動求變應變,探索研究新技術在審計工作中的應用,只有這樣才能保證內部審計的履職能力與業務發展持續匹配,從而更有效地防范審計風險。
然而,在實際工作中審計人員往往需要花費大量的時間和精力在一些重復性工作,比如梳理以往審計發現情況、選取審計重點、制定審計抽樣策略等。同時,審計查證過程多數時間是對點上的問題進行分析,如何點面結合的從人員、機構、業務流程等多個維度,進行審前分析、審計查證、預測風險影響、執行審計跟蹤等審計活動,由于受到技術工具、業務經驗、工作能力等因素制約,審計遺漏甚至差錯仍時有發生,審計工作的效率效果難以得到保證,成為制約審計質量提升的難點和痛點。
針對上述商業銀行內部審計中存在的問題,本文以IT審計為例,詳細闡述了知識圖譜在商業銀行內部審計風險分析中的應用方法,該方法以各類審計信息、COBIT 2019框架為數據基礎構架審計知識圖譜,以一種直觀、易理解、圖形化的方式來表達審計知識以及知識之間的關聯關系,實現對被審計對象風險分布、風險特征、風險量化評價等的一鍵生成。同時,基于鏈接預測實現一鍵式風險影響推薦,解放審計人員用在繁瑣審計事務的時間,大幅減少審計人員在重復性工作上的投入,也能降低審計差錯率,從而使審計人員把更多的精力放在提升審計質量和職業洞察力上。
二、總體分析框架
在內部審計作業過程中,積累了豐富的審計知識,不僅包括審計方法、流程、工具,審計測試點、訪談對象、調閱資料等有形的審計知識,還包括審計專家經驗等無形的審計知識,以及業界最佳實踐、行內業務流程等業務知識。通過利用neo4j圖數據庫,對上述知識進行融合重構,抽取它們之間的內在邏輯關系,將審計知識圖譜化,建立一個高效、去中心、可擴展、可視化知識網絡。在此基礎上,通過知識查詢、聯結、計算,滿足各類審計風險分析需求。總體分析框架如圖1所示。
通過對審計知識進行梳理,形成審計問題、IT管理流程、管理系統、審計測試工具、制度依據、Cobit體系,以及機構、人員、調閱資料、訪談對象等10類知識,通過彼此之間互相關聯形成知識圖譜,如審計問題發生于某審計機構、某審計人員隸屬于某審計機構等關系。其應用場景包括風險評估、內控評估、輔助審計抽樣、審計查證指導等審計作業環節,可為審計人員提供一個較為全景的審計對象分析視圖及量化指標,提升工作效率效果。
三、基于知識圖譜的審計風險分析方法
1.數據提取。
通過使用COBIT R2019框架、審計測試點表、審計問題詞條、IT流程信息、審計工具、機構/人員等信息,根據Neo4j圖數據庫的構建規則,抽取相關信息形成各類數據基線。
2.知識構建。
根據提取的各類數據,對相關數據進行歸納整理,形成neo4j圖數據庫節點和節點之間的關系,用來表示審計知識和知識之間的關系。通過將COBIT業界最佳實踐、行內IT管控流程、審計發現問題等知識實體等進行彼此關聯,形成了一張較為完整的審計知識網絡。通過建立知識實體和知識關系,借助Neo4j圖數據庫查詢及圖算法,便可高效的從多個維度對審計對象的風險水平進行評分,同時對其風險視圖、風險分布、風險特征、風險影響等進行高效分析。
四、基于節點親密度及鏈路預測的風險影響推薦
圖數據庫的優勢在于發掘節點之間的隱形關系,根據風險傳導理論,當某個業務流程評價為高風險的時候,與其親密度較高的業務流程,也可能面臨一定的風險隱患,因此通過使用基于圖數據庫節點親密度及鏈路預測的方法,可為審計人員推薦相關的業務流程予以重點關注。鏈接預測是圖數據挖掘中的一個重要應用方向,旨在預測圖中丟失的邊, 或者未來可能會出現的邊。該算法主要用于判斷相鄰的兩個節點之間的親密程度,通常親密度越大的節點之間的親密分值越高,表示節點之間的相互影響的可能性越大,節點親密度計算可使用Common Neighbors算法和Adamic Adar算法。
1.Common Neighbors算法。
該算法根據相同鄰居,計算兩個節點同時關聯的節點數量,計算公式如下:
CN(x,y)=N(x)∩N(y)
可以看出CN(x,y)越大,表示節點之間的連接關系越多越緊密。
2.Adamic Adar算法。
該算法是一種基于節點之間共同鄰居的親密度測算方法,親密度計算公式如下:
A(x,y)= ■
可以看出,A(x,y)的值越大,表示節點之間的風險傳導越集中,節點之間互相影響程度越大。
3.鏈接預測。
根據計算出的CN(x,y)、A(x,y),即可根據預設的閾值,推薦某個流程發生的問題對其它流程的影響。閾值設置如表1所示。
4.使用鏈路預測進行關聯風險推薦。
通過使用節點親密度及鏈接預測算法,以流程編號為“BAI0302”的業務流程為例,計算其對其它業務流程的影響程度,篩選3個以上共同節點,影響因子為2以上的節點,即可得到與業務流程“BAI0302”關系最密切的4個其它業務流程,推薦給相關審計人員。
五、結論
本文詳細分析了目前商業銀行內部審計風險分析中面臨的內外部環境變化,針對目前審計技術工具、業務經驗、工作能力等方面制約因素,基于知識圖譜技術,提出了一種商業銀行內部審計風險分析框架及方法。與傳統的數據分析方式相比,基于知識圖譜的審計分析方法可以一種人腦最易接受和理解的方式呈現審計知識。同時,由于知識網絡沒有固定的中心,因此可基于圖串聯及鏈接預測,實現對被審計對象的風險分布、風險特征、風險量化評價、風險影響推薦等信息的一鍵生成,大大提升審計質效。
········參考文獻·····················
[1]俞祝良.人工智能技術發展概述[J].南京信息工程大學學報,2017,9(3).
[2]李少敏.大數據技術在人工智能中的應用研究[J].數字技術與應用,2020,38(10).
[3]王鑫,傅強,王林,徐大為,王昊奮.知識圖譜可視化查詢技術綜述[J].計算機工程,2020,46(6).
[4]高洪民,李剛.金融科技、數字貨幣與全球金融體系重構[J].數字貨幣,2020,43(2).
(作者單位:中國建設銀行股
份有限公司山西總審計室)