郭峰濤

摘要:本文主要從中小城市商業銀行管理角度出發,探討在數據質量管理活動中如何有效識別、度量、監控和預警數據質量問題,探索數據質量管理評價考核方法,提高問題數據整改效率,推動統計數據質量的進一步提升,發揮數據資產應用價值。
關鍵詞:銀行 數據質量 校驗規則
一、引言
隨著大數據、云計算、金融科技等技術、概念在銀行業金融機構的不斷深入和運用,數據已成為銀行非常重要的資產,其地位已不亞于金融資產,數據分析和數字化理念已貫穿銀行整個經營管理活動,數據質量的高低,直接影響著數據資產的應用價值。本文根據作者在銀行的實踐經驗,就中小城商行數據質量管理的需求調研、校驗規則制定、問題跟蹤整改、數據質量考核至規則關閉的全流程管理活動進行探討。
二、數據質量管理概述
數據質量管理是指對數據自產生、采集、存儲、共享、應用等各個階段可能引發的各類數據質量問題,進行識別、度量、監控、預警、報告和控制等一系列的管理活動,從而進一步提升數據資產的應用價值。數據質量管理活動應貫穿銀行的數據統計、經營管理和業務發展的各個環節,但中小城商行受人力資源和信息科技系統等方面的制約,應以首先滿足解決監管金融統計的需求為主要目標,來穩步有序推動銀行的數據質量管理。
三、數據質量度量原則
目前,城商行在數據質量管理活動中的度量原則一般可分為:唯一性、準確性、一致性、完整性、有效性和及時性。其中:一致性主要是確保數據在特定數據集中不存在重復值;準確性是指數據符合真實情況;一致性指同一數據項在系統內或不同系統間保持一致;完整性要求所必輸的數據項的數據屬性均被記錄;有效性指數據符合已定義的格式規范和業務規則;及時性指數據被及時更新以體現當前事實。此原則構成了銀行在具體實踐活動中制定數據校驗檢核規則的方法論,若數據不滿足度量原則即可歸類于問題數據。
四、數據管理需求的調研與分析
數據管理需求的調研、收集與分析,是制定有效校驗規則的必要環節和前提條件。通過對數據質量問題產生的原因、管理的動機和目標進行深度剖析,制定符合銀行實際的校驗規則,覆蓋數據的全生命周期,達到管理目的。過程包括:一是對前臺業務和管理人員調研,了解業務操作流程,調研數據生產者的管理需求;二是對數據應用部門調研,確認數據使用者的管理需求;三是對數據報送過程中遇到的問題進行經驗總結,明確監管者統計需求;四是通過內部審計發現數據問題,確定管理者的數據需求。
五、構建數據質量核檢規則
在度量原則的框架下,城商行可制定符合行內實際的檢驗規則,根據發現問題的屬性主要分為:
(一)邏輯性校驗規則
對統計要素或者信息項進行邏輯檢驗,定位問題數據。如對主證件號、客戶號等信息唯一性檢驗;對總賬與明細賬匯總數據比對,核查總分是否一致;根據會計恒等式資產=負債+所有者權益,對會計科目的借貸金額進行比對,定位財務數據問題等。
(二)信息項變動監測
對信息項的取值在前后期資產負債表日的變動進行跟蹤,確定變動是否真實、準確,是否有人為因素干預或因系統穩定性等情形導致。如核查企業規模、行業分類等信息項變動。
(三)風險數據預警
對風險指標數據進行監控預警,為業務管理活動提供信息。如對信貸客戶的逾期警示,對貸后管理中財務信息是否及時更新等信息進行預警。
(四)重點業務監控
對重點管控的業務進行實時監控,如房地產、普惠金融信貸投放和利率管控等。
(五)關鍵字匹配監測
利用模糊查詢方式,對帶有特定關鍵字具有特定屬性的信息項進行監控。如客戶名稱中有股份有限、有限責任字樣的,其機構類型字段不應為機關法人;名稱中帶農村商業、證券、保險等金融機構,其同業客戶類型應為對應的分類。
(六)值域檢驗
對統計要素或信息項的數據元取值進行空值、長度和編碼值等監測。
為確保校驗規則后續的有效運行,需要針對規則建立準確性和可靠性評估體系,城商行可以根據成本效益原則,合理確定評估周期,保持系統運行的穩定性;同時,根據規則運行情況,分析統計誤差,不斷改進和優化規則,實現規則的迭代升級。對于規則運行產生的問題數據較多情況,需進一步分析是否有必要對業務系統進行完善和優化,在業務系統中增加強制性規定、邏輯校驗或者錄入信息時的預警提示,從系統源頭控制數據質量,來反向推動系統的更新升級。
六、數據質量管理監控
針對信息科技力量薄弱的城商行,若未建立數據中心或者數據集市的,通過在業務系統中建立業務查詢SQL語句或者執行腳本的方式,實現對數據的監控和跟蹤。此模式缺點是可能對業務系統造成一定的資源占用,影響系統的運行效率;優點是可以實時監控問題數據,確保問題能在第一時間發現和反饋。
針對已建立完成數據中心的城商行,可以依托數據中心,建立檢驗規則庫或者開發專用的數據質量管理系統,將規則庫加入數據中心的調度任務中,在數據跑批過程中實現問題數據的監控和管理。此模式缺點是依賴于數據中心的數據抽取、加載和加工完成后,方可進行數據監測,問題數據的發現存在一定的滯后性,且數據中心是經過標準化加工的數據,建立規則和定位跟蹤問題數據時,需能熟悉和了解各個業務系統的數據結構,精準定位問題數據的系統來源和信息項;優點在于不占用業務系統的資源,且能從全局角度進行數據質量管理。
七、數據質量管理評價
數據質量管理評價是數據管理活動中最后一個環節,也是推動數據質量改善的主要工具和手段。城商行數據質量管理評價應綜合考慮受評價主體的業務量大小、信息項的影響因子、問題響應程度和解決效率等因素,由數據治理委員會賦予一定權重后,形成科學合理的考核結果。若假定考核得分采用滿分100制,數據質量考核計算如下:
其中,問題考核得分中的影響因子是根據規則對統計數據的影響程度賦予不同系數和權重,響應效率和解決效率表現形式如下:
其中,下發時間是指考核單位的數據質量管理員將問題數據下發至數據所有者的時間;解決時間是指數據所有者改正問題數據的時間。設置效率考核的主要目的是督促機構提高對問題數據的解決效率,激發對數據質量主動管理的積極性。
數據質量問題對于數據統計,類似于系統風險相對于商業銀行,并不能完全消除,但可以通過培訓、編制詳細解決方案等方式,提高數據生產者和錄入者的業務水平,降低數據源頭的發生機率,同時提高問題數據的發現和整改效率,來推動銀行數據治理成熟度水平的提升。
參考文獻:
[1]龍海躍.歐盟統計數據質量管理體系及其對我國的借鑒研究巧[D].湖南大學,2013.
[2]李丹.商業銀行數據治理研究[J].中國金融,2019年13期.
作者單位:長城華西銀行計劃財務部