丁炯 張曉明 富勤偉 趙文瑜 范濤
摘要:基于大數據智能分析技術的金融風險監管平臺融合統計學、經濟學、人工智能等多種方法提升金融風險評估方法,解決現有金融機構風險評價中的瓶頸問題,實現了對新金融機構個體、行業的系統監測和動態評估,把握新金融機構動態發展趨勢及其風險特征,從而推動在監管科技和監管方法上取得突破。
關鍵詞:大數據;金融風險監管;智能數據分析
中圖分類號:TP319
Design and Research of Financial Risk Supervision Platform Based on Big Data Intelligent Analysis Technology
Ding Jiong[1],zhangXiaoming[1],FU Qingwei[1],Zhao Wenyu[2],Fan Tao[2]
(1. Shanghai Shuquan Data Technology Co., Ltd., Shanghai,200237;
2.Center for Financial Data Research, East China University of Technology, Shanghai, 200237)
ABSTRACT: Financial risk monitoring platform based on big data intelligent analysis technology integrates statistics, economics, artificial intelligence and other methods to improve financial risk assessment methods, to solve the bottleneck problem in the risk assessment of existing financial institutions, and to realize the systematic monitoring and dynamic assessment of new financial institutions'individuals and industries. The dynamic development trend and risk characteristics of new financial institutions promote breakthroughs in regulatory technology and methods.
Key words: big data; financial risk supervision; intelligent data analysis
1.背景
隨著互聯網(尤其是移動互聯網)經濟爆發式的增長,從2013年開始的網絡支付、網絡借貸、網絡理財等各類互聯網金融、移動金融的創新發展,到如今從中央到地方全面針對此類新金融規范發展的大命題的轉變,如何識別新金融風險并引導其健康發展就成為了地方新金融服務和管理部門的關鍵任務之一[1]。伴隨近年來新金融的狂飆突進式發展,各類逾期違約、跑路失聯、非法集資、理財詐騙等風險事件也層出不窮,且愈演愈烈[2]。目前,互聯網金融風險專項整治工作已進入“清理整頓”階段,在處置不同形態的互聯網金融時[3],要把投資者的利益放在第一位。平臺旨在通過大數據的技術手段整合機構運營數據、政府公共信用數據、網絡輿情數據等數據源,通過對多元數據的清洗挖掘和風險建模,形成對區域新金融風險的綜合監測與分析報告[4]。
2.平臺建設方案
2.1平臺實施路徑
構建互聯網金融信用風險評價和監測預警平臺,為金融監管提供新的方法和技術,從而保障我國金融業的健康有序發展。具體而言,本平臺的技術實施路徑包括:
1、根據互聯網金融的業務模式、特點與風險特征,建立一個更加全面的金融機構信用風險評價體系,以保障風險評估的有效性;
2、基于多源異構大數據,利用大數據技術和數據挖掘方法提取數據特征,從而形成對互聯網金融機構的風險畫像分析;
3、融合統計學、經濟學、人工智能等多種方法提升風險評估方法[5],解決現有金融機構信用風險評價中的瓶頸問題,對互聯網平臺的風險給出定量分析;
4、構建互聯網金融平臺的風險監測系統,從而實現對互聯網金融各個平臺的監測和動態評估,以把握互聯網平臺的動態發展趨勢及其動態風險特征,從而推動在監管科技和監管方法上取得突破。
2.2 平臺的功能模塊
平臺的功能模塊如圖1所示。根據需要,項目建設后擬實現的新業務流程如圖2所示。根據金融機構信用風險評價系統對數據的需求,基于開放互聯網通過Scrapy分布式爬蟲框架獲取海量異構數據,并通過文本篩選過濾等方式實現對數據的清洗和預處理。
根據業務相關文檔的文本語義特征與潛在關系,完成對業務相關文檔的多標簽標注與語義分類,實現基于集成學習的多標簽分類;利用深度學習實現訓練數據的構建和文本特征的選擇,實現金融企業的多維畫像屬性抽取與知識圖譜構建; 基于信息文本挖掘的信用評價指標體系,分類特征庫與評價指標映射,信用風險評價指標度量和信用風險評價模型形成對金融機構信用風險評價。
2.3 平臺的整體架構
平臺的整體架構如圖3所示,由硬件層、大數據支撐層、平臺系統層構成。
1、硬件層:新金融監管平臺可基于云服務部署,因此其硬件部分包括云計算資源,云存儲資源和網絡資源組成。當然基于內部已有服務器或虛機資源也可重新搭建硬件環境。
2、大數據支撐層:包含大數據平臺及其各個功能組件,包括分布式存儲的分布式文件存儲系統[6],資源管理組件YARN[7],批處理組件PIG[8]和框架MapReduce2,工作流組件Oozie[9],交互式分析組件Zeppelin[10]和交互工具HUE,ES全文搜索引擎,實時同步組件Data Alive[11],數據集成組件Sqoop[12]和日志采集工具Flume,消息隊列Kafka,協作服務組件 Zookeeper以及建立在這些組件之上的PL/SQL引擎,數據挖掘與及機器學習引擎,NoSQL 數據庫和流處理引擎。
3、平臺系統層:平臺框架系統、數據可視化系統、預警監測系統、風險評估系統、管理與共享系統。
3.經濟及社會效益
3.1對防范地方金融風險和預測研判的作用
項目落地實施后可以有助于當地的新金融風險實現“穿透式”,精細化,針對化監管。對與新金融機構的每次交易實現數據顆粒更加細致的監管預警機制,發現新金融機構風險點,針對式的提出整改意見。通過大數據平臺匯聚海量的地方金融風險數據,依據風險評估模型,對區域經濟金融風險起到預測研判的作用。
3.2對提升能級和擴大就業的作用
平臺可填補當前針對地方新金融監測服務的空白,并為線上金融業務風控提供智能化解決方案,實現高效便捷的金融供需對接,優化行業生態和服務模式。項目開發過程中,還會直接帶動40-50人新增就業機會,培養一批大數據金融風控人才。
3.3對區域經濟和行業發展的帶動作用
平臺正式落地投入使用后,通過凈化區域金融環境,為新金融行業更多守法合規機構拓寬業務道路,大力發展普惠金融提供必要保障;同時,平臺拓展大數據在金融監管,包括金融行業的應用示范;最后項目承建方及其合作方將積極引入數十家相關企業,大力發展金融科技,創新金融,人工智能等方面在我市的建設,并擬牽頭發起相關人工智能大數據產業基金。
4.總結
根據全國金融工作會議導向,增強金融監管協調的權威性有效性,強化金融監管的專業性統一性穿透性,所有金融業務都要納入監管,及時有效識別和化解風險。建立健全我市新金融綜合監測服務平臺,對于金融風險防范工作創新和有益嘗試,一方面可有效拓展相關監管機構的視野,減輕日常監管的工作壓力和負擔,實現對新金融風險的“早發現、早研判、早預警、早處置”;另一方面也會對新金融機構運營和發展形成威懾和規范引導作用,從而促進區域新金融產業健康可持續發展。
未來,可以基于區域試驗性落地經驗,并結合其他地區特點進行系統優化,推廣試驗。成為金融監管、金融風控的示范項目,也是地方新金融機構擁護監管,證明機構實力的標桿項目。在地方政府金融監管部門指導下,不斷優化加強系統智能監管能力,對規范新金融發展,踐行普惠金融起到推動作用。
參考文獻:
[1].趙文瑜, 范濤, 候秦,等. 金融交易風險監控平臺的相關技術研究[J]. 電子測試, 2016(17):178-181.
[2].黃清觀. 論提升互聯網防控金融風險監測預警能力[J]. 公安教育, 2018(2):34-37.
[3].李博. 探析商業銀行供應鏈金融風險控制[J]. 財會學習, 2018(11).
[4].袁軼. 商業銀行金融會計風險防范與控制[J]. 財會學習, 2018(16).
[5].陶興海. 基于Scrapy框架的分布式網絡爬蟲實現[J]. 電子技術與軟件工程, 2017(11):23-23.
[6].Harter T, Borthakur D, Dong S, et al. Analysis of HDFS under HBase: a facebook messages case study[M]. USENIX Association, 2014.
[7].Wang K, Meng Q, Zhang Y, et al. High-performance two-ply yarn supercapacitors based on carbon nanotubes and polyaniline nanowire arrays.[J]. Advanced Materials, 2013, 25(10):1494-1498.
[8].Zhao P, Yu Y, Feng W, et al. Evidence of evolutionary history and selective sweeps in the genome of Meishan pig reveals its genetic and phenotypic characterization.[J]. Gigascience, 2018, 7(5).
[9].Vaddeman B. Creating and Scheduling Workflows Using Apache Oozie[M]// Beginning Apache Pig. 2016.
[10].Ladefoged L K, Zeppelin T, Schi?tt B. Molecular modeling of neurological membrane proteins ? from binding sites to synapses[J]. Neuroscience Letters, 2018.
[11].Richins D, Ahmed T, Clapp R, et al. Amdahl's Law in Big Data Analytics: Alive and Kicking in TPCx-BB (BigBench)[C]// IEEE International Symposium on High Performance Computer Architecture. 2018.
[12].Richins D, Ahmed T, Clapp R, et al. Amdahl's Law in Big Data Analytics: Alive and Kicking in TPCx-BB (BigBench)[C]// IEEE International Symposium on High Performance Computer Architecture. 2018.
上海市經濟和信息化委員會人工智能創新發展專項支持項目:針對新金融風險的大數據智能監管平臺建設與應用,項目編號:2017-RGZN-01018