




摘要:近年來,數據安全相關法律法規密集出臺,債券市場金融基礎設施需要提升數據安全服務能力以增強我國債券市場的互聯互通,提升金融信息整合度、市場透明度和資金流通性,改善監管穿透能力。本文研究新型債券市場金融基礎設施,聚焦隱私數據安全計算,打造數字經濟競爭優勢,驅動金融業生產方式、服務方式、治理方式變革,營造應用合規、數據安全的良好數字生態。
關鍵詞:金融基礎設施 數據安全 聯邦學習 多方安全計算 隱私數據
引言
2018年以來,我國數據安全產業2增長勢頭迅猛,同比增速逐年快速上升且連續兩年超過30%(見圖1)。2020年10月,“十四五”規劃和2035年遠景目標綱要提出激活數據要素潛能,加快建設數字經濟、數字社會、數字政府,以數字化轉型整體驅動生產方式、生活方式和治理方式變革,強調數據價值釋放、數字化轉型、數據治理的重要性,對我國數據安全產業提出了更高的要求。
同時,西方主要發達經濟體相繼發布數據戰略,利用數據基礎設施建設、人才培養等手段促進該產業發展。2020年,歐盟發布《歐洲數據戰略》,提出更新法規政策以提供更多數據安全產品,進一步投資數據安全技術創新等愿景,明確關注社會數據安全治理,提升數據中心、邊緣安全、數據托管等方面的能力,擴大歐盟數據安全人才規模,進一步提高歐盟全域數據安全能力。同年,美國發布《聯邦數據戰略和2020年行動計劃》,提出促進數據流通、保護數據完整性、提高數據處理透明度、增強數據管理分析能力和促進數據訪問途徑多樣化等40項具體數據管理實踐,提升了社會對于數據安全的重視程度,進一步促進了政府及企業對數據安全產品和服務的需求。
債券市場流轉的金融數據直接關系到用戶的資產、信用、消費習慣等重要隱私,債券數據的融合應用必須嚴格保障數據隱私安全,確保符合法律法規。因此,本文研究新型債券市場金融基礎設施,聚焦隱私數據安全計算,從債券市場金融基礎設施定義、構建新型債券市場金融基礎設施的意義、隱私數據安全計算關鍵技術、新型債券市場金融基礎設施技術方案等方面展開討論。
隱私數據安全的新型債券市場金融基礎設施
(一)債券市場金融基礎設施定義
金融基礎設施的概念在國內外有所區別。國際支付結算體系委員會和國際證監會組織技術委員會在2012 年聯合發布《金融市場基礎設施原則》,將金融市場基礎設施定義為中央證券存管機構、中央交易對手方、證券結算系統、支付系統和交易數據庫。2020年,人民銀行等六部門聯合印發《統籌監管金融基礎設施工作方案》,認定我國金融基礎設施主要包括金融資產登記托管系統、清算結算系統(包括開展集中清算業務的中央對手方)、交易設施、交易報告庫、重要支付系統、基礎征信系統六類設施及其運營機構。
債券市場是我國資本市場的重要組成部分,能夠有效傳導貨幣政策、提高直接融資比例、防范系統性金融風險、優化資源配置、提供市場基準利率和提供低風險投融資工具等。服務于債券市場的金融基礎設施即為本文重點討論的對象。
(二)構建新型債券市場金融基礎設施的意義
金融業是數據密集型行業,而債券市場作為金融市場的重要組成部分,對數據安全和保障用戶隱私的需求較高。同時,我國銀行間債券市場和交易所債券市場長期面臨著信息整合度較低、資金流通性較弱、互通互信程度不足等問題。2022年,部分交易所、登記結算機構等債券市場金融基礎設施聯合發布《銀行間債券市場與交易所債券市場互聯互通業務暫行辦法》,推進債券市場業務互聯互通,建設高效的市場服務體系,要求債券市場金融基礎設施為跨市場、跨機構客戶提供服務。
構建新型債券市場金融基礎設施,實現隱私數據安全計算,對于增強我國債券市場的互聯互通性、提升金融信息整合度、增強資金流通性、提升市場透明度、改善監管穿透能力等方面有重要意義。
隱私數據安全計算關鍵技術
用于建設隱私數據安全的新型債券市場金融基礎設施的4項關鍵技術分別為聯邦學習、多方安全計算、機密計算和差分隱私。2021年IT研究與咨詢公司Gartner發布的數據安全技術成熟度曲線相關報告中,上述核心技術大多處于萌芽期,因此目前關鍵技術的突破及在債券市場的落地應用需要頭部科研機構及金融機構勠力同心,優勢互補。
(一)聯邦學習
聯邦學習是一項結合傳統密碼學及機器學習的分布式學習技術,旨在面向多家不愿或不能暴露自家明文數據的數據提供方,在滿足數據隱私安全的前提下進行聯合模型訓練,達到保護隱私的同時完成數據價值釋放的效果。聯邦學習的參與方在達成協議后各自從服務中心方下載帶訓練模型,使用自有數據進行本地訓練后將提取出的數據特征、模型參數等要素加密上傳至服務中心方,實現“數據不出本地”。整套流程中各方的數據價值得到充分釋放,而原始數據沒有暴露給其他參與方,即在法律法規層面符合近年來出臺的各類數據隱私保護條例,也符合債券市場的不同金融機構之間出于競爭考慮不愿暴露客戶數據的要求,以技術層面的突破為債券市場金融基礎設施提供新型數據服務奠定了基礎。
聯邦學習可以根據其參與方數據集的共同特征劃分為縱向特征聯合、橫向樣本聯合和聯邦遷移三種類型。一是縱向特征聯合,適用于為相近的客戶提供不同業務的多個債券市場參與方,其數據特征為具有相近客戶的不同數據特征,例如金融基礎設施可以引入其他金融機構及工商、司法、稅務、輿情、產權、投融資、經營、財務、地企關系等多方數據進行債券違約風險聯合監測,實現基于多源異構大數據的債券違約預警、分析、處置全流程創新業務。二是橫向樣本聯合,適用于為不同的客戶提供相近業務的多個債券市場參與方,其數據特征為具有同樣數據特征的不同客戶,例如當前我國債券市場三后臺可以通過橫向聯合實現同一債券業務的全量數據交互,助力我國債券市場金融基礎設施構建跨市場、跨機構、跨地區的多方協作機制,完善債券市場金融基礎設施監管體系和治理模式(見圖2)。三是聯邦遷移,適用于客戶和業務均不相同的多個債券市場參與方,而其中一方擁有性能優良的機器學習模型,其他數據提供方利用多方數據特征的關聯性將該模型通過遷移學習技術遷移至新領域,例如債券市場金融基礎設施可以借鑒證券公司在股票風險預警等方面的成熟模型和經驗,為債券市場參與方提供遷移學習服務。
(二)多方安全計算
多方安全計算是一項重要的密碼學技術,旨在為多個互相不信任的數據提供方提供可信加密方法,在各方不泄漏輸入數據隱私的情況下完成結果計算和返回,實現“數據可用不可見”。多方安全計算可以在各參與方隱私數據無須歸集與明文共享的情況下實現特定函數計算,進而達到保護數據所有方的隱私及數據資產安全的效果。目前,多方安全計算已經在商用領域逐步應用,為實現數字資產的安全管理、多方數據聯合查詢、隱私保護模型訓練、業務黑名單安全共享等業務作出了貢獻。
多方安全計算中包含不經意傳輸(或稱“混淆傳輸”)、零知識證明、同態承諾、同態加密、秘密分享、混淆電路等技術,目前常見的多方安全商用解決方案大多使用了秘密共享技術,其利用由加法門和乘法門組成的基本運算邏輯重構業務需要的復雜函數,能夠有效縮減通信規模,進而將多參與方的信息交互過程轉為在密文下進行,實現數據隱私安全前提下的聯合使用。債券市場金融基礎設施可以在營銷、風控、反詐騙、反洗錢等業務中為參與機構提供多方安全計算服務,在不泄露任何參與機構的原始數據和計算過程的中間結果前提下保證計算結果具備準確性、隱私性(見圖3)。
(三)機密計算
機密計算是一項綜合應用軟硬件的隱私保護技術,旨在為需要隱私保護的應用程序和私密數據提供安全隔離的執行環境,在獨立的存儲空間和數據通路中運行,實現“程序可用不可變”。機密計算通過集中存儲多參與方應用程序和隱私數據的方式對這些程序和數據進行受保護的操作,其他未授權的、惡意的代碼都無法訪問或修改受保護的程序及數據。目前,機密計算已經在金融聯合風控、反欺詐、數據服務平臺、聯合營銷、政務數據開放等眾多領域中落地應用,由于該項技術為原有應用程序和隱私數據提供保護,理論上在任何需要保護代碼和數據隱私安全的場景中都可以外置機密計算技術。
機密計算在可信執行環境(Trusted Execution Environment,TEE)中加載運算,通過基于軟硬件的數據隔離來保護內部加載的應用和私密數據不被常規操作系統干擾,具有程序機密性、應用完整性、私密數據機密性和完整性的優勢。基于可信執行環境的機密計算通過軟硬件方法控制訪問權限,防止內部應用和私密數據受到未經授權的訪問和修改,從而提高債券市場金融基礎設施管理私密數據和應用程序的安全水平。基于TEE的機密計算方案的處理性能和安全性能依賴于TEE中可信執行控制單元的技術架構。
機密計算技術具備以下幾點優勢:一是對可信執行環境中的模型、語言、算法邏輯、可計算類型不設限制,因此具備更強的業務適配性;二是可實現應用程序、算法流程、隱私數據、用戶身份等整體一致性證明,具備較高的可信度和可解釋性;三是對高復雜度算法、多層次程序邏輯支持程度較好,應用執行效率較高。我國在這方面存在的問題是依賴國外芯片廠商,信創硬件升級面臨挑戰等。
(四)差分隱私
差分隱私是一項可量化的、針對數據庫隱私問題的隱私保護技術,旨在為需要保護的業務數據添加噪聲以保護其敏感信息無法被推斷,實現“統計數據不可拆”。差分隱私在保留業務數據統計性特征的前提下,通過對私密數據集進行各類變換,在私密數據集的統計結果中加入噪聲或對用戶數據進行修改,以抵御對隱私數據的背景知識攻擊。該技術通過向查詢數據中引入噪聲使其在無干擾值附近產生概率性波動,達到對真實數據的差分隱私保護,所增加的噪聲越強,隱私保護效果越明顯,但數據可用性越低,因此在實際使用中需要兼顧數據可用性和隱私保護效果選擇合適的噪聲強度。目前差分隱私已經在個性化服務推薦、醫療數據發布、金融數據查詢、工業物聯網數據分析、位置大數據共享、網絡社交隱私保護等領域落地應用,為查詢特定數據庫時的隱私保護發揮了作用。
差分隱私通常采用拉普拉斯噪聲機制、高斯機制和指數噪聲機制,拉普拉斯噪聲機制針對數值型數據,將符合拉普拉斯分布的獨立噪聲添加入查詢映射函數的輸出結果中,進而確保返回值無法被用于推斷原始數據集合;高斯機制同樣針對數值型數據,但采用符合高斯分布的獨立噪聲;指數噪聲機制針對非數值型數據,通過設定打分函數以一定概率值返回具有不確定性的輸出結果,進而實現差分隱私。債券市場金融基礎設施可以在聯合查詢、客戶特征統計等業務中為參與機構提供不暴露客戶個人數據的統計計算結果,實現業務數據統計價值的安全釋放。
新型債券市場金融基礎設施技術方案
(一)數據及模型雙向隱私的債券市場服務
金融基礎設施的一個典型業務場景是結合內外數據對債券市場從業機構輸出的金融工程模型、風險評估服務。傳統解決方案通常采用數據脫敏技術,將內外部數據敏感信息模糊、刪除后把明文數據聚合并進一步建模或進行金融工程計算。隨著數據隱私保護相關法律法規的集中出臺和隱私計算等技術手段的迭代發展,傳統應用脫敏技術的解決方案中原始數據及業務模型泄露風險、不符合數據隱私保護條例、數據融合成本過高等業務痛點逐漸暴露,債券市場金融基礎設施亟待應用新技術、新方法以提供數據及模型雙向隱私保護的債券市場服務。
因此,本文提出一種應用隱私計算技術以保護數據及模型雙向隱私的新型債券市場金融基礎設施技術方案,如圖4所示。不同于需將明文數據集中到第三方的傳統方案,本方案在債券市場金融基礎設施建設連接多個數據源和需求方的隱私計算平臺,采用機密計算技術確保應用程序及本地數據安全,采用區塊鏈技術對服務過程中加密數據流轉進行存證,采用多方安全計算技術實現金融工程提供方的模型隱私和客戶的業務數據隱私雙向保護,因此可以解決不同機構間由于隱私保護政策所帶來的合規性挑戰,并在實現數據安全共享和數據價值安全釋放的同時具備合規性、可追溯性、安全性等優點。
(二)跨機構、跨市場的多方協同安全計算
在傳統債券業務解決方案中,多家從業機構用自身持有的數據構建業務模型或進行查詢統計等操作,但由于債券市場不同業務條線較為割裂且分屬于不同監管機構和前后臺機構,每家從業機構自身數據規模和覆蓋范圍均較為受限,導致建模性能受限且查詢統計覆蓋面積較小。銀行間債券市場、交易所債券市場的不同從業機構之間客戶類型、行為特征、地理位置等分布差異較大,若從業機構能在符合隱私數據安全要求的前提下共享業務數據并基于共享的數據合集構建模型或開展聯合查詢統計操作,可顯著地擴大模型性能和查詢統計覆蓋面。
因此,本文提出一種應用多方安全計算技術的跨機構、跨市場提供協同服務的技術方案,針對傳統方案中債券隱私數據明文共享安全性較低、合規性較差、機構參與意愿較弱的痛點,引入多方安全計算技術實現數據不出域的隱私安全服務,為新型債券市場金融基礎設施實現多方協同、數據安全、合法合規的跨市場、跨機構聯合計算、查詢、統計服務,且查詢等操作可以實現有限范圍的記錄以保護業務隱私。例如,新型債券市場金融基礎設施可以提供跨市場、跨機構的聯合擔保查詢計算服務,在不暴露各參與機構中客戶隱私數據的前提下實現聯合計算,確認客戶是否滿足擔保條件。
(三)基于多源異構大數據的數據融合建模服務
目前,我國債券市場金融基礎設施與工商機關、司法機關、稅務機關、公安機關等外部機構的數據融合共享程度較低,與其他從業機構之間數據共享意愿也較弱,債券市場間數據孤島現象較為明顯。債券市場各從業機構和市場客戶有獲取更先進服務的訴求,但由于債券市場金融基礎設施獲取工商數據、司法數據、稅務數據、公安數據、輿情數據、產權數據、投融資數據、經營數據、財務數據、地企關系數據等外部數據時,存在數據安全要求不清晰、數據采集標準不統一、數據融合需要工作量大、底層數據資源框架不兼容等技術和法規問題,導致數據融合成本高昂且金融等高安全屬性的數據無法合規共享。
因此,本文提出一種應用聯邦學習技術的數據融合建模方案,解決多源異構數據融合中數據安全要求、采集標準、框架兼容等問題(見圖5)。債券市場金融基礎設施建立數據融合建模服務平臺,外部機構和數據供應商作為外部異構大數據來源接入平臺,第三方技術提供方為平臺提供新模型落地應用、平臺升級優化、運維保障等服務,監管部門接入平臺進行穿透式監管,在聯邦學習框架下平臺應用多源異構大數據訓練業務模型并向債券市場客戶提供創新業務服務。
以債券違約風險監測為例,債券市場金融基礎設施可以通過聯邦學習框架融合外部數據源,進行特征對齊和模型訓練,并提供基于多源異構大數據的債券違約風險監測模型,實現不同數據源、不同格式的數據在隱私安全的前提下共同提取特征并提供參數聯合訓練模型,具備安全性好、模型性能強、機構參與意愿高等優點。
總結與展望
推進債券市場金融基礎設施革新與發展,實現金融數據隱私安全交互,是立足國家“十四五”規劃和2035年遠景目標綱要提出的“數字中國”遠景目標,助力打造創新型、友好型、開放型數字生態,驅動債券市場生產及治理模型革新的重要任務。
一是在債券市場數字建設方面打造數字經濟競爭優勢,驅動金融業生產方式變革,助力金融業實現數據驅動的精細管理、精益生產、精準營銷、精確規劃,降低基礎設施運行成本,提高市場服務效率,催生數據驅動的新應用、新模式、新業態。
二是在債券市場數據服務方面加快數字債券建設步伐,驅動金融業服務方式變革,提高債券市場開放和數據共享程度,推動線上線下基礎設施服務協同發展與深度融合,提高債券市場服務能力便捷性及數字債券應用的普惠性。
三是在債券市場治理方面提高基礎設施建設水平,驅動金融業治理方式變革,提高數字化監管效能,實現債券數據跨部門、跨市場、跨地區匯聚融合、深度利用和高質量協作。
四是在債券市場生態方面激發安全技術創新活力,營造良好數字生態,提高債券數據應用透明度,實現債券數據合規應用中的數據最小化、數據分類分級和數據匿名化,促進債券數據應用的合規化發展。
參考文獻
[1] 貝勁松.金融基礎設施數據融合應用實踐[J].中國金融,2021(3).
[2] 竇悅,易成岐,黃倩倩,莫心瑤,王建冬,于施洋.打造面向全國統一數據要素市場體系的國家數據要素流通共性基礎設施平臺——構建國家“數聯網”根服務體系的技術路徑與若干思考[J].數據分析與知識發現,2022,6(1).
[3] 康曉宇.數據基礎設施支撐金融科技創新[J].中國金融,2020(22).
[4] 王延昭,范皓,唐華云,李榮.數字債券長期演進體系構想[J].武漢金融,2022(2).
[5] 王延昭,唐華云,黃爍,馬凱迪.挖掘數據業務價值,探索債券市場基礎設施數字化轉型[J].武漢金融,2022(2).
[6] 楊竑.金融科技助力行業數字化轉型[J].中國金融,2021(11).
[7] 姚前.基于區塊鏈的債券市場基礎設施建設[J].中國金融,2021(7).
[8] 曾堅朋,趙正,杜自然,洪博然.數據流通場景下的統一隱私計算框架研究——基于深圳數據交易所的實踐[J].數據分析與知識發現,2022,6(1).