陳曉靜 楊潤昌 洪 璟 上海對外經貿大學金融管理學院
聯邦學習作為隱私計算的一種,一方面,可以助力保險行業實現精準營銷,細分客戶需求,提供差異化的保險產品;另一方面,可以提高保險行業對風險評分、風險篩查和反保險欺詐監測的風險管理能力,使更多保險機構服務中小微企業,提升服務實體經濟的水平。同類保險公司的保險產品類似、客戶特征相近,保險公司可以建立橫向聯邦學習框架,得到更加精確的風控及定價模型。保險公司與醫院、通信公司等其他行業機構開展數據合作,建立縱向聯邦學習框架,從更多維度對客戶進行畫像,提高業務水平,防范保險欺詐。我國保險業逐步進入高質量發展階段,需要加快轉變發展方式,以更加積極的心態迎接行業轉型,而聯邦學習則為保險業創新發展提供了一種新思路。
聯邦學習由數據源、聯邦學習系統、多方客戶端三大要素構成。聯邦學習本質上是由各個參與方在本地將原始數據處理之后,進行模型更新,再對各個參與方的模型進行匯總優化,最后將得到的優化模型反饋給各個參與方。
根據參與方數據分布情況的不同,聯邦學習可以細分為橫向聯邦學習、縱向聯邦學習與遷移聯邦學習。橫向聯邦學習是指在參與方用戶重疊部分較少、數據特征相似性高的情況下,對數據按照橫向(用戶維度)進行切分,并取出數據特征相似但用戶不同的部分進行訓練。縱向聯邦學習是指在參與方用戶重疊部分較多、數據特征相似性低的情況下,對數據按照縱向(數據特征維度)進行切分,并取出用戶相似但數據特征不同的部分進行訓練。遷移聯邦學習是指在參與方用戶與數據特征重疊部分都較少的情況下,采用遷移學習代替數據切分,以規避數據切分后規模較小的問題。
根據是否具有中心服務器,聯邦學習架構可以細分為去中心化聯邦學習架構和中心化聯邦學習架構。去中心化聯邦學習架構不需要中心服務器,各個參與方將自有的原始數據在本地處理后梯度發送給下一個參與方,與其所有的數據進行迭代。在每一個參與方都進行迭代運算更新模型之后,再將最終的模型分發到各個參與方,以達到聯邦學習的目的。
根據業務安全等級的不同,聯邦學習可以分為高安全等級業務和低安全等級業務。其中,高安全等級業務包括智能風控、反保險欺詐等;低安全等級業務包括智能營銷、智能運營等。
1.智能風控
保險公司進行風險控制所面臨的難題主要有以下幾點:第一,內部數據質量欠佳。傳統保險公司收集客戶信息主要通過保險營銷員進行面對面的溝通驗證,獲取的數據質量參差不齊,部分數據不能滿足保險業或者保險公司的要求。第二,內部信息割裂。保險公司承保、理賠等各個環節的數據信息流動不暢,甚至各省市分支機構內部數據的共享也難以進行。第三,與其他保險公司合作困難,缺少統一可信的信息數據共享平臺。另外,從所需的數據類型來看,保險公司的風控活動除了依賴內部數據,同時需要收集以下數據:行業欺詐觀察名單、公共記錄、第三方聚合數據、社交媒體數據和個人設備數據。值得注意的是,非結構化數據的使用率從2018 年的不到50%飆升至2021年的81%。
聯邦學習實現了數據融合、聯合建模以及模型發布等一體化方案,提高了大數據風控能力,提升了風控效果。大量非結構化數據需要利用聯邦學習進行處理分析,通過跨行業、跨公司建立聯邦學習框架,可以充分利用多維度的特征數據,建立全方位的風險防控體系。以美國醫療信息局(MIB)為例,MIB為保險公司提供投保人在其他機構投保人壽保險的記錄,以此幫助保險公司篩查不合理的投保與理賠行為。這種數據共享方式與聯邦學習相比,多了一個數據信息的“中間商”,不可避免地會給保險公司帶來綜合治理成本的增加,而聯邦學習直接將多方數據所有者聯結在一起,在減少數據流通環節的同時,降低數據泄露的可能性。
2.反保險欺詐
同證券、銀行等金融行業一樣,作為金融業三大支柱之一的保險業面臨著保險欺詐風險。在金融欺詐中,保險領域的欺詐比例尤為突出。國際保險監督官協會測算,全球每年有20%~30%的保險理賠案件涉嫌欺詐,損失金額約800億美元。
反保險欺詐有四個難點:第一,傳統的風險管理體系主要依賴人工,受員工業務水平以及職業道德影響,保險機構應對反保險欺詐的手段單一,難以實時察覺違規行為;第二,保險機構間缺少信息共享機制,客戶的投保信息涉及個人隱私,受法律法規限制,難以在不同保險機構間共享;第三,保險詐騙罪的定罪量刑標準較高,使得犯罪分子有可乘之機;第四,隨著科技進步,機器學習、知識圖譜等技術得到廣泛應用,反保險欺詐手段日益多樣化。
針對層出不窮的保險欺詐現象,保險公司運用多種反保險欺詐技術。《反保險欺詐技術現狀》研究發現,保險公司最常用的反保險欺詐技術包括:危險信號自動標記、預測建模、文本挖掘、報表制作、案例管理、異常報告和數據可視化/關聯分析。基于單一保險公司數據構建的傳統反欺詐模型難以應對更加復雜的欺詐手段,而聯邦學習可以打破保險公司與銀行、醫療機構等擁有投保人財務狀況以及健康信息等行業間的數據孤島現象,通過分析投保人的金融特征、健康狀況等信息,構建反保險欺詐體系,為保險業風險管控提供更全面、完善的保障。

1.智能營銷
《2019 年中國保險行業智能風控白皮書》統計數據顯示,保險公司一年中與客戶的接觸次數僅為1—2次,長期型保單如人身險只有在需要理賠或到期時,保險公司才會與客戶聯系,而車險等短期險如果沒有保險事故發生,則一般不與客戶接觸。傳統的保險銷售工作由于與客戶接觸過少、了解不深,難以挖掘客戶的潛在需求,而過度營銷往往會催生客戶的反感厭惡。聯邦學習通過多維度客戶畫像,對不同客戶的需求進行細分。一方面,聯邦學習能夠快速捕捉生產生活中的風險因子并進行定價分析,為保險公司創新產品提供便利,在市場競爭中占得先機,同時能夠根據場景靈活定制保險產品,識別客戶的潛在風險,提供差異化的精準定價,提升銷售成功率,降低退保率;另一方面,聯邦學習通過持續收集客戶反饋信息,不斷提高模型精確度,實現模型迭代升級,并隨著市場的發展而不斷完善。
2.智能運營
通過聯邦學習,保險公司可以實現對客戶的全維度用戶畫像,充分了解客戶日常生活所需,通過對客戶的特征標簽進行分類管理,節省運營管理成本;同時,方便保險營銷員與特定客戶定期溝通聯系,建立良好的客戶關系,為保險公司創造更多的價值和利潤。智能運營將保險從產品升級到服務,實現以單個保險產品的銷售激發出潛在的多險種購買需求,并且以聯邦學習為基礎構建的人工智能能夠實現24小時在線服務,更快地響應客戶需求,降低人力成本。
雖然發明聯邦學習的初衷是為了解決數據安全問題,但時至今日,聯邦學習仍然要面對多種攻擊帶來的安全風險,主要有四種攻擊:第一,投毒攻擊。投毒攻擊分為數據投毒攻擊和模型投毒攻擊。顧名思義,數據投毒攻擊,是指在參與方的本地數據中加入錯誤、有偏差的數據,降低參與方模型的精確度,從而影響中心服務器模型的計算結果。模型投毒攻擊,是指通過向中心服務器發送參數錯誤的模型數據,影響中心服務器的模型運算。第二,后門攻擊,即通過注入對抗性觸發器來操縱訓練數據的子集,使得在被竄改數據集上訓練的模型在嵌入相同觸發器的測試集上出現錯誤預測,目的是使模型在特定樣本上預測出錯,而不改變其在其他樣本上的預測結果(邱曉慧等,2022)。第三,搭便車攻擊,即不進行本地數據處理,而是通過構建虛假參數發送至中心服務器,以此獲得由中心服務器生成的最終模型數據。這種攻擊方式具體又分為普通搭便車與偽裝搭便車,后者更加隱蔽,危害更大。第四,女巫攻擊,即通過偽造多個惡意節點,影響中心服務器的模型運算,導致最終模型喪失精確性。相較于搭便車攻擊,女巫攻擊的危害更大。
目前,聯邦學習的標準主要有國際、國內兩大類。《聯邦學習技術金融應用白皮書》顯示,國際標準以IEEE 發布的《聯邦學習基礎架構與應用指南》(IEEE/P3652.1-2020:IEEE Guide for Architectural Framework and Application of Federated Machine Learning)為主。而國內標準則分為三個團體標準,第一個是中國信息通信研究院發布的《基于聯邦學習的數據流通產品技術要求與測試方法》(BDC 41-2020);第二個是中國人工智能開源軟件發展聯盟發布的《信息技術服務聯邦學習參考架構》(AIOSS-03-2019);第三個是中關村金融科技產業發展聯盟發布的《聯邦學習金融行業應用指南》(T/ZFIDA0004-2020)。目前,我國尚未形成全國統一的聯邦學習技術標準體系。由于多方參與以及利用多種隱私信息計算的特性,不同的聯邦學習技術標準體系將會對數據安全性、模型精確性等方面產生影響。因此,亟待有關政府部門或行業協會聯合行業內的金融科技企業統一制訂聯邦學習技術標準。
一方面,不同體量保險公司的客戶數量差異巨大,頭部保險公司更容易占據優質的客戶資源,規模效應帶來的低成本使得頭部保險公司在個性化產品定價與建立精確的風控模型中處于有利地位;另一方面,中小型保險公司獲取信息的渠道有限,所獲取的數據量也難以滿足風險建模需要。聯邦學習僅提供了數據隱私處理的方法,無法解決激勵效應不足導致參與方不愿意投入資源建設相關平臺的現狀。正如《聯邦學習技術金融應用白皮書》所述:“建立聯邦學習激勵機制的難點在于,一是如何盡量公平地評估每個參與方的貢獻量;二是如何吸引更多的機構參與聯邦學習貢獻其數據與計算資源,并形成正向激勵;三是如何對惡意的參與方進行識別和懲罰,量化貢獻價值并對聯邦學習系統的最終模型性能進行建模。”
聯邦學習需要參與方進行數據分析處理后上傳平臺,因此,每一個參與方的數據處理能力應當盡量相當,否則會出現因數據處理速度不同,導致其他參與方在模型迭代過程中需要等待較長時間,最終影響模型建設的效率,增加各個參與方的運營成本。《反保險欺詐技術現狀》調查顯示,有68%的受訪者表示,有限的IT 資源是反保險欺詐最大的挑戰。技術能力以及資源的不足導致中小型保險公司很難有效地參與聯邦學習框架。
激勵機制的設定主要從兩個方面考慮,即正向激勵機制與反向激勵機制。正向激勵機制鼓勵參與方盡可能整合數據資源以及提高數據質量,而反向激勵機制則是對貢獻數據量較少以及數據質量不高的參與方采取懲罰措施。第一,激勵機制的設定可以從數據的數量及質量入手,比如數據貢獻量較大的參與方可以向數據貢獻量較少的參與方收取一定的費用,從而提高行業內頭部保險公司數據共享的積極性。第二,以政府為核心建立信息數據共享中心,這樣既能夠保證數據的高質量,又可以確保本地數據的安全性,同時還可以為金融監管提供便利。
各機構的聯邦學習平臺一般都是基于自有知識產權的算法,引入更多的參與方需要對平臺進行適配性調整。為了使數據流通管理更加便捷高效,業內應建立統一的標準數據庫,采用相同的技術協議,如此既可以減少平臺維護成本,避免資源浪費,又可以使數據共享流程易于操作。同時,構建數據共享平臺有利于數據確權,保護數據所有者的合法權益,避免數據被濫用,也便于被監管。
雖然聯邦學習可以保證極高的隱私安全性,但通過模型反演,仍然可以使數據重現。因此,聯邦學習需要其他輔助技術諸如可信執行環境、同態加密、安全多方計算等技術的支持,才能做到既保護隱私數據安全,又能高效地獲得可靠的結果。以保險公司查詢投保人疾病史為例,在該場景下,保險公司和醫療機構建立縱向聯邦學習框架,保險公司需要向相關醫療機構提供查詢條件,醫療機構根據查詢條件進行查詢并反饋結果。借助隱私保護計算的PSI(隱私集合求交)能夠實現數據庫數據及查詢條件的“雙盲”,保護數據和個人隱私的安全。再者,以智能風控為例,所需數據上傳前要經過加密以及脫敏程序,授權使用的數據需要在區塊鏈存證,既要對上鏈前的數據來源、生成機制、存儲過程進行真實性交叉驗證,又要做到上鏈后的數據使用可記錄、過程可審計、不可篡改等。