將大語言模型深入應用于信用行業是做好數字金融這篇大文章的重要實踐。但大模型在信用領域的適用仍是新嘗試,能否從制度層面搭建具前瞻性的監管框架,引導市場化主體通過市場化手段在發展中自主解決模型公平性、模型歧視等問題,是決定大模型能否可持續高質量發展的重要因素。
信用是現代經濟社會發展的基石,完善的信用體系是現代經濟社會實現高質量發展的重要基礎之一。受益于人工智能數十年的積累,憑借高效地處理各類結構化、非結構化數據的優勢,大語言模型正在成為人工智能發展的新熱潮,為推動大數據場景化應用、創新信用服務模式提供了新的技術支持,并為解決信用信息失真、提升信用功能效益提供了新方法、新實踐。但大語言模型在信用領域的探索應用仍然處在起步發展的初期階段,依然面臨諸多挑戰,需要通過在推動數據合作與共享、加強數據標準建設、夯實數據治理與安全保障體系建設、推動產學研用深度融合發展等方面持續發力,在加強隱私安全保護前提下,形成與人類價值觀對齊的大模型信用評級體系。
大語言模型與信用雙循環賦能
目前多數主流模型采用Transformer架構,這種架構大大提高了模型理解復雜語言結構的能力。但特定應用場景還需要進行專項預訓練與微調以適應特定領域或任務,與此同時,研發處理上下文學習和多任務學習能力也很重要。這些技術原理使大語言模型能夠理解和生成人類語言,執行各種復雜的語言任務,并在多個領域展現出強大的應用潛力。
中央金融工作會議提出做好數字金融等五篇大文章,對數字金融高質量發展提出了新要求。大語言模型技術具備強大的數據處理能力和復雜的算法結構,將該技術深人應用于信用行業是做好數字金融這篇大文章的重要實踐。近年來,信用領域積極探索并高度重視大模型的實踐應用,為信用質量評估、風險預測和應急處置提供快速分析與輔助決策,助力實現高質量信用體系建設,已初步取得積極成效,具體體現在:
多模態:文本、圖像、視頻、聲音融合,形成個性化信用評級服務和產品
天語言模型技術具備強大的數據處理能力和復雜的算法結構,能將文本、圖像、視頻、聲音融合,嘗試應用大語言模型基礎,可為企業和個人提供訂制化的信用評級服務與產品。從企業端來看,大語言模型技術利用海量數據,快速識別企業的經營趨勢、還款能力等關鍵信息,并通過深度學習和自然語言處理,從非結構化數據中提取價值信息,提高信用評估的準確性和效率性,實現對企業信用風險的分級識別和分級評估,建立個性化企業信用產品。從個體端來看,大語言模型技術憑借優秀的自然語言理解和業務場景泛化能力,并借助高效的處理和數據分析手段,能快速收集信用領域涉及的大量數據,可根據相應的信用主題、信用目標,對客戶進行精準分類,生成客戶畫像,為其量身定制個性化信用產品和服務,幫助金融機構快速對客戶進行信用分級和識別產品分級機會。
多模型:提供輔助決策支持,助力金融穩定
借助差異化歷史信用數據、交易異常行為、不良交易數據等,通過歸因分析、動態調整參數、模型預測的方式,大模型能夠起到輔助決策作用,降低風險發生概率,顯著提升金融風險防控的準確性,對于維護金融業穩定和安全發揮重要作用。
一方面,大模型能夠獲取高質量的風險防控數據。借助大規模的金融交易數據、客戶行為數據、市場數據等非結構化信息,加上數據補充、修改和統一功能,天模型可以根據客戶訴求輸出結構化的、高質量的數據,鑒別異常交易行為,從而為后續數據分析、模型微調、風險預警提供高質量的風險防控數據基礎。
另一方面,大模型技術可以通過分析歷史信用數據和行為模式,構建精確的風險評估和預警模型。該模型能夠動態調整參數,適應市場變化,為金融機構提供實時的風險評估結果,并根據宏觀經濟數據,分析市場波動、利率變化等對企業的潛在影響,同時結合大模型的異常檢測和輿情監控功能,實時發現企業的潛在風險,輔助金融機構決策者評估未來的經濟波動、信用風險和潛在的行業變化,以及其對企業經營的影響,同時基于上述分析預測進行相應的預警。
實踐中,有信用公司建立公司級智能預警,通過建立風險管理框架,協助金融機構進行風險管控,為投融資業務場景保駕護航。券商智能風控方面,大數據、智能化算法及大模型可輔助證券公司進行風險識別、評估和監管,更好滿足客戶對證券評級和風險預警的需求。
建立可依賴的信用評價模型,精準化預警欺詐、違約
天語言模型基于海量信息,建立起復雜的信用評價模型,用于評估不同的信用欺詐風險,改變傳統的違約檢測對規則和經驗的依賴,可應對金融領域復雜多變的違約和欺詐風險。
從微觀層面看,大模型技術可對企業和個人各項交易模式與異常行為進行交易數據歸集、實時統計分析、及時風險預警,進而有效地識別和預防可能的欺詐行為,并借助實時監控和智能報警系統,減少信用欺詐帶來的損失。天模型可以幫助信用評級機構自身進行合規檢查,審查各類合約和法律文件,確保其符合國家信用管理相關法規要求,并借助大模型的自然語言理解能力降低金融機構的法律合規成本。
從宏觀層面著,在評估和跟蹤企業的信用風險時,除分析傳統的財務指標外,大模型技術還會分析行業動態、區域經濟發展情況、上下游及原材料價格波動對企業成本的影響,以及全球經濟衰退可能導致的訂單減少等宏觀因素,通過這種多維度的評估,更準確地預測企業的違約概率,提供更可靠、精準的違約預警。
在當前的實踐應用場景中,有金融服務類平臺借助大語言模型從紛繁復雜的文字報告中收集到關鍵信息,借助智能化、多維度數據分析和持續學習,建立起符合自身實際的大模型智能評測服務系統,使其成為信用領域核心工具,并進而借助該工具構建全面的企業客戶畫像,基于風險的評分和評級,對區域差異化、主體差異化實現精準分級評估,進而對注冊企業或服務申請主體相關適用性進行準入初篩,從事前減少欺詐和違約風險。
大模型在信用領域應用的機遇與挑戰
也要承認,大語言模型作為人工智能的最前沿技術,其應用尚且缺乏明確的實施標準和指導原則,在模型的公平性、權責劃分、模型透明性和可解釋性,數據匹配性與數據安全性等方面,依然面臨挑戰。
大模型“幻覺”和公平性挑戰。目前大模型對于信用行業依舊處于輔助階段,信用行業的風險防控依靠傳統模型方法,經由大模型輔助來完成風險預警。隨著人工智能的迭代和健康發展,大模型將由輔助轉型發展為信用行業所依賴的主流模型,并最終形成由大模型主導的風險管控審計。一旦大模型成為主流模型,大語言模型公平性挑戰就需要得到妥善解決。
首先,天模型在信用風控領域的應用旨在完善風險管理相關模型,以及應對突發情況的風險預知,基于對于大量數據的機械學習和反復迭代,大模型可通過持續輸入用戶數據來計算出相應違約概率及信用預警,在這個過程中,如何制定模型公平性的評估標準,進而要求在大規模信用評估場景中進行模型偏見的檢測與消除,確保算法結果不因地區、行業、性別、種族、年齡等因素產生歧視,是當下大模型發展值得思考的問題。其次,大模型的算法通常非常復雜,難以理解和解釋,如何在模型開發階段增加反歧視措施,確保訓練數據樣本的平衡性和多樣性,值得思考。最后,天模型可能會受到數據偏差的影響,導致信用評估結果存在不公正或偏見,另外大模型的“幻覺”問題,可能導致錯誤的風險評估,這也是當下大語言模型在運用過程中面臨的一個難點。
評級決策過程中權責主體界定難題。可以預見,大模型相較于傳統模型更能準確反映出評級產品違約率和相應風險,且能更準確地對市場提供預警,信息的準確性會吸引客戶投資,行業競爭格局會圍繞信息的精確性發生改變。一旦大模型成為主流技術,信用機構的核心競爭力和品牌影響力也將從原本的評級數量、口碑等因素變為是否具備大模型技術。在大模型應用于信用領域的過程中,如果出現信用評估錯誤、數據泄露或其他問題,很難確定責任主體:是模型開發者、數據提供者、應用企業還是監管機構的責任?如果一直缺乏行業指導標準和發展原則,應用過程中權責劃分不清、信用評估懲罰機制不明確、商業無序競爭、監管主體不清晰等問題,將成為制約行業發展的挑戰。
信用領域數據隱私與安全挑戰。數據基礎制度建設事關國家發展和安全大局,信用行業作為數據密集型行業,相關數據具有高敏感性和高價值性的特征,全面夯實和保障數據安全與個人信息權益是實現數據治理的關鍵要素。大模型如何在確保數據安全的前提下獲取大量的數據,并進行訓練,尤其在信用領域,收集用戶的個人信息、財務數據、交易記錄等敏感信息時,如何在嚴格遵守相關的數據保護法規的同時,實現數據共享?如何建立數據脫敏、加密處理的標準,防止數據泄露和濫用?如何推動數據共享與跨機構合作的框架,且確保用戶知情和授權的透明性?在應用過程中,數據控制方如何承擔數據安全主體責任,主管部門如何承擔監管職責?如何在處理和使用個人信息時具備明確合理的目的和合適的方法?這應該是整個行業在發展中需要深人思考的問題。總之,大模型在信用領域的應用,應該遵循《中共中央國務院關于構建數據基礎制度更好發揮數據要素作用的意見》,按照黨中央、國務院決策部署,構建數據安全體系,在充分實現數據要素價值、保障數據安全的前提下,促進全體人民共享數字經濟紅利。
評級模型的透明性和可解釋性挑戰。目前,大語言模型在信用領域的應用處在探索階段,行業領域缺乏應用規范和操作指南,如何與現有監管規則相匹配是行業的一天挑戰。從監管層面看,金融機構應該擁有透明、可審計、可調控的信用評級流程及風險評估框架,且業務流程公開、透明,但天模型在前端框架構建完成后,其數據輸入端和輸出端之間所存在的流程具有一定程度上的隱蔽性,智能算法非標準化、非公開化,是否符合以“信披為本”的監管原則,是目前政策法規對于大模型能否在信用領域實現普遍應用的一大疑慮。這意味著,大模型適用于信用領域時,提升其過程中的透明性和可解釋性是重要的,且監管機構對于大模型適用的相應數據保護、數據質量評估、第三方管理、操作合規等方面定性定量規定的出臺,也是保障大模型在信用領域積極健康使用的一大影響因素。
對策建議
盡管多家信用評級機構已經有了對于大模型應用于金融數據分析的落地成果,但大模型在信用領域的適用仍是一個嘗試的新概念,大模型如何在信用領域適用,與信用市場和風險評估的動態變化發展相匹配,還需要通過前瞻性的監管框架,推動數據合作與共享,加強金融訓練數據標準建設,夯實行業發展基礎。
推動信用領域訓練數據合作與共享,助力模型評估與修正。數據的持續更新,以及模型的持續迭代,可以保障大模型與時俱進,這能保證信用行業進行深度數據迭代和天模型信用框架的建立,同時也是大模型技術在信用領域落地的重要保障。首先,企業、金融機構、政府等多方應加強數據共享,保障數據的透明流動和隱私保護,這樣的合作能夠匯聚更多維度的數據,提升信用評估的全面性。高質量的金融訓練數據集需要涵蓋企業財務數據、非結構化數據(如新聞、社交媒體)、行業數據、宏觀經濟指標等,利用交易數據、稅務記錄、經營情況等來反映企業的資金流動和經營健康狀況,數據能夠提供全面的企業信用畫像,幫助識別潛在的信用風險。其次,為適應信用市場的動態變化,金融數據集需要具備實時性。通過與政府、銀行、互聯網金融平臺等合作,能及時收集企業最新的經營狀況、市場變化等數據,確保信用評分的時效性和準確性。最后,制定行業通用的金融數據標準可以幫助更好地整合不同來源的數據,從而提升數據的可用性和一致性,同時在樣本量小的特殊領域也可以保障其有效性。
出臺信用領域大模型發展指南,促進多方參與和監督。新興領域想要高質量發展離不開政策法規和監管的保駕護航。監管層面可以出臺信用領域大模型使用相關監管措施和行業發展指南。高效的監管可以促進技術應用安全落地,并保障技術合規發展,迅速成長。
可以預見,隨著中國大模型方面技術力的提升,相關政策法規及監管規定也會隨之越來越完善。與此同時,監管層可以出臺關于大模型的數據治理和安全保障體系建設的規范,保障投資者數據、企業和證券數據、信用評級公司數據這三方數據的安全。
推動產學研用深度融合發展,形成匹配人類價值觀的信用大模型。大模型在信用領域能持續使用的前提是要結合生產、學習、科學研究、實際應用,即結合產學研用四部分。面對不確定的未來,大模型需要保持更新迭代,以應對多種突發情況,推動產學研用的深度融合,是保障大模型持續更新的一大要素,通過四部分結合,并持續迭代更新,能夠促進形成匹配人類價值觀的信用大模型。
結語
綜上,大模型在信用領域應用,需要與信用市場對于高精度信用風險預警和模型研發的需求相匹配。在大語言模型已經在企業級和信用評級等領域實現了輔助工作的落地的前提下,可以預見,在未來發展過程中,大模型在更高效率風險預警和評價體系的研發方面將起到關鍵性的作用。在大語言模型的助力下,信用行業將加速信用模型和風險評估模型創新,進而在金融市場中表現出更高的穩定性和可持續性。但由于我國人工智能大模型處于發展前期階段,在其起步初期,能否符合監管規定、能否保障數據安全,并從制度層面搭建具有前瞻性的監管框架,引導市場化主體通過市場化手段在發展中自主解決出現的問題,是決定大模型能否可持續高質量發展的重要因素。
(王小明供職于中國人壽保險股份有限公司,鄭杰為安泰信用評級有限責任公司總裁。特約編輯/孫世選,責任編輯/丁開艷)