袁先智

目前,中國國內實施的信用評級體系仍面臨評級虛高、區分度不足、事前預警功能弱等問題。本文介紹的基于“咖啡館(CAFE)全息畫像風險評估體系”的“先知通(IS)信用評級體系”運用大數據探索解決違約“壞”樣本數量不夠的問題,提升信用評級質量和區分度,對于中國構建以主體或者債項的違約率為核心的信用評級體系有積極意義。
信用評級行業是現代金融市場經濟中的重要組成部分。經過近30年的發展,中國的信用評級業務已涉足金融市場的方方方面。但中國當前的信用評級體系仍面臨評級虛高、區分度不足、事前預警功能弱等問題。中國的信用評級公司需要不斷學習國際信用評級機構的評級理論和方法,逐步探索適合中國國情的信用評級方法和技術。
本文在分析中國金融市場信用評級體系現狀的基礎上,介紹了“‘咖啡館’(CAFE)評估體系”框架建設的基本思想,希望對中國構建以主體或者債項的違約率為核心的信用評級體系起到添磚加瓦的作用。
信用評級行業是現代金融市場經濟中的重要組成部分。信用評級行業的發展壯大乃至形成一種制度,一定程度上依賴于金融市場,特別是證券市場的發展。從20世紀初美國穆迪公司成為世界上第一家資信評級機構以來,信用評級行業經過百年發展,在推動市場發展、揭示和防范信用風險、降低交易成本以及協助政府進行金融監管等方面,發揮重要的中間作用,也經歷過許多調整。
經過近30年的發展,中國的信用評級業務已涉足中國金融市場的方方方面。近年來,中國的評級行業在統一規則、完善監管、對外開放等方面取得了長足進步。不過,目前,中國國內實施的信用評級體系仍主要存在三方面的問題:一是評級虛高;二是區分度不足;三是事前預警功能弱。目前國內債券市場的信用評級分布主要以“AA”(或以上等級)為主體,而國際通用的是以中間信用等級(即,“A”和“BBB”信用級)為主導,兩者之間的差異非常突出。據萬得統計,截至2020年末,中國90%以上的發行主體評級分布在AA及以上的區間,整體評級較高且分布較為集中,不利于投資者辨識債券產品的風險程度,更不利于指導投資決策。目前,中國在資本市場每天基本保持存量續期的債券在5萬支以上,每天有市場交易信息的債券數量約在1.2萬支,其中,92%左右的債券評級被定位在AA信用級以上。這與債券本身在金融市場的真實表現情況存在差距。另外,從2018年開始,AAA評級的(國有平臺的)公司或企業和債券直接倒閉、違約的事件多次發生,引發了針對目前中國信用評級體系的不信任感,不利于中國債券市場的健康發展。
作為全球第二大經濟體的中國需要建立適合中國國情并與國際信用評級體系相契合的風險評估體系。2021年8月6日,中國人民銀行等五部委聯合發布《關于促進債券市場信用評級行業健康發展的通知》(以下簡稱《通知》),要求信用評價機構“應當長期構建以違約率為核心的評級質量驗證機制,制訂實施方案,2022年底前建立并使用能夠實現合理區分度的評級方法體系,有效提升評級質量。”此后不久,2021年8月18日,中國人民銀行等六部委聯合發布《關于推動公司信用類債券市場改革開放高質量發展的指導意見》(以下簡稱《意見》),關于信用評級方法體系,其中提出“構建以違約率為核心的評級質量驗證方法體系,推動形成有區分度的評級標準體系”“發揮雙評級、多評級以及不同模式評級的交叉驗證作用”。《通知》和《意見》都特別強調構建以違約率為核心的評級質量驗證機制以及提升評級的區分度,這為提升中國信用評級質量和競爭力,與國際規則體系更加接軌,指明了方向。
構建以主體或者債項的違約率為核心的信用評級體系主要包括五部分:第一部分是構建以違約率為核心的信用評級標準;第二部分是構建信用風險需要的“違約矩陣”;第三部分是構建主體(公司)和債項信用資質變化的“信用轉移矩陣”;第四部分是配套第二、三部分,針對信用模型表現的接受者操作特性曲線(Receiver Operating Characteristic Curve,簡稱ROC曲線)、ROC曲線下的面積(Area Under the Curve,簡稱AUC)進行測試;第五部分是構建反映中國資本市場真實情況需要的基本“(違約)壞樣本”,這部分主要是支持第二、三、四部分,進而完成第一部分。
實踐中,中國構建以主體或者債項的違約率為核心的信用評級體系面臨的主要困難是,許多情況下,中國金融市場對應的資本市場 “違約壞樣本”與西方國家金融市場的“違約”樣本表現不同。另外,中國違約壞樣本數據庫樣本不充足,從2007年至2020年,中國所有違約主體樣本數僅有200個左右。同時,壞樣本披露的(風險)信息完整度也不足。因此中國市場應該發展出適合中國情況的壞樣本構建方法。中國信用評估體系也需要構建對中國壞樣本的描述,而基于大數據等金融科技可實現這一構建。
“基于咖啡館風險評估框架下的評級應用”主要通過“先知通(Intelligence Stone,簡稱IS)” 評級體系實施。通過結合大數據的分析方法構建對應的非結構化“壞樣本”作為分析的支撐,可以構建適合中國國情并與國際體系契合的現代信用評級體系,這個信用體系稱為基于“‘咖啡館’(CAFE)全息畫像風險評估體系”的“IS信用評級體系”。
“先知通(IS)信用評級體系”不再以中國在過去近20年來較流行使用的“以AA信用等級作為投資級的基本標準”進行中國式信用等級評估服務,這就從標準的角度解決了與國際信用評級標準的差異問題,同時也能夠讓中國的信用評級體系體現評級遷移和違約風險等一系列配套的指標要求和信息披露。
在實現的過程中,從以下四個維度來定義公司債券的信用等級:第一,公司財務業績的好壞;第二,公司有沒有欺詐和對應的財務管理質量的好壞;第三,公司在金融資產負債方面的健康情況,即刻畫公司倒閉或者違約的風險程度;第四,公司所處的生態環境和商務風險的好壞。通過建立這套全息評級系統可讓評級區分度更加明顯,主體信用等級更好地反映公司的實際信用狀況(參見表1和表2)。

表1 BBD基于1年和2年期限數據的初評等級映射表

表2 BBD 2015—2020年轉移矩陣匯總信息
“‘咖啡館’(CAFE)全息風險評估體系”是集企業搜索、信息揭示、關聯圖譜等功能于一體的企業全息風險評估體系(以下簡稱“‘咖啡館’信用”(CAFE Credit)),它由四個核心維度組成:公司全息畫像(記為“C”,代表“Corporation”)、財務全息畫像(記為“A”,代表“Accounting”)、金融行為全息畫像(記為“F”,代表“Finance”)和商務生態全息畫像(記為“E”,代表“Ecosystem”)。
這個體系最大的兩個特征是,把靜態分析轉換為動態分析,再將動態分析和企業生態相結合,形成對企業評級較客觀的刻畫。不過,形成這樣的刻畫需要以2015年自主開發的全息畫像(Hologram)為工具,進行異構異源大數據的融合。全息畫像是利用生態并引進對場景、欺詐風險、違約風險的描述,從而形成新指標和特征提取。
需要注意的是,針對公司財務欺詐風險體系的建立,融合從財務報表分析、治理結構分析、審計與內控分析(基于“欺詐三角理論”)進行風險特征的提取和刻畫,這三個方面包含傳統的結構化和非結構化數據。基于欺詐三角理論的欺詐風險分析主要覆蓋三個分析維度的信息:一是壓力或動機維度,包含財務穩定性、外部壓力、個人需要和財務目標等;二是機會或漏洞維度,包含行業屬性、無效監督、組織結構等;三是借口或態度維度,包含審計維度。對此,《當代會計研究》(Contemporary Accounting Research)中《推斷重大會計錯誤》(Predicting Material Accounting Misstatements)等文獻均有提及。針對從2016年至2020年中國上市公司和非上市公司的欺詐類型進行分類,主要有占用公司資產、披露不實(其他)、違規擔保、欺詐上市、擅自改變資金用途、一般會計處理不當、虛假記載(或誤導性陳述)、推遲披露、虛構利潤、重大遺漏、虛列資產。這十一類欺詐信息構建壞樣本集合并結合審計信息,形成一個動態的、生態的企業風險評估。
直到2020年底,中國可用來描述公司倒閉的壞樣本總數僅200個左右。在結構化壞樣本數量遠遠不足的情況下,需要另辟蹊徑,探索通過提取非結構化的風險特征,來構建建模所需要的足夠數量的壞樣本。要支持約8000家的公司(其中上市公司約4800家,發債公司約5500家,金融機構約1000家,城投公司約2500家)在信用評級體系中針對“壞特征”的建立問題,如果基于總樣本為4000家或8000家公司來考慮,按照對應1/4左右的壞樣本數量標準,就需要1000或2000個左右的壞樣本集合。這導致只能基于中國銀保監會對上市公司和發債公司處罰的2700多個案例為原始(非結構化)數據,提取其中基于11大類的非結構化特征的壞樣本,來構建至少1000個或2000個左右建模所需要的壞樣本。這些非結構化壞樣本與傳統財務指標不同,是以文檔陳述的形式出現于報告中,稱為大數據樣本。
為了實現這種刻畫欺詐的非結構化特征的高度關聯的風險特征提取,需要使用一個基于人工智能的算法工具——吉布斯抽樣算法(Gibbs Sampling)。使用吉布斯抽樣算法能提取出刻畫財務欺詐、高度關聯的非機構化風險特征因子,幫助構建甄別壞樣本和好樣本的風險評估體系,并達到對應模型測試的ROC曲線,ROC曲線值在0.7~0.75的區間(ROC測試結果在0.7或者以上,表明其使用特征具有較強的甄別和解釋能力),從而支持“咖啡館”體系比較有效地評估公司和債項的好壞。
公司股權結構是影響公司財務欺詐風險的重要因素。要對公司大股東、管理層、董事會、監事會按照持股比例、擔任的身份、內外的比例分類分析,利用證據權重(Weight of Evidence,簡稱WOE)和信息價值(Information Value,簡稱Ⅳ)信息量來解釋對評估對象可能會發生欺詐行為風險的影響。從公司治理框架的角度,可通過以下四個特征來預警可欺詐行為:第一,大股東和企業法人的持股比例在5%~50%;第二,大股東累計持股比例不超過60%;第三,管理層的大股東持股比例小于1%;第四,董事會中大股東比例不超過12%。
然后,納入基于內部、外部審計相關數據進行特征體系的建立。實際上,公司存在欺詐行為的背后與審計機構的業務情況、違規情況、合作情況,審計師的教育經歷、工作經歷等都有關聯。根據審計指標針對WOE分項結果和對應分析發現,審計委員會的人數、意見的不一致對公司的欺詐也有相應的影響。審計模型因子的ROC曲線是線性的,因此,外部審計只能發現有沒有欺詐,但形成不了推理(如果外部審計能夠形成推理,對應的ROC曲線應該是非線性的凸函數形態);而在對公司董事會人數與公司資質關系的研究中發現,無論公司評級如何,董事會人數為7~9人的情況都占了全部公司總數的80%(大型金融機構和大型集團公司除外)。因此,在公司注冊法要求的情況下,董事會的人數在合理的范圍之間并不能形成對公司好壞的影響。結合董事會、內部審計和外部審計的因素發現,經常有審計公司給出錯誤意見(即在公司存在欺詐行為的時候給出無保留意見)。與此相對的是,全息畫像技術可以用來驗證外部審計做得是好還是不好。
信用等級調整是信用評級機構最重要的評級行動之一,信用等級調整行為包括調升、調降和維持。在一定的時期(考察期)內,信用評級機構對債務發行人的信用等級調整結果可以形成債務發行人的信用遷移路徑,這反映了債務發行人信用質量的變化。
為了使得“咖啡館”信用評估體系的轉移矩陣保持必要的穩定,對評級轉移矩陣的構建按照以下方式進行處理(見表1)。
首先,將違約模型分為1年期和2年期,并進行ROC驗證,確定最終的模型;然后,根據1年期和2年期的違約模型給出不同的評級結果;最后,對1年期和2年期評級結果進行整合,給出初評等級。
由于數據獲取的有限性,“咖啡館”對上市公司樣本的觀察數觀察限于2014—2019年,2014年有完整年報財務信息的公司數為3000家,2019年為4500家。以2020年12月31日為觀察日,倒回一年的違約樣本數為44家;倒回兩年的違約樣本數為89家。
基于上面映射規則的使用,利用1年期和2年期的違約模型對評級結果進行整合后,會觀察到下面的基本結論:從評級AAA-A類到CCC-C類的信用轉移矩陣基本上以BBB為中心,保持良好的穩定性,從而解決AAA、AA和A級別遷移矩陣不穩定的問題(特別是針對像中國這樣的新興市場的情形)。從信用轉移矩陣來看,如果將AAA到A歸為一個“AAA-A”的大類來看,通過調整映射閾值后,有下面的信用轉移矩陣結果(見表2):
由轉移矩陣結果可知,AAA-A等級合并后保持更好的穩定性,轉移矩陣也體現出從AAA-C的在各級別穩定性上的單調遞減,這就支持“咖啡館”體系的相對穩定性問題,從而起到支持業界的作用。
作為“咖啡館”全息風險評估系統的應用,建立的“先知通(IS)信用評級體系”根據公司財務業績、財務舞弊、違約和生態環境的好壞,形成對中國整體公司主體和對應債項的信用評級體系的重塑。根據基于“咖啡館”評估系統的IS信用評級體系對中國所有4800家左右上市公司進行的信用評估,在2020年底左右,中國信用評級為AA以上的上市公司占中國整體上市公司的10%左右,等級為AAA的公司只占整體的1%左右。相較于國外,美國上市公司AAA級的比例占2%~4%,日本上市公司AAA級的占比為3%~6%。從上市公司等級分布、違約概率期限結構以及ROC曲線的檢測結果來看,“咖啡館”評估系統刻畫中國公司的信用風險特征更具優勢,同時有較好的預測能力。
以表3中的公司為例,該公司的生態風險評分和行業平均相當,但財務績效評分和財務舞弊概率都比行業平均的結果差。

表3 “XX科技公司”與行業平均的對比
此外,“咖啡館”全息風險評估體系在具體的股票市場、信用市場、資本市場等不同的應用場景中可形成不同的產品落地應用。 “咖啡館”全息風險評估體系還可以刻畫行業中的風險轉移和行業鏈場景,對應行業的產業鏈上下游鏈的全息畫像,配合關鍵詞字典的支持,其上下游鏈分類的正確率在65%~75%。
“基于‘咖啡館’風險評估框架下的評級應用”,其核心基礎是大數據分析的全維度分析評估,同時結合“異源異構數據”與“動態本體論”,能夠實現對企業風險基因的提取,解決體現中國金融市場本身特點的(違約)“壞”樣本不夠的問題,從而在基于針對公司主體進行全息畫像(企業全貌)的基礎上實現從“企業經營”“財務行為”“金融行為”“企業生態”四個維度對企業信用風險進行全方位動態評估。針對真實場景的應用表明,先知通(IS)評級體系對中國債券市場的信用等級分類具有較強的區分度。