林 燕 馬海峰 上海師范大學商學院

本文為教育部人文社會科學研究項目“審慎監管視角下問題保險公司的救助決策分析:理論與實證”(17YJA790061)的部分成果。
保險公司評級方法經歷了從傳統統計方法到現代評級方法、再到人工智能方法的演變過程,其內在邏輯是從參數模型逐步發展到非參數模型、自我學習訓練型模型,具體方法包括指標法、回歸模型、現代評級模型、人工智能模型等。評級方法的核心內容是指標體系,而回歸模型能夠產生穩定可靠的評級結果,基于互聯網的大數據、云計算等技術則會給評級活動帶來顛覆性變革。人工智能模型和區塊鏈技術的應用前景也都很值得期待,但目前還未能取得實質性進展;不同模型的混合使用將是評級方法的發展趨勢。
公正科學的評級制度和評級結果有利于降低交易成本、信息成本和監管成本,因此被監管機構和市場參與者所重視。保險評級主要包括對保險公司的評級和對其發行產品(主要是債項)的評級,前者又可分為信用評級、償付能力評級、財務能力評級等。這些分類雖在目標定位上有所不同,但從評級過程和結果來看,本質上卻是類同的。因此,本文以保險公司評級方法作為研究對象,同時也會借鑒其他金融業的評級方法。
評級方法經歷了從簡單到復雜、從傳統統計方法到現代評級方法、再到人工智能方法的演變過程。其內在邏輯是從參數模型逐步發展到非參數模型、再到自我學習訓練型模型,而對樣本數據的要求則是從嚴格到逐漸放松的過程。公司評級類的文獻最早始于1908年Rosendale應用流動比率去評估信用價值;1966年Beaver用單指標方法,后改進為多指標法去評價公司財務能力狀況。隨著對樣本數據統計假設的逐步放開,上世紀80年代以Logistic和Probit為代表的回歸模型成為主流方法。在修正回歸模型的基礎上,基于信息和計算機科學的現代模型開始得到大量應用,例如層次分析方法、網絡分析法、決策樹方法等。目前,互聯網創新方興未艾,大數據和云計算等技術將促使人工智能技術應用于評級研究,例如神經網絡模型、粗糙集理論等。
指標法是依據一個或者多個指標所生成的指數,對公司的財務能力或者償付能力等進行評級、評價,可分為單指標法和多指標法,其重點在于指標的選擇和權重賦值,指標選擇的方法包括專家經驗法、統計方法等。
文獻中最早開始使用單指標法可追溯至1908年,Rosendale利用流動比率(current ratio)去評估公司的信用價值。Beaver(1966)是財務風險和信用風險評價領域的開創者,他把單一指標法發展至多指標法,認為現金流與債務總額的比率能很好地預測五年之內財務危機發生的概率。國內單指標法的相關研究有不同選擇,如候旭華(1999)采用凈資產利潤率,何玉梅等(2011)使用總資產凈利潤率等。
單指標法雖然簡單實用、操作性強,但是僅靠一個指標對公司評級評價,未免有所片面不夠公允,多指標法可從多個維度去衡量評價公司,評級結果更加科學穩健。因此,多指標法很快得到廣泛應用,根據指標選擇方法的不同可分為專家經驗法和統計方法。
多指標的選擇方法之一是依靠專家經驗,具體包括Z值、ZETA模型、駱駝(CAMELS)模型等。該領域的奠基者Altman(1968)基于五個指標構建著名的Z值模型,指標包括運營資本與總資產的比率、未分配利潤與總資產的比率、毛收入與總資產的比率、股權市場價值與總債務賬面價值的比率、銷售額與總資產的比率。后來,又加進10年期的營收穩定性和流動性比率,基于七個指標建立了ZETA模型。此后,Benjamin et al.(1986)、Kwan et al.(1986)、Kumar et al.(2015)等都利用不同參數指標構建Z值模型。Gasbarro et al.(2002)利用駱駝評級指標對商業銀行的財務能力狀況進行分析,發現只有營業收入指標能夠較好地預警財務能力危機。國內也有類似的研究,如張玲等(2008)構建財務預警Z值模型,賈曼莉(2015)、龍貞杰等(2017)在駱駝評級模型基礎上構建信用評價指標體系。
多指標篩選的統計方法包括多元判別法(MDA)、聚類分析法、主成分分析法、因子分析法等。
判別分析法系按照一定的準則,建立一個或多個判別函數,利用大量數據資料確定判別函數中的待定系數,并計算判別指標。Benjamin et al.(1986)、Kwan et al.(1986)、何玉梅等(2011)都利用多元判別法(MDA)進行評級相關的研究。有些學者混合兩種模型,如呂長江等(2006)、張勇(2014)使用MDA和Logistic模型等進行比較分析,取得更優的效果。
聚類分析是將一組研究對象分為相對同質群組的統計技術。主成分分析和因子分析本質上是類同的,區別在于前者是通過坐標變換提取主成分,將主成分表示為原始觀察變量的線性組合;而后者是通過構造因子模型,將原始觀察變量分解為因子的線性組合。Jensen(1971)、Gupta et al.(1972)基于聚類分析方法進行評級分析。國內的李心愉等(2011)、《中國保險公司信用評價體系研究》課題組(2014)、曹敏杰等(2008)、張晶(2011)、譚中明(2012)、龐如超(2012)等利用因子分析法進行公司評級相關研究。有些學者混合使用兩種模型進行研究,如肖北溟(2004)通過因子分析和聚類分析等方法構建內部信用評級模型,寇業富等(2013)運用聚類分析和主成分分析方法對財產保險公司競爭力進行評價分級。
由于簡單易操作、高效實用性等優點,指標法至今依然是很多評級機構的主要方法。目前,大多數的評級方法都是基于不同的指標體系展開分析,如何利用先進的方法(例如大數據、深度學習等技術),甄選出高效、科學的指標體系,并構建評級指數函數,將成為指標法的發展方向。
回歸模型基于回歸技術原理,通過選擇對評級結果有顯著影響的因素指標,然后利用指標體系建立指數,不同的指數值成為分級評價的閾值。主要包括Logit和Probit模型、Ordered Logit和Ordered Probit模型等。其中,Logit和Probit等模型輸出二元分類結果,Ordered Logit和Ordered Probit模型可以直接輸出多元的分級結果。
1980年,此領域的奠基者Ohlson選擇Logit模型,以規模、總負債與總資產比率、經營業績、流動性等指標預測公司的破產概率,并構建了著名的O指數(O-Score),通過O指數指標對財務能力進行評級。另有Steven et al.(1999)的 Ordered Probit模型、Bert Kramer(1996)的 Ordered Logit模型、Jennifer et al.(2005)的 Ordered Probit模型等其他研究。國內研究有劉暢等(2012)的Logistic模型、許亦平(2007)的 Ordered Probit模型、林江鵬(2016)的有序回歸模型、錢水土等(2016)的Logit模型等。
回歸模型既可以通過篩選指標來構建評級的指數(如Logit和Probit模型),也可以直接輸出評級結果(如Ordered Logit和Ordered Probit),模型的回歸系數具有實際經濟價值和解釋意義,定性指標和定量指標都可以進行分析,評級結果的穩定性和可靠性是回歸模型的特征。
現代評級模型大多借助計算機超強的運算能力,對樣本進行分類、分級評價,且大多屬于非參數模型,主要包括KMV模型、層次分析法、網絡分析法、決策樹方法等。
KMV模型的基本思想是把公司權益和負債看作期權,而把公司資本作為標的資產,違約概率則是與債務總額和公司資產結構相關的內生變量。張澤京等(2007)、周沅帆(2009)、張寶(2011)、凌江懷等(2013)、謝遠濤等(2018)運用KMV模型對信用風險進行評級和度量等的相關研究。
層次分析法(AHP)是將要決策的問題及其有關因素分解成目標、準則、方案等層次,同一層次中的元素必須是獨立的,不能互相影響或依賴,進而進行定性和定量分析的決策方法。網絡分析法在對其改進的基礎上,考慮了不同的層次和同層次元素之間的相互依存關系,這樣元素間的關系實際上形成了網絡結構。孫文等(2012)、鈕中陽等(2018)利用層次分析法構建風險評價體系。方芳等(2005)、梁偉等(2007)、湯凌霄等(2012)基于網絡分析法對操作風險進行評級等相關研究。
決策樹方法是一種非參數統計方法,由Makowski(1985)率先將其引入信用評估領域。其基本思想是根據樣本集決策屬性的信息增益比率來創建決策樹節點,每個節點循環生成新的子節點,并根據一定的原則和剪枝方法進行簡化,最終生成決策樹,生成的葉子即屬于同一類別的子集。其優點是可以輸入數值型和非數值型變量,缺點是只能輸出二元的評級結果。Angelis et al.(1994)應用決策樹模型去評估保險公司的償付能力。龐素琳(2009)基于決策樹模型建立信用評級模型。辛金國等(2012)、楊勝剛等(2013)、王磊等(2014)基于決策樹和神經網絡進行績效和信用風險評估等相關分析。
現代評級模型需要借助計算機超強的運算能力,具體運算方法各有不同。KMV模型通過計算公司的債務和資本市場的信息,以違約概率等作為評級的主要依據;層次分析方法和網絡分析法是經過計算與反饋過程,設定公司評級指標的體系和權重;決策樹方法是通過計算信息增益比率等來創建節點和分支,最終形成評價的決策樹。
人工智能是指機器能夠像人類的行為一樣運行,能夠模擬自然界的某種(如大腦、遺傳進化等)生物機理(Turban,1990)。人工智能評級方法主要包括人工神經網絡模型、遺傳算法、粗糙集理論、支持向量機、專家系統等。
人工神經網絡(ANNs,Artificial Neural Networks)模型,也稱神經網絡模型,模型通過模擬大腦的某些機理與機制,尤其是模擬生物神經網絡進行信息處理。劉洪等(2004)、任飛等(2007)、張維功等(2009)、劉洪渭等(2009)、鄧慶彪等(2011)基于神經網絡模型等對財務風險等進行預警研究。龐建敏(2006)基于神經網絡進行信用風險度量。楊勝剛等(2013)利用決策樹和神經網絡技術構建信用評估組合模型。
遺傳算法(Genetic Algorithm)是模擬達爾文生物進化論的自然選擇和遺傳學機理的生物進化過程的計算模型,是一種通過模擬自然進化過程搜索最優解的方法,其缺點是無法處理定性指標變量。葉中行等(2006)構建遺傳算法和分類樹相結合的信用評估方法,實證結果表明比單獨使用其中一種方法的準確率高。蔣艷霞等(2010)利用遺傳算法分析企業財務能力的影響因素。李竹梅等(2013)基于遺傳算法和最小二乘向量機對財務能力風險進行預警分析。
粗糙集理論(Rough Set Theory)基于機器學習和計算的智能技術,從給定問題的描述集合出發,對不完整、不精確數據進行分析處理,其主要思想就是在保持分類能力不變的前提下,通過知識約簡,導出問題的決策或分類規則。其優點是能處理離散指標,缺點是不能處理連續變量指標。薛鋒等(2008)建立粗糙集與遺傳算法相結合的財務能力預警模型。亢平等(2008)基于擴展粗糙集理論對信用風險進行等級評價。賈海濤等(2009)應用粗糙集理論評價商業銀行經營績效和能力。鮑新中(2012)混合粗糙集理論和其他模型綜合評價財務能力風險。
支 持 向 量 機(SVM,SupportVector Machine)的基本思想是在機器學習訓練的基礎上,最大化分類之間的距離邊際,其優點是能夠處理小樣本、非線性、離散變量數據,缺點是對大量數據樣本的運算過于復雜。楊毓等(2006)、蔣艷霞等(2009)、吳冬梅等(2010)、丁德臣(2011)基于支持向量機和其他模型預測企業破產、財務能力等風險。韓璐等(2017)、張夢男(2017)利用支持向量機進行信用評分研究。
綜上,人工智能評級模型的優點在于并行分布式處理、非線性處理、自學習能力等,對數據要求并不嚴格,可以是定性或者定量指標;缺點在于運算過程類似于“黑箱理論”,得出的參數無實際解釋意義。因為需要對樣本進行學習訓練,大量樣本數據是實證的前提。人工智能模型發展的新趨勢是不同模型的混合交叉使用,其評級結果往往優于單一模型。Holsapplea et al.(1997)使用多專家系統用于信用評級,評價結果優于單個專家系統模型。Pendharkar(2009)遺傳算法和神經網絡相結合的方法,能夠在企業財務破產預警分析中取得理想效果。郭英見等(2009)基于BP神經網絡、支持向量機等理論構建信用風險評估模型。Arash Bahrammirzaee(2010)、Bahrammirzaee et al.(2011)混合使用神經網絡和專家系統進行信用評分、信用評級等分析,混合模型能夠獲得更優效果。
保險評級的重要意義還未能得到業界的充分認識,相關研究的數量和質量還有待提高。雖然監管機構和商業評級公司會定期發布保險公司的信用評級和償付能力評級的相關信息,但是關于評級方法和評級模型方面的研究相對于銀行等行業還是較少。
回歸模型等傳統評級方法的精確度不夠高,還有提高創新的空間。在評級指標的選擇上,對社會經濟等外部因素考慮得較少。現有評級技術多考慮公司自身財務指標等因素,對外生變量的研究還不夠充分。實際上,評級結果深受經濟周期等宏觀經濟因素的影響,例如利率和投資收益率都隨經濟周期而波動,不利的外因常常導致保險公司發生償付能力或者信用危機等。
現有評級結果還有待進一步改進。一方面,由于歷史積累等原因,發生償付能力危機、信用違約等的樣本公司數量較少,可靠的公司內部數據獲取難度較大,這些數據可得性方面的先天性缺陷會影響到評級結果的準確性和科學性。另一方面,評級方法在簡單和復雜兩個極端游走,簡單的評級方法易于得出結論,但是其科學性和精確度還不足,例如指標法的指標選擇和權重賦值還有改進的空間;復雜類模型由于自身模型的抽象性和復雜性,模擬實證過程往往脫離了行業的實際情況,模型參數缺乏經濟解釋意義,方法和結果同時都令人信服的并不多見。

由于簡單高效和操作性強等特征,指標法在評級活動中始終占據著重要地位,如何充分利用先進技術去優選指標和權重賦值是未來發展的重點方向,尤其是改進基于指標的評分函數,以期得到更優的評級結果。
混合模型是評級理論研究和實踐操作的發展趨勢。如指標法與回歸模型的混合、回歸模型與現代評級模型的結合、回歸模型與人工智能模型的混合、不同人工智能模型之間的混合等,都取得了比單一模型更優的評級結果。
大數據、云計算等技術將會給評級活動帶來很大的變化,甚至是顛覆性變革。實時的投訴、投保數據可以通過互聯網技術及時收集與反饋,為評級結果實時更新提供了可能性。
深度學習能力基礎上的評級模型,尤其是人工智能模型的深層次應用前景很值得期待。但是,由于樣本數據的不充足等原因,可能制約此類模型的訓練學習程度,再加上自身模型的不穩定特性,能夠應用人工智能技術對保險公司評級并得到可靠結果的還較少。
區塊鏈技術具有去中心化、交易可追溯、共識算法、智能合約等特征,建立信用評價體系具有天然優勢(陳向陽等,2018)。某種意義上說,區塊鏈技術本身就是一種信用評價方法,其應用前景值得期待,只是目前還未能在評級活動中取得實質性進展。