摘 要 根據已有的商業銀行個人信用風險評價指標體系和數據,應用投影尋蹤分類(PPC)技術進行建模,通過改變指標歸一化方式前后權重是否互為相反數等性質,以確保PPC建模時求得真正的全局最優解.實證研究表明:對于商業銀行個人信用分類問題,PPC模型的識別正確率高于判別分析模型;在評價指標的四個方面中,借貸人與本行關系最重要,其次是其基本情況,而償債能力和穩定性的影響很小;而且,刪除償債能力和穩定性兩個均值差異不存在顯著性的指標后建立的PPC模型,不僅不會降低識別正確率,還有利于銀行降低采集數據的成本和節約時間,簡化流程,對提高PPC模型的實用性等具有重要理論意義和實踐價值.
關鍵詞 商業銀行;評價指標體系;個人信用風險;實證研究;投影尋蹤分類技術
中圖分類號 F830.5 文獻標識碼 A
1 引 言
巴塞爾協議為商業銀行進行風險管理提供了有效的指南,我國銀監會要求有條件的銀行盡可能實現內部評級和進行風險識別.國內商業銀行信貸業務(尤其是個人信貸業務)發展很快,與此同時,銀行也必須承擔較大的風險.因此,國內商業銀行個人信用風險評價與預警已成為學界和業界急需解決的理論和實踐問題[1-6].國內對個人信用風險研究的歷史并不長,主要從兩個方面來開展:①建立評價指標體系;②確定各評價指標的權重,進行綜合評價研究.這兩個方面既有聯系,又有區別.絕大部分文獻既討論建立評價指標體系,又進行綜合評價研究,如文獻[2, 4-5]. 個人信用綜合評價方法目前主要有兩大類,第一類的樣本結果是已知的(如通過有關銀行、專家學者等的分析判定,個人的信用狀況是已知的),要求根據這些已知結果的樣本建立評價模型,無論對已知的還是未知的新樣本,要求模型有盡可能高的識別正確率,這類方法主要有logistic 模型、判別分析模型、Probit模型、決策樹模型和神經網絡等建模方法[2-6, 8-12],第二類情況是所有樣本的信用(結果)事先是不知道的,針對這類樣本的建模方法主要有層次分析法(AHP)、基于各種傳統賦權方法(信息熵、均方差法、離差法等)的綜合評價法、支持向量機、模糊綜合評價法、因子分析法、主成分分析法、投影尋蹤分類方法等等[2, 13,14].此外,有些作者把幾種模型(或權重)進行組合,以期獲得更高的識別正確率[7,8, 14].但就被廣泛采用的有關個人信用評價的公用數據—德國和澳大利亞個人信用數據(http://archive.ics.uci.edu/ml/machinelearningdatabases/statlog/)—國內外的大量研究、建模結果表明:針對第一類問題,各種模型的識別正確率幾乎相等,差異很小,德國個人信用數據的識別正確率均在75%左右,澳大利亞個人信用數據的識別正確率在85%左右[6, 9,10, 12].另一方面,對于非上述個人信用公用數據,作者們的研究結果往往是不同模型具有不同的識別正確率,有時還相差很大,如文獻[8]的結果是ANN的正確識別率最高,而文獻[10]的結果是ANN的識別正確率最低.針對第二類模型,因為樣本的結果事先是不知道的,而且不同方法的原理差異很大,結果的差異性往往也較大,可比性較差.其實,個人信用風險評價主要涉及兩大方面,即涉及建立合理、有效的綜合評價指標體系和采用合適的方法進行綜合評價兩個方面,主要要達到個人信用的識別正確率盡可能高,或者在滿足識別正確率的情況下,評價指標應盡可能的少,或者建模方法盡可能簡潔(單),模型的穩健性要好.因此,就目前來看,對于個人信用評價問題,無論是有關如何選取合理、有效的評價模型還是建立評價指標體系(選取有效、刪除冗余指標)等問題,都還有待于深入研究探討.另一方面,投影尋蹤分類(Projection Pursuit Clustering,簡稱PPC)模型是一種適用于高維、非線性、非正態分布數據處理的新興統計建模方法[15-18],PPC模型不僅數學意義清晰,而且便于對樣本和評價指標重要性進行排序和分類研究.本文以文獻[2]的銀行實際調研數據為例,與判別分析法為對照,將PPC技術引入到個人信用評價研究中,以期獲得更可靠和有效的結果,并探索一種新的個人信用評價研究方法.
2 構建個人信用風險評價指標體系
構建個人信用風險評價指標體系的基本原則為全面性、重要性、科學性、公正性和可操作性,以及還必須具備各項指標數據的可獲得性和具有本國特色等實用性和適用性.
不同學者建立的個人信用風險指標體系往往不完全相同,但大致都包含基本情況類指標、償債能力類指標、穩定性指標、以及與本行的關系等四大類指標[2-7,13-14].基本情況指標大致包括年齡、性別、學歷、婚姻與健康狀況、配偶職業等;償債能力類指標主要有經濟來源、個人月收入、家庭月收入、家庭人均收入、月均還款占家庭收入比、單位經濟狀況以及職稱等;穩定性指標主要有住房性質、從事本行業時間、是否參加醫療保險、是否參加養老保險以及是否繳納公積金等;與本行關系指標主要包括是否是本行員工、在本行貸款拖欠情況、賬戶情況、存款數額以及其他商業信用等.在進行評價指標篩選時,既要保證包含信息的全面性,又要保證信息盡可能少重疊.評價指標太多,既增加評價工作難度和不便于銀行日常管理,也不一定能提高識別正確率;但評價指標太少,也會造成無法區分個人信用之間的差異,降低模型的識別正確率.建模時,有些作者直接根據評價指標體系的數據進行,有些作者對不同層級的指標,采用不同的方法.由于本文的重點是比較投影尋蹤分類技術與判別分析法的識別正確率以及說明在滿足識別正確率的情況下怎么選取盡可能簡潔的評價指標等問題,筆者不再對究竟應該選取哪些指標進行詳細分析和討論,而是直接選用文獻[2]采用的評價指標體系和建模數據.
文獻[2]將第三層的指標數據采用專家法綜合成4個第二層的指標數據,建立了由4個綜合指標組成的判別分析模型,共計樣本94個(其中測試樣本4個,違約和非違約各2個),其中52個非違約樣本,建模樣本的Ⅰ類(將非違約樣本判斷為違約)錯誤率為8%,Ⅱ類(將違約樣本判斷為非違約)錯誤率為7.5%,而測試樣本的正確率為100%.為便于比較對比,本文采用文獻[2]的指標體系和數據(詳見文獻[2]),應用PPC技術進行建模研究,不僅數學意義明確,而且識別錯誤率也低于判別分析模型.