吳燁
前言
半個世紀以來,我國債券行業(yè)發(fā)展迅速,從二十世紀八十年代初啟動國債和企業(yè)債的發(fā)行,2005年第一批短期融資債券發(fā)行,再到2015年證監(jiān)會出臺《公司債券發(fā)行與交易管理方法》,證明我國證券市場正在不斷發(fā)展壯大。由百度百科最新數(shù)據(jù)顯示:2001年我國債券凈供應(yīng)只有不到4000億人民幣,但到2012年就已超過3.9萬億人民幣;2001年時唯有五個企業(yè)發(fā)行凈融資48億人名幣的信用債,到如今僅僅單月信用債凈供給就逼近4000億人名幣。截止到2018年12月,國際清算銀行統(tǒng)計顯示中國債券市場余額達8380000億人民幣,在亞洲排名第二、全球排名第三,此中公司信用類債券余額排在亞洲首位、全球排名第二。儼然已經(jīng)發(fā)展為世界中頗具規(guī)模且占有相當?shù)匚坏膫灰资袌觥?/p>
一、債券及債券風險
(一)債券相關(guān)定義
債券是政府、銀行、企業(yè)等向社會籌集資金時,按法定程序向投資者刊行并應(yīng)諾依照必需的利率支付息金于指定日清償還本金的有價證券。債券按照發(fā)行人來歸類,首先可先考慮發(fā)行的主體:國家、中央銀行、政策性銀行、金融或非金融企業(yè),其發(fā)行的債券分別是國債、中央銀行票據(jù)、政策性金融債券和企業(yè)債券。其中因為國債、央行票據(jù)和政策性金融債券發(fā)行的主體,它們的信用風險基本不被投資者考慮,也常被人稱為“利率債券”。除此,近年來發(fā)展迅速的企業(yè)債,由于其發(fā)行企業(yè)可能存在的違約性和不確定性,投資者在投資時必須考慮其信用風險,因此常有人把企業(yè)發(fā)行的債券稱之為“信用債券”。
(二)債券信用風險概述
按照驅(qū)動因素,將投資債券帶來的風險分為信用風險、市場風險、流動性風險、操作風險。此中信用風險在風險領(lǐng)域中常被人認為是年代最久遠的一種金融風險,它是指受信人因為自身的一些原因未依照簽訂契約上的規(guī)定履行相應(yīng)的義務(wù),給授信人帶來的風險。在債券領(lǐng)域里多發(fā)生于信用債券操作中,多年來世界范圍內(nèi)由于信用問題導(dǎo)致的違約事件層出不窮,因此,信用風險也是近現(xiàn)代金融風險之中最需要引起人們重視的一種風險,它在各種金融風險之中總是位列首位。本文將著重圍繞債券風險中公司企業(yè)的信用風險來開展內(nèi)容。
二、研究意義
雖然我國對債券信用風險評估有建立相對完備的信用評估體系,通過選用相應(yīng)的模型、選用指定指標計算可能的違約率,但在評估過程中對其中眾多信息所產(chǎn)生數(shù)據(jù)的管理確十分不到位,很多時候會導(dǎo)致效率不高,預(yù)測不夠準確。對此,新興的機器學(xué)習算法或許可以在一定程度上緩解這個問題,提高風險評估模型的準確性和效率。通過使用大量數(shù)據(jù)對機器進行“訓(xùn)練“,使其建立一種模式,對下一次是否會發(fā)生債券違約進行更加準確的判斷。另外,機器學(xué)習方法在個人信用評級和其他平臺的借貸違約預(yù)測上得到越來越多的研究,但在債券市場違約風險預(yù)測評估這一方面,并沒有很多詳細說明結(jié)合預(yù)測的文章,本文希望結(jié)合近年來發(fā)展頗快且回報頗高的機器學(xué)習算法來預(yù)測債券市場風險,以此也豐富了債券信用風險預(yù)測的框架。
三、機器學(xué)習在債券風險評估中研究
(一)模型的選擇
主要運用機器學(xué)習來對個人信用風險做出評估預(yù)測。以機器學(xué)習為工具,選用多項式Logistic回歸、決策樹、神經(jīng)網(wǎng)絡(luò)、隨機森林這四種各異的算法來建立模型,以此來對個人信用風險進行評估。最后對得出的結(jié)果數(shù)據(jù)進行比較,從而觀察哪一種機器學(xué)習方法更有優(yōu)勢,并對最后的結(jié)果做出原因分析,對于模型存在的不足之處給出相應(yīng)的意見。選用的多項式Logistic回歸、決策樹、神經(jīng)網(wǎng)絡(luò)、隨機森林機器學(xué)習方法在目前已經(jīng)比較成熟,國內(nèi)外的學(xué)者都已經(jīng)做過種機器學(xué)習方法的相關(guān)研究,已有人把這些算法運用到信用評級上去。且每種方法都有對應(yīng)的軟件可以進行操作,無需擔心算法過于復(fù)雜而無法得到結(jié)果。
(二)操作流程
對與機器學(xué)習在個人風險評估的過程中,首先選取內(nèi)容符合且數(shù)量相對合適的數(shù)據(jù)。其次選用多項式Logistie回歸、決策樹、神經(jīng)網(wǎng)絡(luò)、隨機森林這四種機器學(xué)習算法分別構(gòu)建四種算法對應(yīng)的模型。之后對于四種不同的模型,選用不同的參數(shù)估計法進行參數(shù)估計。最后利用一些操作軟件,如Eviews、SPSS、R等,操作得到模型的估計結(jié)果。再對結(jié)果進行比較,這其中分為數(shù)據(jù)層面的對比分析和模型層面的對比分析,最后對模型進行評價分析。這樣就將機器學(xué)習應(yīng)用到了債券風險預(yù)測當中。
(三)模型結(jié)果預(yù)測
本文將更傾向于使用Logistic回歸能得到不錯的預(yù)測概率,因為在債券風險評估中,其結(jié)果通常會被認定為“違約”或者是“不違約”,本質(zhì)上是一個二分類問題。對于這種問題,Logistic回歸無疑是一種非常好的評估選擇,因為其本身適用的范圍就是二分類問題,且最后結(jié)果的解釋性也很強,通過特征值的權(quán)重就可知這些特征對是否違約的影響大小,一般特征權(quán)重越高,對是否違約的影響越大。