999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

樣條函數在構造債券收益率曲線中的應用

2016-07-19 02:07:20
計算機應用與軟件 2016年6期
關鍵詞:模型

楊 柳

(復旦大學軟件學院 上海 201203)

?

樣條函數在構造債券收益率曲線中的應用

楊柳

(復旦大學軟件學院上海 201203)

摘要針對債券市場上蕪雜的行情數據,提出將DBSCAN聚類算法應用于構造債券收益率曲線樣條函數。通過運用DBSCAN算法對用于構造債券收益率曲線的行情數據進行聚類分析,能夠有效地剔除市場上的異常交易數據。在聚類分析結果的基礎上,再次應用DBSCAN算法于構造債券收益率曲線,根據市場上行情數據的密集區域對樣條函數進行分段。此外,針對傳統的依賴于經驗進行債券收益率曲線樣條函數分段點選取的缺點,使用DBSCAN算法可有效地提高債券收益率曲線和行情數據的符合程度。實驗結果表明,將DBSCAN算法用于構建債券收益率曲線樣條函數,可以提高收益率曲線反映利率期限結構波動及準確性的效果。

關鍵詞債券收益率曲線樣條函數聚類分析DBSCAN算法利率期限結構

0引言

債券作為一類固定收益證券,是資本市場的重要組成部分,債券收益率曲線對社會經濟的發展及金融體系的完善起著重要的作用。隨著中國資本市場的逐步完善,對于債券收益率曲線也受到了市場前所未有的關注。

市場上債券的交易存在著流動性偏差以及操作方式多樣化的特點。券商需要知道隨市場波動的債券價格以開展業務操作,因此必須對盡可能多的債券進行估值。將市場上的行情數據引入樣條函數,構造債券收益率曲線,并保證曲線的連續性以及平滑性,可以更為合理地對市場上發行的債券進行估值。從收益率曲線構造模型的研究角度出發,可以分為靜態模型和動態模型兩類[1]。從國際上債券估值的經驗來看,美國和日本的央行使用的曲線模型是根據Fisher、Nychka和Zervos提出的,基于McCulloch三次樣條函數的三次平滑樣條函數;英國央行的曲線模型使用的是基于平滑樣條的VRP(VariableRoughnessPenalty)方法,Waggoner(1997)地將平滑樣條常數粗糙度懲罰項優化為可變的粗糙度懲罰項[2];除英國以外的其他歐洲國家則都采用的是NS模型或者是NSS模型,NS模型的主要特點就是簡潔,對于簡單的收益率曲線,能夠較好地估計它的形態[3],但是曲線的擬合程度并不高,特別是用于較為復雜的期限結構,所以Svensson擴展了NS模型,即NSS模型,它能夠有效地提高曲線擬合的效果[4]。除此以外Hermite差值方法在國際上也有機構使用,比如美國的財政部。從上述國際機構使用收益率曲線構造模型的情況來看,基本上大部分的國際機構都選擇使用了靜態模型,并且資本市場越是發達的國家,越是偏向于使用樣條函數構造收益率曲線。

傳統的樣條函數分段處理方式中,分段點的選取通常依賴于經驗,并且分界點通常取1、3、5等[5],債券的性質決定債券市場的交易具有局部性的特點,傳統的處理方式不能隨著市場的變動調整樣條函數參數數量,即曲線的擬合程度不足。針對以上不足,本文利用債券交易局部性的特點,利用DBSCAN算法對樣條函數進行分段,DBSCAN算法是一種較為常見的基于密度的聚類方法[6], 聚類分析是數據挖掘的常用的方法之一,數據挖掘就是從大量的市場交易數據中提取包含在其中的隱藏的知識的過程。能夠識別出運營數據中的孤立點,去除噪音,消除數據中的不一致[7]。董樂在研究債券流動性溢價的問題的時候使用了聚類方法進行樣本篩選[8],將聚類結果用于債券溢價模型[9,10],雖然聚類在該過程中屬于一個輔助的過程,卻增加實驗結果的可信度。許瑾在研究資產定價模型問題時使用聚類分析方法對研究對象進行分類[11],證明聚類分析在辨別數據有效性時具有較好的效果。特別是DBSCAN算法,它的優點是能夠發現任意形狀的聚類簇,聚類算法執行速度較快以及不受數據錄入順序的影響,用來根據市場上的交易數據來擬合債券收益率曲線,提高收益率曲線反映債券利率期限結構波動情況及其準確性。

1債券收益率曲線擬合數據分析

用于構造債券收益率曲線的數據往往過多地依賴于人為判斷,因此債券收益率曲線擬合時,擬合程度與光滑程度之間的平衡直接受制于人為因素,除此以外,現有市場債券收益率曲線發布的現狀不能滿足數據的實時性要求。所以如何通過應用數據挖掘技術來改善上述問題,降低人為因素對于債券收益率曲線準確性的影響、縮短市場和債券收益率曲線發布之間的響應時間成了本文解決的問題。

2樣條函數的應用過程

目前市場上發布債券收益率曲線的機構每日只在市場收盤時發布一次,比如中國在債券收益率曲線編制方面最具影響力的公司——中國債券登記結算有限公司,也僅僅在每日盤終向市場發布數據。從某種程度上而言,用債券收益率曲線來反映債券市場波動,在時效性方面是不足的,特別是除了“11超日債”成為了中國債券歷史上首例違約的事件之外,還有類似于“PR青州債”在盤中被交易所公告“重大事項未公布,暫停交易”的情況發生??梢哉J為中國債市也同樣存在風險,捕捉市場對于風險的反映往往比給風險定價更為重要。目前為止國內大部分的研究都集中于提升收益率曲線模型有效性,而輕于數據的處理,個人認為,數據的準確性比模型的可用性更為重要,所以債券收益率曲線擬合的效果受到用于擬合曲線的行情數據處理效果的影響。

雖然DBSCAN算法在執行時需要預先制定相關參數,并且也存在諸如OPTICS算法對于該方面進行了改進[12],但是在擬合債券收益率曲線時,本文卻使用了DBSCAN算法。現代金融學雖然是建立在理性人假設基礎之上的,但是金融市場在理論實踐方面仍然是個弱有效的市場,所以在樣條函數應用過程中,使用聚類算法必須將經驗效用納入考量范圍,因此使用預先制定參數的DBSCAN算法更為合適。

2.1DBSCAN聚類算法及交易數據篩選

對幾個基本的密度聚類算法的定義做以下簡單的介紹。

(1) ε領域

對于給定的數據點p,其半徑長度為ε內的區域稱為該數據點的ε領域。

(2) 核心對象

假設MinPs為某數據點ε領域內,最少包含的MinPs個數的數據點。

(3) 密度可達

假設數據點集Ω,如果存在一組數據點p1,p2,…,pn;p1=a;pn=b,對于任意的pi,1≤i≤n都存在一個數據點pj,i≠j的ε領域εj,使得pi∈εj,那么則稱數據點a與數據點b密度可達。

(4) 噪音的定義

基于密度可達的最大的ε領域的集合稱之為簇,如果存在一個數據點p∈Ω,p不屬于任何一個簇,則該數據點p被稱之為噪音。

數據挖掘中的DBSCAN算法是基于密度的聚類算法中一個非常典型的聚類算法, 能夠發現任意形狀的聚類。基本思想是:在數據點集Ω的某一個點p,如果要判斷它是否歸于某一個簇,在點未分配到某個簇的時候,首先判斷點p是否為核心對象,若p是核心對象,就對點p的ε領域進行查詢,查詢出所有密度可達的數據點,形成密度連通集。重復迭代該過程,得到所有的密度連通集,最后剩下的不屬于任何密度連通集的數據點就被稱為噪音。DBSCAN算法的特點是由核心對象向周圍進行搜索,用以保證密度連通逐個形成[6]。DBSCAN算法通過索引相鄰數據點,對于全部的數據點只索引一次,加快索引速度。在選擇下一個待處理的數據點前,排除當前ε領域內的點,減少重復查詢的次數[13]。

在行情交易數據篩選中使用密度聚類的過程就是,首先基于歷史數據找出在發生行情的債券剩余期限附近的價格波動區間,在區間之外的可以認為是異常數據;然后在異常數據附近尋找臨近的數據點,如果低于某個閾值,就可以認為該數據為噪音。密度聚類的目標就是提供給樣條函數用于收益率曲線擬合的有效行情數據,過濾掉異常行情數據,進一步縮小樣條函數擬合數據的范圍,提高擬合曲線效率。使用密度聚類為樣條函數進行數據準備,首先要去掉那些明顯的異常行情數據,即行情數據中的孤立點。其次計算對應收益率曲線在該債券剩余期限處20天內的標準差,如果這個債券的交易行情的值在6倍標準差之外,或者在臨近該債券剩余期限的范圍之內及2倍標準差之內,不存在其他的交易行情數據,這樣的行情記錄可以刪除,如圖1所示。

圖1 數據準備中刪除數據示意圖

2.2樣條函數分段點的選取

在上述對于將DBSCAN算法用于判斷異常數據是否為噪音,將該算法還可以用于在有效行情中判斷分界點。

(1) 根據經驗指定收益率曲線分界點

根據陳震構造收益率曲線的結論[5],首先按照債券期限結構進行經驗上的分段點的選取。一年內的債券為到期債券密集的區域,每0.1年設置一個分界點;1至10年為市場上交易比較密集的區域,每0.5年設置一個分界點;10年以上交易量急劇下降,每10年設置一個分界點。

(2) 根據交易密度指定收益率曲線分界點

使用DBSCAN算法,尋找ε為0.01年的行情數據領域,尋找交易數據的密集區域,在經驗進行分段的基礎上,根據數據密集領域再次進行分段。

除此以外,隨著市場交易的繼續進行,原先被判定為異常交易的附近出現了更多的期限結構上臨近的交易行情,則可以認為該區域的行情為合理行情,即孤立點區間交易密度達到密度聚類的下限,該數據將不被剔除。保留高密度區域數據的示意如圖2所示。

圖2 保留高密度區域數據

2.3樣條函數的參數估計

根據債券的價格理論,即債券的估值等于所有未來現金流的現值之和如下:

(1)

其中,Pj為第j個債券的估值價格,Nj為該券現金流的數量,tm為第m筆現金流的剩余期限,Cj(tm)為第m筆現金流的值,D(tm)為tm時刻的貼現函數,經過簡化后,可以得到函數式:

(2)

其中Tn為樣條函數的分界點。上述公式的標準公式如下:

(3)

其中:

(4)

式中的W是一個對角矩陣,處于計算方便的角度考慮,將債券的權重皆設置成1,矩陣上的每個元素代表相關債券的權重,將債券的久期的導數作為權重如下:

(5)

其中,Duri為第i個債券的久期,三次分段懲罰項的平滑樣條需要解決的問題就是:

(6)

這樣就轉化為一個最小二乘擬合問題,通過迭代擬合求解。

3債券收益率曲線擬合結果分析

3.1與行情數據擬合效果分析

以2013年10月之后將近一個月的國債交易數據為例,采用上述樣條模型應用過程進行實證分析。表1市場上實際存在行情數據的債券與其估值價格的偏差分析。

表1 行情價格數據與估值結果偏差統計表

其中估值日為20131108那天,行情偏差最小值存在異常數據,經查證為“光大烏龍指”數據如圖3所示。圖中圓圈為發生異常債券的期限處,并且在行情收益率曲線擬合的時候已經將該異常數據予以排除,故并未對該期限處的收益率曲線波動造成太大的影響,體現出在異常數據篩選時密度聚類的有效性。從結果中還可以發現,平均的行情數據與估值結果的偏差不足0.1元,所以對市場上存在行情數據的債券來說有很好的估值效果。

圖3 國債收益率曲線生成效果圖

從收益率曲線幾個關鍵的期限來看,1年內、1至3年、3至5年、5至于7年以及7至10年之內行情收益率數據與曲線收益率數據的偏差如表2所示。平均收益率的偏差最大在6BP左右,具有較好的擬合效果。

表2 行情價格數據與估值結果偏差統計表

3.2與其他模型生成的收益率曲線數據比對

圖4是使用2014年9月12日中國債市行情數據生成的國債收益率曲線效果對比圖。Hermite曲線為中債公司使用Hermite插值方法生成的收益率曲線;Splines曲線為本文通過樣條函數的應用過程生成收益率曲線??梢钥闯鯯plines曲線在10年以內的波動更大,對那一天中國債市的行情數據進行統計得到表3所示。

圖4 國債收益率曲線生成效果對比圖

偏差期限 Hermite均值(%)Hermite中位數(%)Splines平均值(%)Splines中位數(%)(0,1]-0.08942-0.06634-0.010280.03767(1,3]-0.06367-0.035830.00444-0.00048(3,5]-0.00651-0.00246-0.00693-0.00030(5,7]0.004470.000130.001520.001866(7,10]0.020700.022800.00051-0.00115

從表3中的統計數據可知,通過樣條函數應用過程得到的Splines曲線,雖然在十年之內波動較大,但是它對市場上的債券價格波動擬合程度更好。Hermite曲線在不同期限上,與行情發生價格偏差最大可達到9BP、最小接近0.4BP;Splines曲線最大接近4BP、最小只有0.03BP。Hermite曲線構造的一個重要的問題就是確定用于插值用的數據點,這需要依賴于一個強大的研究團隊,這樣就無法發揮出數據挖掘的智能性。

將用于擬合Splines曲線的數據用于NSS模型,由于NSS模型的參數個數是確定的,可以使用R程序中的fBonds工具包進行優化求解,得到模型參數估計值,見表4所示。

表4 Nelson Siegel Svensson模型參數估計

將NSS模型擬合收益率曲線的結果與Splines曲線進行比對,就可以發現NSS模型在擬合收益率曲線方面并不見長,特別是在行情波動比較大的區域,如圖5所示。

綜上所述,在樣條函數構造債券收益率曲線的過程中應用密度聚類,可以有效地過濾掉異常數據,并且通過樣條函數分段點的選取,可以有效提高與市場債券價格波動的符合程度。

圖5 國債收益率NSS模型曲線生成效果對比圖

4結語

傳統的樣條模型分段處理方式中,分界點的選取通常依賴于經驗,并且分界點通常取1、3、5等[5]。債券的性質決定債券市場的交易具有局部性的特點,傳統的處理方式不能隨著市場的變動調整樣條模型參數數量,即曲線的擬合程度以及實時性方面存在不足。本文基于DBSCAN算法實現了對于樣條模型分界點的自動選取,并在交易不足的區域保留了分段點經驗選取的方式,能夠在交易密集區提高曲線的擬合程度;在交易稀疏區指導曲線的走向,從而更好地生成符合市場波動的債券收益率曲線。

參考文獻

[1]RobertCMerton.Continusous-TimeFinance[M].Wiley-Blackwell,1992.

[2]WaggonerD.Splinemethodsforextractinginterestratecurvesfromcouponbondprices[R].Georgia:FederalReserveBankofAtlanta,1997.

[3]SvenssonLEO.Estimatingandinterpretingforwardinterestrate[R].Sweden:CEPRDiscussionPaperSeries,1994.

[4]SvenssonL.EstimatingforwardinterestrateswiththeextendedNelson&Siegelmethod[R].SverigesRiksbankQuarterlyReview,1995.

[5] 陳震.中國國債收益率曲線研究[D].上海:復旦大學,2009.

[6]KhanK.DBSCAN:Past,presentandfuture,ProceedingsofFifthInternationalConferenceonApplicationsofdigitalInformationandwebtechnologies(ICADIWT),Bangalore,2014[C]//IEEE:Piscataway,2014:232-238.

[7]JiaweiHan,MichelineKamber.Datamining:conceptsandtechniques[M].3rded.ElsevierInc.,2012.

[8] 董樂.銀行間債券市場流動性溢價問題研究[J].運籌與管理,2007,16(4):79-88.

[9]TakemataJun,MiyazakiKoichi.TheGRStestforassetpricingmodelsintheJapaneseequitymarket[J].JournalofJapanIndustrialManagementAssociation,2013,64(1):75-84.

[10]DeGiuli,MariaElena.Bayesianoutlierdetectionincapitalassetpricingmodel[J].StatisticalModelling:AnInternationalJournal,2010,10(4):375-390.

[11] 許瑾.統計方法在利率期限結構和多因素資產定價模型中的應用[D].安徽:中國科學技術大學,2005.

[12]AnkerstM,BreunigMM,KriegelHP,etal.OPTICS:orderingpointstoidentifytheclusteringstructure[R].ACMSIGMODRecord,1999,28(2):49-60.

[13] 李雙慶.一種改進的DBSCAN算法及其應用[J].計算機工程與應用,2014,50(8):72-76.

[14]WileyFinance.Analysingandinterpretingtheyieldcurve[M].Hoboken:JOHNWILEY&SONSINC,2004.

APPLICATION OF SPLINE FUNCTION IN CONSTRUCTING BOND YIELD CURVE

Yang Liu

(School of Software Engineering,Fudan University,Shanghai 201203,China)

AbstractIn light of the miscellaneous quotation data in bond market, we proposed to apply the DBSCAN algorithm to constructing the spline function of bond yield curve. By employing DBSCAN algorithm to the cluster analysis of the quotation data, which is used to construct bond yield curve, it is able to eliminate effectively the abnormal transaction data on the market. On the basis of cluster analysis results, we used the DBSCAN algorithm once again to construct the bond yield curve, and segmented the spline function into sections according to the dense regions of quotation data on the market. Besides, targeted at the defect of traditional way that it selects the segment points of spline function of bond yield curve depending on experience, the use of DBSCAN algorithm can effectively improve the conformance between the bond yield curve and the bond quotation data. From the experimental results it is illustrated that to apply the DBSCAN algorithm to constructing the spline function of bond yield curve can improve the effects of reflecting the fluctuations of interest term structure by bond yield curve and its accuracy.

KeywordsBond yield curveSpline functionCluster analysisDBSCAN algorithmInterest term structure

收稿日期:2015-01-13。楊柳,碩士,主研領域:數據挖掘。

中圖分類號TP311

文獻標識碼A

DOI:10.3969/j.issn.1000-386x.2016.06.023

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 日韩二区三区| 国产在线第二页| 成人福利在线观看| 成人午夜亚洲影视在线观看| 欧美区国产区| 麻豆AV网站免费进入| 日本在线免费网站| 99在线免费播放| 福利视频一区| 久青草免费在线视频| 亚洲欧美日韩中文字幕在线| 欧美日本激情| 国产精品亚洲日韩AⅤ在线观看| 久久综合亚洲色一区二区三区| 欧美成人区| 91久久夜色精品国产网站| 在线毛片网站| 国产精品浪潮Av| 久久国产精品77777| 老司国产精品视频91| 国内老司机精品视频在线播出| 欧美成人精品高清在线下载| 欧美精品一区二区三区中文字幕| 人妻精品全国免费视频| 国产成人a在线观看视频| 亚洲福利网址| 欧美精品H在线播放| 日韩欧美国产中文| a在线观看免费| 亚洲成A人V欧美综合天堂| 欧美一区精品| 国产对白刺激真实精品91| 国产剧情无码视频在线观看| 亚洲欧美成aⅴ人在线观看| 有专无码视频| 亚洲精品国偷自产在线91正片| 9966国产精品视频| 毛片免费视频| 久久久久久久蜜桃| 毛片a级毛片免费观看免下载| 国产乱人乱偷精品视频a人人澡 | 精品自窥自偷在线看| 这里只有精品免费视频| 国产黄色片在线看| 欧美亚洲综合免费精品高清在线观看| 亚洲免费三区| 波多野结衣一级毛片| 麻豆精品在线| 第一区免费在线观看| 欧美成人国产| 99re精彩视频| 久久久久久久久18禁秘| 欧美在线精品怡红院| 亚洲天堂网在线播放| 91久久国产综合精品女同我| www亚洲天堂| 丁香婷婷久久| 成人国产一区二区三区| 亚洲色无码专线精品观看| 精品视频一区二区三区在线播| 亚洲欧美成人综合| 亚洲福利视频一区二区| 老司机精品久久| 免费国产在线精品一区| 女人18毛片一级毛片在线 | 国产精品视频a| 国产对白刺激真实精品91| 免费女人18毛片a级毛片视频| 国产91精品调教在线播放| 久久久久国产一级毛片高清板| 天天综合网站| 精品国产乱码久久久久久一区二区| 国产成人精品男人的天堂| 亚洲视频免| 一级片一区| 日韩国产精品无码一区二区三区 | 亚洲精品中文字幕午夜| 看你懂的巨臀中文字幕一区二区| 色综合天天娱乐综合网| 九色最新网址| 国产伦精品一区二区三区视频优播 | 国产高清在线精品一区二区三区|