999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

標簽傳播時間序列聚類的股指期貨套期保值策略研究

2019-04-10 08:39:16李海林梁葉
智能系統學報 2019年2期
關鍵詞:方法

李海林,梁葉

(1. 華僑大學 信息管理系,福建 泉州 362021; 2. 華僑大學 現代應用統計與大數據研究中心,福建 廈門361021)

股指期貨是基于股票指數的金融衍生品,不僅能夠對現貨資產進行對沖來降低系統風險,還能作為一種投機套利工具來豐富資產組合,獲得良好收益。股指期貨與現貨市場存在一定的關聯,正常市場條件下雙方表現出同漲同跌的情況[1]。現貨組合與股指期貨表現出的趨同程度越大,套期保值的效果越明顯。標的指數是一籃子股票,在實際操作中,是無法使用所有現貨股票來構建組合的。此外,隨機或者人工指定少數股票來構建投資組合,不僅無法充分把握整體信息,又會產生一定的模擬誤差,增加投資風險。因此,用較少的股票來構建現貨投資組合,降低同步買賣的成本,并反映該投資組合與標的指數之間的相關性,是本文的研究關鍵。

目前,針對股指期貨的套期保值研究有不少的研究和應用成果[2-6],其中通過指數復制和組合追蹤來研究股指期貨的套期保值也日益得到國內外研究者的關注,采用新的量化研究方法成為研究指數復制問題的一個方向。蘇治等[7]建立混合整數線性規劃模型并引入內核搜索分析框架,通過實證分析發現,增強型內核搜索法在成分股很大時才能夠得到高質量的解,考慮現實交易成本特征的模型具有更好的穩健性,在指數追蹤時投資組合的動態調整具有一定的必要性。倪禾[8]提出一種基于啟發式遺傳算法的尋優方案,通過最大效用函數來尋找一個最為經濟的組合,該組合擁有最少的資產數、較少的權重調整次數和盡可能的接近或超越標的指數收益的優勢,具有較強的實用性。胡春萍等[9]構建時間加權SVN的指數優化復制模型,不僅能夠考慮時間因素對歷史追蹤誤差的影響,還能夠提高追蹤組合的追蹤效果。劉睿智等[10]使用自適應套索方法構造稀疏投資組合,使得該組合對指數的追蹤效果良好。Chen等[11]設計了一種穩健的跟蹤市場指數投資組合模型,該模型旨在利用0-1規劃找到組合和標的指數之間的最大相似性,且在實驗中,該模型得到的投資組合具有更低的跟蹤誤差和投資風險。Guastaroba等[12]為了平衡最小跟蹤誤差和超額收益的關系,設計出混合整數線性規劃方法,利用內核搜索方法尋求最優解。該方法可以引入真實交易的特征,獲得的最優組合也具有較好的表現,相比于傳統的啟發式方法具有更優的性能。Filippi等[13]針對指數追蹤問題中獲得超額收益和最小跟蹤誤差雙的目標問題,提出了雙目標整數線性規劃模型。該模型旨在獲得的組合在指數追蹤上具有最小的追蹤誤差,并且能夠獲得超額收益。

時間序列聚類在金融領域的應用越來越受到研究者的關注,對探究金融市場的發展規律、把握市場信息起到重要的作用。Dose等[14]利用基于隨機優化技術的時間序列聚類來增強指數跟蹤,通過層次聚類得到不同的簇,每個簇中選擇股票的子集并確定相應的權重后作為投資組合。該方法表明,通過聚類方法要比隨機選擇股票組合具有更少的噪聲和更好的穩健性。Nanda等[15]利用K-means聚類將股票劃分成不同的簇,并從不同簇中選擇一些股票作為組合。由于組合來自不同的簇,分散投資使得風險最小化。柴尚蕾等[1]利用基于獨立主成分分析和模糊C均值聚類的兩階段優化方式構建現貨組合,相比隨機方法得到更低的跟蹤誤差,提高了組合對大盤動蕩的抵抗力。Lemieux等[16]分別探討了通過3種傳統聚類方法獲得的投資組合上在實際交易中的應用,分析不同聚類技術是如何影響分析師對不同風險組合的看法。

時間序列聚類在金融領域得到了充分的利用,但傳統時間序列聚類方法一般先指定初始簇中心,也不能充分反映其空間組織聯系。社區發現是復雜網絡研究中的重要研究工具,根據某種規則將網絡中的節點劃分為若干個社區,每個社區內部的節點連接較為緊密,而社區之間連接稀疏。因此,社區發現與聚類是不謀而合的。目前結合社區發現探索時間序列聚類的有關成果仍舊不足[17],標簽傳播[18]作為簡便的劃分算法,可以在相連的節點中傳播有用的信息。將標簽傳播應用到時間序列聚類分析,是一種新的研究視角。此外,動態時間彎曲是一種度量準確性高的度量方法,是各個領域理論和應用研究的熱點。綜上,本文提出一種基于標簽傳播的時間序列聚類方法來對股指期貨套期保值策略進行研究。利用動態時間彎曲構建股票池網絡,將每只股票看作網絡中獨立的節點;通過標簽傳播方法將網絡中的節點劃分成不同的社區,實現時間序列聚類;構建最小追蹤誤差模型,優化每只股票在組合中的權重。

1 相關理論基礎

標簽傳播是社區發現領域的重要方法之一,其簡單高效的思想使其得到了廣泛的關注。動態時間彎曲是泛化能力強的度量方法,是各個領域的研究熱點。為了充分理解標簽傳播方法計算原理,對標簽傳播和動態時間彎曲的基本原理進行闡述,明確兩者在本研究中的重要作用。并給出了優化權重過程所使用的最小追蹤誤差模型。

1.1 標簽傳播

標簽傳播(label propagation algorithm, LPA)是根據網絡的局部信息結構,利用節點的連接關系自動傳播信息,最終得到社區的劃分結果。LPA不需要事先指定社區規模、個數、優化目標函數,算法簡單又容易實現,同時具有接近線性的時間復雜度。因此,獲得了社區發現領域的廣泛關注。設無向無權網絡 G (V,E), V 為節點集,E 為邊集。利用LPA獲取節點的標簽集 L , 以 cx表征節點 x的標簽。先隨機為每個節點分配唯一的標簽作為其所在的社區的標識,其標簽的決定取決于鄰接節點標簽的分布狀況。該算法如下。

算法標簽傳播算法(label propagation algorithm, LPA)

輸入網絡 G (V,E);

輸出L。

1) t =0 , 首次定義全部節點的標簽。節點 x有Lx(0)=x。 Lx(t)為 x于 第t次計算時的標簽。

2) t = 1。

3) 打亂節點順序,獲取打亂順序的節點集 V′。

4) 對于各個節點 x ∈V′, 設 Lx(t)=f(LNb(x)(t)),其中 N b(x)表 示節點 x的 鄰接點集, f (·)得到個數最大的標簽。

5) 若 L (t)與 L (t-1)相等,則算法停止;反之,t=t+1, 返回3),算法重復進行 (L (t)為 第t次計算獲取的標簽集)。

1.2 動態時間彎曲

動態時間彎曲(dynamic time warping, DTW)為一種魯棒性強的度量方法,最早用于語音識別[19]。與歐氏距離相比,DTW能夠彎曲時間軸達到不等長時間序列的度量,充分反映時間序列的形態[20]。特別地,在時間數據挖掘[21]領域中,動態時間彎曲具有較為廣泛的應用。利用歐氏距離構建兩條時間序列 S ={s1,s2,···,sn}和 Q ={q1,q2,···,qm}的距離矩陣 Dn×m, D中的元素為數據點的歐氏距離。DTW的目的就是在 D 中找到一條彎曲路徑P={p1,p2,···,pH}使 得 S 和 Q 之 間的累積代價最小,則 S和Q的DTW距離為

式中: P 是 由 H 個 距離元素的集合,代表著 S 和 Q 之間數據點的最佳匹配關系。最優彎曲路徑可以利用動態規劃方法來構造一個累積代價矩陣γ獲得,即

式(2)表示當前的累積代價為當前距離加上相鄰3個最小的累積代價。最后 γ (n,m)為起點反向搜索路徑,以相鄰最小的累積代價元素作為下一個路徑節點,直到搜索至 γ (1,1)。 那么,γ(n,m)=DTW(S,Q)即為兩條時間序列的DTW距離。

1.3 最小追蹤誤差模型

為得到最優現貨組合,從標的指數的 N 只成分股中選出 k (k<N)只來構建現貨投資組合,使得該現貨投資組合的股票收益率與標的指數的收益率誤差最小。根據最小誤差追蹤模型(minimum error tracking model, METM)來得到各個股票所占比例,得到最優現貨組合。設有T個交易日的追蹤組合,在第 t( t∈[1,T])個交易日的收益率為

標的指數的收益率為

式中: pi,t為 組合的第 i( i=1,2,···,n)只 股票于第t天的價格; wi為 第i只 股票在組合中所占比例; Pt為標的指數在第t天的指數值。追蹤誤差 T E為追蹤組合的收益率和標的指數收益率的誤差平方和的均方根:

優化現貨投資組合需要結合以下約束:一是資本的預算;二是投資比例的最低要求和最大限制,表示對風險的控制,也可根據投資者的風險偏好來制定。綜合目標函數和約束條件,METM如下:

2 標簽傳播時間序列聚類

聚類是數據挖掘重要任務之一,根據一定規則將數據劃分為若干個簇,簇內的對象保持著高度相似性,簇之間的對象盡可能不同。在金融領域中,聚類對于板塊分析、投資組合分析有著重要的意義。LPA的便捷高效,應用到時間序列聚類則是一種新興嘗試。為了充分反映時間序列的網絡空間結構,并且能夠根據時間序列之間的關系相互影響自動實現聚類,提出一種基于標簽傳播的時間序列聚類方法,并將其應用到股指期貨套期保值優化策略中。

算法標簽傳播時間序列聚類(time series clustering based on label propagation, TCLP)

輸入時間序列數據集;

輸出時間序列聚類結果。

1) 對時間序列進行標準化處理;

2) 利用DTW度量每條時間序列之間的距離;

3) 將時間序列視為節點,指定距離閾值 ε,距離小于閾值 ε的時間序列創建連接,得到時間序列網絡 G (V,E);

4) 利用LPA對時間序列網絡進行劃分,實現聚類。

為消除量綱對度量的影響,對時間序列進行標準化處理。例如,由于公司資本大小不同,經營業績不同等原因,使得不同股票價格千差萬別,若沒有對股票價格進行標準化處理,那么時間序列相似性度量結果則不準確,使得兩條形態很相似的時間序列之間的距離很大。步驟2) 是時間序列相似性度量,DTW可以實現數據點“一對多”匹配,從而實現兩條不等長時間序列的度量。由于股票數據存在可能停牌、數據缺失、數據錯誤等原因,利用DTW可以有效地解決數據清洗之后帶來的序列不等長問題。使用LPA之前,需要創建好時間序列網絡,而構建時間序列網絡的方法通常有兩種,即 k -NN 和 ε -NN 。 k-NN是節點連接與之距離最短的前 K 個 節點, ε -NN為給定閾值,滿足閾值 ε要求的節點進行連接。相關研究表明,以 ε -NN創建的網絡后獲得的聚類結果好于 k -NN[17],因此本文使用 ε -NN方法構建時間序列網絡結構。在步驟4) 中使用LPA對以每條時間序列為節點的網絡進行劃分,最終達到時間序列聚類目的。

3 數值實驗

3.1 仿真實驗

為驗證方法的有效性,通過對Keogh教授提供CBF數據集[22]進行檢驗。CBF,即Cylinder-Bell-Funnel,它是一種人工數據集,每個類的數據都是服從標準正態分布的噪聲加上一個不同于每個類的偏移量。CBF共有3個類別,每個類別時間序列形態各不相同,可以直觀地體現聚類效果。度量每條時間序列之間的DTW距離,以時間序列 S 與它的前 K 條相似序列距離之和的均值作為 S的距離閾值 ε , 若 Q 與 S 之 間的距離小于 ε,則Q 與 S 相 連。在本實驗中 K 取10,表示每條時間序列與之最為相似的10條時間序列距離之和的均值作為連接閾值。可以發現,每條時間序列都具有不同的連接閾值,那么與之相連的時間序列個數則不同。CBF數據集中各個時間序列的形態以及聚類結果如圖1所示。

圖1(a)左側給出CBF三種形態相異的時間序列,右側是對應形態的時間序列的ID。圖1(b)展示新方法的聚類效果,用不同顏色代表不同簇,發現新方法能夠成功將數據集劃分為3個簇。具體分析圖1(b),盡管節點3與節點1相連且真實情況也同屬一類,但是節點3與更多的綠色節點相連,導致在標簽傳播過程中節點3接受了綠色節點傳過來的標簽,被劃分到了綠色的簇中。同理可分析節點13和節點24。度量方法和網絡構建方式影響著時間序列空間網絡布局和最后的聚類結果。然而,通過構建時間序列網絡并利用標簽傳播方法實現聚類,為聚類分析提供了一種新的研究模式。

圖1 CBF數據集和TCLP-DTW聚類效果Fig.1 CBF dataset and the clustering result of TCLPDTW

3.2 實證分析

為了檢驗方法的真實有效性,使用真實股票數據來進行實證分析。采用金融行業的股票數據,采用2014年1月2日至2014年12月31日滬深300股成分股的日收盤價作為實驗數據,數據從銳思數據庫下載獲得。為保證后續挖掘的質量,對數據進行清洗,即剔除7天以上未開盤股票,默認值為該股票的平均收盤價。數據清洗后剩余265只股票數據。

對每只股票數據做標準化處理:

式中: Xi為 股票第i個 時刻的價格,μ為這支股票的價格均值,δ為價格方差。

利用基于TCLP時間序列聚類方法,對實驗股票數據集進行聚類。TCLP不必先指定簇數,能依據度量公式的特點自行劃分數據集。本實驗在構建股票網絡結構之前,先利用DTW度量每條時間序列的距離,接著由前50相似序列距離之和的均值確定距離閾值,最后利用標簽傳播方法對股票網絡結構進行劃分,劃分結果如圖2。

TCLP-DTW將股票數據集劃分為了4個形態不同的股票簇,并且簇內的股票時間序列表現出類似形態,而不同股票簇之間的形態有著明顯的區別,說明聚類效果較好。

從每個股票簇中選定追蹤組合成分股,并通過METM計算每只追蹤成分股的權重,得出追蹤誤差。首先,從每個股票簇中確定成分股。選擇能呈現該股票簇走勢的幾只股票,在建立組合時表征了整體情況,分散風險。

各個股票簇的股票依據在滬深300指數中的比重從大到小排列,采用前兩只比重大的股票,獲得8只股票,選取結果如圖3所示。

可以發現,各個簇選擇股票的走勢是相似的,而不同股票簇的成分股走勢也不同,充分體現TCLP-DTW方法的聚類效果。

其次,利用METM計算每只成分股的權重。觀察4種投資約束條件下TCLP-DTW得到的現貨組合追蹤誤差情況。

如表1所示,得到了TCLP-DTW構建優化現貨組合的TE。盡管不同約束條件下能夠獲得最小的TE,但是部分股票的權重占比很大,不利于風險分散。此外,盡管前面兩種約束條件得到的追蹤誤差并非最低的,然而貴州茅臺等股票價格較高,因此在組合中所占權重相對少一些。TCLPDTW構建優化現貨組合是比較傾向于低投資比例的,并且股價較高的成分股占比較少,有利于投資者控制成本風險。

由于K-means聚類方法簡單、高效,成為金融領域中應用得較多的聚類方法。為對比K-means和TCLP-DTW創建投資組合的效果,利用K-means將股票池劃分成4個簇,同時對比同一條件下雙方的 T E,如圖4所示。

圖3 8支成分股選取情況Fig.3 Eight constituent stocks were pick out

表1 TCLP-DTW構建優化現貨組合成分權重Table1 Constituent stock weight optimally created by TCLP-DTW %

從圖4中發現,K-means方法在投資比例不設限的條件下同樣得到最低的TE。由于投資比例不設限,就能在更大的范圍中搜索最優解。對比TLPC-DTW、K-means和隨機這3種選股方式所構建優化組合的TE。隨機選股為對于各個約束比例模擬追蹤10次,每回隨機抽取8只股票創建組合。利用METM得到股票的權重,以10次TE的均值當做該種投資約束下的TE。盡管K-means在初始化時隨機選取簇中心,但整個聚類過程是一個迭代優化的過程,使得每個簇中對象盡可能相似,簇間的對象盡可能相異,這與隨機選取方式有著本質的區別。為了比較聚類方式構建最優現貨組合和隨機構建最優現貨組合,利用

作為相對追蹤誤差率。 Eothers為其他方法得到的TE。若 T ERothers是負數,表明TLPC-DTW構建組合的TE獲得了優化;反之,說明誤差更大。結果如表2所示。

從表2給出的TE以及TER發現,TCLP-DTW構建的現貨組合在3種投資比例約束條件下現貨組合的TE較于K-means、隨機方法的TER均為負數,表明誤差均得到了改進。K-means只對等長的時間序列聚類,若股票長度不同,則先預處理達到等長效果。K-means的簇中心是簇內的對象的平均值,不是實際中的股票。TCLP-DTW是根據股票的相互影響進行劃分,并能從中得到股票連接關系。隨機方式的隨機性容易存在收益波動大的情況。通過對比發現,TCLP-DTW構建的組合得到更小和穩定的TE,為研究套期保值提供新的視角。

圖4 K-means構建優化現貨組合成分權重Fig.4 Constituent stock weight optimally created by K-means

表2 兩種方式構建現貨組合的追蹤誤差Table2 Tracking error was optimally created by two methods %

4 結束語

本文提出一種標簽傳播時間序列聚類方法,使用動態時間彎曲能夠較好地度量時間序列之間的距離,結合距離閾值構建反映時間序列之間關聯關系的網絡,再利用標簽傳播來實現新方法。該方法能夠較好地用于股票聚類,用來選擇代表股票以確定投資組合,并通過最小誤差追蹤模型優化組合中的股票權重。實證分析得出,本文方法對追蹤誤差有一定優化,為進一步了解市場規律、提高投資效率提供一定的技術支撐。

猜你喜歡
方法
中醫特有的急救方法
中老年保健(2021年9期)2021-08-24 03:52:04
高中數學教學改革的方法
河北畫報(2021年2期)2021-05-25 02:07:46
化學反應多變幻 “虛擬”方法幫大忙
變快的方法
兒童繪本(2020年5期)2020-04-07 17:46:30
學習方法
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
最有效的簡單方法
山東青年(2016年1期)2016-02-28 14:25:23
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 亚洲精品国产精品乱码不卞| 国产91色| 福利视频99| 免费a级毛片视频| 人人澡人人爽欧美一区| 午夜爽爽视频| 午夜日b视频| 99久久精品国产综合婷婷| 久久久久无码国产精品不卡| 欧美三级视频网站| 日本成人一区| 男女猛烈无遮挡午夜视频| 亚洲高清无码精品| 伊人激情综合网| 91在线丝袜| 久久黄色视频影| 无码av免费不卡在线观看| 小说区 亚洲 自拍 另类| 国产成人乱无码视频| 91外围女在线观看| 久久性妇女精品免费| 亚洲最大综合网| 色悠久久久久久久综合网伊人| 黄色福利在线| 欧美亚洲网| 久久人妻系列无码一区| 欧美久久网| 青青草国产在线视频| 中文精品久久久久国产网址| 无码福利视频| 亚洲AV成人一区国产精品| 国产无遮挡猛进猛出免费软件| 99在线视频免费| 99国产精品免费观看视频| 激情乱人伦| 成人免费网站久久久| 久久婷婷五月综合97色| 污污网站在线观看| 国产欧美日韩精品第二区| 2048国产精品原创综合在线| 久久9966精品国产免费| 国产大全韩国亚洲一区二区三区| 97久久人人超碰国产精品| 国产高清免费午夜在线视频| julia中文字幕久久亚洲| 日韩资源站| 老司机精品99在线播放| AV老司机AV天堂| 最新国产高清在线| a级毛片在线免费观看| 午夜精品国产自在| 色屁屁一区二区三区视频国产| 影音先锋丝袜制服| 国产欧美日本在线观看| 成人永久免费A∨一级在线播放| 一本色道久久88| 国产高潮流白浆视频| 1024你懂的国产精品| 国产精品极品美女自在线网站| 亚洲成人黄色网址| 欧美日本在线观看| 亚洲制服丝袜第一页| 精品人妻无码区在线视频| 日韩成人免费网站| 国产精品亚洲一区二区在线观看| 在线免费观看a视频| 国产日韩精品一区在线不卡| 免费在线a视频| 亚洲欧美成aⅴ人在线观看| 找国产毛片看| 国产美女视频黄a视频全免费网站| 19国产精品麻豆免费观看| 色爽网免费视频| 欧美日韩在线亚洲国产人| 国产网站免费看| 992Tv视频国产精品| m男亚洲一区中文字幕| 欧洲在线免费视频| 18禁黄无遮挡网站| 久久久精品无码一区二区三区| 国产在线91在线电影| 在线无码九区|