999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于混沌游戲表示和自適應(yīng)仿射傳播聚類(lèi)的股票板塊分類(lèi)

2020-11-02 18:28:06張紫璇段紅梅
財(cái)會(huì)月刊·上半月 2020年10期

張紫璇 段紅梅

【摘要】為對(duì)我國(guó)A股進(jìn)行板塊分類(lèi), 首先用混沌游戲表示算法對(duì)股票日收益率數(shù)據(jù)進(jìn)行降維, 再用自適應(yīng)仿射傳播聚類(lèi)算法得到將所有股票分為5類(lèi)和11類(lèi)兩種板塊的分類(lèi)結(jié)果。 與證監(jiān)會(huì)行業(yè)分類(lèi)中類(lèi)內(nèi)外平均相關(guān)系數(shù)差0.0140相比, 分5類(lèi)時(shí)類(lèi)內(nèi)外相關(guān)系數(shù)差均值為0.0284, 分11類(lèi)時(shí), 類(lèi)內(nèi)外相關(guān)系數(shù)差均值為0.0270, 均比證監(jiān)會(huì)行業(yè)分類(lèi)區(qū)分度高。

【關(guān)鍵詞】混沌游戲表示;自適應(yīng)仿射傳播聚類(lèi);股票板塊分類(lèi);A股

【中圖分類(lèi)號(hào)】F832.5 ? ? ?【文獻(xiàn)標(biāo)識(shí)碼】A ? ? ?【文章編號(hào)】1004-0994(2020)19-0152-4

一、引言

股票板塊分類(lèi)方法中應(yīng)用最廣的是按股票行業(yè)分類(lèi)。 早在1966年, 美國(guó)學(xué)者Kahle等[1] 就指出股票價(jià)格的變動(dòng)會(huì)受到行業(yè)分類(lèi)的影響。 之后又有學(xué)者得出了行業(yè)因素能解釋股票收益率26%波動(dòng)率的結(jié)論[2] 。 現(xiàn)有的行業(yè)分類(lèi)標(biāo)準(zhǔn)主要有ISIC行業(yè)分類(lèi)、GICS、證監(jiān)會(huì)行業(yè)分類(lèi)、WIND行業(yè)分類(lèi)、申銀萬(wàn)國(guó)行業(yè)分類(lèi)及中信證券行業(yè)分類(lèi)等。 上市公司行業(yè)信息是上市公司對(duì)外應(yīng)披露信息的重要方面。 上市公司行業(yè)分類(lèi)方法的科學(xué)與否, 對(duì)于規(guī)范和提高上市公司信息披露質(zhì)量、市場(chǎng)參與者對(duì)公司股票進(jìn)行定價(jià)、投資者進(jìn)行投資決策都有著直接的影響。 由于各種原因, 我國(guó)證券市場(chǎng)在建立之初沒(méi)有對(duì)上市公司進(jìn)行統(tǒng)一的分類(lèi), 上海、深圳證券交易所根據(jù)各自工作的需要, 分別對(duì)上市公司進(jìn)行了簡(jiǎn)單劃分:上交所將上市公司分為工業(yè)、商業(yè)、公用事業(yè)和綜合四類(lèi); 深交所則分為工業(yè)、商業(yè)、公用事業(yè)、金融和綜合五類(lèi)。 近年來(lái), 隨著證券市場(chǎng)的發(fā)展、上市公司數(shù)量的激增, 兩交易所原有分類(lèi)的不足表現(xiàn)得越來(lái)越明顯:分類(lèi)過(guò)粗, 給市場(chǎng)各方對(duì)上市公司進(jìn)行分析帶來(lái)了很多不便。

本文采用混沌映射聚類(lèi)算法, 根據(jù)上市公司的股票價(jià)格建立相關(guān)映射, 并且將該金融時(shí)間序列的相關(guān)系數(shù)與映射之間的耦合強(qiáng)度聯(lián)系在一起進(jìn)行分析。 以我國(guó)A股日收益率數(shù)據(jù)為數(shù)據(jù)源, 通過(guò)混沌游戲表示算法降維和自適應(yīng)仿射傳播聚類(lèi)算法進(jìn)行聚類(lèi)分析, 從而獲得新的上市公司板塊分類(lèi)結(jié)果, 對(duì)比原有的證監(jiān)會(huì)行業(yè)分類(lèi)結(jié)果, 本文提出的分類(lèi)結(jié)果區(qū)分度更高, 類(lèi)內(nèi)外平均相關(guān)系數(shù)差別也更加明顯, 與當(dāng)前A股企業(yè)實(shí)際較為貼合。

二、模型構(gòu)建

1. 數(shù)據(jù)。 根據(jù)上市公司的股票價(jià)格建立相關(guān)映射, 并且將該金融時(shí)間序列的相關(guān)系數(shù)與映射之間的耦合強(qiáng)度聯(lián)系在一起進(jìn)行分析, 基于本論文的分析訴求, 在對(duì)分析數(shù)據(jù)進(jìn)行選擇時(shí), 以我國(guó)A股(包括上交所和深交所)2843只股票2007年1月1日 ~ 2017年1月23日的交易數(shù)據(jù)為對(duì)象, 將其日收益率作為聚類(lèi)數(shù)據(jù)進(jìn)行研究。

初始數(shù)據(jù)集一共包含3325只股票數(shù)據(jù)。 股市中通常把上市時(shí)間不足半年的股票稱(chēng)為新股, 而新股存在新股弱勢(shì)且數(shù)據(jù)量少, 故刪除268只發(fā)行時(shí)間少于180天的股票; 研究過(guò)程中, 發(fā)現(xiàn)有上百只股票自2016年5月1日起不再有交易數(shù)據(jù), 數(shù)據(jù)缺失時(shí)間較長(zhǎng), 故刪除2016年5月之后沒(méi)有交易數(shù)據(jù)的116只股票; 刪除B股。 剩余2843只股票。 在數(shù)據(jù)分析中, 本文充分考慮了2008年全球金融危機(jī)的影響和2015年A股股災(zāi)異常波動(dòng)的影響, 對(duì)相關(guān)數(shù)據(jù)進(jìn)行了相應(yīng)處理, 以求在數(shù)據(jù)層面更加切實(shí)地反映正常交易市場(chǎng)下股票的數(shù)據(jù)信息。

證監(jiān)會(huì)上市公司行業(yè)分類(lèi)結(jié)果來(lái)自2017年2月16日在證監(jiān)會(huì)網(wǎng)站發(fā)布的2016年四季度上市公司行業(yè)分類(lèi)結(jié)果。 研究發(fā)現(xiàn), 采用混沌游戲模擬可以實(shí)現(xiàn)數(shù)據(jù)的自然分割, 相同行業(yè)背景下的公司通常是聚合在一起的, 下文重點(diǎn)結(jié)合混沌游戲與上市公司交易數(shù)據(jù)進(jìn)行整合分析。

2. 混沌游戲表示。 混沌游戲表示算法流程如下:①作一個(gè)正方形, 四個(gè)角分別表示DNA序列中的A、C、G、T四種堿基。 ②在正方形面上隨機(jī)取一個(gè)初始點(diǎn)。 ③對(duì)于任意一個(gè)長(zhǎng)度為N的DNA序列, 按照DNA序列中的堿基順序, 用以下方法繪制混沌游戲表示(CGR)圖:按順序讀取DNA序列的堿基, 繪制讀到的堿基對(duì)應(yīng)的角與初始點(diǎn)的中點(diǎn), 并將這個(gè)中點(diǎn)設(shè)為新的初始點(diǎn), 得到一張包含N+1個(gè)點(diǎn)的CGR圖。 更具體地說(shuō), 令A(yù)、C、G、T分別為P1(0,0)、P2(4,0)、P3(4,4)、P4(0,4), CGRi(x,y)為要在CGR圖中繪制的第i個(gè)點(diǎn), Pi(x,y)是序列的第i個(gè)點(diǎn), 按以下迭代公式得到CGR圖中所有的點(diǎn):CGRi(x)=[CGRi-1(x)+Pi(x)]/2,i=1,…,N; CGRi(y)=[CGRi-1(y)+Pi(y)]/2,i=1,…,N。

CGR圖有以下性質(zhì):①當(dāng)將CGR圖用x=0,1,2和y=0,1,2分為如圖1所示的4個(gè)分塊時(shí), 若CGRi(x)落在第一個(gè)分塊, 按以上第一個(gè)迭代公式得到這個(gè)CGR點(diǎn)對(duì)應(yīng)的DNA堿基一定是A, 其他三個(gè)分塊類(lèi)似。 ②參照第一條性質(zhì), 當(dāng)將CGR圖用x=0,1,2,3和y=0,1,2,3分割成16個(gè)分塊時(shí), 以AT塊為例, 若CGRi(x,y)落在AT塊, 按以上第一個(gè)迭代公式得到這個(gè)CGR點(diǎn)對(duì)應(yīng)的DNA堿基一定是A, 上一個(gè)DNA堿基為T(mén), 其他分塊類(lèi)似。 ③當(dāng)將CGR正方形進(jìn)行更高維的剖分時(shí), 類(lèi)似的結(jié)論仍然成立。 基于CGR圖的這個(gè)性質(zhì), 可以認(rèn)為在CGR圖中, 序列的順序被充分表達(dá)。 將圖2中的16個(gè)分塊按1 ~ 16進(jìn)行編號(hào), 令Sk(k=1,2,…,16)為落在第k個(gè)分塊內(nèi)的CGR點(diǎn)數(shù), 則Fk=Sk/N(k=1,2,…,16)。 其中N為DNA序列的長(zhǎng)度, 這樣任意一個(gè)序列都將能轉(zhuǎn)化為一個(gè)16維的向量。

3. 混沌映射聚類(lèi)算法。 在混沌映射聚類(lèi)算法被引入作為主要算法時(shí), 是將要被聚類(lèi)的那些元素嵌入一個(gè)D維的特征空間里。 在這個(gè)框架下, 每個(gè)數(shù)據(jù)點(diǎn)都被看成在承載混沌映射動(dòng)力學(xué)的網(wǎng)格上有一個(gè)對(duì)應(yīng)的位置。 相應(yīng)在原始數(shù)據(jù)空間中的高密度區(qū)域, 在靜態(tài)的體系下同步映射聚類(lèi)會(huì)出現(xiàn)。

4. 自適應(yīng)仿射傳播聚類(lèi)算法。 仿射傳播聚類(lèi)在算法進(jìn)行之前不需要確定最終聚類(lèi)族的個(gè)數(shù), 且適合大類(lèi)數(shù)的聚類(lèi)。 在算法開(kāi)始時(shí), 所有的數(shù)據(jù)點(diǎn)都被看作潛在的聚類(lèi)中心。 在算法進(jìn)行中, 仿射傳播聚類(lèi)算法為數(shù)據(jù)集收集信息得到兩個(gè)重要的證據(jù)矩陣:吸引信息矩陣R和歸屬信息矩陣A。 r(i,k)描述了數(shù)據(jù)點(diǎn)k適合作為數(shù)據(jù)點(diǎn)i的聚類(lèi)中心的程度; a(i,k)描述了數(shù)據(jù)點(diǎn)i選擇數(shù)據(jù)點(diǎn)k作為其聚類(lèi)中心的程度。 r(i,k)和a(i,k)越大, 證據(jù)越強(qiáng), 數(shù)據(jù)點(diǎn)k作為最終聚類(lèi)中心的可能性就越大。 仿射傳播聚類(lèi)算法在信息傳遞過(guò)程中, 兩個(gè)矩陣的迭代過(guò)程如下:rt+1(i,k)=s(i,k)-max{at(i,k')+s(i,k')}, k'≠k; at+1(i,k)=min{0,rt(k,k)}+ ? ?max{0,rt(i',k)}, i≠i,k。 迭代完成后得到m個(gè)可行度較高的聚類(lèi)中心和對(duì)應(yīng)的聚類(lèi)結(jié)果。

自適應(yīng)仿射傳播聚類(lèi)算法輸入變量數(shù)據(jù)集為待聚類(lèi)變量集, 主要輸出參數(shù)有以下幾個(gè):①矩陣“l(fā)abels”, 以類(lèi)標(biāo)的形式存儲(chǔ)不同類(lèi)數(shù)的聚類(lèi)結(jié)果; ②向量“NCs”,存放“l(fā)abels”對(duì)應(yīng)的類(lèi)數(shù);③“NCopt”, 存放最優(yōu)類(lèi)數(shù), 最優(yōu)類(lèi)數(shù)對(duì)應(yīng)的聚類(lèi)結(jié)果可在“l(fā)abels”中查找; ④“Sil”, 存放不同類(lèi)數(shù)的聚類(lèi)結(jié)果的Silhouette指標(biāo)的平均值; ⑤“Silmin”, 存放每一個(gè)聚類(lèi)結(jié)果中任意兩個(gè)聚類(lèi)Silhouette指標(biāo)中的最小值。 Silhouette指標(biāo)記為Sil(t):Sil(t)=[b(t)-a(t)]/max{a(t),b(t)}。 其中, a(t)為樣本t和與它同一類(lèi)內(nèi)的其他樣本的平均距離, b(t)表示樣本t和其他類(lèi)距離的平均值。 自適應(yīng)仿射傳播聚類(lèi)中, 用Silhouette指標(biāo)的平均值來(lái)反映聚類(lèi)結(jié)果的優(yōu)劣程度, 值越大表示聚類(lèi)結(jié)果越好, 數(shù)據(jù)可分性越高, 最大值對(duì)應(yīng)的分類(lèi)結(jié)果為最優(yōu)聚類(lèi)結(jié)果。

三、實(shí)證與結(jié)果

1. 板塊分類(lèi)效果評(píng)價(jià)指標(biāo)。 對(duì)股票進(jìn)行板塊分類(lèi)是為了方便構(gòu)建投資組合以對(duì)沖非系統(tǒng)風(fēng)險(xiǎn)。 本文采用板塊內(nèi)部股票價(jià)格波動(dòng)的相關(guān)系數(shù)和板塊之間股票價(jià)格波動(dòng)的相關(guān)系數(shù)來(lái)判斷板塊分類(lèi)方法的有效性。

假設(shè)滬深市場(chǎng)一共有N只股票, 并將它們分成M個(gè)板塊, 每個(gè)板塊對(duì)應(yīng)有Nm只股票, 則對(duì)于第i(i=1,2…,N)只股票, 設(shè)它屬于第m個(gè)板塊, 它與板塊內(nèi)外的相關(guān)系數(shù)分別按如下定義:

板塊內(nèi):Pim= ? ?pij/(Nm-1), j≠i。 版塊外:Qim= ? ? pij/(N-Nm), j≠i。 pij表示第i只股票和第j只股票之間的相關(guān)系數(shù)。 板塊內(nèi)部股票價(jià)格波動(dòng)的相關(guān)系數(shù)Pm= ? Pim/Nm。 與板塊外部股票價(jià)格波動(dòng)的相關(guān)系數(shù)Qm= ? ? Qim/Nm。 平均板塊內(nèi)股票價(jià)格波動(dòng)的相關(guān)系數(shù)P= ? ?Pm/M。 平均板塊外股票價(jià)格波動(dòng)的相關(guān)系數(shù)Q= ? ?Qm/M。 通過(guò)比較板塊內(nèi)外相關(guān)系數(shù)差值的大小, 可以評(píng)價(jià)板塊分類(lèi)方法的優(yōu)劣。

2. 股票CGR圖。 下面以平安銀行(股票代碼:000001)股票為例作展示。 圖3是某財(cái)經(jīng)網(wǎng)站的平安銀行股票的K線圖。

K線圖按時(shí)間順序展示股票的交易價(jià)格數(shù)據(jù), 但作為聚類(lèi)算法輸入數(shù)據(jù), 維數(shù)太大, 對(duì)聚類(lèi)要求高。 通過(guò)混沌游戲表示算法處理股票日收益率數(shù)據(jù), 得到平安銀行(000001)股票的日收益率CGR圖, 如圖4所示。

混沌游戲表示算法將股票日收益數(shù)據(jù)以迭代形式繪制在正方形圖上, 其落點(diǎn)嚴(yán)格按照時(shí)間順序產(chǎn)生, 也展示了部分分形特征, 如平安銀行的CGR圖無(wú)論是從整體來(lái)看還是按分塊來(lái)看, 其落點(diǎn)都具有向右下角集中的特征, 這個(gè)特征意味著平安銀行的日收益數(shù)據(jù)落在B集合, 即(-2.04%, 0.391%)這個(gè)區(qū)間的頻率很高。

3. 自適應(yīng)仿射傳播聚類(lèi)結(jié)果。 將16維向量集作為自適應(yīng)仿射傳播聚類(lèi)算法的輸入變量數(shù)據(jù)集, 在Matlab中運(yùn)行后得到從2 ~ 78共計(jì)77種類(lèi)數(shù)情況下的各項(xiàng)指標(biāo), 包含每種類(lèi)數(shù)對(duì)應(yīng)的各只股票的類(lèi)標(biāo)、分類(lèi)優(yōu)劣評(píng)判指標(biāo)Sil和Silmin的值等。 整理不同類(lèi)數(shù)對(duì)應(yīng)的Sil和Silmin指標(biāo)值得到表1, 類(lèi)數(shù)大于18類(lèi)之后Sil和Silmin兩個(gè)指標(biāo)值都越來(lái)越小, 受篇幅限制, 不再羅列。

可以看到, Sil的最大值是0.3479, 最優(yōu)聚類(lèi)結(jié)果為兩類(lèi), 考慮到Sil的最大值小于0.5, 表明聚類(lèi)有一些重疊的情況, 在聚類(lèi)結(jié)果指標(biāo)Sil值較小的情況下, 應(yīng)優(yōu)先考慮最靠近兩類(lèi)的可分性, 故取指標(biāo)Silmin最大值0.1973對(duì)應(yīng)的聚類(lèi)數(shù)5類(lèi), 參考其他行業(yè)分類(lèi)都是超過(guò)10類(lèi)的情況, 再取次高點(diǎn)0.1688對(duì)應(yīng)的聚類(lèi)數(shù)11類(lèi)。

4. 板塊內(nèi)外相關(guān)系數(shù)的比較。 用證監(jiān)會(huì)網(wǎng)站發(fā)布的2016年四季度上市公司行業(yè)分類(lèi)結(jié)果分別計(jì)算類(lèi)內(nèi)和類(lèi)外相關(guān)系數(shù), 得到表2。

用本文的方法得到的分類(lèi)結(jié)果分別計(jì)算類(lèi)內(nèi)和類(lèi)外相關(guān)系數(shù), 得到表3和表4。

分為5類(lèi)時(shí), 主要包括A、B、H、P以及其他類(lèi)。 類(lèi)內(nèi)外相關(guān)系數(shù)差均值為0.028361795, 類(lèi)內(nèi)外相關(guān)系數(shù)差值較為明顯, 僅一類(lèi)存在類(lèi)內(nèi)相關(guān)系數(shù)小于類(lèi)外相關(guān)系數(shù)的情況。 分為11類(lèi)時(shí), 主要包括A、B、H、P、D、E、G、I、N、R以及其他類(lèi)。 相關(guān)系數(shù)情況如下:類(lèi)內(nèi)外相關(guān)系數(shù)差均值為0.026968596, 類(lèi)內(nèi)相關(guān)系數(shù)小于類(lèi)外相關(guān)系數(shù)的情況增加。 整體而言, 無(wú)論是將所有股票分為5類(lèi)還是分為11類(lèi), 類(lèi)內(nèi)外相關(guān)系數(shù)差均值都比證監(jiān)會(huì)行業(yè)分類(lèi)結(jié)果大, 區(qū)分度高。

從實(shí)際運(yùn)用場(chǎng)景來(lái)看, 當(dāng)股票投資者不需要對(duì)投資行業(yè)進(jìn)行甄選細(xì)分, 僅對(duì)特殊行業(yè)進(jìn)行統(tǒng)籌考慮時(shí), 可以選用5類(lèi)分析法進(jìn)行分析; 當(dāng)投資者需要進(jìn)一步深入挖掘細(xì)分行業(yè)的投資機(jī)會(huì)或者行業(yè)特性時(shí), 可以選用11類(lèi)分析法進(jìn)行甄選分析, 這樣能夠提高分析的精準(zhǔn)度。

四、結(jié)論

本文以A股日收益率數(shù)據(jù)為數(shù)據(jù)源, 基于混沌游戲表示算法和自適應(yīng)仿射傳播聚類(lèi)算法對(duì)我國(guó)A股進(jìn)行板塊分類(lèi)研究。 利用生物信息學(xué)中的混沌游戲表示算法將股票日收益率數(shù)據(jù)轉(zhuǎn)化為CGR圖, 為股票數(shù)據(jù)展示提供了一種新的形式, 再對(duì)CGR圖進(jìn)行4×4的網(wǎng)格剖分, 將股票日收益序列轉(zhuǎn)化為16維的向量, 降低聚類(lèi)數(shù)據(jù)維度, 提高聚類(lèi)效果。 通過(guò)自適應(yīng)仿射傳播聚類(lèi)算法聚類(lèi)得到新的A股板塊分類(lèi)結(jié)果, 與證監(jiān)會(huì)行業(yè)分類(lèi)相比, 類(lèi)內(nèi)外平均相關(guān)系數(shù)差別更大, 區(qū)分度更高。 本文提出的方法給股票板塊分類(lèi)提供了新的參考, 但仍存在一些不足, 本文主要側(cè)重利用自適應(yīng)仿射傳播聚類(lèi)算法對(duì)股票進(jìn)行板塊分類(lèi)研究, 沒(méi)有對(duì)通過(guò)混沌游戲表示算法得到的股票數(shù)據(jù)CGR圖的分形特征進(jìn)行深入研究。

【 主 要 參 考 文 獻(xiàn) 】

[ 1 ] ? Kahle K. M., Walkling R. A.. The Impact of Industry Classifications on Financial Research[ J].Journal of Financial and Quantitative Analysis,?1996(3):309 ~ 335.

[ 2 ] ? Moskowitz T., Grinblatt M.. Do Industries Explain Momentum?[ J].Journal of Finance,1999(54):1249 ~ 129.

主站蜘蛛池模板: 欧美午夜在线视频| 国产靠逼视频| 国产成人高清亚洲一区久久| 麻豆AV网站免费进入| 亚卅精品无码久久毛片乌克兰| 国产男女XX00免费观看| 日韩国产精品无码一区二区三区| 色综合天天视频在线观看| 国产成年女人特黄特色毛片免| 亚洲国产精品日韩专区AV| 中国国产高清免费AV片| 日韩黄色精品| 99这里精品| 夜色爽爽影院18禁妓女影院| 最新国产在线| 久久久久免费精品国产| 国产区免费精品视频| 97se亚洲综合在线| 国产va在线观看| 亚洲综合色吧| 国产成人综合久久精品尤物| 蜜桃臀无码内射一区二区三区| 国产精品毛片一区| 激情五月婷婷综合网| 男女男精品视频| 亚洲高清中文字幕| 午夜免费视频网站| 黄片一区二区三区| 国产一级妓女av网站| 好紧太爽了视频免费无码| 伊人久综合| 欧美成人aⅴ| 狠狠亚洲婷婷综合色香| 99热这里只有精品在线观看| 日韩高清在线观看不卡一区二区| 日本不卡在线播放| 国产成人AV男人的天堂| 在线观看国产网址你懂的| 婷婷色中文| 精品无码一区二区三区电影| 国产精品林美惠子在线播放| 九九视频免费在线观看| 动漫精品中文字幕无码| 日韩在线1| 亚洲最大福利视频网| 亚洲a级在线观看| 久久一色本道亚洲| 成人免费一区二区三区| 国产自在线播放| 成人久久精品一区二区三区| 三级国产在线观看| 成人免费一级片| 丁香六月综合网| 欧美日韩在线第一页| 亚洲三级a| 九色视频最新网址| 欧美日韩动态图| 国产呦视频免费视频在线观看| 日本人妻一区二区三区不卡影院| 成人亚洲视频| 四虎成人精品在永久免费| 国产91在线|日本| 在线五月婷婷| 婷婷六月激情综合一区| 欧美三级不卡在线观看视频| 亚洲日本中文字幕乱码中文| www精品久久| 91丝袜在线观看| 欧美成人精品高清在线下载| 欧美视频在线播放观看免费福利资源| 亚洲综合中文字幕国产精品欧美| 亚洲中文在线看视频一区| 国产欧美高清| 国产美女91视频| 色综合激情网| 亚洲三级成人| 精品国产成人av免费| 国产欧美中文字幕| 欧美无遮挡国产欧美另类| 国产精品深爱在线| 天天视频在线91频| 日韩av在线直播|