楊博翔
北京交通大學中國產業安全研究中心博士后科研工作站,北京100032
基于優勢粗糙集的證券投資決策研究及其應用
楊博翔
北京交通大學中國產業安全研究中心博士后科研工作站,北京100032
粗糙集方法在金融及投資領域發揮著越來越大的作用,然而經典粗糙集理論不能發現偏好多屬性決策表中與偏好屬性相關的不相容性。本文基于優勢粗糙集理論的知識約簡算法,提出了基于優勢關系的屬性重要度約簡算法,并構建了基于優勢粗糙集的證券投資分析模型,針對中國上市公司財務數據為連續值、分布未知、含有偏好信息等特征,對證券樣本進行綜合排序,得到最終的綜合排序和評價,并對算法進行有效性分析。
粗糙集;優勢關系;證券投資決策
基于證券市場的全球化大背景,以及證券投資分析的重要作用,關于證券投資決策分析的理論和方法的研究已經成為一個重要的前沿領域[1]。以往的證券投資分析方法由于預測的精度比較低,或由于過于苛刻的基本假設而在真實市場中無法完全實現等問題,影響投資者進行科學、正確的投資決策。因此需要研究更適合于管理決策的數據挖掘方法——粗糙集方法。在一個投資決策方案中,偏好屬性的順序特性是很重要的決策信息,這就決定了優勢粗糙集比傳統的粗糙集理論對投資決策問題應具有更強的適應力和解釋力[2]。
將借鑒經典粗糙集啟發式知識約簡算法提出基于優勢關系的偏好決策表的有效算法。屬性約簡是以獲取最佳屬性約簡為目標的,前提條件是不損失原有信息系統的信息。在經典的約簡算法中,最直觀的就是使用刪除法,但該復雜度非常高,不適合于數據和屬性龐大的信息系統。為了降低復雜度,基于屬性重要度的約簡算法應運而生,經典的基于屬性重要度的約簡算法是建立在經典粗糙集理論的基礎上的,因沒有考慮到決策者的偏好決策需要,而使得約簡結果容易產生不相容問題,大大制約了這種算法的使用。而在眾多基于DRSA的知識約簡算法中,以屬性重要度為約簡原則的算法還比較少。文章擬借鑒經典的基于屬性重要度的約簡算法,充分考慮偏好關系,以屬性的重要性作為啟發規則,尋求基于優勢關系的啟發式最小約簡算法。基于優勢關系的啟發式最小約簡算法的主要思想是,判斷從條件屬性集中刪除某個屬性后,剩下的條件屬性集是否能將對象正確地劃分到決策屬性類中,最終找到與C的Cl分類質量一致的C的最小子集。
2.1證券投資指標體系的選擇與建立
2.1.1選擇指標的原則一般來講,選購股票就是選擇上市公司。本文僅從證券投資者的角度出發,按照以下原則選擇財務指標:
(1)由于不同行業在不同時期的情況不盡相同,如果選擇多種行業的股票會導致對排序和評價的結果產生不良影響,使結果可信度不高,因此,選擇一個行業板塊進行股票指標的分析;
(2)考慮到指標的客觀性、可比性原則,不選擇反應公司經營規模和財務規模的指標,如資產總額、利潤總額等,而是選擇能夠融合更多特征的指標,如每股凈資產、股東權益等財務比率指標;
(3)選擇指標要盡可能體現公司的財務結構、經營效率、成長能力、盈利能力、以及抵抗風險的能力,這些指標能夠綜合反映出公司的經營狀況和財務狀況,是進行投資選擇的重要指標。
2.1.2證券投資指標體系的選擇根據以上原則,在證券領域普遍認為的證券指標作為參照,確定以下9個證券投資財務指標:
(1)每股收益(元)=凈利潤/總股本;(2)每股凈資產(元)=股東權益/總股本;(3)每股資本公積金=資本公積金/總股本;(4)每股未分配利潤=未分配利潤/總股本;(5)每股經營現金流量=經營活動產生的現金流量凈額/總股本;(6)主營業務收入增長率(%)=(本期主營業務收入-上期主營業務收入)/上期主營業務收入;(7)凈資產收益率=凈利潤/股東權益;(8)股東權益比=股東權益/資產總額;(9)資產負債率=負債總額/資產總額。
其中,指標1、2、3、4、5、7可以體現公司股票價值和盈利能力,指標6可以體系公司經營與發展能力,指標8可以反應公司財務結構,指標9可以反應公司抵抗風險的能力。
2.2針對偏好決策表的兩種排序方法
2.2.1基于優勢粗集權重的綜合排序方法基于優勢粗集權重的綜合排序方法[3]的步驟:
(1)確定評價因素集C={C1,C2,...,Cn};
(2)確定評價目標集U={S1,S2,...,Sm};
(4)建立基于DRSA[4]的權重矩陣;
(6)多級綜合排序:如果評價目標的有關因素很多,很難合理的定出權數分配,就難以真實的反映各因素在整體中的地位,有時通過一次綜合排序很難分出評價等級,即評價次序,這時需要采取二級或多級評價。如綜合二級評價。其中。這里算子“∧”,“∨”表示取大,取小的含義;
(7)綜合評價。對綜合排序結果向量進行分析。
以上基于優勢粗集權重的綜合排序方法的七個基本步驟,第四步和第七步為比較核心的兩個步驟,第六步根據實際需要選取,也可不進行。由此,以優勢粗糙集相關理論為基礎,應用關系合成的原理,建立起基于優勢粗集權重的綜合排序方法。
2.2.2基于擴展Vague值理論的偏好決策表綜合排序方法基于擴展Vague值的偏好決策表[5]綜合排序方法的一般步驟:
(1)據(1)式將偏好決策表中的評價目標賦予擴展Vague值;

其中,tx表示基于優勢關系擴展Vague集的肯定隸屬度,fx表示基于優勢關系擴展Vague集的否定隸屬度為[6];Yl是含有m個分量的一維列向量,l=1,2。
(2)根據擴展Vague值建立構造矩陣Y;(3)計算矩陣Y的最大特征值對應的特征向量作為排序向量;(4)根據排序向量對Vague值排序,分量越大,Vague值越大;(5)根據排序結果進行綜合評價。
2.3基于優勢粗糙集的證券投資分析模型
基于優勢粗糙集的證券投資決策模型建立步驟:
(1)建立證券投資指標體系;(2)從證券網站上選數支股票為樣本,輸入各指標值并進行數據歸一處理,生成初始偏好決策表;(3)將指標進行離散化,按照偏好順序作分級處理,生成分級評價偏好決策表;(4)對決策表按照基于優勢關系的屬性重要度約簡算法進行知識約簡,得到約簡后的偏好決策表;(5)按照兩種綜合排序方法對所選股票進行綜合排序,得出評價結果,分析模型的有效性。
至此,證券投資決策模型構建完成。
3.1樣本選擇及分析
本文從有色金屬板塊中隨機抽取了35支股票2009年第四季度的數據作為研究樣本,以9個財務指標作為條件屬性,綜合評價作為決策屬性,由于這些屬性均是含有偏好信息的,如投資者希望每股收益總是越高越好,資產負債率越低越好,決策屬性也具有偏好信息,如評價等級越高,代表股票的質量越好,越值得投資,因此19家上市公司的財務數據便形成了一張初始的偏好決策表。從該偏好決策表中任意抽取3個屬性,對其屬性值的分布情況進行分析,發現屬性的值域分布見圖1。
圖1所顯示的是每股收益、主營收入增長率、股東權益比率三個屬性指標的分布情況,可以看出,該三個屬性指標均為無序分布,即不服從現有已知的正態分布、均勻分布等。

圖1 證券指標屬性值的分布Fig.1 Distribution of securities index properties
從以上屬性的分布及其他屬性的分布圖中可知,各屬性指標值的分布均不相同,對于該樣本,首先對數據進行標準化處理,然后利用基于優勢關系的屬性重要度約簡算法進行知識約簡,得到約簡后的偏好決策表,再利用綜合排序方法對所選股票進行綜合排序,得出最終的評價結果[7]。
3.2綜合排序
3.2.1基于優勢粗集權重的綜合排序方法
由偏好決策表可知評價矩陣為R
綜合評價模型

得到所選樣本的綜合排序為:

其中,“?”代表優于,“{}”內元素表示評價值相同。
3.2.2基于擴展Vague值理論的偏好決策表綜合排序方法基于優勢關系擴展Vague集的肯定隸屬度為

基于優勢關系擴展Vague集的否定隸屬度為

采用Eig函數[8],用Matlab計算得:最大的特征值為:δ=24.7517。
得到所選樣本的綜合排序為:

可見兩種方法得到的產品排序有一定的差異,從ω的值可以看出第二種方法得出樣本間的評價值非常接近,導致基于擴展Vague值理論的偏好決策表綜合排序方法對樣本數據分辨率不高,如果將精確度變低,將小數點后三位精確到小數點后兩位,再看兩種方法的綜合排序結果。
基于優勢粗集權重的綜合排序方法:

基于擴展Vague值理論的偏好決策表綜合排序方法:

兩種方法的排序結果的擬合度較高,排序結果基本相同。
3.3有效性分析
當結果取高精確度進行排序時,兩種排序方法的結果有一定的差異性,主要是由于基于擴展Vague值理論的偏好決策表綜合排序方法得出的評價值非常接近,對樣本數據分辨率不高,但這時排名前兩位和排名后兩位的股票是相同的,可以告訴投資者者22、28兩支股票評價值最高最值得推薦,18,31兩支股票評價值最低要謹慎投資,同理,兩種方法同樣排名靠前的股票2綜合評價值很高,股票26評價值都很低,模型不予推薦。
因此,當只關心綜合評價最好的股票和綜合評價最不好的股票時,模型是適用的,這種情況對投資者也是有意義的,因為投資者在投資時可能不需要全部的排序,只需挑出1到2支評價最高的股票進行投資,或者知道評價最低的股票,從而在投資時不予購買;當結果降低精確度進行排序時,兩種排序方法的結果基本相同,上述案例中35個樣本數據,排序相同的有27支股票,只有1、8、12、19、24、25、32、33等8支股票不同,兩種方法的排序一致性達到77.14%,是一個滿意的結果,對于8支“另類”樣本,本文的模型可能不適應這類數據,對此將進行下一步研究。
首先,構建了基于優勢粗糙集的證券投資分析模型,提出了兩種綜合排序方法,給出了基于優勢關系的偏好決策表的權重系數,并在此基礎上給出了排序方法;利用上下聯合的粗糙隸屬函數基于優勢關系擴展Vague集的肯定隸屬度、否定隸屬度,然后采用特征向量的方法,將不同的Vague區間值轉化特征向量,建立了基于擴展Vague值理論的偏好決策表綜合排序方法。根據上述研究,建立了基于優勢粗糙集的證券投資分析模型的完整模型。最后,對所建立的基于優勢關系的證券投資分析模型進行應用研究,并取得了良好的效果。
[1]曾劍鋒,吳根秀.基于相異關系的粗糙集理論[J].江西師范大學學報:自然科學版,2004,28(5):426-430
[2]李鋼,張雪婷.基于相似關系粗糙集的分解[J].計算機工程與應用,2004(2):85-87
[3]崔玉泉,張麗,史開泉.粗糙集的動態特性研究[J].山東大學學報:理學版,2010,45(6):8-14
[4]Ju S,Wu W,Zhang W.Approaches to Knowledge Reduction Based on Variable Precision Rough Set Model[J]. Information Sciences,2004(159):255-272
[5]楊青山,王國胤,張清華,等.基于優勢關系的區間值粗糙集擴充模型[J].山東大學學報:理學版,2010,45(9):7-13
[6]菅利榮,達慶利,陳偉達.基于粗糙集的不一致信息系統規則獲取方法[J].中國管理科學,2003,11(4):90-95
[7]安利平,陳增強,袁著扯.多準則分級決策的擴展粗糙集方法[J].系統工程學報,2004,12,19(6):559-576
[8]侯福均,廖愛紅,吳祈宗.判斷信息為偏好序的社會選擇:特征向量法[J].南京理工大學學報:自然科學版,2008,32(12):80-83
Research andApplication of Securities Investment Decision Based on Rough Set Theory
YANG Bo-xiang
Postdoctoral Scientific Research Workstation of China Center for Industrial Security Research/Beijing Jiaotong University,Beijing 100032,China
Rough set method plays a more and more important role in finance and investment field.However,the classical rough set theory cannot find the incompatibility between preference attribute and preference attribute in the decision table. Under this background,this paper constructed the dominance rough set based on securities investment analysis model and for the Chinese Listed Companies'financial data for continuous value,distribution is unknown,preference information and other characteristics,the comprehensive sort of sample securities was made and the final comprehensive ranking and evaluation were gotten to analyze the validity of the algorithm.
Rough set theory;dominance relation;security investment decisions
TN202
A
1000-2324(2016)05-0785-04
2016-05-15
2016-06-18
楊博翔(1989-),男,湖南常德人,博士后,主要研究方向為金融產業安全.E-mail:yangboxiang7@126.com