丁小軍

摘 要:股票市場作為多人參與的復雜系統,具有很大的隨機性。隨著信息技術的普及,如何通過計算的方法來選股是很多股民都感興趣的。本文針對中國股市的股票具有短時政策性、新聞性、概念性、關聯性等特點提出用短時相關性來推薦股票的方法。通過實際的滬深股市數據,發現這種推薦方法確實能帶來較大的利潤,且不需要人們去耗費巨大精力選股。當然,此方法仍有一些不足,需要改進。
關鍵詞:股票;推薦;相關性
1 引言
股票是金融市場中的一個重要組成部分,受到廣大投資者的熱切關注。在股票市場的長期跟蹤研究中發現,股票之間也會有明顯的相互影響作用,尤其是在地區板塊、行業板塊內,這種相互影響關聯作用更加明顯[1]。甚至有時候,在不同板塊、不同概念及不同行業股票之間也會出現同漲同跌等現象,學者將其稱為聯動[2]。總而言之,某一支股票的價格也會隨著其它股票價格的波動而波動,某一支股票價格的波動也會使別的相關股票的價格隨之波動[3]。這種相互作用也可以稱作股票之間的相關性,是許多投資者研究的熱點之一。本文分析了用原始股票漲跌幅來分析相關性的缺陷,提出了用量化方式來強調漲跌的同步性,弱化漲跌幅度的差異,同時將概念行業相關性加權,得到了適應于股票的相關性計算方式,并以此設計出了一個股票推薦算法,在滬深股市2020年1月到4月的數據上進行了回測,取得了較為滿意的效果。
2 方法
相關系數最早是由統計學家卡爾·皮爾遜提出的用來研究變量之間線性相關程度的量,兩個向量x,y的皮爾遜相關系數p(x,y)定義如公式(1)所示。其中ux,uy分別為xi,yi的均值。
皮爾遜相關系數相關系數范圍是[-1,1],相關系數不同的值體現了不同的意義。當相關系數越等于1時候,表示兩個向量完全正相關,當相關系數等于-1時,表示兩向量完全負相關。當系數接近0時,表示兩向量不相關。首先本文取股票20日的漲跌幅作為股票的指標x,(x[i]為每一日漲跌幅),計算他們的相關系數,但是發現在這種情況下大漲或大跌的股票相關系數非常高,即直接使用原始漲跌幅的話,相關系數更看著漲跌幅度。為此,本文將漲跌幅量化如公式(2)所示
在這種量化指標下,漲跌幅度對相關系數影響就沒有那么高。兩只股票具有高相關性更在于他們漲跌的同步性。同時我們定義一支全為零向量的股票與其他股票相關性為0,即20日不漲不跌的股票不再關注。接下來,本文定義股票所屬板塊和概念的向量Cx,若股票屬于某一概念i,則對應Cx[i]=1,否則Cx[i]=0。
綜合股票行業概念和走勢,我們定義了如下相關系數計算公式。
根據公式(3),我們可以算出任意兩只股票20天的相關性。這種相關性一般能維持一段時間。
在每日開盤后,每只股票根據自身漲跌幅度對與其相關性排在前十的股票進行推薦(漲)或者反對(跌),推薦力度與自身漲跌幅成正比,然后將推薦票數比較多的股票反饋給投資者。如果一支股票得到了較多的推薦,那么可以知道必然有一批圍繞此股票的相關性較高的股票都是漲的,這一批股票很可能就反映了當天的熱點。同時,當一批高度相關的股票有啟動的苗頭的時候,因為推薦,這種苗頭會被放大,從而可以在熱點還沒有啟動的時候就能提醒投資者。而在熱點概念之外的且自身板塊內很多股票是跌的股票,會因為得到較多的反對票,從而提醒投資者放棄。
3 實驗與結論
本文以2020年1月到4月的滬市深市的股票為實際數據,進行了回測,發現股票漲跌確實是有聯動效應的,即部分大漲的概念股確實具有很高的相關性。如圖所示萬象德農和順鑫農業兩只股票,他們每日漲跌的幅值相差比較大,但是漲跌的同步性較好,所以用本文提出的相關性計算方法可以得到他們是高度相關的。因此,本文提出的方法也可以用來研究團體股票的走勢,從而可以分析出一群高度相關的股票具備了什么樣的走勢后,更有可能大漲,提高人們買股的成功率。
參考文獻
[1]汪玉環.股票間相關性測量方法的研究及應用[D].哈爾濱工業大學,2017.
[2]牛紅麗,王軍.基于選舉模型理論研究股市特性[J].北京交通大學學報,2012,36(3):138-144.
[3]陳花.基于復雜網絡的股票之間有向相關性研究[D].北京郵電大學,2012.
[基金項目]玉林師范學院博士科研項目G2018014