999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機(jī)器學(xué)習(xí)下量化選股的分析

2018-05-31 02:49:24楊亞?wèn)|
商情 2018年14期
關(guān)鍵詞:機(jī)器學(xué)習(xí)

楊亞?wèn)|

【摘要】股票市場(chǎng)屬于非線性系統(tǒng),復(fù)雜性高而信噪比低。目前,多個(gè)領(lǐng)域中已經(jīng)證實(shí),機(jī)器學(xué)習(xí)是一種能夠針對(duì)模糊非線性數(shù)據(jù)建模的工具,所以機(jī)器學(xué)習(xí)具有天然的應(yīng)用到量化投資領(lǐng)域的優(yōu)勢(shì)。從本質(zhì)上看,選股是排序問(wèn)題,投資者希望在眾多的股票中選擇出具有更好未來(lái)表現(xiàn)的股票。基于此,本文分析了利用機(jī)器學(xué)習(xí)量化選股的方法。

【關(guān)鍵詞】機(jī)器學(xué)習(xí) 量化投資 選股

相對(duì)于國(guó)外來(lái)說(shuō),我國(guó)屬于剛剛開(kāi)始發(fā)展量化投資,存在的不足之處仍比較多,但從實(shí)際情況看,A股市場(chǎng)具有較短的發(fā)展歷程,與已經(jīng)發(fā)展的比較成熟的海外市場(chǎng)相比,市場(chǎng)有效程度比較弱,錯(cuò)誤定價(jià)的股票數(shù)量比較多,普遍存在非理性人投資行為,也正是因?yàn)榇朔N不成熟特征的存在,為我國(guó)量化投資的發(fā)展提供了巨大的空間。因此,在現(xiàn)階段A股市場(chǎng)中,更適合的量化投資方式為公正、理性、客觀的。由此看來(lái),本文研究量化選股的方法具有十分重要的現(xiàn)實(shí)意義。

一、短線選股策略

本節(jié)構(gòu)建樣本集時(shí),特征選擇為20個(gè)交易日內(nèi)個(gè)股的收盤價(jià)走勢(shì),訓(xùn)練樣本方法采用兩種,分別為機(jī)器學(xué)習(xí)算法GBDT、GBRank,模式識(shí)別有機(jī)器學(xué)習(xí)自動(dòng)進(jìn)行。

(一)數(shù)據(jù)準(zhǔn)備

需準(zhǔn)備的數(shù)據(jù)包含2部分,一部分為樣本內(nèi)數(shù)據(jù),屬于訓(xùn)l練集,另一部分為樣本外數(shù)據(jù),屬于測(cè)試集。本文數(shù)據(jù)均來(lái)源于Wind資訊,時(shí)間段為2006年1月1日2016年11月30日,均為A股收盤價(jià)。之后分割該時(shí)問(wèn)段的數(shù)據(jù),使其變?yōu)椴淮嬖诮患膬刹糠郑?xùn)練樣本使用2006年1月1日2012年11月5日數(shù)據(jù),測(cè)試樣本使用剩余時(shí)間段的數(shù)據(jù)。訓(xùn)l練樣本和測(cè)試樣本生產(chǎn)時(shí),如果股票上市后的交易日未滿21個(gè),做剔除處理,最后,生產(chǎn)約240萬(wàn)訓(xùn)練樣本。

(二)提取特征

構(gòu)建策略時(shí),關(guān)鍵性的一步為特征提取,因本章短線選股策略是在模式識(shí)別基礎(chǔ)上進(jìn)行的,因此,關(guān)注K線形態(tài)特,征過(guò)程中僅選擇20個(gè)交易日的。首先,通過(guò)指數(shù)移動(dòng)平均線,過(guò)濾到收盤價(jià)的噪聲,隨后進(jìn)行價(jià)格走勢(shì)形態(tài)特征向量的描述,描述序列為收益率序列,最后,完成特征提取。

(三)模型訓(xùn)練

排序模型訓(xùn)練時(shí),利用兩種算法進(jìn)行。第一種為GBDT,訓(xùn)練中,股票問(wèn)相對(duì)順序不做考慮,僅擬合其絕對(duì)得分,訓(xùn)練樣本構(gòu)建過(guò)程中,3個(gè)交易日后,若樣本漲幅≥1%,則得分=1,否則樣本得分=O,根據(jù)此種方式,訓(xùn)練樣本集即可獲得,接著以訓(xùn)練樣本集作為GBDT的輸入樣本集,訓(xùn)練排序模型,此過(guò)程中,由于GBDT存在較多的參數(shù),如果調(diào)參采用交叉驗(yàn)證方式,將會(huì)耗費(fèi)大量的時(shí)間,因此,本文按照知識(shí)和經(jīng)驗(yàn),調(diào)優(yōu)逐步的進(jìn)行,完整訓(xùn)練后,排出函數(shù)h輸出,通過(guò)h,即可開(kāi)展打分操作,依據(jù)分?jǐn)?shù)由高到低,排序未來(lái)3天內(nèi)漲幅會(huì)超過(guò)1%的股票,供投資者選擇。第二種為GBRank,這是一種pairwise方法,僅對(duì)同一時(shí)段內(nèi)股票的相對(duì)漲跌幅做出考慮,保證訓(xùn)練樣本不會(huì)受到系統(tǒng)性風(fēng)險(xiǎn)的影響,訓(xùn)練樣本集獲取后,輸入到GBRank中,訓(xùn)練排序模型,參數(shù)直接選擇相同于GBDT的,最終,排除函數(shù)h獲得,排序未來(lái)3天內(nèi)股票的表現(xiàn)。

二、長(zhǎng)線選股策略

因短線選股策略僅能排序3天以內(nèi)的,時(shí)間較短,本節(jié)提出的長(zhǎng)線選股策略可排序未來(lái)20個(gè)交易日內(nèi)的股票。

(一)數(shù)據(jù)準(zhǔn)備

本節(jié)中,數(shù)據(jù)來(lái)源、選取時(shí)間段、劃分訓(xùn)練樣本和測(cè)試樣本的方法均相同于1.1,不過(guò),訓(xùn)練樣本和測(cè)試樣本生成時(shí),要將股票上市時(shí)間不足3個(gè)月的剔除,以能與44維的要求相符合。最后,生成約160萬(wàn)的訓(xùn)練樣本。

(二)特征提取

因要構(gòu)建長(zhǎng)線選股策略,因此要對(duì)個(gè)股在過(guò)去20個(gè)交易內(nèi)、2個(gè)月交易日內(nèi)、3個(gè)月交易日內(nèi)的動(dòng)量因子做出關(guān)注。首先。動(dòng)量、反轉(zhuǎn)效應(yīng)特征向量描述時(shí),采用的序列為個(gè)股動(dòng)量因子序列,z-score標(biāo)準(zhǔn)化處理每一維度的特征向量;其次,以元素所處維度為依據(jù),將每個(gè)元素的分位數(shù)計(jì)算出來(lái);最后,組合上述兩步處理后的特征向量,使特征向量達(dá)到44維,此種特征向量能夠輸入到機(jī)器學(xué)習(xí)中。

(三)模型訓(xùn)練

模型訓(xùn)練時(shí),同樣采用1.3中的兩種方法。利用GBDT訓(xùn)練過(guò)程中,訓(xùn)練方式采用pointwise,無(wú)需對(duì)股票問(wèn)相對(duì)順序做出考慮,僅需擬合其絕對(duì)分?jǐn)?shù),20個(gè)交易日后,與股票漲幅均值相比,樣本股價(jià)漲幅更大時(shí),得分=1,樣本股價(jià)漲幅更小時(shí),得分=O,此處劃分樣本參照的標(biāo)準(zhǔn)為漲幅均指,以能保證排序的客觀性、準(zhǔn)確性,隨后,獲得訓(xùn)練樣本集,并輸入到GBDT中,訓(xùn)練排序模型,由于本節(jié)特征向量維度要顯著高于1.3節(jié)的,因此設(shè)置參數(shù)時(shí)會(huì)不同于1.3,要增加回歸樹最大深度、并增加葉子結(jié)點(diǎn)數(shù)上限,完成訓(xùn)練后,排序函數(shù)h獲得,通過(guò)h,即可完成未來(lái)20個(gè)交易日內(nèi)的股票排序工作。利用GBRank訓(xùn)練過(guò)程中,訓(xùn)練方法相同于1.3此種方法,獲得訓(xùn)練樣本集后,輸入到GBRank中,接著訓(xùn)練排序模型,設(shè)定的參數(shù)完全相同于本節(jié)的GBDT方法,最終,排序函數(shù)h獲得,完成排序。

三、結(jié)論

機(jī)器學(xué)習(xí)基礎(chǔ)上,本文構(gòu)建了短線和長(zhǎng)線量化選股策略,能夠排序未來(lái)3個(gè)交易日及未來(lái)20個(gè)交易日內(nèi)的股票,利于投資者實(shí)現(xiàn)量化選股,從而提高投資者投資的理性程度,促進(jìn)我國(guó)A股市場(chǎng)的良好發(fā)展。不過(guò),本文構(gòu)建選股策略后,并未進(jìn)行實(shí)際的實(shí)驗(yàn),因而還需要進(jìn)一步的開(kāi)展驗(yàn)證研究。

參考文獻(xiàn):

[1]馮楠,陳有為.基于量化趨勢(shì)跟蹤的計(jì)算機(jī)自動(dòng)化選股模型的設(shè)計(jì)與實(shí)現(xiàn)[J].自動(dòng)化與儀器儀表,2016,(08).

[2]李姝錦,胡曉旭,王聰.淺析基于大數(shù)據(jù)的多因子量化選股策略[J].經(jīng)濟(jì)研究導(dǎo)刊,2016,(17).

猜你喜歡
機(jī)器學(xué)習(xí)
基于詞典與機(jī)器學(xué)習(xí)的中文微博情感分析
基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測(cè)分析
前綴字母為特征在維吾爾語(yǔ)文本情感分類中的研究
下一代廣播電視網(wǎng)中“人工智能”的應(yīng)用
活力(2016年8期)2016-11-12 17:30:08
基于支持向量機(jī)的金融數(shù)據(jù)分析研究
基于Spark的大數(shù)據(jù)計(jì)算模型
基于樸素貝葉斯算法的垃圾短信智能識(shí)別系統(tǒng)
基于圖的半監(jiān)督學(xué)習(xí)方法綜述
機(jī)器學(xué)習(xí)理論在高中自主學(xué)習(xí)中的應(yīng)用
極限學(xué)習(xí)機(jī)在圖像分割中的應(yīng)用
主站蜘蛛池模板: 国产精品真实对白精彩久久| 国产区人妖精品人妖精品视频| 九色在线视频导航91| 国产理论一区| 国产在线第二页| 亚洲中久无码永久在线观看软件| 国产人成在线观看| 18禁黄无遮挡网站| 爱爱影院18禁免费| 97视频免费在线观看| 欧美国产日韩另类| 亚洲国产精品一区二区第一页免 | 国产爽妇精品| 99久久亚洲综合精品TS| 永久在线播放| 九九九精品成人免费视频7| 亚洲乱码视频| 免费看av在线网站网址| 无码又爽又刺激的高潮视频| 亚洲人成成无码网WWW| 日韩精品一区二区深田咏美| 国产亚洲高清在线精品99| 18禁色诱爆乳网站| 国产欧美成人不卡视频| 伊人大杳蕉中文无码| 国产精品视频第一专区| 亚洲va在线∨a天堂va欧美va| 久久免费视频播放| 四虎影视库国产精品一区| 美女免费精品高清毛片在线视| 中文字幕亚洲乱码熟女1区2区| 在线观看亚洲国产| 国模私拍一区二区三区| 国产美女91呻吟求| 国产一在线| 日韩欧美网址| 极品国产一区二区三区| 新SSS无码手机在线观看| 亚洲午夜天堂| 久青草网站| 国产欧美日韩免费| 福利视频一区| 国产男女免费完整版视频| 亚洲天堂色色人体| 国产一级视频久久| julia中文字幕久久亚洲| 午夜爽爽视频| 毛片免费在线| 中文字幕首页系列人妻| 国产在线一区二区视频| 视频二区中文无码| 色丁丁毛片在线观看| 国产精品原创不卡在线| 国产永久免费视频m3u8| 9999在线视频| 暴力调教一区二区三区| 国产你懂得| 日本午夜精品一本在线观看| 一级看片免费视频| 欧美日韩激情在线| 日本www在线视频| 亚洲精品国产自在现线最新| 国产SUV精品一区二区6| 中文字幕无码制服中字| 被公侵犯人妻少妇一区二区三区| 青青草原国产精品啪啪视频| 亚洲第一中文字幕| 日本在线视频免费| 日韩欧美91| 日日拍夜夜操| 激情视频综合网| 国产成+人+综合+亚洲欧美| 国产成人久久综合777777麻豆| 少妇精品久久久一区二区三区| 幺女国产一级毛片| 日本免费福利视频| 全裸无码专区| 精品国产成人高清在线| 青青久在线视频免费观看| 国产成人艳妇AA视频在线| 亚洲国产欧美自拍| 全部免费毛片免费播放 |