999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于動態異構網絡的股價預測

2024-08-17 00:00:00韓忠明孟怡新郭惠瑩郭苗苗毛雅俊
計算機應用研究 2024年7期

摘 要:股票預測通常被形式化為非線性的時間序列預測任務,但很少有研究者試圖通過技術面數據去系統地揭示股票市場內在結構,例如股票上漲或下跌背后的原因可能是業務領域之間的合作或沖突,這些額外信息的增加有助于判斷股票的未來趨勢。為了充分真實刻畫股票市場的交易狀態,表達股票之間顯式或隱式的關系,提出一種基于動態異構網絡的股價預測模型sDHN(stock dynamic heterogeneous network),綜合股票以及所屬行業和地域,將其建模為動態異構網絡。該模型在網絡上引入動態時序特征,創新融合股票節點的四種不同技術層面的相似性圖,生成富信息異構圖,最后聚合不同元路徑中隱含的語義信息生成嵌入,從異構圖的角度充分探索股票之間的潛在關聯。此外,在三個真實世界的股票數據集上進行了大量實驗,所提出的模型準確率比所有基線模型均高出5%~34%,F1-score則高出11.5%~37%,并且在圖解釋上證明了該方法的有效性。

關鍵詞:股票預測; 異構網絡; 圖相似性

中圖分類號:TP399 文獻標志碼:A 文章編號:1001-3695(2024)07-028-2126-08

doi:10.19734/j.issn.1001-3695.2023.11.0568

Stock price prediction based on dynamic heterogeneous network

Abstract:Stock prediction is typically a non-linear time series task. However, few researchers attempt to systematically reveal the underlying structure of the stock market through technical data. The interactions of collaboration or conflicts among various business domains can explain the fluctuations in stock. The incorporation of this additional information aids in predicting the future trends of stocks. In order to represent the trading situation of the stock market as realistically as possible and to express the explicit or implicit relationships between stocks, this paper proposed a stock price prediction model sDHN based on a dynamic heterogeneous network, which synthesized the base of the stock and the industry and geographical information, and modeled it as a dynamic heterogeneous network. The model introduced dynamic time series capabilities to the network, and the algorithm creatively combined four different technical levels of similarity graphs of stock nodes to generate a rich information heterogeneous graph. Finally, it aggregated the semantic information hidden in different meta-paths to generate embeddings, exploring the potential correlations among stocks from the perspective of the heterogeneous graph. In addition, experiments on three real-world stock data sets show that the proposed model achieves accuracy improvements of between 5% and 34% over the overall baseline models. The F1-score is higher by approximately 11.5%~37%. It demonstrates through graphical analysis the effectiveness of this approach.

Key words:stock prediction; heterogeneous network; graph similarity

0 引言

隨著機器學習和深度學習的快速發展,數據大規模的涌入和計算機技術的提升為把握復雜多變的股票市場提供了技術支撐。股票市場規模數量龐大、回報利潤高的特性使眾多投資者們趨之若鶩,而通過技術分析出股票的潛在趨勢還需要專業的技術分析人員來進行指導投資[1,2]。影響股票價格波動的因素不僅僅是基于股票自身的信息,也與自身所處的行情現狀以及其他外界因素[3,4]有關,而這些因素在現實生活中往往是迅速變化的。如何通過計算機分析大量不同類型的金融數據,構建一種準確而可靠的預測模型,一直是股票投資市場上迫切需要解決的一個難題。

股票漲跌預測[5]對公司管理者、投資者和股票交易者而言都具有重要的價值和意義,它不僅能讓投資者獲得收益,而且蘊涵著各行各業的發展前景,把握行業的發展動向。股票市場是非線性的、不確定的、復雜的黑盒系統[6],從財務數據中選擇有效的特征是股票預測問題中常用的處理方法[7]。現有的股票預測模型大部分從兩個建模思路進行構建:一是使用歷史價格數據[8,9] 和技術指標[10,11],使用機器學習和深度學習模型來預測股票價格序列;二是在上述的基礎上,加入自然語言處理,在時序數據的基礎上逐漸加入其他可以反映當前市場情況的變量,比如說投資者情緒、新聞數據等。Yang等人[12]通過隨機森林算法評估因子特征的重要性,再將其輸入到GRU(gated recurrent unit)中學習股票的動態特征并進行預測。Zhang等人[13]利用中國證券交易所中的股票新聞標題數作為輸入,來預測第二天股票價格波動最高的概率。相關模型取得了一定的效果,但是目前還存在以下問題:

a)采用手工構造的限維特征,目前大多數模型采用的是單純數字或文本特征,這些特征來自于股票的市場描述或價格波動,基于這些特征的模型在表示股票價值變化方面存在局限性,從而導致模型的預測性能不佳。

b)股票市場具有大規模,有著難以捕捉的整體聯動的特性。僅通過個體特征嵌入可能會較難把握住整體股票行情市場,特別是股票之間的聯動和價值一致性趨勢等,不能在單純手工構造的限維特征得到體現。

圖1所展示的是英特爾和英偉達股價增長趨勢,兩者同屬于半導體產品與設備的龍頭企業,在同一行業下,漲跌趨勢幾乎相同;而微軟作為全球軟件服務行業的頂尖企業,其漲跌趨勢與英特爾和英偉達幾乎同起同落,其原因可能是微軟的商業運作需要大量的半導體芯片, 三個機構之間形成了供給關系,雖然處于不同行業,但價格變化之間存在著潛在關聯。隨著圖學習的應用越來越廣泛,新的圖概念的提出為圖的發展上升了一個層次。異構網絡[14]在圖深度學習上的應用也越來越廣泛,在金融領域也同樣具有普適性。

異構信息網絡是由多種類型的節點或邊組成的復雜網絡。股票市場包括來自各種行業的公司,如計算機、金融、能源、醫療保健等,這些公司的多樣性導致了市場的多元化,而股票市場本身可以看作是一個具有多元主體以及主體之間關系信息豐富的復雜金融網絡,并且通過市場行情反饋出的大量輔助信息也包含潛在的網絡信息。因此對這種多元多關系的股票網絡進行動態異構網絡建模,不僅保留了股票網絡中主體和關系特征,并且有效融合了實時的行情輔助信息,從而有效緩解了節點形式單一且缺失信息的問題,并且在一定程度上提高了股票網絡的可解釋性。基于從股票市場整體和關聯分析基礎出發,本文提出了基于動態異構網絡來構建模型,從而實現有效的股價預測,主要貢獻如下:

a)為了捕捉股票市場中價格的動態變化趨勢。本文考慮了股票時序特征,將漲跌趨勢用編碼的方式加入到節點信息中。

b)構建金融相似性圖,考慮到影響不同股票之間潛在的結構因素,為異構圖中附加額外金融信息,有效捕獲了動態股票市場中復雜的市場行為和結構演化特征。

c)異構圖配合元路徑,能夠通過金融尺度特定地進行信息傳遞,更好地學習股票內在的不同異構屬性的表示。

早期金融市場的研究者們主要運用機器學習模型來擬合股票時序數據,隨著深度學習[15,16]的廣泛發展與應用,研究者們將注意力轉向神經網絡領域。LSTM(long short-term me-mory)在數據的處理計算過程中,更能捕捉到時間維度中的信息,但機器學習模型仍然被廣泛用于與深度學習模型進行比較的基準。根據筆者調研,本文主要介紹三種在股票預測方面使用到的建模思路:從技術選型來看,一是通過支持向量機(support vector machine)或者決策樹(decision tree,DT)等單一機器學習方法或者多種機器學習方法混合模型;二是使用自然語言處理后的文本數據,結合深度學習混合模型進行預測;三是基于圖表示的深度學習模型。

Nayak等人[17]使用部分金融數據作為特征,采用支持向量機、Logistic回歸(Logistic regression)和提升樹(Boosting tree)模型對銀行業、石油、礦產行業的股票進行漲跌預測。Ji等人[18]在18個技術指標作為原始特征,提出了基于小波去噪對技術指標進行改進的兩階段自適應特征選擇方法。Song等人[19]使用一種新的SPCA(sparse principal component analysis)主成分分析來聚合情緒相關變量中的公共信息,并在預處理中消除了可能大幅改變情緒指數的常見噪聲分量,能較好地預測出中國股市實際的波動性。Fang等人[20]通過最大化自適應lasso懲罰對數似然函數來選擇對長期股市波動性影響最強的變量,構建具有變量選擇功能的GARCH-MIDAS(GARCH with maximizing adaptive-lasso penalty)模型來提高對股市長期波動的預測能力。

Xu等人[21]提出了一種新的遞歸卷積神經網絡來預測股票市場的趨勢,該模型可以從股票市場的信息自動捕捉有用的新聞并加入實體嵌入。Li等人[22]通過分析文本新聞文章學習情緒向量,并構建了新聞金融領域特定情緒詞典對新聞情緒進行了更好的學習。Chang等人[23]提出了以專家評論中的情緒價值作為股價預測的基礎。Du等人[24]提出一種具有事件分布的News-Stock嵌入空間,以股票作為對象來獲取各類事件分布,計算出股票的實體嵌入,借此降低股票投資組合風險。Lin等人[25]根據財經新聞對比了四種不同的文本特征表示,分別是TF-IDF(term frequency-inverse document frequency),word2vec(word embeddings),ELMo(embeddings from language model),BERT(bidirectional encoder representations from transformer),用于生成SVM,CNN(convolutional neural network)和LSTM的輸入,使用的時間維度不同,不同模型的AUC(area under curve)指標有明顯差異。

Feng等人[26]通過從文本數據中提取股票之間的關系,構建一個股票圖,使用圖神經網絡進行股票收益預測。 Kim等人[27]提出了一個基于股票預測的層次注意網絡HATS(hierarchical graph attention network for stock),它使用關系數據進行股票市場預測,通過有選擇地聚合不同關系類型的信息,并將這些信息添加到每個公司的表示中,被用作具有初始化節點表示的關系建模,通過圖分類任務來預測個股價格和市場指數的走勢。Ma等人[28]提出了一個屬性驅動的模糊超圖網絡AFHGN(attribute-driven fuzzy hypergraph network),AFHGN通過模糊聚類構造關聯矩陣,用相似度來表示超邊關聯的程度,并在圖卷積中引入了一個屬性驅動門來模擬股票在實際市場中的影響。

隨著網絡科學的興起,股票結構可以被建模成復雜網絡的形式[29]。對復雜網絡的研究可以有效地幫助分析股票市場豐富的特性。上述模型股票預測領域也取得了部分成果,但是上述模型僅考慮到了對時序數據進行計算,或是僅考慮股票之間的單一結構關系[30]。由于股票市場通常是具有多種類型的實體類型和復雜的邊關系的一個系統,若是單純地將股票市場視為同質網絡,可能會遺漏豐富的潛在信息,導致生成嵌入的單一性。

1 動態異構網絡股價預測模型

股票信息以及交易的過程往往是公開且透明的,在相應的各大交易所以及專業的股票研究投資終端中可直接訪問。本文分別在中國A股市場、美股一級市場NASDAQ和NYSE中篩選股票,股票規模約9 185條。本文應用到的數據結構分為股票屬性和行情技術指標兩種。股票屬性主要包括股票代碼、上市地域、所屬證監會行業指數名稱三種股票靜態屬性;行情技術指標包括日個股收盤價、日個股交易股數、日個股漲跌幅以及日個股回報率四種股票動態技術指標。

具體地,對股票、行業以及地域三類實體進行異構節點編碼,分別獲得三種實體中不同子類型的唯一標識,編碼符號如表1所示,例如Euclid Math OneIAp16代表的是行業中的計算機行業;異構邊的構建除了連接地域、行業等靜態屬性節點之外,額外補充通過計算五種股票動態技術指標,篩選出與該只股票指標相關性最大的另一只股票,豐富異構圖中已有的邊信息,詳細的股票指標相關性計算見1.2節。對此,本文通過基于股票屬性和技術指標特征構建股票市場動態異構網絡。

構建的股票市場動態異構網絡的節點包含了股票市場的交易目標和目標的特定性質,邊包含潛在語義信息,基于此,可以通過特定的元路徑集合{0,1,…,P}實現節點-邊-節點之間的消息傳遞,為股票節點的時序價格序列上帶來額外的行情附加信息,生成最終嵌入Z,綜合多方面的信息融合來實現股票的漲跌預測。

在股票預測等金融場景中,異構信息網絡(heterogeneous information network)能夠對多源異構信息[31]進行建模。通過節點和邊的連接屬性來表示它們之間的關聯關系,將不同類型的實體和關系組織成一個網絡結構,這種網絡結構可以更好地反映股票等金融實體之間的復雜聯系,包括股票與股票、股票與財務指標、股票與行業和地域等信息關聯。通過HIN可以賦予節點和邊不同的金融知識概念,能更全面地捕捉到這些關系,從而提高股票預測模型的精度和可解釋性。基于股票市場動態異構網絡,本文提出sDHN(stock dynamic heterogeneous network)股票預測模型,模型整體架構由時間特征信息節點嵌入、異構節點金融相似性圖、基于注意力的元路徑消息聚合模塊三部分組成。具體來說,首先在異構圖中每個股票節點中加入時間信息,生成具有動態時間信息的節點嵌入;再通過不同股票技術指標計算得出節點相似性,構建節點金融相似性圖,注入到原金融異構圖中,豐富異構圖中的信息存儲;最后聚合前兩個模塊得到的異構圖,通過不同元路徑進行圖采樣,使用注意力對不同元路徑本身代表的語義消息的重要性進行加權,輸入到圖卷積網絡中完成對股票漲跌的預測。模型的總體架構如圖2所示。

1.1 時間特征信息節點嵌入

股票價格數據具有非線性和高波動性的特點,從原始股票價格提取有效信息,學習其價格趨勢特征,這些信息能更好地代表每只股票的歷史價格信息,降低數據的復雜性。本文以半個月的時間間隔下的股票收盤價作為原始價格數據,利用One-Hot的編碼方式對歷史股票價格數據進行編碼,以獲得有效的股票價格趨勢嵌入。

One-Hot編碼是一種常用的數據編碼方式,用于將離散的分類特征表示為二進制向量,即將每個分類變量的取值轉換為一個唯一的整數標識,并將其表示為一個只有一個元素為1其他元素為0的向量。輸入股票的歷史價格序列Cst={Cst,Cst+T,Cst+T+1,Cst+T+2,…,Cst+T+n}代表股票每月的收盤價,其中T=15是時間窗口長度,n={0,1,2,…,23}代表時間維度。將 Cst與下一時間間隔 Cst+T進行對比,生成隱含歷史趨勢的時序嵌入 hst={hst,hst+T,hst+T+1…,hst+T+n},hst將輸入到編碼層進行One-Hot編碼,將特征進行向量化,生成Xs,使得不同時間段內的特征之間通過離散化度量能夠更加方便地進行處理。

1.2 異構節點金融相似性圖

在金融領域中的網絡結構通常是大規模的無標度網絡,即少部分重要的金融機構中體現出影響力較大,而普通的金融機構則擁有少數連接,這可能會使網絡中使用的元路徑長度過短,從而導致傳遞信息缺失。公司在圖中表示為節點,其中每個節點內部都蘊涵著豐富的金融屬性,任意兩家公司股票的技術指標之間都可能存在各種相似之處。然而,股票網絡中有限的規模和明確的公司相似性暗示的缺乏,可能會限制其整體網絡的連通性。為了解決這個問題,本文建立了節點金融相似性圖,在其異構邊中包含了不同金融指標之間的相似性關系,每種相似性關系的具體含義如表2所示。

為了度量上述金融指標下股票的相似程度,本文使用Spearman_rank相關系數來計算股票金融指標的相關性。Spearman_rank相關系數通常被用來量化兩列數據單調依賴程度的非參數指標,基于兩個變量的排序順序而不是具體數值大小來計算相關性,適用于非線性關系或異常值較多的股票市場。首先將原始的金融數據當日范圍內轉換成對應的等級數據,根據前后等級差值的平方和來計算Spearman_rank相關系數,具體計算公式如下:

1.3 基于注意力的元路徑消息聚合模塊

金融動態異構圖中的每個節點都包含股票數據的時間信息,僅關注于時序信息的股票節點嵌入不能完全反映市場的復雜情況,可能會忽視其他行業或市場因素對該股票的影響。為了學習更全面的節點嵌入,需要聚合不同元路徑隱含的多個屬性和技術指標層面代表的語義消息。為了解決異構圖中元路徑選擇和消息聚合的挑戰,本文構建了基于注意力的元路徑消息聚合模塊,以自動學習不同元路徑的重要性,并將它們包含的語義消息融合到金融場景中。

將最終得到的聚合多維消息的嵌入輸入到預測層中,將標記了股票漲跌的真實值和預測值進行交叉熵最小化,損失函數如下:

其中:C為分類器的參數;L是標簽類別數;Yl和Zl是已標記節點的標簽和嵌入(真實值和預測值)。通過反向傳播算法進行迭代訓練來優化所提出的模型。

綜上所述,基于動態異構網絡的股票預測模型sDHN中共涉及到3個模塊算法,提供的偽代碼如下:

算法1 具有時間特征信息的節點嵌入算法

算法2 異構金融相似性圖框架算法

算法3 基于注意力的元路徑消息聚合算法

2 實驗設計與結果分析

2.1 數據集

為了驗證sDHN模型在真實金融網絡中的性能和準確度,在全球股市較具有代表性的三個股票市場數據集上進行漲跌二分類預測,包括中國A股、納斯達克(NASDAQ)和紐約證券交易所(NYSE)公開的股票數據。其中所有的股票數據均來自中國互聯網財經資訊門戶東方財富網旗下的Choice數據終端,東方Choice金融終端的數據主要來自于權威的金融市場數據提供商和相關機構,包括交易所、金融信息服務公司以及政府監管機構等,這些數據源被大部分金融機構、學術研究機構和專業投資者們廣泛認可。其中:A股的股票數量有4 395只,其關系屬性中的行業個數為31個,地域分布個數為32個;NASDAQ數據集中的股票數量為2 569只,行業個數為11個,地域分布個數為102個;NYSE中的股票數量為2 221只,行業個數為11個,地域分布個數為121個;日個股交易股數相似性、漲跌幅相似性、日收盤價相似性、日個股回報率相似性個數分別與股票數量相等。

三個數據集的時間跨度均為2022年1月—2022年12月,使用的均為公開數據,模型以半個月作為時間間隔,將2022年1月初至2022年12月中旬間所有的行情數據作為訓練樣本數據集,以2022年12月底的股票收盤價,對比上個時間間隔下的股票收盤價,將股票的漲跌趨勢作為預測標簽。

本文基于上述數據構建動態異構金融網絡圖,同時剔除在2022年中一個月內交易數據缺失超過10天的股票,目的是減少因異常數據導致的交易信息誤判,以最真實的數據還原交易場景。除此之外,由于股票交易中存在休市日,也可能導致某一天的交易數據缺失,對此則采取最近鄰的交易數據進行補充,最大限度地確保數據的準確性和一致性。整個數據集分為三個部分,其中70%的數據用于訓練,20%的數據用于驗證,剩下10%的數據用于測試。此外,本文分別對三個數據集中的所有節點規定了位置掩碼,確保當前節點只能在隨機選取后的訓練集、驗證集、測試集范圍內進行訓練,從而避免了在訓練過程中出現數據泄露問題。所構建的股票異構金融網絡的詳細信息如表3所示。

2.2 基線模型

為了評估本文sDHN模型的性能,本文與股票價格預測中經典且廣泛使用的技術分析、機器學習和深度學習模型進行對比實驗。具體來說,首先選用了兩個傳統的股票預測技術指標作為基線模型:

a)MOM[32]:動量線(momentum)可以視為一段期間內,股價漲跌變動的慣性,即使用上一個收盤價減去t天前的收盤價,然后將這個正值或負值繪制在零線周圍,通過比較零線反映股價未來走勢。

b)MR[33]:均值回歸(mean reversion)是識別到價格偏離其歷史平均值過多的情況下,預測其趨勢會逆轉的一種策略。

機器學習中通常將歷史的價格時序數據作為輸入,訓練分類器來預測股價的漲跌趨勢。接下來進一步對比五種經典分類或回歸模型:

c)SVM[34]:支持向量機是經典的機器學習算法,經常應用于二分類問題,在股票漲跌預測中同樣適用,其中一類表示漲,另一類表示跌。

d)XGBoost[35]:XGBoost是機器學習領域有效的集成學習算法,根據預測模型輸出的漲跌標簽或概率值來判斷股票的漲跌趨勢。

e)LSTM[36]:使用LSTM(long short-term memory)在股票價格預測領域十分流行,因為LSTM引入了記憶單元(memory cell)和遺忘門(forget gate)來記錄和保存時序數據特征,這使得LSTM能夠更好地處理和捕捉時間序列數據中的長期依賴關系。可以通過價格預測與前一天收盤價進行比較,來預測股票的漲跌。

f)GRU[37]:GRU(gated recurrent unit)和LSTM是RNN(recurrent neural network)常見的兩種變體,由于GRU使用的參數和門控單元更少,在訓練計算中更加高效。通常是將股票的每日收盤價作為時序特征進行輸入,來預測下一個交易日的收盤價。

g)Attention[38]:注意力機制通過賦予股票價格時序數據在不同時間步的輸入權重來動態地選擇和聚焦于關鍵信息,將注意力權重看作是每個時間節點重要性的度量,最后通過計算加權和來對股價整體趨勢進行預測。

此外,本文也對比了其他三種基于股票關系構建圖網絡的深度學習算法:

h)GCN[39]:GCN(graph convolutional network)使用LSTM網絡對股票的歷史價格數據進行編碼,然后將結果輸入GCN,根據股票關系圖進行學習。

i)TGC[26]:TGC(temporal graph convolution)時間圖卷積框架通過捕捉動量溢出效應,并以一種時間敏感的方式編碼股票關系,構建了一個基于上市公司的同構市場圖,用于預測股票走勢。

j)STHGCN[40]:時空超圖卷積(spatiotemporal hypergraph graph convolutional network)通過超圖對股票的行業歸屬關系進行建模,并引入了門控時間卷積來捕獲股票價格特征中的時間依賴性。

2.3 實驗設置

本文使用Intel CoreTM i7-6800k的CPU訓練環境進行實驗,內存大小為65 536 MB,Linux操作系統版本號為Ubuntu 5.4.0。

sDHN模型由PyTorch 1.9.0中的DGL模塊實現,對于本文模型,元路徑設置為16條,長度為2。Adam隨機初始化參數并進行優化,模型訓練中需要設置的超參數分別有:學習率設置為0.005,注意力頭數為8,dropout的概率為0.2,批處理大小為100,epoch次數設置為150,并使用早停策略,patience設置為100,即損失在連續100個epoch下沒有減少,則停止訓練。

2.4 實驗結果與分析

本文sDHN模型在中國A股市場、NASDAQ和紐約證券交易所三個數據集上進行實驗,分別與2.2節給出的十種基線模型進行對比,結果如表4所示。實驗結果表明,本文模型在三個數據集上的表現都優于其他模型,在A股數據集上,本文模型比其他基線模型在準確率上高出uTHQxNWygzn1sfvAucEPVBpq98sJkz9NTT2KvfFsm1s=7%~16%,在NASDAQ數據集上,準確率則比其他模型高出10%~34%,而在NYSE數據集上,準確率比其他模型高出5%~21%。這表明僅依托于股票的屬性或是時序價格數據,對價格預測的準確性是有限的,忽略股票之間的潛在聯系可能會導致價格評判的片面性,而整體市場的行情影響對股票而言也是極其重要的,本文模型使用的異構網絡為股票間的聯系提供了額外信息,在圖拓撲結構上與股票交易場景也具有較高的適配性,并且也在股票節點中加入時序價格信息,補充了模型的時間價格判別能力。從實驗結果可以看出,與上述基線模型相比,sDHN模型展示出更好的性能,說明金融異構網絡的構建在模擬股票預測場景中起著非常重要的作用。

2.4.1 模型參數對比

本節中分別對比在不同參數設置下的sDHN模型效能的評估,在A股、NASDAQ和NYSE三個數據集上進行實驗,實驗結果如圖3所示。

如圖3所示,每個子圖的x軸代表訓練的epoch數,左y軸代表的是模型的F1-score,右y軸代表的是模型的準確率。圖3分別給出本文模型在3個數據集上不同訓練epoch下分類評估指標的變化情況。

首先將模型的學習率固定為0.005,并設置epoch∈{5,25,50,75,100,125,150,175,200},由于epoch設置的不同,包括Acc和F1-score在內的指標呈現出一定的變化趨勢,其中,圖3(a)(c)中A股的指標波動情況比圖3(b)中NASDAQ更加明顯,而且三者的ACC和F1-score的表現呈現出同步上升的趨勢,而且當epoch=150時,模型實現出最好的性能,分別是Acc的0.722 7(A股)、0.863 8(NASDAQ)、0.820 6(NYSE)和F1-score的0.719 4(A股)、0.509 7(NASDAQ)、0.583 1(NYSE)。但是當epoch大于150時,模型性能一致處于飽和狀態,在圖3(b)的NASDAQ和圖3(c)的NYSE中F1-score上甚至一度出現下滑狀態,并且隨著模型訓練的epoch增加,Acc整體并沒有明顯提高。這一實驗結果表明,更大的參數不僅會帶來額外的計算負擔,而且也無法確保會帶來更好的性能效果。

需要注意的是,本文選擇epoch=150作為模型的最佳參數,綜合度量了Acc和F1-score的性能表現、計算成本和過擬合。一般來說,對于股票預測任務,大部分人可能會更加關注準確率的大小,而忽視了F1-score對于正負樣本的均衡性評估,股票市場獨有的表現可能會導致極端情況(樣本不均衡)的出現,即可能會隨著某個產業的興起或是熱度提升,同一時期內出現價格一邊倒的情況,這可能導致模型學習產生偏差性,所以加強對F1-score的重視程度,由圖3(b)可知,當epoch=100時,模型的Acc已經達到了峰值,但是相較于epoch=175時模型的表現,F1-score卻減少了2%,而epoch=200的性能與epoch=150的表現一致,然而卻額外增加了50個epoch的計算代價,此外,在epoch=175時,模型性能出現了小幅下降的趨勢,所以選擇epoch=150作為模型性能表現的最佳參數。

2.4.2 元路徑對比

sDHN模型中考慮了金融技術指標的語義級注意力,以元路徑的形式來實現,為了證明不同元路徑對模型性能的影響,本文使用了三種不同形式的元路徑進行比較,元路徑詳細的設置如表5所示,實驗結果如圖4所示,其中,x軸代表的是不同訓練的epoch數,y軸代表的是在測試集中整體模型的loss變化情況。

可以看到,在圖4(a)~(c)中的loss損失整體呈現下降趨勢,在三個數據集中相比其他的元路徑,meta path_1的loss損失下降最低,即使用matapath_1時,模型的預測結果與真實標簽之間的差距最小,相較于matapath_2,matapath_1中的子路徑數量更多,并且提供雙向的信息反饋,幫助節點更好地聚合周圍鄰居所提供的表示信息;而相較于matapath_3,兩條元路徑都提供同等的語義信息,但是子路徑的路徑長度不同,matapath_3的路徑長度更長,這會使當前節點獲取到更遠處的節點信息,但對于中小型異構圖來說,可能導致異構圖中符合該條元路徑的子圖數量減少,進而使得訓練中節點獲取到整體信息減少,使得模型性能下降。在圖4(a)~(c)中的matapath_3都出現loss值短暫上升的情況,在這個階段,模型可能會學習到錯誤或不理想的權重組合,導致loss值上升,但隨后呈現下降趨勢,這從側面反映出訓練過程中的patience機制對模型性能進行調整和優化。

2.4.3 相似性熱圖

為了驗證sDHN模型中構建的金融相似性圖的合理性,本文在三個不同市場的數據集中挑選了6只案例股票作進一步分析,實驗結果如圖5所示,橫縱軸分別是三個不同市場里的股票代碼,案例股票的詳細信息如表6所示。

圖5(a)中可以看出,300034.SZ(鋼研高納)和002025.SZ(航天電器)的相關性系數為0.90,相同的是600118.SH(中國衛星)和601698.SH(中國衛通)的相關性高達0.96,表明金融相似性圖模塊可以識別出處于不同行業中的上下游業務關系,圖5(b)中的ADEA.O(Adeia Inc.)和LITE.O(Lumentum Hol-dings Inc.)和圖5(c)的MHO.N(MI 家居)和BLDR.N(Buil-ders FirstSource Inc.)也體現出與圖5(a)類似的性質,在圖5(a)~(c)中屬于不同行業且在業務上沒有直接關聯的股票000006.SZ、AACG.O、ATGE.N(主營業務分別為房地產開發和教育服務),為其分配的相關性權值都較小,這在實際情況中是較為合理的情況。從而推斷出通過相關性圖可以有效地挖掘出股票之間潛在的業務相關性,也就是說,圖中的相關性從認知層面上更加理性地推斷出額外信息,而不是簡單的高階關系,這為預測模型的圖結構注入更重要的信息。

3 結束語

本文將股票預測設置為二分類問題,以預測股票的漲跌趨勢。利用現有的股票屬性,從不同屬性的交織中獲取到重要信息是一項非常具有挑戰性的任務,基于此,本文構建了不同關系類型的金融異構圖來模擬股票之間各種復雜的關系,從圖的角度衡量對股價變化的綜合影響。針對股票的行情信息,本文基于股票市場中經典的金融指標構建了四種新的股票關系圖,稱為金融相似性圖,該模塊可以有效探索股票之間的市場內股票交易信息和收益情況的相似性,捕捉到不同類型股票之間的潛在聯系,從結構上補充圖中的行情信息;為了在圖中進行信息挖掘,實現有效的信息融合,本文使用元路徑將具有特定的金融技術指標語義傳遞到節點嵌入中,配合股票的時序價格特征并使用GNN來進行股票預測。本文在三個真實的股票市場數據集中進行大量實驗,實驗結果表明本文構建的 sDHN模型能緩解由于單只股票關系圖的稀疏性而導致的有效信息不足的問題;金融相似性圖可以有效學習到不同類型股票的業務相似性,所以能夠較好地預測股票趨勢。

在未來,將進一步探討、改進或擴展股票間關系的、不同的構建方法。考慮到股票市場可能會短期快速變化的可能性,可以通過構建短期動態圖來進行建模,以提高模型的性能。

參考文獻:

[1]Moshirian F, Tian Xuan, Zhang Bohui, et al. Stock market libera-lization and innovation[J]. Journal of Financial Economics, 2021, 139(3): 985-1014.

[2]Gao Yanzi, Wu Jiabing, Feng Zhichao, et al. A new BRB model for technical analysis of the stock market[J]. Intelligent Systems with Applications, 2023, 2023(18): article ID 200198.

[3]Umar M, Mirza N, Rizvi S K A, et al. Asymmetric volatility structure of equity returns: evidence from an emerging market[J]. The Quarterly Review of Economics and Finance, 2023,87: 330-336.

[4]Kehinde T O, Chan F T S, Chung S H. Scientometric review and analysis of recent approaches to stock market forecasting: two decades survey[J]. Expert Systems with Applications, 2023, 213: article ID 119299.

[5]Mintarya L N, Halim J N M, Angie C, et al. Machine learning approaches in stock market prediction: a systematic literature review[J]. Procedia Computer Science, 2023,216: 96-102.

[6]Asgharian H, Christiansen C, Hou A J. The effect of uncertainty on stock market volatility and correlation[J]. Journal of Banking & Finance, 2023, 154: article ID 106929.

[7]Supsermpol P, Thajchayapong S, Chiadamrong N. Predicting financial performance for listed companies in Thailand during the transition period: a class-based approach using logistic regression and random forest algorithm[J]. Journal of Open Innovation: Technology, Market, and Complexity, 2023, 9(3): article ID 100130.

[8]Pang Bowen, Wei Wei, Li Xiang, et al. A representation-learning-based approach to predict stock price trend via dynamic spatiotemporal feature embedding[J]. Engineering Applications of Artificial Intelligence, 2023, 126: article ID 106849.

[9]Jiang Junji, Wu Likang, Zhao Hongke, et al. Forecasting movements of stock time series based on hidden state guided deep learning approach[J]. Information Processing & Management, 2023,60(3): article ID 103328.

[10]Peng Yaohao, Albuquerque P, Kimura H, et al. Feature selection and deep neural networks for stock price direction forecasting using technical analysis indicators[J]. Machine Learning with Applications, 202zcbuDBFRWNn0R6ClK1hA0w==1, 2021(5): article ID 100060.

[11]Stein T. Forecasting the equity premium with frequency-decomposed technical indicators[J]. International Journal of Forecasting, 2024, 40(1): 6-28.

[12]Yang Shuying, Guo Haiming, Li Junguang. CNN-GRUA-FC stock price forecast model based on multi-factor analysis[J]. Journal of Advanced Computational Intelligence and Intelligent Informa-tics, 2022, 26(4): 600-608.

[13]Zhang Daxing, Cai E. Improving stock price forecasting using a large volume of news headline text[J]. Computers, Materials & Con-tinua, 2021,69(3):3931-3943.

[14]Liu Jiawei, Shi Chuan, Yang Cheng, et al. A survey on heteroge-neous information network based recommender systems: concepts, methods, applications and resources[J]. AI Open, 2022, 3: 40-57.

[15]Kanwal A, Lau M, Sebastian N, et al. BiCuDNNLSTM-1dCNN—a hybrid deep learning-based predictive model for stock price prediction[J]. Expert Systems with Applications, 2022, 202: article ID 117123.

[16]Ma Chenyao, Yan Sheng. Deep learning in the Chinese stock market: the role of technical indicators[J]. Finance Research Letters, 2022, 2022(49): article ID 103025.

[17]Nayak A, Pai M, Pai R. Prediction models for Indian stock market[J]. Procedia Computer Science, 2016, 2016(89): 441-449.

[18]Ji Gang, Yu Jingmin, Hu Kai, et al. An adaptive feature selection schema using improved technical indicators for predicting stock price movements[J]. Expert Systems with Applications, 2022, 200: article ID 116941.

[19]Song Guowei, Zhao Tianlong, Wang Suwei, et al. Stock ranking prediction using a graph aggregation network based on stock price and stock relationship information[J]. Information Sciences, 2023, 643: article ID 119236.

[20]Fang Tong, Lee T H, Su Zhi. Predicting the long-term stock market volatility: a GARCH-MIDAS model with variable selection[J]. Journal of Empirical Finance, 2020,58: 36-49.

[21]Xu Bo, Zhang Dongyu, Zhang Shaowu, et al. Stock market trend prediction using recurrent convolutional neural networks[C]//Proc of the 7th CCF International Conference on Natural Language Processing and Chinese Computing. Berlin: Springer, 2018: 166-177.

[22]Li Xiaodong, Wu Pangjing, Wang Wenpeng. Incorporating stock prices and news sentiments for stock market prediction: a case of Hong Kong[J]. Information Processing & Management, 2020, 57(5): article ID 102212.

[23]Chang Zhihao, Zhang Zuping. Judging stock trends according to the sentiments of stock comments in expert forums[J]. Electronics, 2023, 12(3): 722.

[24]Du Xin, Tanaka-Ishii K. Stock portfolio selection balancing variance and tail risk via stock vector representation acquired from price data and texts[J]. Knowledge-Based Systems, 2022, 249: article ID 108917.

[25]Lin Weichao, Tsai C, Chen H. Factors affecting text mining based stock prediction: text feature representations, machine learning mo-dels, and news platforms[J]. Applied Soft Computing, 2022, 130: article ID 109673.

[26]Feng Fuli, He Xiangnan, Wang Xiang, et al. Temporal relational ranking for stock prediction[J]. ACM Trans on Information Systems, 2019, 37(2): 1-30.

[27]Kim R, So H, Jeong M, et al. Hats: a hierarchical graph attention network for stock movement prediction[EB/OL]. (2019-08-07)[2019-11-12]. https://arxiv.org/pdf/1908.07999.pdf.

[28]Ma Xiang, Zhao Tianlong, Guo Qiang, et al. Fuzzy hypergraph network for recommending top-K profitable stocks[J]. Information Sciences, 2022, 613(31): 239-255.

[29]Chen Wei, Hou Xiaoli, Jiang M, et al. Identifying systemically important financial institutions in complex network: a case study of Chinese stock market[J]. Emerging Markets Review, 2022, 50: article ID 100836.

[30]程海陽, 張建新, 孫啟森,等. 基于深度跨模態信息融合網絡的股票走勢預測[J]. 計算機科學, 2023,50(5): 128-136. (Cheng Haiyang, Zhang Jianxin, Sun Qisen, et al. Deep cross-model information fusion network for stock trend prediction[J]. Computer Science, 2023, 50(5): 128-136.)

[31]Li Weimin, Liu Lu, Kevin W, et al. Preface of special issue on heterogeneous information network embedding and applications[J]. Future Generation Computer Systems, 2024, 152: 331-332.

[32]Moskowitz J, Ooi H, Pedersen H. Time series momentum[J]. Journal of financial economics, 2012, 104(2): 228-250.

[33]Feng Fuli, Chen Huimin, He Xiangnan, et al. Enhancing stock movement prediction with adversarial training[C]//Proc of the 28th International Joint Conference on Artificial Intelligence.Palo Alto,CA: AAAI Press, 2018: 5843-5849.

[34]周帆, 陳曉蝶, 鐘婷,等. 面向金融科技的深度學習技術綜述[J]. 計算機科學, 2022, 49(S2): 20-36. (Zhou Fan, Chen Xiaodie, Zhong Ting, et al. Survey of deep learning technologies for financial technology[J]. Computer Science, 2022, 49(S2): 20-36.)

[35]何泳, 李環. 改進的NSGA-Ⅲ-XGBoost算法在股票預測中的應用[J]. 計算機工程與應用, 2023, 59(18): 293-300. (He Yong, Li Huan. Application of improved NSGA-Ⅲ-XGBoost algorithm in stock forecasting[J]. Computer Engineering and Applications, 2023, 59(18): 293-300.)

[36]Nelson D, Pereira A, Oliveira R. Stock market’s price movement prediction with LSTM neural networks[C]//Proc of International Joint Conference on Neural Networks. Piscataway,NJ:IEEE Press, 2017: 1419-1426.

[37]Gao Ya, Wang Rong, Zhou Enmin. Stock prediction based on optimized LSTM and GRU models[J]. Scientific Programming, 2021(4): article ID 4055281.

[38]Teng Xiao, Zhang Xiang, Luo Zhigang. Multi-scale local cues and hierarchical attention-based LSTM for stock price trend prediction[J]. Neurocomputing, 2022, 505: 92-100.

[39]Chen Yingmei, Wei Zhongyu, Huang Xuanjing. Incorporating corporation relationship via graph convolutional neural networks for stock price prediction[C]//Proc of the 27th ACM International Conference on Information and Knowledge Management. New York: ACM Press, 2018: 1655-1658.

[40]Sawhney R, Agarwal S, Wadhwa A, et al. Spatiotemporal hypergraph convolution network for stock movement forecasting[C]//Proc of IEEE International Conference on Data Mining. Piscataway,NJ:IEEE Press, 2020: 482-491.

主站蜘蛛池模板: 成人年鲁鲁在线观看视频| 欧美性爱精品一区二区三区 | 久久精品国产精品国产一区| 国产特级毛片aaaaaa| 亚洲av片在线免费观看| 伊人成人在线视频| 老司机午夜精品视频你懂的| 亚洲精品综合一二三区在线| 亚洲资源在线视频| 亚洲国产中文综合专区在| 精品无码国产一区二区三区AV| 精品国产福利在线| 波多野结衣亚洲一区| 国产黑丝视频在线观看| 性色一区| 一本久道久久综合多人| 亚洲欧美综合另类图片小说区| 特级毛片8级毛片免费观看| 久久这里只精品热免费99| 狠狠亚洲五月天| 国产在线一区二区视频| 女人毛片a级大学毛片免费| 日韩欧美91| 亚洲系列中文字幕一区二区| 99爱在线| 视频在线观看一区二区| 亚洲伊人天堂| 久久99国产视频| 97一区二区在线播放| 波多野结衣在线一区二区| 亚洲无码不卡网| 亚洲欧美综合精品久久成人网| 97综合久久| 亚洲日韩欧美在线观看| 国产毛片不卡| 国产精品一区二区不卡的视频| 久久成人国产精品免费软件| 成人福利视频网| 久久人搡人人玩人妻精品 | 亚洲嫩模喷白浆| 综合社区亚洲熟妇p| 久久这里只有精品8| 午夜高清国产拍精品| 日韩美一区二区| 在线亚洲小视频| 国产精品香蕉| 91日本在线观看亚洲精品| 国产亚洲精品yxsp| 日本午夜精品一本在线观看| 波多野结衣一二三| 91青青视频| 香蕉国产精品视频| 亚洲综合精品第一页| 亚洲日本中文综合在线| 久久精品丝袜高跟鞋| 亚国产欧美在线人成| 老司机久久精品视频| 2024av在线无码中文最新| 欧美日韩在线亚洲国产人| 国产99免费视频| 久青草网站| 国产精品性| 欧美在线三级| h视频在线观看网站| 亚洲美女一区| 欧美一级99在线观看国产| 妇女自拍偷自拍亚洲精品| 午夜日韩久久影院| 亚洲无码精品在线播放| 色男人的天堂久久综合| 99性视频| 色哟哟国产精品| 国内精品视频区在线2021| 免费在线视频a| 国产一区二区人大臿蕉香蕉| 欧美成人精品在线| 99久久精品国产麻豆婷婷| 免费一级毛片不卡在线播放| 手机精品视频在线观看免费| 亚洲an第二区国产精品| 国产成人精品免费av| 99手机在线视频|