歐陽資生 唐伯聰



摘要:碳中和指數(shù)是落實碳中和戰(zhàn)略、推動經(jīng)濟綠色轉(zhuǎn)型的重要工具和載體,準(zhǔn)確預(yù)測碳中和指數(shù)可以為相關(guān)政策的實施提供依據(jù),吸引投資者參與碳中和市場并獲取收益。因此,本文提出了一種融合數(shù)據(jù)分解重構(gòu)和注意力機制的深度學(xué)習(xí)預(yù)測模型——VMD-BiLSTM-ATT模型,并將其運用到碳中和指數(shù)的預(yù)測與應(yīng)用中。具體而言,研究分為三個部分,一是通過計算四個誤差評價指標(biāo)驗證本文模型具備最佳預(yù)測性能,二是為獲取更高的預(yù)測精度對模型超參數(shù)進行調(diào)整得到最優(yōu)超參數(shù)組合,三是以六個投資評價指標(biāo)為標(biāo)準(zhǔn)衡量模型的投資應(yīng)用價值。實證結(jié)果表明,在預(yù)測性能方面, VMD-BiLSTM-ATT模型優(yōu)于所有基準(zhǔn)模型,且經(jīng)過超參數(shù)調(diào)整后,模型預(yù)測性能更佳;在量化投資應(yīng)用方面,基于本文模型的碳中和指數(shù)投資策略獲得的投資績效遠(yuǎn)遠(yuǎn)優(yōu)于持有期相同的碳中和指數(shù)和滬深300指數(shù)的投資績效,并且超參數(shù)的調(diào)整能在此基礎(chǔ)上進一步提升投資績效,證明了本文模型在量化投資方面具有良好的應(yīng)用價值。
關(guān)鍵詞:碳中和指數(shù);深度學(xué)習(xí);變分模態(tài)分解;注意力機制
中圖分類號:F832.5? ? ? ? ?文獻標(biāo)識碼:A? ? ? ? ? ? ? 文章編號:1007-0753(2023)10-0075-16
一、引言
工業(yè)革命以來,化石能源的消耗使得空氣中CO2含量逐漸增加,導(dǎo)致全球氣候變暖并引發(fā)一系列環(huán)境問題,如極端天氣和自然災(zāi)害增多、作物生長環(huán)境受影響而導(dǎo)致產(chǎn)量下降、土地沙漠化、冰川消融及海平面上升等。為實現(xiàn)氣候治理,《巴黎協(xié)定》提議把全球平均氣溫較工業(yè)化前水平升高控制在2 ℃之內(nèi),并為把升溫控制在1.5 ℃之內(nèi)而努力。截至2021年底,全球已有 136個國家提出了“碳中和”承諾。有關(guān)氣候問題,習(xí)近平主席強調(diào)“氣候變化是全球性挑戰(zhàn),任何一國都無法置身事外”,并于2020年正式提出“雙碳”目標(biāo)。“雙碳”目標(biāo)不僅符合國家可持續(xù)發(fā)展戰(zhàn)略的要求,推動了生態(tài)文明建設(shè)和高質(zhì)量發(fā)展,而且展現(xiàn)出中國主動承擔(dān)應(yīng)對全球氣候變化責(zé)任的大國擔(dān)當(dāng)。“雙碳”目標(biāo)提出后,我國政府陸續(xù)出臺相關(guān)的碳減排政策,積極引導(dǎo)資金流入碳中和市場,從而推進經(jīng)濟綠色轉(zhuǎn)型發(fā)展。碳中和指數(shù)既是反映碳中和市場變化情況的客觀評價指標(biāo),又是資本市場落實碳中和戰(zhàn)略、推動經(jīng)濟綠色轉(zhuǎn)型的重要工具和載體,準(zhǔn)確預(yù)測碳中和指數(shù)在碳中和研究中就顯得尤為重要。從政府角度看,它可以幫助政府提前預(yù)知未來市場發(fā)展趨勢,為相關(guān)政策實施提供參考;從投資者和市場角度看,先進的預(yù)測模型一方面可以吸引投資者參與碳中和市場獲取收益,另一方面隨著投資額的增加為碳中和市場注入資金,助力“雙碳”目標(biāo)的實現(xiàn)。
二、文獻綜述
目前來看,碳中和相關(guān)研究主要分為以下三個方面:一是綠色金融對碳排放的影響。綠色金融是國家實現(xiàn)碳中和環(huán)境治理的核心,在碳市場的發(fā)展中具有舉足輕重的地位。Saeed Meo和 Karim(2022)考察了包含英國、美國和日本在內(nèi)的十大支持綠色金融的經(jīng)濟體,發(fā)現(xiàn)綠色金融是減少碳排放的最佳金融策略。由于國家間的市場狀況不同,綠色金融對碳排放雖然呈現(xiàn)負(fù)向影響,但不同分位數(shù)之間的影響程度是不同的。因此,綠色金融發(fā)展應(yīng)結(jié)合具體國情,積極探索有中國特色的道路。二是碳排放權(quán)交易市場的研究與預(yù)測。碳排放權(quán)交易市場是實現(xiàn)碳中和目標(biāo)的核心政策工具,是利用市場機制實現(xiàn)最低減排成本的重要制度創(chuàng)新。市場的完善離不開對價格的研究,從傳統(tǒng)的計量模型方法到人工智能預(yù)測技術(shù),碳價格預(yù)測模型精度不斷提升,然而碳價格變動是非線性且復(fù)雜的。目前來看,預(yù)測效果較優(yōu)異的模型還是加入時間序列分解的預(yù)測模型,如Rezaei等(2021)使用二次分解的機器學(xué)習(xí)模型并證明了模型的有效性。三是碳中和的實現(xiàn)途徑。碳中和作為我國可持續(xù)發(fā)展的綱領(lǐng)性目標(biāo),其實現(xiàn)路徑也值得仔細(xì)探討。張浩楠等(2022)總結(jié)了碳中和實現(xiàn)的兩條路徑,分別是以可再生能源為基礎(chǔ)的“零碳”途徑,以及依靠化石能源脫碳化處理的“凈零”途徑,但兩者之間存在一定的沖突,需要進一步討論兩者的系統(tǒng)可塑性、經(jīng)濟適用性和減碳潛力等。總的來看,與西方國家碳排放集中在消費端相比,我國碳排放主要集中在生產(chǎn)端,因此應(yīng)當(dāng)堅持采取“受益者付費”的消費端責(zé)任原則,走中國特色碳中和道路,而非盲目學(xué)習(xí)西方模式。
以上研究涉及公司層面的綠色融資與碳排放的關(guān)系、市場層面的碳排放權(quán)交易價格預(yù)測以及宏觀層面的碳中和實現(xiàn)路徑。碳中和指數(shù)由于發(fā)布時間較晚,國內(nèi)外相關(guān)研究目前停留在指數(shù)的構(gòu)建與變動趨勢分析上(陳夢月等,2022;孫翊,2022)。不足的是,歷史的變動分析遠(yuǎn)遠(yuǎn)不能滿足投資者、市場和政府的需求,而對指數(shù)變化趨勢的預(yù)測分析更能帶來實際的價值,例如,買賣指數(shù)后的收益預(yù)測、政策實施后的效果預(yù)測以及經(jīng)濟大環(huán)境的變化趨勢預(yù)測等。
在早期,由于機器學(xué)習(xí)技術(shù)不夠普及,金融時間預(yù)測研究多采用傳統(tǒng)的計量預(yù)測模型,如移動平均自回歸模型(ARIMA)、廣義自回歸條件異方差模型(GARCH)等(惠曉峰等,2003)。傳統(tǒng)的計量模型雖簡潔實用,但其僅適用于較平穩(wěn)的時間序列數(shù)據(jù),對于復(fù)雜數(shù)據(jù)的預(yù)測效果較差。隨著計算機技術(shù)的不斷發(fā)展,雖然傳統(tǒng)的計量模型仍占有一席之地,如張貴生等(2016)曾運用基于微分信息的ARMAD-GARCH模型對五種不同市場的指數(shù)進行預(yù)測,預(yù)測結(jié)果具備一定的準(zhǔn)確性和穩(wěn)定性,但在多數(shù)情況下傳統(tǒng)模型已不能滿足研究者對預(yù)測精度的要求。基于計算機技術(shù)的深度學(xué)習(xí)網(wǎng)絡(luò)模型開始進入學(xué)者的視野,如楊剛等(2021)的研究表明ELM神經(jīng)網(wǎng)絡(luò)較ARMA模型預(yù)測精度有顯著提高,可為氣溫衍生品的定價奠定基礎(chǔ)。在預(yù)測研究中,許多學(xué)者的研究結(jié)果都表明了挖掘時間序列數(shù)據(jù)長期依賴關(guān)系的循環(huán)神經(jīng)網(wǎng)絡(luò)相比于傳統(tǒng)計量模型和前饋神經(jīng)網(wǎng)絡(luò)模型更具優(yōu)勢(Chandra等,2021;Yang等,2023)。循環(huán)神經(jīng)網(wǎng)絡(luò)模型中,傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)由于容易陷入梯度消失和梯度爆炸而較少在預(yù)測研究中使用。Shen等(2018)在對恒生指數(shù)、德國股票指數(shù)和標(biāo)準(zhǔn)普爾500指數(shù)的預(yù)測中,證明了門控循環(huán)網(wǎng)絡(luò)模型(GRU)的預(yù)測精度優(yōu)于傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)和支持向量機模型(SVM)。長短期記憶模型(LSTM)由于其強泛化能力在時間序列預(yù)測中備受青睞。楊青和王晨蔚(2019)通過全球30個指數(shù)數(shù)據(jù)研究了LSTM模型的泛用性、準(zhǔn)確性和穩(wěn)定性,認(rèn)為其在金融預(yù)測中有廣闊的應(yīng)用前景。歐陽資生等(2022)為提高模型的預(yù)測精度,將LSTM納入金融風(fēng)險預(yù)警體系,發(fā)現(xiàn)LSTM的引入有利于構(gòu)建科學(xué)的風(fēng)險檢測和預(yù)警機制。雙向長短期記憶模型(BiLSTM)與前面的模型相比,其優(yōu)勢在于能夠雙向讀取序列信息,從而在預(yù)測中更充分地利用信息。Barua 和 Sharma(2022)對LSTM和BiLSTM兩個模型進行了對比研究,從評價指標(biāo)結(jié)果來看BiLSTM模型的預(yù)測性能更加優(yōu)越。
隨著研究數(shù)據(jù)的復(fù)雜化和多樣化,波動大的復(fù)雜數(shù)據(jù)想要取得與較平穩(wěn)數(shù)據(jù)相近的預(yù)測結(jié)果是十分困難的,而物理學(xué)中的信號分解理論正好為這個難題提供了一個可行的解決方法。信號分解理論通過將成分復(fù)雜的原數(shù)據(jù)分解成一系列規(guī)則的子序列,然后對各子序列分別進行預(yù)測,從而達到提升模型預(yù)測精度的目的。金融時間序列分析中常見的信號分解理論有小波分解(WT)(Chang等,2019)、經(jīng)驗?zāi)B(tài)分解(EMD)(Wang等,2020)和變分模態(tài)分解(VMD)(Huang等,2021)等。WT分解和EMD分解都存在一定的局限性,前者需要主觀設(shè)計基函數(shù),后者則是容易產(chǎn)生模態(tài)混疊,相比之下VMD分解具有不容易產(chǎn)生模態(tài)混疊和自主選擇分解子序列個數(shù)的兩大優(yōu)勢,因此常運用于時間序列分析預(yù)測中。Liu等(2020)將VMD分解與長短期記憶模型(LSTM)相結(jié)合,構(gòu)建了預(yù)測模型并與其他六種最先進的方法進行比較;結(jié)果表明,該模型對有色金屬價格預(yù)測具有較好的效果。
信號分解理論的引入雖然使得模型在精度和穩(wěn)定性方面有了極大提升,但仍需合理利用計算資源,即將計算能力更多地用于對預(yù)測有幫助的信息中,減少無關(guān)信息的干擾。注意力機制便具有這項能力,能在計算能力有限的情況下,依據(jù)對預(yù)測結(jié)果的貢獻度不同給信息賦予不同權(quán)重,提升預(yù)測效率。Qiu等(2020)通過研究標(biāo)準(zhǔn)普爾500綜合股價指數(shù)、道瓊斯工業(yè)平均指數(shù)和恒生指數(shù)等數(shù)據(jù)發(fā)現(xiàn),在LSTM模型中加入注意力機制會使得模型的可決系數(shù)均高于94%且均方誤差低于0.05。Ouyang等(2021)在系統(tǒng)性風(fēng)險指標(biāo)的預(yù)測中也證實了各風(fēng)險指標(biāo)的預(yù)測精度都隨著注意力機制的加入而提升。Abbasimehr和Paki(2022)的研究也同樣表明注意力機制的引入能夠顯著提高模型的預(yù)測性能。
前文主要介紹了預(yù)測模型的發(fā)展以及如何構(gòu)建預(yù)測模型才能提升預(yù)測性能,但預(yù)測只是方法與過程,最終的落腳點在于模型的應(yīng)用。從近些年的研究來看,機器學(xué)習(xí)預(yù)測模型在金融領(lǐng)域的應(yīng)用屢見不鮮。張鵬等(2023)認(rèn)為優(yōu)質(zhì)股票的選擇是投資組合獲益的基石,從而提出了基于機器學(xué)習(xí)方法選股和以均值-下半方差構(gòu)建投資組合的XGBoost+MSV模型,該模型在收益和風(fēng)險指標(biāo)上均優(yōu)于其他模型。Cipiloglu等(2020)則利用LSTM模型預(yù)測未來收益方向,然后將這些預(yù)測用于計算投資組合權(quán)重,通過與常見的投資組合構(gòu)造策略比較分析得出,融入LSTM模型后預(yù)測將會改善投資組合的績效。但是機器學(xué)習(xí)預(yù)測模型在投資領(lǐng)域的應(yīng)用遠(yuǎn)不止于此,先進的預(yù)測方法以及與之結(jié)合的更豐富的投資策略構(gòu)造仍待探索和發(fā)掘。
在前文研究的基礎(chǔ)上,本文從改進預(yù)測方法的角度入手,提出預(yù)測更為準(zhǔn)確的VMD-BiLSTM-ATT模型,并通過其在碳中和指數(shù)的投資應(yīng)用來評判模型的應(yīng)用價值。本文的邊際貢獻在于:一是擴展了碳中和指數(shù)相關(guān)研究,將研究領(lǐng)域從碳中和指數(shù)的構(gòu)建和變動趨勢分析,延伸到碳中和指數(shù)的預(yù)測以及構(gòu)造投資策略進行投資應(yīng)用分析;二是為預(yù)測研究提供了新的預(yù)測方法。本文所提出的模型充分結(jié)合了數(shù)據(jù)分解重構(gòu)、注意力機制和深度學(xué)習(xí)三大結(jié)構(gòu)的優(yōu)勢。在實證研究中,通過與前人提出的不同架構(gòu)模型進行對比分析發(fā)現(xiàn),本文模型在各項誤差指標(biāo)評價中都具備最優(yōu)預(yù)測性能。
三、模型構(gòu)建與評價指標(biāo)
(一)變分模態(tài)分解
Dragomiretskiy等(2014)提出了一個完全非遞歸的分解模型VMD(Variational Mode Decomposition),即變分模態(tài)分解。VMD模型通過尋找一組本征模態(tài)函數(shù)(Intrinsic Mode Function,IMF)和它們各自的中心頻率來共同再現(xiàn)輸入信號。與傳統(tǒng)信號分解算法相比,VMD不僅擁有自主選擇模態(tài)個數(shù)的優(yōu)點,而且克服了EMD方法存在端點效應(yīng)和模態(tài)分量混疊的問題,并具有更堅實的數(shù)學(xué)理論基礎(chǔ),可以降低復(fù)雜度高和非線性強的時間序列的非平穩(wěn)性,分解獲得包含多個不同頻率尺度且相對平穩(wěn)的子序列,適用于非平穩(wěn)性的序列。VMD的核心思想是構(gòu)建和求解變分問題。
其中,tanh表示正切雙曲函數(shù),σ表示sigmoid函數(shù)。
因此,在LSTM模型的基礎(chǔ)上構(gòu)建的BiLSTM模型單元結(jié)構(gòu)如圖2所示。
輸入序列分別以正序和逆序輸入2個LSTM神經(jīng)網(wǎng)絡(luò)進行特征提取,正序輸入生成對應(yīng)的輸出值h→ = {h→1, h→2,…,h→n };同樣地,逆序輸入也會生成對應(yīng)的輸出值h← = {h←1, h←2,…, h←n }。最后將正序與逆序?qū)?yīng)的輸出值進行拼接得到BiLSTM的輸出值h = {h1, h2,…, hn }。
(三)注意力機制
神經(jīng)網(wǎng)絡(luò)中的注意力機制(Attention Mechanism,ATT)是指在計算能力有限的情況下,將計算資源分配給更重要任務(wù)的一種資源分配機制。通過引入注意力機制,可以在眾多的輸入信息中聚焦對當(dāng)前任務(wù)更為關(guān)鍵的信息,降低對其他信息的關(guān)注度,提高任務(wù)處理的效率和準(zhǔn)確性。在實際應(yīng)用中,注意力機制通常分為軟注意力機制和硬注意力機制。軟注意力機制是指在學(xué)習(xí)所有數(shù)據(jù)時計算每個數(shù)據(jù)的權(quán)重,然后進行相應(yīng)的加權(quán)平均。相對地,硬注意力機制的權(quán)重只能是0或1。本文模型采用軟注意力機制來處理神經(jīng)網(wǎng)絡(luò)的問題,在模型訓(xùn)練過程中,依據(jù)不同特征賦予碳中和指數(shù)預(yù)測的貢獻率不同的注意力權(quán)重。圖3展示了注意力機制的網(wǎng)絡(luò)結(jié)構(gòu)。
對于一個i維的特征輸入,通過密集層生成對應(yīng)的特征隱藏輸出值S = {s1,s2,s3,…,si};然后該隱藏輸出值通過softmax函數(shù)轉(zhuǎn)化為權(quán)重和為1的特征權(quán)重向量A = {α1,α2,α3,…,αi};由于整個變換中并未改變特征的維度,最后可以將每個輸入特征與對應(yīng)的特征權(quán)重相乘,從而得到注意力層的最終輸出結(jié)果。
(四)VMD-BiLSTM-ATT模型
在前文三個模型的基礎(chǔ)上,集成各模型的優(yōu)點,通過對模型的有效組合,提出了預(yù)測更為精確的VMD-BiLSTM-ATT模型。模型的具體組成結(jié)構(gòu)如圖4所示。
VMD-BiLSTM-ATT模型的原理是對數(shù)據(jù)的分解、預(yù)測和重構(gòu)。先是分解以降低數(shù)據(jù)的復(fù)雜度,將復(fù)雜數(shù)據(jù)的預(yù)測問題轉(zhuǎn)化為對簡單分量數(shù)據(jù)的預(yù)測問題,然后將各分量分別輸入BiLSTM-ATT模型預(yù)測得到分量預(yù)測結(jié)果,最后重構(gòu)分量預(yù)測結(jié)果,加總得到最終預(yù)測值。模型的具體實現(xiàn)步驟如下:
1.將碳中和指數(shù)輸入至VMD模型中進行數(shù)據(jù)分解,得到各本征模態(tài)函數(shù)IMF = {IMF1, IMF2, …, IMFn};
2.將分解的各分量輸入融合注意力機制的BiLSTM-ATT模型,先是將各分量輸入至BiLSTM模型得到BiLSTM層輸出結(jié)果,再通過注意力層提取得到注意力加權(quán)特征;
3.從上一步獲取的特征輸入至Dense層得到各IMF分量的預(yù)測結(jié)果Prediction={Predicton1,Pred-icton2 ,… , Predictonn};
4.最后對各分量預(yù)測值加總獲得碳中和指數(shù)的最終預(yù)測值。
(五)誤差評價指標(biāo)
平均絕對誤差(MAE):衡量預(yù)測值與真實值之間的平均絕對誤差,MAE越小表示模型越好。
四、碳中和指數(shù)量化投資模型選擇
(一)數(shù)據(jù)來源與描述性統(tǒng)計分析
本文從中證指數(shù)官網(wǎng)獲取2017年6月30日—2022年12月31日的SEEE碳中和指數(shù)收盤價數(shù)據(jù),數(shù)據(jù)中的前80%用作訓(xùn)練集訓(xùn)練模型,后20%數(shù)據(jù)用作測試集驗證模型的性能。碳中和指數(shù)共計100只樣本股,以2017年6月30日為基期,以
1 000點為基點。樣本股篩選基于碳中和概念股過去一年成交金額排名的前90%,再剔除其中ESG得分后 10%的股票。樣本股分為深度低碳(清潔能源與儲能、綠色交通、減碳和固碳技術(shù)等)和高碳減排(火電、鋼鐵、建材、有色金屬、化工、建筑等)兩個領(lǐng)域并分別賦予不同權(quán)重。其中,2022年深度低碳領(lǐng)域貢獻度為 66.47%, 高碳減排領(lǐng)域貢獻度為 33.53%。由此可見,碳中和指數(shù)構(gòu)成科學(xué)合理,能充分反映我國碳中和市場的整體表現(xiàn)。碳中和指數(shù)時間序列圖及描述性統(tǒng)計表見圖5和表1。
從圖5可以看到,整體上碳中和指數(shù)波動較大。碳中和指數(shù)較大的變動往往與國家政策的提出相關(guān),2017年6月至2020年9月,我國在碳減排方面的政策和舉措力度較小,碳中和指數(shù)的變動較為平穩(wěn)。2020年9月22日,習(xí)近平主席在第七十五屆聯(lián)合國大會上提出“雙碳”目標(biāo),一系列政策措施在其后兩年內(nèi)相繼頒布,碳中和指數(shù)進入高速上漲期。2021年末,碳中和指數(shù)到達頂峰,此時碳中和指數(shù)已經(jīng)居于高位。2022年一季度指數(shù)開始下跌。2022年3月,《“十四五”東西部科技合作實施方案》頒布,指數(shù)再次上漲但幅度遠(yuǎn)不及高速上漲期。之后指數(shù)雖有波動,但逐漸趨于穩(wěn)定。
表1展示了碳中和指數(shù)的7個數(shù)據(jù)特征,從數(shù)據(jù)的最大值、最小值、中位數(shù)、均值及標(biāo)準(zhǔn)差并結(jié)合圖5分析可知碳中和指數(shù)數(shù)據(jù)波動較大,這意味著如果不采用數(shù)據(jù)分解而直接對指數(shù)進行預(yù)測,準(zhǔn)確率較難達到預(yù)測要求。從數(shù)據(jù)的偏度和峰度分析可知,碳中和指數(shù)呈現(xiàn)正偏態(tài)且分布較為平緩。
(二)模型比較分析
本節(jié)通過比較不同深度學(xué)習(xí)模型及其組合模型以驗證所構(gòu)建模型的有效性。本文使用前6個交易日的碳中和指數(shù)收盤價作為數(shù)據(jù)的輸入特征,后1個交易日收盤價作為輸出值(即預(yù)測結(jié)果),利用單位交易日滑動窗口獲得一系列輸入特征與輸出值。首先,在訓(xùn)練集中通過優(yōu)化預(yù)測值與真實值的距離來訓(xùn)練深度學(xué)習(xí)模型;隨后,在測試集中利用訓(xùn)練好的模型獲取碳中和指數(shù)收盤價的預(yù)測值;最后,由真實值和預(yù)測值計算得到四個誤差評價指標(biāo),用于各深度學(xué)習(xí)模型性能的比較分析。模型的相關(guān)超參數(shù)設(shè)置如表2所示。
完成相關(guān)超參數(shù)設(shè)置后,將所有模型分為三部分,分別是基礎(chǔ)的循環(huán)神經(jīng)網(wǎng)絡(luò)模型、加入VMD分解的循環(huán)神經(jīng)網(wǎng)絡(luò)模型及融合VMD分解和注意力機制的循環(huán)神經(jīng)網(wǎng)絡(luò)模型,并從四個誤差評價指標(biāo)上分析不同模型的性能,不同模型間的比較結(jié)果如表3所示。在第一部分中,本文比較了四個循環(huán)神經(jīng)網(wǎng)絡(luò)模型(RNN、GRU、LSTM和BiLSTM)。可以看到,BiLSTM模型在四個誤差評價指標(biāo)上都具有最優(yōu)的結(jié)果,而RNN雖具備信息記憶能力,但對信息的處理能力不足,模型性能最差。因此,在循環(huán)神經(jīng)網(wǎng)絡(luò)的選擇上,優(yōu)先選擇BiLSTM并在此基礎(chǔ)上融入VMD分解和注意力機制。
在第二部分中,通過加入VMD分解,所有模型都獲得了極大的預(yù)測性能提升,其中VMD-GRU模型提升幅度最大,且性能接近于VMD-BiLSTM模型,但加入VMD分解的BiLSTM模型在所有誤差評價指標(biāo)上依然優(yōu)于其他模型。VMD分解加入后,BiLSTM模型的MAE、RMSE和MAPE分別下降了7.738 6、11.745 3和0.004,R2提升了0.020 8。
第三部分在第二部分的基礎(chǔ)上引入了注意力機制,通過對特征的注意力加權(quán)來提升模型的性能。可以看到,注意力機制的引入對性能的提升雖不如VMD分解,但也在一定程度上提升了各模型的性能。VMD-BiLSTM-ATT模型與所有基準(zhǔn)模型相比,仍具備最優(yōu)的預(yù)測性能,其MAE、RMSE、MAPE和R2分別為15.953 0、19.067 3、0.008 2和0.988 1。
(三)模型超參數(shù)優(yōu)化
在深度學(xué)習(xí)的算法中,超參數(shù)作為不通過訓(xùn)練優(yōu)化的提前進行設(shè)置的一種參數(shù)類型(如神經(jīng)網(wǎng)絡(luò)單元數(shù)等),其選擇是訓(xùn)練深度學(xué)習(xí)模型時必不可少的過程,并且會直接影響模型的訓(xùn)練速度和質(zhì)量。為進一步提高模型的預(yù)測精度,本文將對模型中最重要的兩個超參數(shù)(VMD分解數(shù)和BiLSTM單元數(shù))進行調(diào)整。通過對比不同超參數(shù)組合下的誤差評價指標(biāo),選擇出最優(yōu)的超參數(shù)組合。表4—表7分別展示了MAE、RMSE、MAPE和R2在不同超參數(shù)組合下的值。
如表4—表7所示,各誤差評價指標(biāo)反映的是模型在不同角度上的預(yù)測性能,故在不同超參數(shù)組合下,MAE、RMSE、MAPE和R2四個誤差評價指標(biāo)的最優(yōu)值會產(chǎn)生相應(yīng)的變化。其中MAE和MAPE都在K=7和BiLSTM單元數(shù)為90時取得最低值,分別為7.919 4和0.004 0,而RMSE和R2在參數(shù)組合為K=8和BiLSTM單元數(shù)為130時分別達到最低值10.068 0和最高值0.996 7(R2反映的是模型的擬合效果,值越大代表擬合效果越好)。總體來說,兩組超參數(shù)組合的性能差距并不大,但考慮到VMD分解數(shù)和BiLSTM單元數(shù)的增加會顯著提高模型預(yù)測所需的時間,經(jīng)過綜合考慮后確定本文模型的最優(yōu)超參數(shù)組合為K=7和BiLSTM單元數(shù)為90。
為了證明模型在超參數(shù)調(diào)整后依然具備最優(yōu)性,本文基于調(diào)整后的超參數(shù)(VMD分解數(shù)變?yōu)镵=7和BiLSTM單元數(shù)變?yōu)?0,其余超參數(shù)不做改變)重新訓(xùn)練本文模型與各基準(zhǔn)模型,并將它們在測試集上的誤差評價指標(biāo)結(jié)果列于表8中。
如表8所示,經(jīng)過超參數(shù)優(yōu)化的各模型預(yù)測性能總體趨勢基本與超參數(shù)調(diào)整前一致:(1)在基礎(chǔ)的循環(huán)神經(jīng)網(wǎng)絡(luò)模型中,BiLSTM依然具有最佳預(yù)測性能;(2)加入VMD分解的循環(huán)神經(jīng)網(wǎng)絡(luò)模型顯著優(yōu)于基礎(chǔ)的循環(huán)神經(jīng)網(wǎng)絡(luò)模型;(3)在VMD分解的基礎(chǔ)上,注意力機制的引入能夠進一步提升模型的性能;(4)本文模型,即VMD-BiLSTM-ATT模型依然具備最優(yōu)預(yù)測性能。
模型在總體趨勢上與超參數(shù)調(diào)整前保持一致,也從一定程度上證明了模型的魯棒性。從表8中能夠明顯看到超參數(shù)調(diào)整使得大多數(shù)模型得到了優(yōu)化,MAE、RMSE和MAPE相較超參數(shù)調(diào)整前都有一定程度的下降,同樣地R2也得到了提升。為了更好地反映誤差評價指標(biāo)的變化情況,本文對超參數(shù)調(diào)整前后誤差評價指標(biāo)的變化進行了分析,結(jié)果見表9。
如表9所示,大多數(shù)模型的性能都在超參數(shù)調(diào)整后得到了提升,其中基礎(chǔ)循環(huán)神經(jīng)網(wǎng)絡(luò)模型的提升幅度較小,甚至性能有所下降,但隨著VMD分解和注意力機制的逐漸加入,各模型的性能提升幅度顯著增加。從各部分來看:在第一部分中,GRU和BiLSTM的性能得到了小幅度提升,但RNN和LSTM的性能下降;在第二部分中,除VMD-RNN的性能大幅度下降外,其余三個模型的性能皆得到了大幅提升;而在第三部分中,所有模型的性能都在參數(shù)調(diào)整后得到了大幅度提升,尤其是VMD-BiLSTM-ATT的誤差評價指標(biāo)MAE、RMSE和MAPE都下降了近50%,同時R2提升了0.85%。上述結(jié)果證明了VMD分解和注意力機制在深度學(xué)習(xí)預(yù)測領(lǐng)域的重要性。
五、量化投資應(yīng)用分析
模型的預(yù)測性能是應(yīng)用的保證,模型的應(yīng)用則是預(yù)測的最終目的,本節(jié)將利用VMD-BiLSTM-ATT模型的預(yù)測結(jié)果來構(gòu)造投資策略,根據(jù)模型在六個投資評價指標(biāo)上的表現(xiàn)討論模型的應(yīng)用價值。具體的投資策略構(gòu)造過程如下:
首先,運用已訓(xùn)練好的VMD-BiLSTM-ATT模型在測試集中預(yù)測的碳中和指數(shù)收盤價預(yù)測值計算碳中和指數(shù)預(yù)測收益率,第i天碳中和指數(shù)預(yù)測收益率R ?i的計算公式如下:
R ?i = ln( p ? i /pi-1)? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(17)
其中, p ? i為碳中和指數(shù)在第i天的預(yù)測收盤價,pi-1為碳中和指數(shù)在第i-1天的真實收盤價。然后依據(jù)預(yù)測結(jié)果將碳中和指數(shù)價格運動分為“上漲”(up)和“下跌”(down)兩類,其定義如下:
(18)
本文設(shè)置以下交易策略:在碳中和指數(shù)預(yù)測結(jié)果為“上漲”時買入或持有碳中和指數(shù),在碳中和指數(shù)預(yù)測結(jié)果為“下跌”時賣出或不持有碳中和指數(shù)。為了實驗的簡單性和公平性,忽略所有比較方法的交易成本。
通過本文提出的VMD-BiLSTM-ATT模型在測試集上的預(yù)測結(jié)果,采取上述投資策略買賣指數(shù),并依據(jù)預(yù)測結(jié)果計算出年化收益率、夏普比率、勝率、盈虧比、VaR和ES共六類投資評價指標(biāo)來檢驗?zāi)P陀糜诹炕顿Y的有效性。具體投資評價指標(biāo)計算公式如表10所示,各投資評價指標(biāo)的具體計算值如表11所示。
表11展示了四列投資評價指標(biāo),其中超參數(shù)優(yōu)化后和超參數(shù)優(yōu)化前的投資評價指標(biāo)采取本文模型的碳中和指數(shù)投資策略計算所得,而碳中和指數(shù)和滬深300指數(shù)的投資評價指標(biāo)則是采取消極投資策略(即簡單購買持有)計算得出。通過對比采用本文投資策略的超參數(shù)優(yōu)化后、超參數(shù)優(yōu)化前以及持有期相同的碳中和指數(shù)和滬深300指數(shù)的六項投資評價指標(biāo)可得:未使用本文模型時,持有碳中和指數(shù)相較滬深300指數(shù)而言,承擔(dān)了更高的風(fēng)險卻享有更低的收益,即采取消極投資策略參與碳中和市場投資并不能從中獲益。反觀采取本文模型預(yù)測的投資策略,其經(jīng)超參數(shù)優(yōu)化后的年化收益率、夏普比率、勝率以及盈虧比分別為421.32%、1.064 0、87.27%和5.788 5,均高于超參數(shù)優(yōu)化前,且比簡單購買持有碳中和指數(shù)和滬深300指數(shù)的年化收益率分別高出459.97個百分點和451.73個百分點、夏普比率高出1.136 3和1.137 0、勝率高出38.77個百分點和40.28個百分點,盈虧比高出4.900 5和4.848 9;同時,超參數(shù)優(yōu)化后的風(fēng)險指標(biāo)度量值VaR和ES分別為33.85%和42.45%,也小于超參數(shù)優(yōu)化前、碳中和指數(shù)和滬深300指數(shù)。總而言之,超參數(shù)優(yōu)化不僅能夠優(yōu)化模型誤差,也能提高模型的投資應(yīng)用能力,采取VMD-BiLSTM-ATT預(yù)測模型的投資策略比持有碳中和指數(shù)和滬深300指數(shù)收益更高、風(fēng)險更低,本文模型在投資應(yīng)用方面具有良好的實用價值。
六、結(jié)論
本文將信號分解理論、注意力機制和深度學(xué)習(xí)網(wǎng)絡(luò)三者有機結(jié)合,提出了一種混合預(yù)測模型——VMD-BiLSTM-ATT模型。具體來說,模型分為以下三個步驟:步驟一,利用VMD分解得到各子序列,降低原序列的預(yù)測難度;步驟二,通過BiLSTM模型的雙向處理獲得子序列的特征輸出,然后引入注意力層依據(jù)各特征的重要程度對其進行加權(quán);步驟三,將特征輸入密集層獲得子序列預(yù)測結(jié)果,子序列預(yù)測值加總獲得最終預(yù)測值。
在預(yù)測模型評價上,本文依據(jù)MAE、RMSE、MAPE和R2四個誤差評價指標(biāo)對比分析了VMD分解和注意力機制的加入是否能夠提升循環(huán)神經(jīng)網(wǎng)絡(luò)模型的預(yù)測性能。結(jié)果顯示,VMD分解能夠降低序列復(fù)雜度,從而大幅度提升模型的預(yù)測精度;注意力機制的加入效果雖不如VMD分解,但也能在一定程度上降低模型誤差。VMD-BiLSTM-ATT模型在四個誤差評價指標(biāo)上均為最優(yōu),其值分別為15.953 0、19.067 3、0.008 2和0.988 1。在此基礎(chǔ)上,對模型的兩個重要超參數(shù)(VMD分解數(shù)和BiLSTM單元數(shù))進行超參數(shù)調(diào)整來尋找最優(yōu)超參數(shù)組合,結(jié)果發(fā)現(xiàn):當(dāng)VMD分解數(shù)K=7和BiLSTM單元數(shù)為90時,模型在總體趨勢上與超參數(shù)調(diào)整前保持一致,大多數(shù)模型的預(yù)測性能都在超參數(shù)調(diào)整后得到了提升,且本文模型提升幅度最高,MAE、RMSE和MAPE都下降了近50%,同時R2提升了0.85%。這也進一步說明了模型的有效性和魯棒性。
在預(yù)測模型的投資應(yīng)用價值上,本文進行了投資策略的構(gòu)造并根據(jù)模型預(yù)測結(jié)果計算測試集內(nèi)超參數(shù)優(yōu)化后、超參數(shù)優(yōu)化前和持有期相同的碳中和指數(shù)和滬深300指數(shù)的六個投資評價指標(biāo)。實證結(jié)果說明,超參數(shù)優(yōu)化后的VMD-BiLSTM-ATT模型不僅能夠降低模型誤差,而且提高了模型的投資應(yīng)用能力,采用本文模型的量化投資結(jié)果具有更高的收益和更低的風(fēng)險,年化收益率、夏普比率、勝率、盈虧比、VaR和ES分別為421.32%、1.064 0、87.27%、5.788 5、33.85%和42.45%。由此可見,本文模型在投資領(lǐng)域中具有良好的應(yīng)用價值。
參考文獻:
[1] SAEED MEO M, KARIM M Z A. The role of green finance in reducing CO2 emissions:An empirical analysis[J]. Borsa Istanbul Review, 2022,22(01):169-178.
[2] REZAEI H, FAALJOU H, MANSOURFAR G. Stock price prediction using deep learning and frequency decomposition[J]. Expert Systems with Applications, 2021, 169:114332.
[3]張浩楠,申融容,張興平,等.中國碳中和目標(biāo)內(nèi)涵與實現(xiàn)路徑綜述[J].氣候變化研究進展,2022,18(02):240-252.
[4]陳夢月,姚惠芳.碳中和股價指數(shù)的構(gòu)建與應(yīng)用[J].中國林業(yè)經(jīng)濟,2022(02):97-100.
[5]孫翊.碳中和指數(shù)構(gòu)建與指數(shù)波動研究[J].中國林業(yè)經(jīng)濟,2022(05):92-94.
[6]惠曉峰,柳鴻生,胡偉,等.基于時間序列GARCH模型的人民幣匯率預(yù)測[J].金融研究,2003(05):99-105.
[7]張貴生,張信東.基于微分信息的ARMAD-GARCH股價預(yù)測模型[J].系統(tǒng)工程理論與實踐,2016,36(05):1136-1145.
[8]楊剛,王文卓.碳中和背景下氣溫衍生品定價研究——基于ELM神經(jīng)網(wǎng)絡(luò)方法[J].金融發(fā)展研究,2021(08):66-73.
[9] CHANDRA R,GOYAL S,GUPTA R.Evaluation of deep learning models for multi-step ahead time series prediction[J].IEEE Access,2021,9:83105-83123.
[10] YANG P, WANG Y L, ZHAO S Y, et al. A carbon price hybrid forecasting model based on data multi-scale decomposition and machine learning[J].Environmental Science and Pollution Research,2023,30(2):3252-3269.
[11] SHEN G Z,TAN Q P,ZHANG H Y,et al.Deep learning with gated recurrent unit networks for financial sequence predictions[J].Procedia Computer Science,2018,131:895-903.
[12]楊青,王晨蔚.基于深度學(xué)習(xí)LSTM神經(jīng)網(wǎng)絡(luò)的全球股票指數(shù)預(yù)測研究[J].統(tǒng)計研究,2019,36(03):65-77.
[13]歐陽資生,路敏,周學(xué)偉.基于TVP-VAR-LSTM模型的中國金融業(yè)風(fēng)險溢出與預(yù)警研究[J].統(tǒng)計與信息論壇,2022,37(10):53-64.
[14] BARUA R,SHARMA A K.Dynamic Black Litterman portfolios with views derived via CNN-BiLSTM predictions[J].Finance Research Letters,2022,49:103111.
[15] CHANG Z H,ZHANG Y,CHEN W B.Electricity price prediction based on hybrid model of Adam optimized LSTM neural network and wavelet transform[J].Energy,2019,187:115804.
[16] WANG B,WANG J.Energy futures and spots prices forecasting by hybrid SW-GRU with EMD and error evaluation[J].Energy Economics,2020,90:104827.
[17] HUANG Y S,DENG Y.A new crude oil price forecasting model based on variational mode decomposition[J].Knowledge-Based Systems,2021,213:106669.
[18] LIU Y S,YANG C H,HUANG K K,et al.Non-ferrous metals price forecasting based on variational mode decomposition and LSTM network[J].Knowledge-Based Systems,2020,188:105006.
[19] QIU J Y,WANG B,ZHOU C J.Forecasting stock prices with long-short term memory neural network based on attention mechanism[J].PLoS One,2020,15(01):e0227222.
[20] OUYANG Z S,YANG X T,LAI Y Z.Systemic financial risk early warning of financial market in China using Attention-LSTM model[J].The North American Journal of Economics and Finance,2021,56:101383.
[21] ABBASIMEHR H,PAKI R.Improving time series forecasting using LSTM and attention models[J].Journal of Ambient Intelligence and Humanized Computing,2022,13(1):673-691.
[22]張鵬,黨世力,黃梅雨.基于機器學(xué)習(xí)預(yù)測股票收益率的兩步驟M-SV投資組合優(yōu)化[J/OL].中國管理科學(xué):1-14[2023-10-19].DOI:10.16381/j.cnki.issn1003-207x.2021.2308.
[23]CIPILOGLU YILDIZ Z,YILDIZ S B.A portfolio construction framework using LSTM-based stock markets forecasting[J].International Journal of Finance & Economics ,2020,27(02):2356-2366.
[24] DRAGOMIRETSKIY K,ZOSSO D.Variational mode decomposition[J].IEEE Transactions on Signal Processing,2014,62(03):531-544.
[25] Hochreiter S, Schmidhuber J. Long short-term memory[J]. Neural computation, 1997, 9(08): 1735-1780.
[26]李斌,林彥,唐聞軒.ML-TEA:一套基于機器學(xué)習(xí)和技術(shù)分析的量化投資算法[J].系統(tǒng)工程理論與實踐,2017,37(05):1089-1100.
[27] WEN F H,WU N,GONG X.China's carbon emissions
trading and stock returns[J].Energy Economics,2020,86:
104627.
[28]唐曉彬,董曼茹,張瑞.基于機器學(xué)習(xí)LSTM&US模型的消費者信心指數(shù)預(yù)測研究[J].統(tǒng)計研究,2020,37(07): 104-115.
[29]李沐勛.基于機器學(xué)習(xí)算法的信用風(fēng)險量化模型研究[J].金融經(jīng)濟,2023(04):75-83.
[30]? SEZER O B,GUDELEK M U, OZBAYOGLU A. Financial time series forecasting with deep learning:A systematic literature review: 2005-2019 [J]. Applied Soft Computing ,2020,90.
[31]歐陽紅兵,黃亢,閆洪舉.基于LSTM神經(jīng)網(wǎng)絡(luò)的金融時間序列預(yù)測[J].中國管理科學(xué),2020,28(04):27-35.
(責(zé)任編輯:唐詩柔)
Quantifying Carbon Neutrality Investment Research
Based on VMD-BiLSTM-ATT Forecasting Model
OUYANG Zisheng, TANG Bocong
(Business School, Hunan Normal University)
Abstract: The carbon neutrality index is an important tool and carrier for implementing the carbon neutrality strategy and promoting the green transformation of the economy. Accurately predicting the carbon neutrality index can provide a basis for the implementation of related policies and attract investors to participate in the carbon neutrality market and obtain returns. Therefore, this paper proposes a deep learning forecasting model that integrates data decomposition reconstruction and attention mechanism, the VMD-BiLSTM-ATT model, and applies it to the prediction and application of the carbon neutrality index. Specifically, the research is divided into three parts: first, four error evaluation indicators are used to verify that this model has the best predictive performance; second, the model hyperparameters are adjusted to obtain the optimal hyperparameter combination for higher prediction accuracy; third, six investment evaluation indicators are used as criteria to measure the investment application value of the model. Empirical results show that in terms of predictive performance, the VMD-BiLSTM-ATT model outperforms all benchmark models, and the predictive performance of the model is better after hyperparameter tuning; in terms of quantitative investment applications, the carbon neutrality index investment strategy based on this model achieves much better investment performance than the carbon neutrality index and Shanghai and Shenzhen 300 index with the same holding period, and hyperparameter tuning can further improve investment performance on this basis, proving that the model has good application value in quantitative investment.
Keywords: Carbon neutrality index; Deep learning; Variational mode decomposition; Attention mechanism
收稿日期: 2023-07-19
作者簡介:歐陽資生,教授,博士生導(dǎo)師,湖南師范大學(xué)商學(xué)院,研究方向為金融風(fēng)險管理與金融科技。
唐伯聰,碩士研究生,湖南師范大學(xué)商學(xué)院,研究方向為金融科技。
基金項目:國家社會科學(xué)基金項目“中國金融市場輸入性風(fēng)險測度與預(yù)警研究”(23BTJ043)。