DOI:10.3969/j.issn.1004-910X.2025.07.012 [中圖分類號]F205;F832.5 [文獻標識碼]A
引言
為有效應對日益嚴峻的全球氣候變暖與環境危機,我國于2020年制定了“雙碳”目標戰略,即2030年前實現碳達峰,2060年前達成碳中和。碳交易市場作為強有力的碳排放控制體系,是實現“雙碳”目標的重要抓手。碳交易價格與溫度、空氣質量指數和煤碳等因素相關性較高[1],其精準預測對于緩解環境問題、推進“雙碳”目標、為政府制定政策提供參考以及幫助企業管控碳資產與金融風險具有重要意義。然而,由于碳價格具有非線性、非平穩且高噪音的復雜特性,且受到能源、政策、經濟等外部環境影響,使得碳價格精準預測成為學術研究的熱點與難點。
目前,學術界有關碳價格的預測研究可分為兩類。第一類是基于多重碳價影響因素的預測研究。該類研究將氣候環境、能源價格以及宏觀經濟等結構化數據與預測模型相結合,以實現碳價格的精準預測。具體而言,崔煥影與竇祥勝采用EMD-GA-BP組合預測模型,將原始碳價格分解序列及宏觀經濟因素納入其中預測碳價格波動。王一蓉等[3]則在電力行業碳排放因素的基礎上,引入外生變量的自回歸模型預測全國碳價格。高長征等4通過皮爾森相關系數法識別關鍵影響因素,并運用CEEMDAN-Transformers智能機器學習方法對湖北碳價格進行預測。Mao與 Yu[5] 進一步構建了四維碳價格指標體系,采用FS-CEEMDAN一VMD-GWO-LightGBM多功能混合預測模型,從經濟形勢、碳交易市場、國際碳交易市場、化石能源4個維度預測全國碳價格。在此基礎上,學者們試圖將新聞文本[6]、投資者關注度[7]以及百度搜索指數[8.9]等非結構化數據納入模型,提出基于非結構化數據的組合預測模型,相較于傳統的非文本挖掘技術,這些方法在碳價格預測上準確性更高。然而,鮮有研究充分考慮了影響因素的降維處理和特征選擇的有效性,顯著提升了模型處理的復雜度。此外,模型中潛在的遺漏變量問題以及變量間的多重共線性,可能影響預測結果的精確性,降低模型預測的可靠性[10]
第二類研究是基于歷史數據的碳價格預測,涵蓋計量經濟模型、機器學習方法以及各模型混合等,僅以原始碳價格數據作為數據源,突破了上述研究的局限。為有效彌補傳統計量經濟模型對樣本數據穩定性、線性度要求高及模型結構與理論假設要求嚴格的缺點,不少學者引入機器學習對碳價格時間序列進行預處理與預測,結果表明機器學習方法在建模非線性和復雜的碳價數據方面更具有效性[1]。其中,ANN(Artificial Neural Net-work)具備捕捉變量之間高度復雜非線性關系的自適應映射能力與結構靈活性等優點[12]。CNN(Con-volutionalNeuralNetwork)擅長處理并捕獲空間結構數據[13]。RNN(Recurrent Neural Network)因其擁有以上深度神經網絡所不具備的強大記憶特性,更適用于順序數據的處理,在時間序列預測方面優勢明顯[14]。然而,RNN在模型訓練中,通常存在梯度爆炸或梯度消失的隱患。為克服這一問題,學者創新性引入了具備門控機制的LSTM(LongShort-TermMemoryNeural Network),該方法也已成為時序預測任務中的主流解決方案[15]
Hochreiter和Schmidhuber[16]提出的LSTM是一種經典的深度學習算法,廣泛應用于時間序列建模問題。通過創新性地引人門控機制,有效解決了傳統RNN在處理長序列時的梯度消失和梯度爆炸問題,顯著提升了模型捕捉長距離依賴關系的能力[17]。每個LSTM神經元由輸入門、遺忘門和輸出門3個主要門控組成。其中,輸入門和輸出門分別負責控制網絡的輸入結構和記憶單元的輸出結構,而遺忘門用于調節記憶單元的遺忘程度。通過這些門控機制,LSTM能夠在每個時間步選擇性地保留重要的輸入特征,有效解決傳統RNN在反向傳播過程中,梯度逐漸變小,導致網絡難以更新早期時間步的權重,亦或者由于梯度逐漸擴大,導致權重更新不穩定的問題[18],從而有效地處理長距離依賴關系,在時間序列處理中具有重要的理論和實踐意義,成為現代時間序列分析中的前沿模型[19]。與單向LSTM相比,BiLSTM(Bidi-rectionalLong-Short TermMemoryNeuralNetwork)通過引入前向和反向處理層,顯著提升了模型性能。其從左到右和從右到左對輸入序列進行雙重優化,增強了模型對時間序列的學習能力;另外,其通過兩個連接輸入和輸出單元的LSTM神經元,使輸出單元既能保留來自過去的輸入信息,又能捕捉未來時刻的潛在模式[20],大幅擴展了信息處理的范圍和深度,在解決時間序列數據中的長間隔和延遲問題時表現出色[21]
基于此,為探索一種基于機器學習神經網絡的新型混合預測模型,以有效提高碳價格的預測精度,本文采用BiLSTM方法,創新性地選取兩個具備相同結構的LSTM框架以處理隨機IMFs(In-trinsicModeFunctions)組合與所有IMFs樣本,前者為預防框架,防止過擬合問題,后者則為預測框架,實現預測功能。將兩平行框架的輸出值作為一個新輸入特征,傳輸到全連接神經網絡中,生成最終的碳價格預測結果。
能源價格的非平穩性及高噪聲特性對精確預測構成了重大挑戰[22],為實現碳價格的精準預測,對碳價序列進行分解降噪處理極其重要。本文將子序列分析納人預測模型,使原始時間序列解構為一系列有限相關的靜止分量,即固有模態函數,從而更精確地揭示序列的內在特性[23]。在能源價格預測領域,EMD(Empirical Mode Decomposition)、EEMD(Ensemble Empirical Mode Decomposition)、CEEMD(Complete Ensemble Empirical Mode Decom-position)以及基于VMD(VariationalModeDecompo-sition)的算法已被證實為有效的技術手段[20]。與經典的小波變換方法相比,EMD及其衍生算法無需預設基函數,克服了前者的非自適應性局限[24」,在處理非線性、非平穩信號方面呈現明顯優勢,但也存在著模態混疊的缺陷[10]。VMD 算法雖具有比EMD更好的處理非平穩信號與分解的能力,但也具有參數選擇敏感性、計算復雜度高、易引入額外噪音等方面的不足[25]。因此,本文選用EMD算法展開對歷史碳價格數據的分解降噪處理,并創新引入數據增強技術,加強數據隨機組合,提高模型對關鍵特征信息的提取能力,不僅在一定程度上緩解了模態混疊問題對預測模型的負面影響,還克服了樣本內預測效果好而樣本外預測效果不理想的過擬合困境。
因此,本文基于湖北碳交易市場的2532份日度收盤價格數據,開展湖北碳價格預測的實證研究。將EMD算法、數據增強技術和雙向長短期記憶神經網絡BiLSTM框架相結合,提出Mod-EMD-BiLSTM新型混合預測模型,邊際貢獻如下:
(1)構建了融合數據增強技術、變分模態分解與雙向長短期記憶神經網絡的新型混合預測框架,即由預防和預測框架組成的Mod-EMD-BiL-STM碳價預測模型,有效防止過擬合問題,顯著提高模型預測精準性。
(2)本文并非傳統地將EMD的分解序列IMFs直接輸入到預測模型中展開訓練,而是創建預防和預測兩大平行機制,采取獨立框架處理IMFs的隨機組合,減輕整體模式對數據端點極值的可能依賴,降低意外噪聲信息的產生。此外,引入數據增強思想,將數據增強與預防模塊結合,增加數據組合量,增強模型對IMFs中有效信息的提取能力,緩解了由EMD模態混疊缺陷為模型預測的負面影響,防止因訓練集數據不足而導致嚴重的過擬合問題。
1 研究方法
1. 1 EMD
EMD是一種自適應信號處理技術,它無需預先了解信號的頻率特性,而是基于數據本身的內在特征來分解非平穩、非線性的碳價格時間序列。其IMF需滿足以下條件:在整個信號上的極值點數目相同或最多相差1個;在任何點上,通過IMF的局部均值計算得到的殘差均值為0。其分解步驟如下:
(1)構建由整個數據區間所有局部極大值與極小值連線而成的上下包絡線。(2)從原始信號中減去局部平均值,得到初始 MIF(Modal Instantaneous Function)。(3)若MIF滿足IMF的條件(局部同質且在所有時間尺度上其瞬時頻率變化有限)則作為第一個IMF,否則進入下一步循環。(4)重復上述步驟,對剩余信號進行迭代處理,每次提取1個新的IMF分量,直至剩余部分變為趨勢項或接近于零的噪聲。(5)最終得到一系列IMFs和1個殘余項(Re-sidual)。其中,每個IMF代表原信號的1個固有振動模式,頻率由高到低排列,殘余項則通常包含信號的全局趨勢信息。
1.2 BiLSTM
BiLSTM由兩個相同結構的LSTM組合而成,分別作為處理隨機IMFs組合的預防框架與實現預測功能的預測框架。LSTM作為一種有效處理時間建模問題的深度學習算法,由輸入門、遺忘門與輸出門3個門控機制組成,具備良好的保持、感知與更新長期時間模式的能力,其內在結構原理如圖1所示。此外,BiLSTM引入雙向機制,可更好處理更多內存信息,有效解決時間序列數據預測的延遲和長間隔問題,從而具備比常規LSTM更好的預測性能[26]

圖1中, xt 代表 χt 時刻時間步的輸入狀態, Ct 為記憶細胞, ht 代表輸入下一時間步的隱藏狀態,ht-1 代表上一時間步的隱藏狀態。LSTM的更新過程大致如下:(1)由遺忘門(ForgetGate, ft )接收xt 與 ht-1 ,進而確定前一時間步的記憶細胞 Ct-1 中哪些信息應該被遺忘,并基于式(1)計算收斂于[0,1]范圍內代表遺忘程度的 ft 值;(2)基于輸入門(InputGate, it )同樣接收 xt 與 ht-1 ,決定當前時間步的輸入信息 (xt) 哪些需存儲于記憶細胞 Cι ,并基于式(2)計算[0,1]內的 it 值,表示新信息進入細胞狀態的比例。另外,圖中的 σ 層控制信息的更新過程且式(5)的 nt 值代表細胞狀態候選值,而tanh層則是創建候選值項 Cι 并基于遺忘門與輸出門的結果輸入式(3)來更新 Ct 細胞狀態;(3)利用輸出門(Output Gate, ot )確保當前時間步的記憶細胞 Cι 中哪些信息被輸出到下一時間步的隱藏狀態 ht 并計算[0,1]范圍內代表輸出信息量的 ot 值。需注意,在式(1)\~(8)中,A、 B 均表示權重矩陣, b 代表偏置項,符號 * 表示逐元乘法, tanh(Σ) 表示雙曲正切函數且輸出值在[-1,1]范圍內。 σ(θ) 表示Sigmoid函數,能夠將輸出值收斂至[0,1]范圍內,并且若輸出值為0,則所有信息均無法通過激活函數,輸出值增加,則允許更多信息,當輸出值為1時,則能夠保留所有信息。
式分別如下所示:

其中, yt 代表真實值,
代表預測值, N 為樣本長度。 R2 反映預測模型的擬合優度和解釋能力,其值與1越接近,預測效果越好;MSE和MAE主要評估預測結果與真實值的偏差程度,其值越小,模型預測越精確;DA用于衡量模型碳價格預測方向的精準性,DA值越高,表明模型方向預測精度越高,該模型預測性能越好。
2 模型構建
本文提出一種基于數據分解與LSTM技術融合的新型混合預測方法。傳統方式將分解后的IMF分量直接代入預測模型,此做法在數據豐富且相對穩定時預測較準,但在數據低頻、非線性甚至高噪聲時,難以獲取足夠的樣本點來訓練深度學習預測模型,無法充分捕捉樣本數據中隱藏的關鍵特征信息,難以避免過擬合問題。因此,本文引入數據增強技術和預防框架,加強輸人數據組合,擴大訓練集數據量,使得預測框架充分提取IMFs模態分量所隱藏的重要預測信息,從而提高模型的精準性,消除過擬合問題。該預測模型由預防框架與預測框架組成,完整模型框架如圖2所示,具體步驟如下:

1.3 評價指標
為更好地評估預測模型的優越性,本文選取盡可能多的不同損失函數來綜合判斷模型預測的精確性,將決定系數 (R2 )、均方誤差(MSE)、平均絕對誤差(MAE)、平均絕對百分比誤差(MAPE)和方向精度(DA)作為評價標準,各項指標計算公
(1)數據選取與預處理。基于Python爬蟲技術獲取湖北碳價格數據,通過EMD方法分解原始碳價格序列,得到內在模態分量。利用數據增強技術,增強數據組合,獲得一半IMFs的隨機組合。
(2)處理后數據代人模型框架。將數據增強技術生成的隨機組合輸入預防框架,提取模型訓練過程中所有IMFs隱藏的本質特征信息,記為結果1。該操作旨在強化組合,避免特定IMF中噪聲信息對碳價格預測產生干擾。將所有IMF數據輸入預測框架,得到初始預測結果,記為結果2。將結果1與結果2串聯生成的新輸入特征輸入到全連接層中,預測最終碳價格。
(3)模型訓練與碳價格預測。通過計算原始碳價格與預測值之間的均方誤差MSE損失值,迭代優化神經網絡參數。并重復上述步驟,直至MSE收斂至特定值0.01,固定模型參數,使用訓練好的模型預測樣本外碳價格。
(4)模型檢驗。用 R2 、MSE、MAE、MAPE、DA這5種評價指標來衡量模型的預測性能,并通過實證分析與模型比較進一步確定預測模型的精準性與有效性。

3 實證分析
3.1 數據來源
湖北碳排放交易市場是我國首批高度市場化的碳排放交易市場之一,憑借成熟交易機制和海量的交易數據,在全國碳排放配額成交量與成交額中占據重要地位。本文基于湖北碳排放權交易中心官方網站(https://www.hbets.cn),利用Python爬蟲技術,爬取2014年4月2日至2024年1月31日碳交易日度收盤價格的2532份數據,作為研究樣本,對碳價格預測進行深人研究。湖北碳交易價格曲線如圖3所示。

為更好地訓練模型并檢驗其性能,本文參考Guan與 Gong[27] 的做法,將樣本數據按9:1的比例劃分為訓練集(2279條)與測試集(253條),如圖3中實線與虛線所示。其中,2023年1月26日之前的數據用于模型訓練,其余數據作為測試集,用于檢驗模型的精準性與優越性。
3.2 數據預處理
3.2.1 數據分解
經驗模態分解(EmpiricalModeDecomposition,EMD)是一種自適應的信號處理技術,它無需預先了解信號頻率特性,通過數據本身的內在特征來分解信號。EMD將復雜非平穩信號分解為多個獨立、易于理解的IMF分量(內在模態分量),每個分量反映信號在不同時間尺度上的自然波動特性,有助于更深人地理解與分析信號內容。
本文采用EMD方法來處理非平穩、非線性、高噪聲的原始碳價格時間序列數據,并將其分解為10個IMF和1個殘余項(Residual)。其中每個IMF代表原始信號的一個固有振動模式,頻率由高到低排列。殘余項則包含信號的全局趨勢信息。最終碳價格分解序列如圖4所示,分解后的子序列從低頻到高頻依次呈現。IMF1及原始序列的峰值信息與長期趨勢高度相關,其他分量包含短期或中期的碳價格波動信息。分解后的子序列相較原始數據更具規律性與周期性,因此將其代入不同模型預測,可顯著提高預測效果。
3.2.2 數據增強
本文創新性地引人數據增強思想,采取EMD分解后的數據增強技術,提高預測模型的訓練性能與精準度。將訓練集與測試集比例設置為 9:1 從而擴大訓練集數據量,避免因訓練集數據不足導致的過擬合問題;從數據預處理著手,摒棄傳統地將EMD分解子序列IMFs直接輸入到預測模型中展開訓練,而是運用數據增強技術,強化數據組合,更有效地提取IMFs中隱藏的一般特征信息,提高模型精準性。以下是數據增強技術的具體內容。

(1)基于圖5所示原理,隨機選取5個分解子序列(一半的IMF)作為輸入特征,擴充訓練集數據,使數據組合數量提高252倍,如式(14)所示;(2)在往后的500次迭代中,每過10個Epoch,將會任意選擇一個IMF組合輸人神經網絡;(3)對這252個組合平均進行4\~5輪模型訓練,以此充分減少數據組合隨機性對模型預測性能的干擾,增強模型的魯棒性與可重復性。綜上,神經網絡習慣通過不特定的組合序列學習,因此在模型訓練時,其將基于整體視角有效提取隱藏在子序列中的一般特征模式。另外,由于IMF均源自于原始碳價格序列的分解,因此,在各歷史階段,每個序列所包含的特征信息給碳價格預測帶來的影響都是相近的,且不會因IMF成分比重改變而導致影響程度產生變化的狀況。

3.3 Mod-EMD-BiLSTM模型預測
鑒于碳價格數據具有高噪聲和非線性特征,為精準捕捉其自然波動規律并開展預測。本文首先基于EMD算法將日度碳交易價格時間序列分解為10個分解子序列(IMF分量)和1個殘余項。并將獲取的子序列按 9:1 的比例劃分為訓練集(2279條)與測試集(253條)。
其次,鑒于將分解后的IMF分量直接作為輸入特征進行碳價格預測的傳統做法,難以充分提取復雜且低頻時間序列中的關鍵預測信息,并難以有效緩解因訓練集數據不足而導致的過擬合問題,因此本文創新性地引入數據增強技術并將其與預防框架有效融合,這不僅克服了傳統預測方法的缺陷,還有效提高預測模型的穩定性與精準性。具體而言,隨機生成的5個IMF組合被輸入預防框架,用于提取模型訓練中所有IMFs隱藏的關鍵特征信息,輸出結果1;同時,將所有IMF分量輸入預測框架生成初始預測值,記為結果2。將結果1與結果2聯合生成的新變量傳送至全連接層,輸出最終的碳價格預測結果。值得注意的是,預防與預測框架為兩個獨立結構,旨在處理IMF分量組合,以防止過擬合及間接信息干擾。此外,預防框架通過隨機生成的反饋組合避免對IMF中的噪聲信息進行過度提取。

最后,計算真實值與預測結果間的均方誤差損失值,當損失值為0.01時,模型將停止訓練,優化并固定其參數,接著利用訓練好的預測模型開展碳價格的精準預測。此外,本文選用決定系數 (R2 )、均方誤差(MSE)、平均絕對誤差(MAE)、平均絕對百分比誤差(MAPE)和方向精度(DA)五項指標對模型預測性能進行全面評估。
3.4基準模型的構建與參數設置
為驗證本文構建的Mod-EMD-BiLSTM模型的優越性,選取并設計15種機器學習技術模型作為基準,進行橫向與縱向對比分析。
選用Ridge回歸模型、多層感知器模型(MLP)、決策樹模型(DT)、隨機森林模型(RF)、Adaboost模型(Ada)和支持向量回歸模型(SVR)6種經典機器學習模型。此外,因LightGBM以其高效性與準確性在數據挖掘領域表現突出,亦被納入橫向對比模型。各模型的具體參數設定詳見表1。
為進一步探索預防框架性能,本文創新性地設計了八大深度學習模型展開縱向比較。其構建原理如下:為檢驗本模型預防框架是否有利于提升模型預測精度并規避過擬合問題,本文基于預測框架分別構建了輸入特征為滯后3個月碳價序列的LSTM模型與所有未進行置換處理IMF分量的EMD-LSTM模型。此外,為證實LSTM在防止過擬合方面的優越性,本文用普通循環神經網絡和人工神經網絡替換各模型中的LSTM神經元,形成6種競爭模型:RNN、EMD-RNN、Mod-EMD-RNN、ANN、EMD-ANN、Mod-EMD-ANN。考慮到LSTM和RNN神經網絡的層數均為2,為保持一致性,將兩個人工神經網絡代替為1個BiLSTM神經元。因此,1個ANN擁有3個人工神經網絡,輸出維數分別為100、32和1。此外,各模型參數設置基本與Mod-EMD-BiLSTM參數一致,見表1。

3.5 實驗結果與分析
3.5.1 模型預測結果
比較真實值與預測值間的誤差大小是衡量模型預測性能不可或缺的手段之一。本文基于樣本內、樣本外以及全樣本2個范圍,繪制各模型的預測趨勢圖,并通過 R2 、MAE、MSE、DA4個常見誤差評價指標,初步驗證模型有效性。由圖6\~9可見,本模型在樣本內外均展現良好的預測趨勢,預測結果與真實值也存在著良好的擬合效果。基于整體視角,無論訓練集還是測試集,模型均能有效捕捉碳價格的劇烈波動,顯示出較強預測能力。進一步分析評價指標,結果表明在3種數據范圍內的模型指標表現穩定,無明顯差異,且DA值接近0.8,進一步凸顯模型的穩定性與精準性,具體數據詳見表2。



3.5.2 不同模型的比較與評價
為突顯本文構建的預測模型的優越性,下文對3.4節所提各基準模型與本模型進行橫向與縱向比較。并通過 R2 、MSE、MAE、MAPE、DA這5種評價指標評估預測性能。由圖6\~9可初步判定,決策樹模型和Mod-EMD-ANN模型在樣本內外預測效果較差。表3表示,盡管本模型的 R2 、MSE、MAE、MAPE四類誤差評價指標值均排名第三,但與最優值間差距較小,并且本模型的方向預測精度( DA=79.0514Ω )位居第一。因此本模型兼具方向預測精度與良好的預測性能。


(1)比較輸入特征均為碳價格序列的3個深度學習模型ANN、RNN、LSTM發現,三者的 R2 、MSE、MAE、MAPE指標結果無較大懸殊,但是LSTM的DA值最優,表明其在精準預測碳價格方面具備優勢。此外,相較于簡單的線性機器學習模型Ridge,以上3種單一深度學習模型在預測性能方面仍有提升的空間。
(2)當以IMFs內在模態分量為輸入特征時,ANN模型各項指標值由 R2=0.851 ! MSE=1.2405 MAE=0.7553 一 MAPE=0.0176 : DA=62.0553 顯著上升到EMD-ANN模型 R2=0.9261 MSE=0.6153 、MAE=0.5945 、 MAPE=0.0138 : DA=77.4704 ,且RNN與LSTM模型的DA分別由61.2648、64.0316提高至模型EMD-RNN的69.17和EMD-LSTM的66.4032。這表明,融合數據增強的EMD分解技術有利于提高后期模型預測的精準性與有效性。
(3)將分解得到的IMFs輸入Prevention框架進行預處理,EMD-RNN模型由 R2=0.7307 、MSE=2.2415 、 MAE=1.0246 、 MAPE=0.0236 、DA=69. 17顯著上升至Mod-EMD-RNN模型 R2=Φ 0.92、 MSE=0.6663 、 MAE=0.586 、 MAPE=0.0135 DA=76.6798 ;EMD-LSTM模型的DA值由66.4032提高至本模型的79.0514。該結果表明,Mod-EMD-RNN和Mod-EMD-BiLSTM模型的預測能力比EMD-RNN和EMD-LSTM模型均有了明顯提高。預防框架的預處理機制能有效增強模型捕捉隱藏信息的能力,提高模型的預測精度并規避過擬合。
(4)與各基準模型相比,本模型具備良好的預測性能,方向預測精度最佳,這間接證明LSTM神經網絡在處理復雜、非平穩、高噪音時間序列時,具備卓越的關鍵信息提取能力及門控機制對低頻復雜序列建模的適應性和泛化能力。橫縱向對比進一步驗證了本文提出的Mod-EMD-BiLSTM模型的優越性和卓越的預測性能。

4結論與展望
隨著碳金融市場的日臻完善與碳定價機制的日漸成熟,精準預測碳價格對推動低碳經濟發展、應對氣候變化意義重大。本文基于機器學習技術構建了融合數據增強、經驗模態分解和雙向長短期記憶技術的新型混合預測模型,以提升其精準性與有效性,為碳價格預測領域注人新思維并提供理論參考。(1)利用EMD技術處理非平穩、非線性的碳價格時間序列,生成較平穩的內在模態分量(IMF);(2)引入數據增強技術,將其與預防框架有效結合,旨在處理IMF分量組合,強化預測模型對關鍵預測信息的提取能力,提高其預測性能并消除過擬合困境。再將所有的IMF子序列輸入預測框架生成初始預測值;(3)將預防與預測框架生成的結果輸人至BiLSTM網絡全連接層進行精準預測。對比分析表明,本文所提模型具備優越性與精準性,呈現出最佳的碳價格方向預測精度。本文的研究結論如下:
(1)提出一種結合數據增強、經驗模態分解和雙向長短期記憶技術的新型混合預測模型,不但能夠有效地捕捉變量之間高度復雜的非線性關系,提取隱藏于IMFs模態分量的有效預測信息,而且規避了由訓練集數據不足導致的過擬合問題。相較于其他流行的機器學習和深度學習模型,本文預測模型具備最佳的樣本外方向預測精度,呈現穩定且優越的碳價格預測性能。
(2)創新性地引入數據增強技術,并將其與EMD分解方法相融合,不僅擴充訓練數據,還自適應地將非線性、非平穩、高噪音的碳價格序列分解為容納更多預測信息的IMFs模態分量,進而增強LSTM神經網絡對時間序列的建模能力,避免模型花費大量時間尋找自標變量的預測因子,并消除過擬合,提高預測模型的精準性與魯棒性。
(3)Mod-EMD-BiLSTM新型混合預測模型涵蓋預防與預測兩個創新機制,引入預防框架,有利于充分捕獲IMFs組合中隱藏的關鍵特征信息并防止特定IMF中噪聲信息對模型預測產生干擾。接著將預防框架提取的有效預測信息與所有IMF子序列輸入預測框架后生成的初步預測結果串聯至全連接層,輸出最終預測結果,從而提供模型的預測性能和泛化能力。
伴隨人工智能熱潮的興起,機器學習以及深度學習的方法逐漸被應用于碳價格預測領域。本文提出的Mod-EMD-BiLSTM新型混合預測框架顯著提高了碳價格預測精度,為碳價格預測增添新思路,并為該領域的預測者和投資者提供理論借鑒。此外,未來將嘗試引人二次分解技術,并將經濟、政策、新聞影響力、國際形勢等與碳價格相關的重要影響因素納入研究范圍,以增強模型的預測性能,擴大其在股票市場、債券市場等其他領域的預測通用性與有效性。
參考文獻
[1]HanM,DingL,ZhaoX,et al.ForecastingCarbonPricesintheShenzhenMarket,China:TheRoleofMixed-frequencyFac-tors[J].Energy,2019,171:69~76.
[2]崔煥影,竇祥勝.基于EMD-GA-BP與EMD-PSO-LSSVM的中國碳市場價格預測[J].運籌與管理,2018,27(7):133~143.
[3]王一蓉,陳浩林,林立身,等.考慮電力行業碳排放的全國碳價預測[J].中國電力,2024,57(5):79~87.
[4]高長征,李東偉,王秀娜,等.利用智能機器學習方法對區域碳排放權交易價格預測研究——基于湖北碳市場數據的分析[J].價格理論與實踐,2022,(4):89~93,205.
[5]MaoYQ,YuXB,etal.AHybridForecastingApproach forChina'sNational Carbon Emission Allowance Priceswith BalancedAccuracyand Interpretability[J].Journal of Environmental Mana-gement,2024,351:119873.
[6]張大斌,黃均杰,凌立文,等.融合新聞影響力衰減的碳價格多元分解集成預測[J].河南科技大學學報(自然科學版),2024,45(1):51~61,7~8.
[7]PanD,ZhangC,ZhuD,etal.CarbonPrice ForecastingBasedonNews Text Mining Considering Investor Attention [J].Envi-ronmental Scienceand Pollution Research,2O23,30(11):28704~28717.
[8]劉金培,張了丹,朱家明,等.非結構性數據驅動的混合分解集成碳交易價格組合預測[J].運籌與管理,2023,32(3):149~154.
[9]周熠烜,陳華友,周禮剛,等.基于非結構化數據的LLE-WOA-LSSVR碳價格組合預測模型[J].合肥工業大學學報(自然科學版),2022,45(4):570~576.
[10]高楊,李健.基于EMD-PSO-SVM誤差校正模型的國際碳金融市場價格預測[J].中國人口·資源與環境,2014,24(6):163~170.
[11]Xu YY,Dai YF,Guo L L,et al.Leveraging Machine Lear-ning to Forecast Carbon Returns:Factors from Energy Markets [J].Applied Energy,2024,357:122515.
[12] Cicek Z I E,Ozturk Z K. Optimizing the Artificial Neural Net-work Parameters Using a Biased Random Key Genetic Algorithmfor Time Series Forecasting [J].Applied Soft Computing,2021,102:107091.
[13]JiL, Zou Y C,He KJ,et al. Carbon Futures Price Forecas-ting Based with ARIMA-CNN-LSTM Model[J]. Procedia Com-puter Science,2019,162:33~38.
[14]Fern(ndez-Martinez D, Jaramillo-Morán M A. Multi-step HourlyPower Consumption Forecasting in a Healthcare Building with Recur-rent Neural Networksand Empirical Mode Decomposition[J].Sen-sors,2022,22(10):3664.
[15]ZhouF,Huang Z,Zhang C,et al. Carbon Price ForecastingBased on CEEMDAN and LSTM[J]. Applied Energy,2022,311: 118601.
[16]Hochreiter S,SchmidhuberJ.Long Short-term Memory[J].NeuralComputation Mit-press,1997,9(8):1735~1780.
[17]Yu,Lean,Liang,et al.Predicting Monthly Biofuel Produc-tionUsing a Hybrid Ensemble Forecasting Methodology[J].In-ternational Journal of Forecasting,2022,38(1):3~20.
[18]Baek Y,Kim H Y. ModAugNet:A New Forecasting Frame-work for Stock Market Index Value with an Overfiting PreventionLSTM Module and a Prediction LSTM Module[J].Expert Sys-tems with Applications,2018,113:457~480.
[19]Houdt G V,Mosquera C,Napoles G.A Review on the LongShort-termMemoryModel[J].Artificial IntelligenceReview,2020,53(8): 5929~5955.
[20]Lin Y,Lu Q,TanB,et al. Forecasting Energy Prices Using aNovel Hybrid Model with Variational Mode Decomposition[J].Energy,2022,246:123366.1~123366.16.
[21]Tian P,Zhang C,Zhou JZ,et al. An Integrated Framework ofBi-directional Long-short Term Memory(BiLSTM)BasedonSine Cosine Algorithm for Hourly Solar Radiation Forecasting[J].Energy,2021,221:119887.1~119887.19.
[22]Huang YS,Deng Y.A New Crude Oil Price Forecasting ModelBased on Variational Mode Decomposition[J].Knowledge-basedSystems,2021,213:106669.
[23]Zhang K,CaoH,TheJ,et al.A Hybrid Model for Multi-step CoalPrice Forecasting Using Decomposition Technique and Dep Lear-ning Algorithms[J]. Applied Energy,2022,(306):118011.1~118011. 21.
timeAlgorithm for Signal Analysiswiththe Help oftheWaveletTransform[A]//Wavelets:Time-frequencyMethodsandPhaseSpaceProceedings of the International Conference[C].Marseille,France,December14~18,1989:286~297.[25]Wu LL,TaiQR,BianY,et al.Point and Interval ForecastingofUltra-short-term Carbon Price in China [J].Carbon Manage-ment,2023,14(1):1~16.
[26]吳麗麗,部慶瑞,卞洋,等.基于GA-VMD與CNN-BiL-STM-Attention模型的區域碳排放交易價格預測研究[J].運籌與管理,2024,33(9):134~139.
[27]Guan,Keqin,Gong,etal.ANewHybrid Deep Learning ModelforMonthly Oil Prices Forecasting[J].Energy Economics,2023,128:107136.
[Abstract]Accurate predictionofcarbon pricescanprovidequantitative supportandreferencebasisforclimate policy formulation,rationaldecisionmakingof investors,andmaintaining thestableoperationofthecarbonmarket.Thisarticleproposesao velhybrid machinelearning Mod-EMD-BiSTMpredictionmodelthatcombinesdataaugmentation,empirical mode decomposition, andbidirectionallongshorttermmemorytechniques.Specifically,theoriginalcarbonpriceseriesisfistsubjectedtoempirical modedecompositiontoobtainaseriesofrelativelystableandlownoise intrinsicmodecomponents(IMF).Secondly,introducedataaugmentationtechniquestoenhancedatarecombinationandrandomlygeneratehalfoftheIMFcombinations.Furthermore,based onthetwoparalelmechanismsofpreventionandpredictioninthismodel,theIMFcompositecomponentsarefurtherpreprocesed andmodeltrainingiscarrdout.Fially,theoutputvauesoftetwoframeworksareintegratedtroughthefullycoectedlayerf the BiLSTMneural network toobtainthefinalcarbonpricepredictionresults.OnthebasisofestablishingapredictionmodelempiricalesearchisconductedbycrawlingthedailyclosingpricesofcarbontradinginHubei’scarbontrading marketfrom2014to 2024.Teresultsshowthatthemodelestablishedinthisarticleexhibitsthebestdirectionpredictionaccuracycomparedtotheother 16 benchmark models,reflecting the superior prediction performance and good practicality of the model.
[Key words]carbon finance;machine learning;empirical mode decomposition;BiLSTM;data augmentation technology: carbon market mechanism;directional prediction accuracy;time series analysis
[Jelclassification]O16;F18(責任編輯:張舒逸)