佟 磊,張 媛,吉宇豪,吳思青
(1.東北大學 工商管理學院,遼寧 沈陽 110819;2.首都經濟貿易大學 財政稅務學院,北京 100070)
在現有針對時間序列的預測模型的研究中,牛紅麗等[1]提出用GRU模型預測股票價格指數;朱俊蓉等[2]根據ARIMAX模型,基于人民幣匯率的時間序列進行預測;黃玉成等采用LSTM模型,基于以往股票價格這一時間序列進行預測。基于以上研究內容,結合學者的研究和現實情況,將預測模型相互比較,提出一種基于EMD-LSTM預測模型與夏普比率風險回溯的交易策略。
文章主要考慮交易者同時持倉黃金和比特幣兩種交易物時的情況,數據分別取自2016年9月11日至2021年9月10日黃金與比特幣市場五年交易期內各交易日的交易物收盤價,即一盎司黃金的美元收盤價與指定日期單個比特幣的美元價格。
(1)只進行做多操作,不考慮做空的情況;
(2)在每日臨近收盤時執行交易;
(3)認為數據中的每日價格均為收盤價格。
為了能滾動地訓練、測試、預測基于價格的時間序列,設置一個數據滾動窗口,將時間序列預測問題轉化為經典的監督學習問題。令滯后特征為7(lag_days = 7),即在訓練集中,每日使用前7日的數據進行訓練得到訓練集的標簽,在測試集中,每日使用前7日的數據進行訓練得到最新的預測數據,往復進行,動態地不斷生成固定數量的訓練集和測試集。
經驗模態分解(EMD)是由Huang等[3]提出的自適應信號時頻處理方法。EMD從非線性、非平穩的對數收益率時間序列中根據數據本身基于時間尺度的信號進行分解,分解出有限個組內稟模態函數(IMF),分解步驟如下:
(1) 找出時間序列中所有的極大值和極小值;
(2) 用三次樣條插值函數將所有極值點擬合到上包絡U(t)和下包絡L(t)上;
(3) 計算上下包絡線的局部平均值m(t):
(4) 從S(t)中減去m(t),得到新的時間序列h(t)。
h(t)=x(t)-m(t)
(5) 用h(t)作為新的輸入序列重復步驟 (1)~(4) ,直到h(t)的平均值接近零,此時得到第一個模態函數IMF,記為Ci(t) (i=1,2,3,…,N)。
(6) 將Ci(t)從原始序列S(t)中分離出來,得到一個沒有高頻分量的差分序列:
(7) 以ri(t)作為新的輸入序列重復步驟(1)~(6),直到滿足終止條件(通常使得最后的余數滿足單調性)。
通過上文中得到的記錄為Ci(t)的諸多IMF,可將S(t)分解結果表示為:
在本模型中,黃金和比特幣的交易市場與金融市場類似,其價格變動是一個非線性、非平穩的復雜動態系統。在將金融時間序列輸入深度學習框架之前,筆者需要對數據進行預處理。首先處理原始對數收益率的時間序列S(t)。
計算某一日的對數收益率r,將對數收益率作為自變量輸入到EMD中:
ri=ln(pi)-ln(pi-1)
使用Python編寫EMD程序,可得到比特幣和黃金的數個模態函數IMF。見圖1。

圖1 EMD處理黃金數據結果
LSTM是深度遞歸神經網絡的代表,尤其擅長處理序列數據。其引入了門控制單元系統,使用不同的“門”來讓網絡學習。
LSTM的門結構:
其中,激活函數σ是在0和1之間具有值的Sigmoid函數,bf、Uf、Wf分別是偏差、輸入權重和遺忘門的遞歸權重。

其中,b、U、W表示偏差、輸入權重和LSTM單元中遞歸權重。
其中,激活函數σ是sigmoid函數,x(t)是當前的輸入向量,h(t)是當前的隱含層向量,bg、Ug、Wg分別表示輸入門偏差、輸入權重和遞歸權重。
其中,b0、U0、W0分別表示偏置、輸入權重和輸出門遞歸權重。
得益于三個控制門和存儲單元,LSTM能容易地保持、讀取、復位和更新長時間信息。另外,由于LSTM內部參數的共享機制,可以通過設置權重矩陣的維度來控制輸出的維度。LSTM 在輸入和反饋之間建立了一個長時間的延遲。梯度既不會爆炸也不會消失,因為存儲單元的內部狀態保持著連續的誤差流[4]。
EMD處理時間序列后,用Python編寫LSTM程序以滯后特征=7的數據滾動窗口動態往復地訓練和預測,得到以下預測結果。詳見圖2、圖3和表1。

圖2 EMD-LSTM對比特幣價值擬合效果

圖3 EMD-LSTM對黃金價值擬合效果

表1 擬合曲線方差
可以看到,預測價格曲線與實際價格曲線高度擬合,EMD-LSTM模型預測效果極佳。
首要計算預期收益率。
由以上的預測模型,在每日臨近收盤時給出明日的預測值,并決定交易。此后,設定一個交易閾值τ,經過交叉驗證調試,發現閾值設置為比特幣τB=8%、黃金τB=0.7%時表現較為優異,收益較高。設黃金的交易費用率αG=2%,比特幣的交易費用率αB=1%。
操作策略為:
式中,“h”表示不操作,“1”表示此種交易物滿倉,“0”表示此種交易物空倉。
第一年時,因為缺乏往年數據,保險起見將比特幣和黃金平均分倉為500元/倉分別進行決策,即比特幣和黃金的倉位均為500元。從第二年起(即從2016年10月25日/2016年10月26日+360日后的第一天),根據前一年的實際數據計算出交易物的夏普比率Sp:
式中,E(RP)表示交易物的平均收益率,Rf表示無風險收益率,取2%,σp表示收益率的標準差,即每一個風險能帶來多少收益。
下一年的分配為:

假設初始資金為1000美元。
在由EMD-LSTM得到t+1日的價格預測值后,計算預期收益率后在第t日臨近收盤時決定交易策略。在第一年內,比特幣和黃金的資金分配均為500元。且在前幾個交易日內,因訓練數據較少,模型預測效果偏差較大,保守起見均保持觀望,即持有現金(比特幣為前80個交易日,黃金為前50個交易日)。
從第二年起,根據以往年份交易物的實際價格計算出夏普比率Sp(見表2)。

表2 各年夏普比率
最終,2016年9月11日價值1000美元的投資款在2021年9月10日得到黃金和比特幣的資產分別為116104.26美元和5970.25美元,總資產為122074.52美元。
圖4表示選取比特幣在初始投資一單位資金的情況下,使用策略進行操作與持倉不進行操作的單位凈值變動情況。

圖4 EMD-LSTM比特幣策略對比
可以看到,操作比特幣使用策略的收益遠高于不進行操作,使用操作策略是較優且必要的。
相比于EMD-GUR、RNN、ARIMAX、LSTM預測模型的策略,基于EMD-SLTM預測模型的策略在對預測價格的擬合準確度上有顯著優勢。LSTM黃金價格擬合曲線見圖5。

圖5 LSTM黃金價格擬合曲線
分別計算黃金和比特幣的以下擬合指標:MAE(平均絕對誤差)、MAPE(平均絕對百分比誤差)、MSE(均方誤差)、RMSE(均方根誤差)、NMSE(歸一化后均方誤差)。黃金五模型方差比較見表3。

表3 黃金五模型方差比較
經過擬合五方差指標分析,在所比較的EMD-LSTM、EMD-GRU、ARIMAX、LSTM、RNN五個模型之間,EMD-LSTM在預測價格上有著最優異的擬合精度,各模型擬合關系不等式為EMD-LSTM >EMD-GRU >ARIMAX >LSTM >RNN。
此外,分別使用五個模型以相同的交易策略運行,由表4可以明顯看出,使用EMD-LSTM模型進行交易能獲得最高的收益(122074.52美元的凈資產),且區間絕對收益、年化收益也均高于其他四類模型,收益關系不等式為:EMD-LSTM >ARIMAX >EMD-GRU >RNN >LSTM。各模型總資產比較見圖6。

表4 五個模型以相同的交易策略進行的收益

圖6 各模型總資產比較