王曉蕾,張艷,柳平增,溫孚江,鄭勇,王剛
(1. 山東農業大學信息科學與工程學院,山東泰安,271000; 2. 山東省現代農業農村發展研究中心,濟南市,250100;3. 德州市陵城區農業農村局,山東德州,253500)
我國是世界上最大的蘋果生產國和消費國,蘋果已成為部分農民增收致富的支柱產業,受供求、季節和自然災害等因素的影響,蘋果市場價格波動愈發顯著,價格波動直接影響著蘋果產業從業者的收益。開展蘋果市場價格的短期預測,對果農規避市場風險,以及對穩定農業生產、平衡物價水平、保障消費者福利水平至關重要,也是制定農業產業政策、維護市場健康發展的重要依據。
從農產品價格預測方面來看,學者們主要從兩個方面進行了探討:一是基于傳統的時間序列、神經網絡以及機器學習等單個模型進行預測;二是使用組合模型進行農產品價格預測。單模型方面,早期的農產品價格預測方法主要為時間序列預測,因ARIMA能較好的擬合時間序列,因此多采用ARIMA系列模型進行價格預測[1-3]。ARIMA模型未能完全提取季節因素特征,利用季節分解方法剔除季節因素后[4],再利用非平穩時間序列模型進行預測分析能得到更好的預測結果[5];神經網絡的自學習以及可靈活考慮多輸入因素等特點[6-8],能充分考慮影響價格的種植面積、產量及自然災害因素,近幾年被廣泛應用于農產品價格預測[9]。組合模型方面,與神經網絡中的各類模型相結合的組合模型,在價格預測模型中扮演著越來越重要的角色[10-13]。利用神經網絡能提取更深層次的序列特征等優點,整合其他機器學習模型等預測特點[14-15],能夠滿足對預測精度進一步提高的要求[16-17]。價格預測模型方面,部分學者從兩方面對LSTM神經網絡模型開展了研究,一是使用LSTM模型對價格時序進行預測[18-19],利用改進和優化后的LSTM來提高預測精度[20-22];二是采用與LSTM相結合的組合模型進行價格預測也能達到很好的效果[23-24],其中LSTM-BP與LSTM-RNN組合模式被廣泛應用于趨勢預測、特征信息融合及語義分類等[25]。
綜上研究結果發現,與神經網絡相結合的組合模型在農產品價格預測方面具有顯著性優勢,且價格的空間傳導效應對價格波動產生明顯的影響。本文擬采用基尼系數與Granger因果關系檢驗分析蘋果價格空間傳導效應,并利用空間Markov鏈分析蘋果價格的空間動態演進。為提高蘋果價格的預測精度,采用熵值法客觀提取價格空間傳導效應特征信息,與改進后的堆疊式多層LSTM相結合來預測蘋果價格。最后,基于堆疊式多層LSTM對蘋果價格進行預測,并分析驗證預測結果的準確性。
本研究使用的數據源自中華人民共和國商務部創辦的全國農產品商務信息公共服務平臺,選取全國共99個農產品批發市場蘋果價格,利用各省農產品市場的富士蘋果日均價格進行空間傳導效應分析,并預測山東富士蘋果日均市場價格,單位為元/kg,選取區間為2014-01-01至2020-12-31。
1.2.1 地區差距
采用基尼系數對全國各省蘋果價格的地區差距進行分析,基尼系數(GINI)[26]的定義如式(1)所示。
(1)
式中:k——區域劃分數;
nj——j區域內省份數;
nh——h區域內省份數;
yji——j區域內i省份的蘋果價格;
yhr——h區域內r省份的蘋果價格;
μ——全國各省份蘋果價格平均值;
n——省份數。
1.2.2 Granger因果關系
為驗證蘋果價格的空間傳導特征,采用Granger因果關系檢驗進行分析。Granger因果關系檢驗多被用于驗證經濟變量時間平穩序列之間的因果關系,其原理是假設一個省份蘋果價格序列Xt的變化能夠導致另一個省份蘋果價格序列Yt的變化,且Xt的變化發生在Yt之前,則稱Xt是Yt的Granger因,Yt是Xt的Granger果;反之亦然。對Granger因果關系檢驗進行估計如式(2)所示。
(2)
式中:α、β——被估計參數;
ε——殘差序列;
θ——滯后階數。
1.2.3 空間Markov鏈
空間Markov鏈方法是將“空間滯后”這一概念引入Markov分析過程中所得到的,如式(3)所示。利用該模型可以考察相鄰省份的蘋果價格對本省份蘋果價格狀態轉移的影響。其具體方法是通過設定空間權重矩陣,把N×N的轉移概率矩陣分解為N×N×N的轉移概率矩陣,從而狀態轉移概率Pij表示為某省份由a時期的i類型轉移到a+1時期的j類型的概率,以此揭示空間效應對蘋果價格動態演進的影響。
P{Xa=j|Xa-1=i,Xa-2=ia-2, …,X0=i0}=
P{Xa=j|Xa-1=i}=Pij
(3)
式中:Pij——狀態轉移概率;
i,j——狀態;
X——隨機變量。
1.2.4 熵值法
熵值法是一種客觀賦權方法,它通過計算多個特征的信息熵,根據各項特征信息的相對變化程度對蘋果價格整體的影響來決定各項系數的權重,例如,相對變化程度大的特征項具有較大的權重。指標的信息熵值與權重分別如式(4)、式(5)所示。
(4)
(5)
式中:ej——第j項指標的熵值;
m——地區數;
Yij——第i個地區的第j個指標的數值;
Wj——指標權重。
1.2.5 長短期記憶模型
長短期記憶模型LSTM是一種時間遞歸神經網絡,能解決RNN的梯度消失和梯度爆炸問題,能夠用來預測特征間隔長、延遲長、具有滯后空間效應的蘋果價格數據。LSTM的核心思想是門控邏輯,內部結構如圖1所示。LSTM由遺忘門、輸入門和輸出門組成,其中遺忘門通過sigmoid函數取舍,決定對前一時刻狀態的遺忘程度,如式(6)所示,其中,ft介于0與1之間。
ft=σ(Uf×Xt+Wf×ht-1+bf)
(6)
式中:σ——sigmoid函數;
U、W——變量的權重;
Xt——輸入變量;
h——輸出變量;
b——截距項。
輸出門首先利用激活函數和激勵函數篩選、保存輸入變量并創建新向量,通過舊細胞狀態與新變量更新細胞狀態。如式(7)所示,其中,it取值為0或1。
it=σ(Ui×Xt+Wi×ht-1+bi)
(7)

tanh——正切激勵函數;
ct-1——舊細胞狀態值;
ct——新細胞狀態值;
ft——遺忘程度。
式(8)中輸出門根據激活函數確定輸出變量,并利用激勵函數處理細胞狀態。
ot=σ(Uo×Xt+Wo×ht-1+bo)
ht=ot×tanh(ct)
(8)
式中:ot——輸出門激活函數;
h——輸出變量。
LSTM是由記憶塊而不是神經元組成的,通過一個存儲單元和三個控制門使得LSTM能夠更好地選擇數據并學習,對時間間隔長的有效歷史信息形成記憶。隨著信息量的增加,LSTM模型能夠有效地學習預測已實現的價格波動所需的特征,讓價格數據中的關鍵信息進行有效的更新和傳遞,能更好地捕捉蘋果市場價格波動規律,從而提高對蘋果市場價格的預測準確性。

圖1 LSTM模型結構Fig. 1 LSTM model structure
供求關系是影響蘋果價格波動的重要因素,因供需關系而引起的蘋果價格地區差距會造成地區內蘋果市場供求失衡,利用基尼系數公式求解所得到的2014—2020年全國蘋果價格季度均值的基尼系數值,以此來分析全國各省份的蘋果價格地區差距,如圖2所示,各地區蘋果價格存在著較為明顯的地區差距。首先,在2014年第一季度到2016年第二季度的地區差距呈現波動上升趨勢,隨后,2016年第三季度到2019年第一季度地區差距呈現波動下降趨勢,從2019年第一季度到2019年第三季度地區差距持續升高,并且2019年第四季度地區差距達到階段高點為0.46,之后到2020年第四季度地區差距降低并在0.4上下波動,但在此階段地區差距仍然存在。

圖2 2014—2020年全國蘋果價格季度均值及地區差距Fig. 2 National apple price quarterly average and regional gap from 2014 to 2020
為分析山東省蘋果價格波動因素,對山東與山東近鄰省市之間的蘋果價格空間傳導效應進行分析,根據表1可得,山東、北京、江蘇、河北4個城市蘋果價格序列同階單整,因此可進行Granger因果關系檢驗。設置VAR模型最大滯后期為4,如表2所示。根據VAR最優滯后階數選取準則,選取最優滯后期為3,即傳導周期為15 d。
根據Granger因果關系檢驗得知(見表3),在1%顯著性水平下,山東是引起北京、江蘇和河北蘋果價格變化的原因,并且存在北京與山東的雙向Granger因果關系,山東多以傳導源存在。各省蘋果價格之間存在多個Granger因果關系,因此可以說明,蘋果價格存在空間傳導效應。

表1 各變量一階差分的ADF檢驗結果Tab. 1 ADF test results of the first-order difference of each variable

表2 VAR最優滯后階數確定Tab. 2 VAR optimal lag order is determined and established

表3 蘋果價格Granger因果關系檢驗結果Tab. 3 Apple price Granger causality test results
運用空間Markov鏈分析各地區蘋果價格的空間動態演進,并對周邊地區的蘋果價格是否會影響本地區的蘋果價格水平轉移情況作出判斷,基于表4所示的卡方檢驗的顯著性檢驗結果,P值都小于0.01,當時長為1年(T1)、2年(T2)、3年(T3)、4年(T4)及5年(T5)后,Q統計值均在1%的水平下顯著,表明空間因素對各地區蘋果價格的轉移產生顯著影響。

表4 空間轉移概率顯著度結果Tab. 4 Significance result of spatial transition probability
表5揭示了空間因素對蘋果價格的動態演進的影響,在地理權重下,以蘋果價格高水平地區為例,當其相鄰地區為高水平時,1年后該地區保持平穩轉移概率為84%,5年后該地區保持平穩轉移概率仍超過58%。

表5 蘋果價格的空間Markov轉移概率Tab. 5 Space Markov transition probability of apple price %
上述研究結果表明空間因素對蘋果價格的影響較明顯。在周圍地區蘋果價格較高的情況下,高水平地區降低自身蘋果價格的難度較大,而與中、低水平地區為鄰,促進本地區蘋果價格的降低。此外,隨時間推移,在不同水平“鄰居”的影響下,蘋果價格發生轉移的概率總體上有所增加。
利用熵值模型對價格空間傳導多個特征進行信息熵擬合,包括基尼系數、Granger因果關系、以及空間Markov鏈系數,其中,因北京與山東存在雙向Granger因果關系,熵值法中Granger因果關系值利用北京農產品市場富士蘋果日均價格表示,得到如圖3所示的信息熵序列。

圖3 空間傳導效應信息熵Fig. 3 Information entropy of spatial conduction effect
1) LSTM模型。本文分別收集預測日的前25、50、100 d的蘋果價格數據來預測價格,根據訓練結果發現,選取50個蘋果價格數據來預測下一日的價格預測效果較好,因此在后續試驗中收集預測日的前50個數據進行試驗。LSTM模型使用了五個隱藏層,其中,三個LSTM層以及兩個全連接層,三個LSTM層的隱藏節點數分別為20、15和10,兩個全連接層包含的隱藏節點數分別是5和1。為了防止過擬合,在三個LSTM層中加入了dropout函數,分別設置為0.3、0.8、0.8。本文將10%樣本數據設為驗證區間。
2) 加入信息熵。將空間效應的三項特征序列進行信息熵擬合,三項特征序列分別為基尼系數(GINI)、Granger因果關系、以及空間Markov鏈,將信息熵代替三項空間效應特征序列作為輸入向量,結合LSTM對蘋果價格進行預測。
3) 堆疊式LSTM。利用LSTM對空間傳導特征提取后的信息熵進行預測,將預測的信息熵作為輸入變量,并加入價格序列后利用LSTM模型預測蘋果價格。利用LSTM預測信息熵后,再次結合LSTM進行預測的過程形成堆疊式LSTM(如圖4),對比LSTM與組合模型預測蘋果價格的精度。

圖4 堆疊式LSTM與熵值法組合預測流程Fig. 4 Stacked LSTM and entropy methodcombined forecasting process
4) 堆疊式多層LSTM。對神經網絡的最優隱含層進行試驗,得出預測蘋果價格序列的最優神經網絡層。
5) 模型預測性能對比。對比分析組合模型以及優化模型的預測性能。
本文使用均方誤差(MSE)、平均絕對值誤差(MAE),與將兩種誤差通過異方差調整后的HMSE、HMAE,以上四種損失函數來評估模型的預測精度,如式(9)中所示。
(9)

RVt——真實值;
T——樣本數量。
根據損失函數值評估模型預測性能,結果如表6所示。
1) LSTM模型。比較LSTM預測結果的損失函數發現,損失函數MAE為0.609 4,說明神經網絡模型對蘋果價格波動有良好的預測性能。
2) 加入信息熵。利用熵值模型對價格空間傳導效應的三個特征項進行信息熵擬合,并結合LSTM進行預測,根據表6的預測結果發現,組合模型的預測性能優于LSTM模型,因捕捉到蘋果價格的空間傳導效應等特征信息,LSTM- 熵對比LSTM的損失函數HMAE從0.101 6降低到0.092 3,如圖5所示三種模型部分預測值以及真實值的對比情況。
3) 堆疊式LSTM。堆疊式LSTM的預測損失函數MAE為0.508 7,在輸入向量加入價格空間傳導效應的基礎上,改進的LSTM模型對蘋果價格預測發揮了良好的作用。
4) 堆疊式多層LSTM。為尋找神經網絡的最優隱含層,改變神經網絡隱含層數對蘋果價格序列進行預測,不同神經網絡隱含層的預測結果的損失函數值如表7所示。針對蘋果價格樣本數據,在神經網絡隱含層為4時,損失函數達到最低。
5) 模型預測性能對比。對比分析組合模型以及優化的組合模型的預測性能,加入價格空間傳導效應的組合模型預測精度提高,利用堆疊式多層- 墑進行預測的損失函數比其他組合模型的損失函數低。以上結論證明,加入蘋果價格的空間傳導效應特征有助于提高預測精度,并且優化后的組合模型預測能力更強。

表6 模型損失函數比較Tab. 6 Model loss function comparison

圖5 LSTM與組合模型預測結果截取Fig. 5 Prediction results snippet of single model andcombined model

表7 不同隱含層數損失函數對比Tab. 7 Comparison of loss functions withdifferent hidden layers
根據上述對蘋果價格組合模型預測方法的研究,堆疊式多層LSTM與價格空間傳導效應的熵值模型結合的組合模型預測精度較高。基于此,利用優化后的組合模型預測2021年1月1—31日的蘋果價格,驗證組合模型的預測能力。通過組合模型預測31 d蘋果價格的損失函數MAE為0.448 8。從圖6預測結果中可以發現,堆疊式多層LSTM- 墑組合模型預測數值在真實值附近波動,預測趨勢與真實價格數據波動趨勢相符,這進一步驗證了基于堆疊式多層LSTM與熵值模型的組合模型對蘋果價格預測的有效性。

圖6 堆疊式多層LSTM-墑預測31 d蘋果價格對比Fig. 6 Stacked multi-layer LSTM-E forecast31-day apple price comparison
通過對蘋果價格空間傳導效應分析發現,蘋果價格空間傳導效應是引起蘋果價格波動不可忽略的因素。利用基尼系數、Granger因果關系以及空間Markov鏈獲取了蘋果價格的地區差距、時空傳導關系以及動態演進方向等多個價格空間傳導特征,并利用熵值法客觀提取多個特征的信息熵,結合改進的堆疊式多層LSTM模型的自身學習數據特征的特性,本文提出了一種堆疊式多層LSTM與熵值模型相結合的新方法。試驗分析表明,(1)蘋果價格存在較為明顯的空間傳導效應,各地區的蘋果價格存在地區差距和Granger因果關系。(2)加入價格空間傳導效應的堆疊式多層LSTM與熵值法相結合的組合模型預測精度提高,對比LSTM預測結果MAE的0.609 4,組合模型MAE為0.494 8,精度提高18.81%,在蘋果價格預測方面發揮了良好的作用。
本文在現有價格預測基礎上,增加輸入向量,考慮價格空間傳導效應特征,優化LSTM神經網絡模型,進一步提高了價格的預測精度。由于價格數據受多種因素影響,如蘋果的種植面積、國家政策、進出口貿易、蘋果替代水果的價格變動等,眾多因素共同對蘋果價格波動產生影響,下一步的工作將增加影響因素的輸入維度,進一步提高蘋果價格預測精度,并增強預測模型的穩定性。