李曄 白雪



摘要:針對小麥產量具有較大波動性的特點,結合灰色預測模型和馬爾可夫理論,同時利用新信息優先的思想,以河南省2010—2019年小麥產量作為原始數據建立無偏灰色GM(1,1)模型、無偏灰色馬爾可夫模型和新維無偏灰色馬爾可夫模型,并對比3種模型的預測精度。結果表明,新維無偏灰色馬爾可夫模型能提高預測精度,適合中長期預測,并預測出河南省未來5年的小麥產量數據。
關鍵詞:河南省;小麥;新維無偏灰色馬爾可夫模型;產量預測
中圖分類號: F326.11? 文獻標志碼: A
文章編號:1002-1302(2021)15-0181-05
收稿日期:2020-10-26
基金項目:河南省高等學校重點科研項目(編號:20A630015);河南省軟科學研究計劃(編號:182400410375);河南省高等學校人文社會科學研究一般項目(編號:2020-ZDJH-140)。
作者簡介:李 曄(1972—),女,河南南陽人,碩士,教授,主要從事灰色系統和物流管理研究。E-mail:zzliye@163.com。
糧食問題是關系國計民生的重大戰略問題,解決好糧食問題是人類生存和發展的社會基礎[1-2]。隨著全球新冠肺炎疫情不斷的發展蔓延,糧食安全的意義更為突出。2020年5月份的全國兩會期間,習近平總書記強調“農業基礎地位任何時候都不能忽視和削弱,手中有糧、心中不慌在任何時候都是真理”。河南省是我國的糧食主產省,小麥生產作為河南省糧食生產的主導產業,其產量高低不僅關系到河南省的經濟發展,還關系到我國糧食供需平衡和生產安全。因此,科學準確地預測河南省的小麥產量,對保障我國糧食安全具有十分重要的價值和意義。
目前國外預測糧食產量的方法主要有氣象產量預測法[3]、遙感技術[4]和統計動力學模擬法[5]這3種。它們的預測提前期一般為2個月左右,預測誤差為產量的5%~10%,精度較低。國內預測糧食產量的方法主要分為2類。一類是傳統的線性建模預測法,主要包括投入產出模型預測法,線性回歸預測法和指數平滑法等。陳錫康等利用投入占用產出技術預測了我國未來幾年的糧食產量[6];劉東等基于向前選擇法的多元線性回歸模型來預測糧食產量的發展趨勢[7];何延治等利用時間序列分析中的 ARIMA(p,d,q)模型預測了吉林省糧食產量[8];吳越等分別使用Holt兩參數指數平滑法和ARIMA模型預測2019—2023年長三角地區的糧食產量,預測效果理想[9]。另一類是非線性模型預測法,主要包含灰色預測、BP神經網絡、馬爾可夫模型和粗糙集理論等。樊超等利用灰度極限學習機模型預測我國糧食產量,為準確預測短期糧食產量提供了一種新的技術手段[10];李炳軍等利用灰色區間預測和 GM(1,N) 模型分別預測了我國主要糧食的需求量和產量[11];楊陽利用尾端殘差修正的 GM(1,1) 模型預測了我國人均糧食產量,預測精度提高[12];郭亞菲等利用粒子群優化神經網絡的模型預測糧食產量,為糧食產量預測提供了新的途徑[13];尹宗成基于粗糙集理論預測了我國的糧食產量[14];張文政等通過比較線性回歸、支持向量機和隨機森林這3種方法的預測精度[15],最后選用精度較高的支持向量機預測了遼寧省的糧食產量。
線性建模預測法雖然建模簡單,容易實現,可以清楚地了解各個變量之間的關系,但是需要收集大量數據才能提高預測的精度,而且僅適用于短期糧食產量預測。非線性模型預測法彌補了傳統預測方法的許多缺陷,然而由于小麥生產受氣候、環境和政策等多種因素影響,導致其產量數據具有較大的波動性。以上預測方法均不適合對隨機波動性較大的小麥產量進行中長期預測。
為了彌補這一缺陷,提高河南省小麥產量的預測精度,解決中長期預測的波動問題,本研究采用新維無偏灰色馬爾可夫模型[16-17]進行分析預測。在無偏GM(1,1)模型的基礎上利用馬爾可夫鏈修正預測值殘差,同時引入新信息優先的思想,不斷更新原始數據,應用于河南省小麥產量預測,不僅保留了短期預測的高精度,而且提高了中長期的預測精確度。
1 模型構建
1.1 無偏GM(1,1)模型的構建
吉培榮等對傳統GM(1,1)模型的性質做了相關研究,證明傳統GM(1,1)模型是有偏差的指數模型,基于此提出無偏GM(1,1)模型[18]。具體建模過程如下:
設原始序列為
X(0)=[x(0)(1),x(0)(2),…,x(0)(n)]。(1)
其中,x(0)(k)≥0,k=1,2,…,n。
(1)對X(0)做一次累加生成得
X(1)=[x(1)(1),x(1)(2),…,x(1)(n)]。(2)
其中,
x(1)(k)=∑ki=1x(0)(i),k=1,2,…,n。(3)
(2)確定數據矩陣B,Y。
B=-12[x(0)(1)+x(1)(2)]1
-12[x(1)(2)+x(1)(3)]1
-12[x(1)(n-1)+x(1)(n)]1,
Y=x(0)(2)x(0)(3) x(0)(n)。(4)
(3)使用最小二乘法,計算參數估計量a,u。
a^=[a,u]T=(BTB)-1BTY。(5)
(4)計算無偏灰色GM(1,1)模型的參數b,A。
b^=ln2-a2+a A^=2u2+a。(6)
(5)建立原始數據序列模型。
x^(0)(1)=x(0)(1),x^(0)(k+1)=Aebk,k=1,2,…,n。(7)
其中,x^(0)(k+1)在k=1,2,…,n-1時為原始序列的擬合值,在k≥n時為原始序列的預測值。
1.2 無偏灰色馬爾可夫模型的構建
馬爾可夫模型通過狀態間的轉移概率對系統將來的發展趨勢做出預測,可對隨機波動序列進行長期預測[19]。無偏灰色馬爾可夫模型是將無偏 GM(1,1) 模型和馬爾可夫模型相結合建立的[20]。具體步驟如下:
(1)建立無偏GM(1,1)模型,
得到無偏灰色預測值:X^(0)(1)=X(0)(1),X^(0)(k+1)=Aebk,k=1,2,…,n。
(2)計算預測值與實際值之間的相對誤差。
Q=x(0)(it)-x^(0)(it)x(0)(it)×100%。(8)
(3)狀態劃分。
根據預測值與實際值之間相對誤差的大小將樣本數據劃分為若干狀態,任一狀態可記為 Ei∈[1i,2i],i=1,2,…,s,其中s為劃分的狀態數目,灰元1i和2i分別表示第i種狀態的上下界。s和1i、2i視具體情況而定。
(4)構造狀態轉移概率矩陣。
設N(n)ij為由狀態Ei經過n步轉移到Ej的頻數,Ni為狀態Ei出現的頻數,則由狀態Ei經過n步轉移到Ej的概率為
p(n)ij=N(n)ijNi,i,j=1,2,…s。(9)
從而得到狀態轉移概率矩陣為
p(n)=p(n)11p(n)12…p(n)1s
p(n)21p(n)22…p(n)2s
p(n)s1p(n)s2…p(n)ss。(10)
(5)計算預測值。
結合狀態轉移概率矩陣,確定系統將來最可能所處的狀態,進一步得出預測值的變動區間[1i,2i],取此區間的中值作為修正值y,具體公式為
y=x^(0)(k)×1±12(1i+2i)。(11)
1.3 新維無偏灰色馬爾可夫模型的構建
隨著時間的不斷推移,灰色系統中會有一些隨機擾動因素不斷加入,從而影響系統發展;預測的時間越遠,模型的精度越低。為了提高模型的預測精度,引入新維無偏灰色馬爾可夫模型[21],對原始數據序列做等維信息處理,即將最新得到的預測值加入到已知序列,同時刪去序列中的第1個數據,然后對新得到的數據序列再次進行無偏灰色馬爾可夫預測,這樣反復對原始數據進行實時修正,直到完成預測目標。由于新維無偏灰色馬爾可夫模型不斷增加新信息并同時刪除舊信息,得到的新序列可以更好地反映系統的當前特征,進而提高中長期的預測精度[22-23]。
2 基于新維無偏灰色馬爾可夫模型的河南省小麥產量預測
河南省小麥產量受環境、天氣和政策等多方面因素的影響,具有較大的波動性,有效預測河南省小麥產量的變化趨勢,提升預測精度,是增加其產量的關鍵。無偏GM(1,1)模型適用于預測隨機波動性不大的時間序列變化趨勢,如果用來預測波動性較大的小麥產量數據會使其預測精度變差[24]。馬爾可夫模型適用于具有非平穩隨機特點的序列預測,因此,結合無偏GM(1,1)模型與馬爾可夫模型,使2個模型優勢互補,能夠預測序列的發展趨勢且提高預測精度,在小麥產量預測方面有較強的理論意義和實用價值。
選取2010—2019年的河南省小麥產量數據作為原始數據(表1),數據源于《河南省統計年鑒》。
2.1 無偏GM(1,1)模型預測
根據無偏GM(1,1)模型的建模原理,結合表1中2010—2019年河南省小麥產量數據,使用灰色建模軟件第7版和Matlab 2016b可以得到相應的時間響應函數:
X^(0)(1)=X(0)(1)=3 131.00,X^(0)(k+1)=Aebk=3 096.69e0.02k,k=1,2,…,n。(12)
預測結果見表2,該模型的平均相對誤差為1.57%。
2.2 馬爾可夫鏈修正灰色預測值
無偏灰色GM(1,1)預測模型反映出小麥產量數據的指數變化規律,并根據該規律外推可得出預測值。受氣候、環境、政策等多方面因素影響,單一模型不能刻畫小麥產量的變化趨勢,因此,引入馬爾可夫模型修正殘差,充分發揮其在預測離散隨機波動大的事件上的優勢,彌補灰色預測模型的不足。
2.2.1 狀態劃分
根據河南省小麥產量的實際值和無偏GM(1,1)模型得出預測值之間的相對誤差,
將小麥產量的數據序列劃分為4個區間:E1(-0.86,0.32)、E2(0.32,1.50)、E3(1.50,2.68)、E4(2.68,3.86)。河南省小麥產量預測年份的所處狀態見表3。
由于河南省小麥產量2011—2019年的所處狀態已知,令對應區間的中點作為擬合值。如2011年小麥產量處于狀態1,則2011年小麥產量的擬合值為:
X2011=3 159.24-3 159.24×0.5×(-0.86%+0.32%)=3 150.71。(13)
同理,可以擬合2012—2019年河南省小麥產量,擬合值見表2。
2.2.2 構造狀態轉移概率矩陣
由狀態劃分表及各年對應的狀態,可得1步和2步轉移概率矩陣:
p1=121200
0001
0000
130023
p2=1414012
130023
0000
71816049。(14)
2.2.3 確定預測值
因為2019年小麥產量處于狀態4,根據1步轉移概率矩陣計算2020年小麥產量數據:
X2020=3 782.30-3 782.30×0.5×(2.68%+3.82%)=3 905.98。(15)
同理可根據2步、3步、4步、5步轉移概率矩陣計算2021—2024年小麥產量數據,分別為3 984.88 萬、4 065.39萬、4 147.52萬、4 231.32萬t。
擬合和預測結果見表2,該模型的平均相對誤差為0.31%。
由于傳統無偏灰色GM(1,1)模型沒有考慮河南省歷年小麥產量對未來預測年份小麥產量的影響,初始預測值較為準確,2011—2014年的預測誤差均小于1%。但隨著年份的不斷增加,小麥年產量之間的相互影響作用以及歷年小麥產量數據對未來小麥產量影響逐步降低,導致模型的預測精度變差。從圖1可以明顯看出,2015—2017年的小麥產量的預測誤差明顯增加;無偏灰色馬爾可夫模型綜合考慮了序列的波動性以及歷年產量對未來年份小麥產量的影響,結合這2種模型的優勢,提高了河南省小麥產量的預測精度。2011—2019年的預測誤差均降低到小于0.8%,但仍有個別年份預測誤差偏大,如2017年模型的預測誤差達到0.72%,模型仍需要進一步改進。
2.3 新維灰色馬爾科夫模型預測
影響河南省小麥產量的各方面因素在不停地變化,不斷有新的隨機擾動因素加入系統,而且舊數據在預測序列中的有效作用逐步降低,對小麥產量產生重要影響。因此,需對建模原始數據序列進行實時修正。
利用無偏灰色馬爾可夫模型得到的2020年小麥產量預測值添加到原數據序列,同時剔除第1個數據,即2010年小麥產量數據,以2011—2020年小麥產量數據作為新的數據序列,然后構建無偏灰色GM(1,1)模型
X^(0)(1)=X(0)(1)=3 144.90,X^(0)(k+1)=Aebk=3 179.05e0.02k,k=1,2,…,n
最后通過馬爾可夫模型修正,得到2021年河南省小麥產量預測值。
由于進行1次等維新息處理后,平均相對誤差為0.29%,仍比較大,所以繼續對建模序列做等維處理。將該值作為2021年小麥產量數據重復使用上述的步驟,得到2022年小麥產量數據,同理可得2023、2024年小麥產量數據,其平均相對誤差分別為0.25%、0.22%、0.22%,預測結果見表4。
2.4 模型比較
河南省小麥產量是非平穩的時間序列,通過結合無偏GM(1,1)模型和馬爾可夫模型,并等維處理建模原始數據序列,得到新維無偏灰色馬爾可夫模型,該模型充分發揮了2個模型的優勢,能較好地預測非平穩時間序列。
通過表5預測模型的精度對比可以看出,通過馬爾可夫修正對河南省小麥產量預測的平均相對誤差減小,新維無偏灰色馬爾可夫模型的平均相對誤差低至0.22%,相對最小,精度最高,可以很好地反映河南省小麥產量變化趨勢,在中長期的預測中更具有優勢。
結合最終預測結果和預測精度檢驗可以得出,采用新維無偏灰色馬爾可夫模型預測出2020—2024年河南省小麥產量分別為3 905.98萬、3 985.99萬、4 067.29萬、4 151.19萬、4 235.40萬t。結果顯示河南省小麥產量在未來5年都會呈上升趨勢,但增長速度呈緩慢趨勢。
3 結論
本研究以河南省小麥產量預測為例,采用新維無偏灰色馬爾可夫模型,充分利用了灰色預測建模所需信息量少的特點以及馬爾可夫模型能夠處理隨機波動性數據的特性,并利用實時修正對模型進行優化。對河南省2010—2019年小麥產量預測結果表明,該模型的預測精度較高,預測結果更精確,可以很好地反映河南省小麥產量變化趨勢,對河南省制定小麥生產規劃、調整和優化小麥種植結構以及促進河南省小麥生產的可持續發展具有重要意義。同時,本研究結果可以為政府相關決策部門擬定糧食配置和宏觀經濟計劃提供依據,從而保障我國糧食安全,維護國民經濟發展和社會穩定。
參考文獻:
[1]楊宗輝,蔡鴻毅,覃 誠,等. 我國糧食生產的時空格局及其影響因素分析[J]. 中國農業科技導報,2018,20(9):1-11.
[2]陳光軍. 鄉村振興背景下中國改革40年來糧食安全的回顧與思考[J]. 農業經濟,2020(3):3-5.
[3]Ajwde W,Cavan D. Crop model data assimilation with the Ensemble Kalman filter for improving regional crop yield forecasts[J]. Agricultural and Forest Meteorology,2007,146(1):38-56.
[4]Rosegrantm W,Ringler C,Roe T L. Asian economic crisis and the long-term global food situation[J]. Food Policy,2000,25(3):243-254.
[5]Jin Z Q,Zhu D W. Impacts of changes in climate and its variability on food production in Northeast China[J]. Acta Agronomica Sinica,2008,34(9):1588-1597.
[6]陳錫康,楊翠紅. 投入占用產出技術在全國糧食產量預測及鄉鎮企業中的應用[J]. 中國科學基金,2003,17(3):149-152.
[7]劉 東,白雪峰,孟 軍. 基于向前選擇變量法的我國糧食總產量多元線性回歸預測模型[J]. 東北農業大學學報,2010,41(10):124-128.
[8]何延治. 基于時間序列分析的吉林省糧食產量預測模型[J]. 江蘇農業科學,2014(10):478-479.
[9]吳 越,張煥明. 基于Holt兩參數指數平滑法和ARIMA模型的長三角糧食產量的預測[J]. 武漢輕工大學學報,2020,39(1):30-36.
[10]樊 超,曹培格,郭亞菲,等. 基于灰度極限學習機的糧食產量預測[J]. 江蘇農業科學,2018,46(5):212-214.
[11]李炳軍,楊衛明. 基于灰色區間預測和GM(1,N)模型的我國糧食供需結構平衡分析[J]. 江蘇農業科學,2019,47(18):325-329.
[12]楊 陽. 基于殘差修正的GM(1,1)模型的我國人均糧食產量預測[J]. 統計與決策,2011(17):53-55.
[13]郭亞菲,樊 超,閆洪濤. 基于主成分分析和粒子群優化神經網絡的糧食產量預測[J]. 江蘇農業科學,2019,47(19):241-245.
[14]尹宗成. 運用粗糙集理論對我國糧食產量的預測[J]. 統計與決策,2008(6):46-48.
[15]張文政,孫德山,王 玥,等. 基于支持向量機的遼寧省糧食產量預測[J]. 經濟數學,2019,36(1):96-99.
[16]李 東,蘇小紅,馬雙全. 基于新維灰色馬爾科夫預測模型的股價預測算法[J]. 哈爾濱工業大學學報,2003,35(2):244-248.
[17]高 陽,譚陽波. 基于新維無偏灰色馬爾科夫預測模型的中長期能源消費預測[J]. 統計與決策,2007(22):55-57.
[18]吉培榮,黃巍松,胡翔勇.無偏灰色預測模型[J]. 系統工程與電子技術,2000,22(6):6-7,80.
[19]張冬詠,陳泗達. 基于灰色-馬爾可夫模型的國內游客總數預測[J]. 河南科學,2020,38(1):96-101.
[20]王 姍,翟 瓊,許麗娜. 基于灰色馬爾科夫模型的中國女子中長跑成績的預測[J]. 數學的實踐與認識,2016,46(24):161-170.
[21]Li L,Sun L,Ning G. Deterioration of urban bridges on network level using Markov-chain model[J]. Mathematical Problems in Engineering,2014(7):1-10.
[22]陳寶平 .基于新維無偏灰色馬爾科夫模型的圍欄草場面積的預測[J]. 數學的實踐與認識,2013,43(24):58-63.
[23]趙 玲,許宏科. 基于新維無偏灰色馬爾可夫的交通事故預測[J]. 計算機工程與應用,2013,49(7):35-38.
[24]向 宇,吳 琴. 改進的灰色預測模型在全國用水量預測中的應用[J]. 湖北民族學院學報(自然科學版),2015,33(1):25-30.