胡林燕,徐士元
(浙江海洋大學經濟與管理學院,浙江舟山 316000)
茶葉產業作為我國重要的農業支柱產業,是中國農業不可或缺的一部分,在現代注重健康、回歸自然的文化潮流中,已經成為世紀興旺發達的“綠色產業”[1]。茶葉產量預測,可為我國茶葉生產企業控制生產數量、提高茶葉生產品質提供切實可行的實踐對策參考;也可以為我國茶葉管理部門制定發展規劃提供實證支持,對茶葉相關企業的成長壯大、農民增收與就業以及實現茶葉生產的可持續發展,都有重要的實踐意義。
近些年國內外學者對茶葉產量及農產品產量預測進行了大量的研究,如唐海軍等[2]運用灰色系統理論對萬源市的茶葉年產量進行了建模研究,結果表明灰色預測模型的預測精度較高。胡克滿等[3]利用灰色預測適合部分原始信息數據的預測特點,結合神經網絡系統理論構建了基于灰色神經網絡的茶葉產量預測模型,結果表明,該模型精度較高能較好實現茶葉產量的預測;呂海濤等[4]以2010—2018年信陽毛尖茶葉產量、品牌收益、品牌價值為樣本數據,構建了信陽茶葉產量、價值、收益的灰色預測模型,預測結果可為信陽毛尖的茶農增收、改善茶葉生產結構、提升品牌價值轉化率等提供決策依據;呂海俠等[5]在ARMA預測的基礎上利用灰色系統理論原理對ARMA預測值的殘差序列構建GM(1,1)預測模型,即構建了ARMA-GM(1,1)的茶葉產量組合預測模型,通過實例計算,結果表明組合預測模型的預測精度有了大幅度提高。在農產品產量的預測問題中,馬創等[6]結合灰色預測模型和馬爾可夫鏈理論的優點,針對糧食產量預測提出了一種灰色馬爾可夫預測模型,預測結果表明,該模型的預測精度較單一的灰色預測模型有大幅度提高,可以對糧食產量進行周期性預測。尹邦華等[7]針對湖南省糧食產量預測建立了GM(1,1)預測模型、優化的AGM(1,1)模型和利用新陳代謝理論改進的無偏GM-Markov預測模型,通過實例計算表明,經新陳代謝理論改進的無偏GM-Markov預測模型更適合于糧食產量的中短期預測。曹維陽[8]在統計學、預測學等理論的基礎上,利用灰色系統預測理論建立了灰色預測模型,對我國烏桕的總產量及我國主要烏桕產區的烏桕籽產量進行了預測,并根據預測結果和經驗對如何提高我國烏桕籽產量有針對性地提出了科學有效的建議。
通過對以上各灰色預測模型及相關組合模型的研究可以看出,灰色預測計算過程中依然存在預測過程不甚科學、計算過程復雜等特點,預測精度有待進一步提高;而且,GM(1,1)模型是有偏差的預測模型,不能充分利用灰色系統的信息[9]。單因子系統云灰色[SCGM(1,1)c]預測是在GM(1,1)預測的基礎上發展而來的,具有建模過程更加嚴謹、計算過程更為簡單、精度更高等特點,該模型被廣泛運用于茶葉、蔬菜、糧食產量等農業領域以及相關領域預測研究中[10-11],取得了良好的預測效果。為了更為準確地完成預測研究,該研究采用在農產品產量預測中運用比較廣泛的SCGM(1,1)c預測模型,并通過馬爾可夫預測理論對其進行優化并建立SCGM(1,1)c-Markov預測模型,以實現對浙江省茶葉產量的高精度預測。
SCGM(1,1)c預測模型是在灰色GM(1,1)預測模型的基礎上發展而來的,其對原始數列的處理采用了更為科學的積分計算方法,即計算過程中由采用梯形面積替代了GM(1,1)預測計算中的矩形面積,使得預測精度得到提高[10]。同時,與GM(1,1)預測模型相比SCGM(1,1)c預測模型在計算模型參數時不需要進行矩陣運算,而且求取預測值時也不需要累減計算,使得SCGM(1,1)c預測模型的預測計算量得到大幅度簡化。
SCGM(1,1)c茶葉產量預測模型的建模過程如下。
設茶葉產量樣本數據序列為X(0):
X(0)={X(0)(1),X(0)(2),…,X(0)(n)}
(1)
對樣本X(0)序列進行積分生成變換,得X(0)′={X(0)′(1),X(0)′(2),…,X(0)′(n)},其中,
(2)
而
X(1)(m)=0.5×[X(0)(m)+X(0)(m+1)]
(3)
設茶葉產量積分樣本序列X(0)′與函數fr(k)=bea(k-1)-c滿意趨勢關聯,用X(0)′的數據貼切擬合于fr(k),可計算得到云灰色系數:
(4)
(5)
(6)

(7)
對X(0)′(k)還原處理,即可得茶葉產量的SCGM(1,1)c預測模型:
(8)
單因子系統云灰色SCGM(1,1)c預測的基本原理是灰色預測,盡管其預測精度和運算簡易程度上較灰色GM(1,1)預測上有了一定提高,但是,對于因不確定性因素造成的茶葉產量的波動,該預測模型依然不能達到理想的預測精度。為了提高模型的預測精度,對SCGM(1,1)c模型預測值進行了修正。
馬爾可夫預測理論最顯著的特點是無后效性,對于具有較強波動性原始數據量的預測問題具有良好的預測效果。茶葉產量原始值與SCGM(1,1)c預測模型預測值的差稱作殘差,殘差的分布狀態可以作為馬爾可夫狀態[12]。馬爾可夫預測是通過計算各狀態的轉移概率來實現的,轉移概率反映了各狀態的內在規律。因此,該研究將SCGM(1,1)c模型與馬爾可夫預測結合起來,利用馬爾可夫理論修正茶葉產量預測值。
首先,計算茶葉產量SCGM(1,1)c模型預測值的殘差及相對誤差:
(9)
(10)
其次,根據相對誤差Q的大小分布,均分Q為i個數值區間,設一個數值區間為一個預測狀態:
Ei=(Li,Ui),i=1,2,…,n
(11)
再次,構造轉移概率矩陣,記由狀態Ei轉移到狀態Ej發生了nij次,而狀態Ei在相對誤差系列中出現了ni次,則由Ei轉移到狀態Ej的狀態轉移概率為pij=nij/ni,可得1步狀態轉移概率矩陣:
(12)
P(n)=(P(1))n為n步狀態轉移概率矩陣。
最后,通過計算狀態轉移概率并比較各個狀態概率的大小,概率最大者為預測年份的狀態。設預測年份狀態為Ei=(Li,Ui),取狀態Ei的中間值Ii為修正參數,即
Ii=|0.5×(Li+Hi)|
(13)
則可得修正的馬爾可夫SCGM(1,1)c預測模型:
(14)
預測值大于樣本值時取“+”,預測值小于樣本值時取“-”。
預測模型的預測結果是否合理可信,要通過一定檢驗。SCGM(1,1)c預測基本原理為灰色預測,而殘差和后驗差校驗是灰色預測常用的檢驗方法[13-14]。該研究采用灰色預測模型常用的檢驗方法驗證所建模型的精度。
3.1 殘差檢驗及指標
(1)最大絕對百分比誤差(APE),體現模型預測值與樣本數據的最大偏差:
(15)
(2)平均相對誤差(MAPE),體現不同模型對相同樣本數據擬合程度的好壞:
(16)


表1 預測模型等級劃分
為了驗證所建模型的可行性,以浙江省統計局網站公布的2006—2017年全省茶葉年產量數據為樣本,根據上述建模過程建立預測模型,并對2018、2019、2020年的數據進行預測(表2)。

表2 2006—2020年浙江省茶葉產量
茶葉生產是浙江省傳統的優勢農業產業,為浙江省農業發展、農民增收作出了巨大貢獻[15]。由表2及圖1可以看出,2006—2017年浙江省茶葉總產量整體呈上升趨勢,但考慮到勞動力、氣候、政策等影響因素的影響,浙江省茶葉總產量增長趨勢并非線性增長而是呈現一定程度的波動。鑒于此,對浙江省茶葉年產量建立系統云灰色預測模型和經過馬爾可夫理論修正的SCGM(1,1)c-Markov預測模型,并對比分析2種模型的預測精度和預測值曲線擬合度,以期進一步提高預測精度,更好地服務浙江省茶葉產業發展。
4.1 浙江省茶葉產量SCGM(1,1)c預測模型由表2得2006—2017年浙江省茶葉產量樣本值序列:
X(0)={15.24,16.02,16.23,16.74,16.27,16.97,17.48,16.86,16.54,17.25,17.22,17.83}
根據上文SCGM(1,1)c建模過程,可得預測模型:
(17)
為了驗證所建模型的預測精度,用所建模型分別預測2006—2017年浙江省茶葉產量預測值,結果見表3。由表3及圖1可以看出,SCGM(1,1)c預測模型預測值基本能反映近年來浙江省茶葉產量的整體增長趨勢,但部分年份(2006、2009、2012、2014、2016)預測誤差較大,預測值曲線與樣本值曲線有明顯的背離,即SCGM(1,1)c預測模型總體預測效果不佳,模型的預測精度有待進一步提高。

表3 浙江省茶葉產量預測

圖1 SCGM(1,1)c預測模型擬合曲線
4.2 浙江省茶葉產量SCGM(1,1)c-Markov預測模型為了進一步提高浙江省茶葉產量的預測精度,對已建立的SCGM(1,1)c預測模型利用Markov預測理論進行改進。具體步驟如下:
(1)計算浙江省茶葉產量SCGM(1,1)c預測模型的殘差和相對誤差。由2006—2017年浙江省茶葉產量的SCGM(1,1)c模型預測值及式(9)、(10),可得相應殘差和相對誤差,見表3。
(2)根據SCGM(1,1)c預測值相對的大小誤差分布情況,劃分出4個狀態,見表4。
(3)構造狀態轉移概率矩陣,根據表4的預測值狀態劃分,計算各狀態轉移概率,得1步狀態轉移概率矩陣:

表4 浙江省產業產量SCGM(1,1)c模型預測值狀態劃分
n步狀態轉移概率矩陣P(n)=(P(1))n
(4)建立浙江省茶葉產量的SCGM(1,1)c-Markov模型。由改進SCGM(1,1)c預測模型的建模過程,得經過Markov理論修正后的預測模型:
(18)
式中,Ii為預測年份狀態的中間值。
由式(18)及表4所列2006—2017年的預測狀態,可計算得出2006—2017年的SCGM(1,1)c-Markov模型預測值,見表3。關于2017年以后各年份預測值的計算,以距離最近的2015、2016、2017年作為預測狀態的基礎年份,通過計算狀態轉移概率并比較各個狀態概率的大小,概率最大者為預測年份的狀態。然后,再根據式(18)計算得到預測值。
4.3 模型檢驗為了驗證所建SCGM(1,1)c-Markov模型的預測精度,分別計算SCGM(1,1)c模型和SCGM(1,1)c-Markov模型2種預測模型的殘差校驗和后驗差檢驗指標,見表5。同時,為了更直觀比較2種預測模型的預測值曲線擬合情況,作出2種預測模型的擬合曲線,見圖2。

表5 SCGM(1,1)c模型和修正模型的預測精度比較
由表5數據可以看出,SCGM(1,1)c模型及改進模型的均方差指標C≈0.03‰(遠小于0.35),小概率誤差P均為1,由表1可知,2種模型的預測等級均為“優”,說明云灰色預測模型適用于浙江省茶葉產量的預測。但是通過比較殘差校驗指標,可以看出SCGM(1,1,)c-Markov預測模型的殘差檢驗指標均較SCGM(1,1)c預測模型有大幅度的降低。從反映模型預測精度的平均相對誤差指標MAEP,可以看出SCGM(1,1,)c-Markov預測模型較單一SCGM(1,1)c預測模型的精度提高了76.47%。同時,由圖2,SCGM(1,1,)c-Markov預測模型的擬合曲線更能反映樣本值的變化規律,擬合效果較SCGM(1,1)c預測模型更好。

圖2 2種預測模型的擬合曲線
為了驗證所建SCGM(1,1)c-Markov預測模型的可行性,以2006—2017年浙江省茶葉產量為樣本值序列,按照SCGM(1,1)c-Markov預測模型的建模計算過程,對浙江省2018、2019、2020年的茶葉產量進行預測,預測結果見表6。

表6 SCGM(1,1)c-Markov模型的可行性驗證
由表6可以看出,2018、2019、2020年預測值和實際值的預測誤差率分別為5.52、1.53%、1.05%,在誤差允許的范圍內能較好地反映浙江省茶葉產量的發展變化趨勢,具有較高的可行性。
4.4 浙江省茶葉產量預測利用該研究建立的浙江省茶葉產量SCGM(1,1)c-Markov模型預測了2021、2022、2023年的浙江省茶葉產量,分別為18.38、19.32、19.53萬t。
由預測結果可知,2021年浙江省茶葉產量較2020年有一定程度下滑,但2022年開始茶葉產量又出現穩定增長趨勢。類比2016年浙江省茶葉生產情況,因2016年浙江省受到春霜夏旱嚴重災情的影響,浙江省茶葉產量產值出現了明顯的“兩頭低,中間高”態勢[16],考慮到2020年全球新冠肺炎疫情對茶葉生產的不利影響,2018—2020年的數據基本符合此規律。2021年是我國“十四五”的開局之年,2021年2月,《中國茶產業“十四五”發展規劃建議》正式向社會發布,作為中國特色優勢農業產業的茶產業得到了國家的高度重視,相繼出臺了關于茶葉生產的“提質增效”“科技創新”“產業協同”“國際拓展”等一系列舉措,這必將積極促進浙江省茶葉產量的穩步提升[17]。由此得出,該研究建立的預測模型對浙江省茶葉產量的預測數據基本符合浙江省茶葉生產的趨勢,具有一定的參考價值。
我國為農業生產大國,茶葉生產是我國經濟性農產品生產問題的重中之重,做好茶葉產量的預測,對保障我國茶葉的有序生產具有重要意義。單因子系統云灰色預測SCGM(1,1)c模型在農業生產領域的產量預測中應用比較廣泛,但鮮有在茶葉產量預測中使用。該研究把改進的SCGM(1,1)c模型運用到茶葉產量預測中,通過對2006—2020年浙江省茶葉產量預測的實例分析,可得出以下結論:
(1)所建模型對茶葉產量的預測數據有較高的可信度,預測數據基本上能反映茶葉產量的實際情況。
(2)SCGM(1,1)c模型能反映茶葉產量變化的總體趨勢,用它來預測茶葉產量是合適的,但是通過建模和實例分析發現,SCGM(1,1)c預測模型對波動較大的數據系統,預測精度不高。
(3)經過Markov預測理論改進的SCGM(1,1)c-Markov預測模型,不僅能反映茶葉產量的總體變化趨勢,而且可以解決灰色系統數據波動較大的問題,改進后的模型大幅度提高了茶葉產量的預測精度,為茶葉產量的預測研究提供了新的方法和思路。