繆燕子 王志銘 李守軍 代 偉
灰色預測模型(Grey model,GM)是灰色系統理論的基礎和核心內容,其研究重點在于解決小樣本、貧信息的不確定性問題,且灰色預測模型在眾多領域都得到了廣泛的運用[1].GM(1,1)模型是灰色預測的核心內容,是最簡單、應用最廣泛的單變量灰色預測模型.但GM(1,1)模型只包含一個因變量,不考慮外部其他因素對系統發展的影響,大量研究表明GM(1,1)模型的性能不夠穩定,模擬精度不理想[2-5].因此提出了一種具有一個因變量和N-1個相關因素變量的多維灰色預測GM(1,N)模型[6].但傳統的GM(1,N)模型由于背景值表達式構造的不精確,導致模型預測誤差較大,且當取N=1時,其不能轉化為對應的GM(1,1)模型,說明傳統的GM(1,N)與GM(1,1)模型在結構上是不相容的[7].因此,在某些情況下GM(1,N)模型的預測精度甚至會低于GM(1,1)模型.在考慮多變量預測的同時,為了提高GM(1,N)模型的預測精度,國內外學者針對模型的結構、參數優化、背景值的優化等方面進行了相關研究分析[8-9].
針對背景值優化的問題,主要有插值法和擬合法等改進措施.為提高預測精度,文獻[10] 通過Goldfeld-Quandt 檢驗區分GM(1,1)模型的異方差性,并采用插值法對背景值進行了優化,以此最小化原始序列平方誤差之和的函數來構建其模型;文獻[11]利用一次累加具有非齊次灰指數規律,構建動態序列模型,從積分幾何意義的視角,利用函數逼近的思想,結合復化梯形公式改進模型背景值;文獻[12]提出了一種優化背景值和調整初始系統參數的組合優化方法,通過優化灰色微分方程中的背景值來模擬和預測無偏指數分布的序列;文獻[13]提出一種尋找模型平均擬合誤差(ARPE)最小值的方法,采用粒子群優化算法對模型背景值系數進行優化,當ARPE 最小時的背景值系數取值即是模型的最優解,但其優化是針對傳統背景值表達式,在背景值表達式構造上仍存在一定誤差.
針對模型結構缺陷問題,主要有基于智能算法的結構選擇及參數和結構融合優化等方法.文獻[14-16]對初始條件、累加生成順序、發展系數和背景值分布系數進行了參數優化,研究結果表明上述參數的優化對提高多維灰色預測模型的性能有積極的作用,但當N=1 時,GM(1,N)模型仍然不能等價于GM(1,1)模型,意味著這些改進的灰色預測模型在結構相容性上仍存在缺陷;文獻[17] 提出了一種基于數據算法自適應選擇模型結構的灰色預測模型,稱為離散灰色多項式模型,該模型具有代表最普遍的同構和非同構離散灰色模型的能力,并且可以歸納出一些其他新穎的模型,從而突出了模型與其結構之間的關系;文獻[18]在模型中加入了相鄰變量滯后項、線性校正項和隨機擾動項,其中線性校正項反映了因變量和自變量之間的線性關系,消除了解釋變量之間的多重共線性問題,使模型的預測性能得到了顯著的提高.
基于現有的文獻我們發現傳統GM(1,N)、GM(1,1)模型在構造背景值表達式時存在一定誤差,且模型結構單一,從而導致模型預測精度不高,結構相容性不強等問題.因此,本文對以上兩個問題進行了深入研究.
首先針對模型背景值的構造方法不準確,考慮傳統模型背景值表達式固定用幾何梯形面積近似方程來表示,而現有文獻中的工作亦是基于該公式對參數進行優化,未能從根本上減小誤差.本文從背景值函數表達式的幾何意義出發,構造了一個新的背景值表達式,并采用MATLAB 數值分析對背景值系數的取值進行優化,使背景值系數的取值更靈活,減小了系統參數計算的誤差,進而提高模型的預測精度.其次針對模型結構的缺陷,考慮傳統灰色預測模型結構單一,結構相容性弱,泛化性能差,雖然現有文獻中對各種系統參數及結構參數有所改進,但仍不能使模型具有較好的結構相容性.本文在預測模型中加入了灰色作用量,以反映自變量數據變換關系,改善了模型的結構相容性,提高模型的泛化能力,使模型預測性能得到顯著提高.
本文所提的改進背景值及結構相容性的多維灰色預測模型(Improved background value and structure compatibility of grey prediction model,IBSGM(1,N))解決了傳統多變量灰色預測模型預測性能不穩定的問題,該模型結構泛化能力強,魯棒性好,適用于大部分多變量灰色預測系統.同時,本文突破了傳統的模型改進思想,有效解決了對系統參數優化的同時使模型結構泛化性提高的問題,對多維灰色預測模型的改進方法上提供了新的思路.
灰色預測方法是一種用來對灰色系統進行預測的方法.通過對系統因素發展趨勢之間的相關性分析,生成和處理原始數據,以找出系統的變化規律,生成一組有更明顯規律的數據序列,并基于該數據序列建立微分方程模型,對事物的未來發展狀態進行預測.
單變量GM(1,1)預測模型的基本原理是:對某一數據序列使用累加的方法生成一組變化趨勢明顯的新序列,對新的數據序列建立模型并進行預測,然后利用累減方法逆向計算,使其恢復為原始序列,得出預測模型結果[19].
多變量GM(1,N)預測模型的預測原理與單變量GM(1,1)預測模型類似,不同之處在于輸入數據變量是N個.
GM(1,N)模型的建模過程如下:
設系統有特征數據序列:

為簡化建模過程,傳統GM(1,N)預測模型的背景值表達式固定為幾何面積近似方程,致使模型參數估計產生誤差;其次,模型結構單一,泛化性能不強,導致模型預測魯棒性較差.因此,本文從改進背景值表達式及模型結構方面入手,提出一種新的多維灰色預測模型.
根據對構建灰色GM(1,N)預測模型的研究發現,參數a和b是影響模型預測精度的重要因素,而a和b的取值取決于背景值的參數估計公式,因此,提高背景值表達式構造的準確性,將直接提高模型的預測精度.
稱Z(1)={Z(1)(2),Z(1)(3),···,Z(1)(n)} 為序列改進后的背景值序列,式(3)為改進的背景值表達式,其中參數λ為背景值函數的調節因子,稱為背景值系數,且背景值系數的選取將會直接影響系統參數a和b的計算值,進而影響模型預測性能.
定理 1.對于給定的原始數據序列,定義1所給的優化背景值表達式(3)存在的誤差小于傳統背景值表達式存在的誤差.即


圖1 背景值幾何示意圖1Fig.1 Schematic diagram 1 of the background value



圖2 背景值幾何示意圖2Fig.2 Schematic diagram 2 of the background value



定理 2.對于定義2 中的IBSGM(1,N)模型,時間響應函數為


在灰色系統理論中,有許多常見的單變量或多變量預測模型,如GM(1,1)、GM(1,N),不同的模型具有不同的結構和表達式,其對應的適用場景也有所差異.從傳統GM(1,N)預測模型表達式中不難看出,當N=1 時,該模型并不能等價于GM(1,1)預測模型,因此,GM(1,N)與GM(1,1)模型結構不相容,即傳統GM(1,N)模型泛化能力弱,適用性較差.而本文所提出的IBSGM(1,N)模型在滿足一定條件時可以等價為傳統GM(1,1)、GM(1,N)模型,具有較好的結構相容性.
命題 1.對于所提出的IBSGM(1,N)模型與傳統的GM(1,1)模型,不考慮對背景值所做的優化改進,當N=1,a·b·γ0 時,IBSGM(1,N)模型即為GM(1,1)模型.
證明.對于所提IBSGM(1,N)模型,當N=1,a·b·γ0時,式(23)變為

根據定義1 提出的改進背景值表達式:

IBSGM(1,N)模型表達式可寫為:

顯然,式(34)即為GM(1,1)模型表達式,也就是說當N=1,a·b·γ0 時,不考慮對背景值所做的優化改進,IBSGM(1,N)模型可以等價為GM(1,1)模型,稱其與GM(1,1)模型具有結構相容性.□
命題 2.對于所提出的IBSGM(1,N)模型與傳統的GM(1,N)模型,不考慮對背景值所做的優化改進,當N>1,a·b0,γ=0 時,IBSGM(1,N)模型即為GM(1,N)模型.
證明.對于IBSGM(1,N)預測模型,當N>1,a·b0,γ=0 時,式(23)變為

根據定義1 提出的改進背景值表達式:

IBSGM(1,N)模型表達式可寫為:

顯然,式(37)即為GM(1,N)模型表達式,也就是說當N>1,a·b0,γ=0 時,不考慮背景值所做的優化改進,IBSGM(1,N)模型可以等價為GM(1,N)模型,稱其與原GM(1,N)模型具有結構相容性.
為了確定背景值系數的取值,采用MATLAB對多維灰色預測模型進行數值分析,通過窮舉法計算在不同λ取值下IBSGM(1,N)模型的平均擬合誤差ε,使ε達到最小值時的λ取值即為改進多維灰色預測模型的最優背景值系數.
具體步驟如下:
步驟 1.輸入原始特征序列及相關因素序列在MATLAB 中建立IBSGM(1,N)預測模型;

步驟 2.初始化背景值系數λ=0;
步驟 3.λ以步長0.01 增加至1 迭代計算模型平均擬合誤差ε;
由定理2 可得一次累加序列模擬值:


步驟 4.求得使平均擬合誤差ε取得最小值時的λ值即為IBSGM(1,N)預測模型的最優背景值系數解.


表1 寸草塔煤礦日均瓦斯濃度及影響因素Table 1 Daily average gas concentration and influencing factors in Cuncaota Coal Mine
利用MATLAB 仿真實驗,當λ∈[0,1] 時,λ從0 開始以0.01 的精度逐漸增大,求得模型擬合誤差最小值?=0.0337,此時λ=1.由此可得,在該組實驗數據下,當背景值系數λ=1 時,模型擬合誤差最小、預測精度最高,且IBSGM(1,N)模型擬合誤差為3.37%,較傳統GM(1,N)預測模型擬合精度有顯著提高.IBSGM(1,N)與GM(1,N)模型預測模擬值對比見表2.

表2 IBSGM(1,N)與GM(1,N)模型預測模擬值誤差對比Table 2 Comparison of prediction and simulation errors between IBSGM(1,N)and GM(1,N)model
為了檢驗所提出的IBSGM(1,N)模型的性能,本文進行了三個實例研究,計算了IBSGM(1,N)多維灰色預測模型分別在三組實驗數據下的模擬值和預測結果誤差,并與其他常用的單變量和多變量灰色預測模型的擬合情況及預測性能進行了對比分析.
例 1.文獻[22]提出了一種可以構造出自變量與因變量之間函數關系預測模型,稱為OGM(1,N)預測模型,利用該模型對一種材料在400℉至1100℉溫度范圍內的抗拉強度和布氏硬度的實驗數據進行了實驗,實驗數據如表3 所示,由于溫度條件的限制,該組樣本只有400℉至1100℉范圍內的8 組數據,具有小樣本數據集特征.本文采用同樣的數據比較了IBSGM(1,N)模型與其他灰色預測模型的模擬和預測性能.

表3 一種熱處理鋼在400℉至1100℉的抗拉強度及布氏硬度Table 3 The tensile strength and Brinell hardness of a heat-treated steel from 400°F to 1100°F
示例實驗數據中有三個變量,其中為特征序列抗拉強度(MPa),相關因素序列為布氏硬度(HBW),為溫度(℉).取前七組數據作為建模樣本,第八組數據作為測試樣本,利用MATLAB建立的IBSGM(1,N)模型進行計算,得到模型參數值 [a,b1,b2,γ,λ]T結果如表4 所示,模型預測結果及誤差對比如表5 所示.

表4 IBSGM(1,N)模型的參數值Table 4 Parameter values of IBSGM(1,N)model

表5 四種模型下預測結果和誤差對比Table 5 Comparison of prediction results and errors under the four models
由表4 可以看出,針對該組數據,IBSGM(1,N)模型平均擬合誤差為0.0573%,GM(1,1)模型擬合誤差小于1%,但預測誤差接近5%,GM(1,N)模型擬合及預測誤差較大,預測性能不穩定.相較于傳統GM(1,1)和GM(1,N)灰色預測模型,IBSGM(1,N)模型的平均擬合誤差及預測結果相對誤差均要小得多,且相較于文獻[22]中提出的OGM(1,N)模型,IBSGM(1,N)模型的模擬及預測性能也更勝一籌.
四種模型的模擬預測結果如圖3 所示,可以看出IBSGM(1,N)模型實現了高精度預測,且GM(1,N)模型擬合性能較GM(1,1)更差,驗證了GM(1,N)模型缺陷分析的準確性,OGM(1,N) 與IBSGM(1,N)模型曲線均貼合實際值曲線,但IBSGM(1,N)模型的模擬和預測性能更好.

圖3 例1 中四種模型的模擬預測結果曲線圖Fig.3 Curves of simulated prediction results of the four models in Example 1
例 2.文獻[13]提出了一種改進動態背景值系數OBGM(1,N)模型,通過粒子群算法尋找系統相對誤差最小值以此求解背景值系數,利用該模型對文獻[23]中給出的中國無線通信用戶人數和其他影響因素的數據進行了模擬預測,實驗數據如表6所示,該文獻只公布了2000 年至2010 年相關數據,屬于小樣本數據集.本文采用同樣的數據比較了IBSGM(1,N)模型與其他灰色預測模型的模擬和預測性能.

表6 中國無線通信用戶數量和相關因素Table 6 Number of wireless communication users and related factors in China

表7 IBSGM(1,N)模型的參數值Table 7 Parameter values of IBSGM(1,N)model
由表8 可以看出,IBSGM(1,N)預測模型在該組實驗數據下的平均擬合誤差為0.25%,而傳統GM(1,N)模型的擬合誤差高達21.59%,相較于傳統GM(1,1)和GM(1,N)灰色預測模型,IBSGM(1,N)模型的平均擬合誤差及預測結果相對誤差均要小得多,且IBSGM(1,N)模型的模擬及預測性能比文獻[10]中的OBGM(1,N)模型性能更好.

表8 四種模型下預測結果和誤差對比Table 8 Comparison of prediction results and errors under the four models
四種模型的模擬預測結果如圖4 所示,可以看到在四種模型中IBSGM(1,N)預測模型具有最高的預測精度,與實際數據擬合度最高,擬合誤差明顯小于GM(1,N)與GM(1,1)模型,雖然OBGM(1,N)模型也取得了較高的精度,但IBSGM(1,N)模型由于背景值取值更加靈活,結構相容性更強,預測性能更好.

圖4 例2 中四種模型的模擬預測結果曲線圖Fig.4 Curves of simulation prediction results of the four models in Example 2
例 3.文獻[24]提出了一種改進的多變量時滯GM(1,N)預測模型,利用該模型對浙江省經濟總產值與固定資產投資額進行預測,實驗數據如表9所示,由于所用數據時《浙江省統計年鑒》只公布了2003~ 2011 年的固定資產投資額數據,具有小樣本數據集特征.本文采用同樣的數據樣本比較了IBSGM(1,N)模型與其他灰色預測模型的模擬和預測性能.

表9 2003-2011 年浙江省經濟總產值與固定資產投資額Table 9 2003-2011 Zhejiang province′s total economic output value and fixed asset investment

表10 IBSGM(1,N)模型的參數值Table 10 Parameter values of IBSGM(1,N)model
由表11 可以看出,IBSGM(1,N)模型在該組實驗數據下的平均擬合誤差為1.52%,而傳統GM(1,N)模型的擬合誤差高達11.01%,傳統GM(1,1)模型擬合誤差為2.22%,且相較于文獻[24]中提出的時滯GM(1,N)預測模型,本文所提出的IBSGM(1,N)預測模型在擬合效果及預測精度上都有更優的表現,對比三種模型的預測結果,IBSGM(1,N)模型的預測相對誤差為0.66%,實現了高精度預測.

表11 四種模型下預測結果和誤差對比Table 11 Comparison of prediction results and errors under the four models
四種模型的模擬預測結果如圖5 所示,可以看到在四種模型中IBSGM(1,N)預測模型具有最高的預測精度,與實際數據擬合度最高,擬合誤差明顯小于傳統的GM(1,N)、GM(1,1)預測模型及時滯GM(1,N)預測模型.分析實驗結果表明,IBSGM(1,N)模型由于背景值取值更加靈活,結構相容性更強,使模型預測性能顯著提高.
現有的傳統GM(1,N)多維灰色預測模型在實際預測領域中應用并不廣泛,主要由于其背景值表達式的構造存在較大誤差及模型結構上存在缺陷.傳統灰色預測模型為簡化建模過程,其背景值表達式固定用幾何梯形面積近似方程來表示,本文從背景值函數的幾何意義出發,構造了一個新的背景值表達式,采用MATLAB 數值分析對背景值系數的取值進行優化,并從理論上證明了新的背景值函數相較傳統模型背景值函數的誤差更小.考慮到傳統GM(1,N)預測模型在結構上與GM(1,1)等基礎預測模型不兼容的問題,在模型中加入了灰色作用量,以反映自變量數據變換關系.通過理論證明,改進的IBSGM(1,N)模型具有與傳統單變量和多變量灰色預測模型的結構相容性.本文通過對三個實驗案例的研究,計算了IBSGM(1,N)的模擬值和預測誤差,并與其他常見的灰色預測模型進行了對比分析,可以看出,由于本文所提IBSGM(1,N)模型背景值取值更加靈活,結構相容性更強,使模型預測性能有顯著提高.
本文提出的結合背景值優化與改進模型結構相容性方法,在理論證明和實驗分析中均取得了較好的結果.本文在對多維灰色預測模型的改進方法上進行了創新,所提出的IBSGM(1,N)模型在預測精度和結構相容性方面有較強的優勢,適用于常規條件下的多變量灰色預測,為灰色預測模型提供了新的改進思路.在未來進一步的研究中可采用不同參數優化及模型結構改進方法相結合,針對不同應用環境選取最優的預測模型.
在研究中發現,對于文中實驗案例給出的三組數據,IBSGM(1,N)模型的背景值系數取值僅取了0 和1,未作背景值系數取值的定性分析.因此,探究在更多不同實驗數據下,背景值系數的取值差異及規律是未來需要繼續展開的工作.