趙 磊,薛東劍,方 坤
(1.成都理工大學地球科學學院,四川 成都 610059;2.四川省國土科學技術研究院,四川 成都 610045)
灰色系統是由我國著名學者鄧聚龍在1982年提出來的,灰色系統的提出解決了大量預測問題,灰色系統著重于小樣本、貧信息和不確定性問題的研究,并依據信息覆蓋,通過序列算子的作用探索事物運動的現實規律,其特點是“少數據建?!?,著重研究“外延明確,內涵不明確”的對象[1]。預測的任務就是探尋研究客觀事物發展變化的規律,由于預測的對象、目標和內容的不同,形成了多種多樣的預測方法[2],薛東劍等[2]采用灰色系統預測模型進行礦產預測,并證實了灰色系統預測模型在礦產預測中的適用性,此后灰色系統預測方法在礦產預測中被廣泛使用,為礦產資源編制工作提供了新的方法與思路。然而面對礦產產量數據的無規律性,灰色預測系統模型在對礦產預測過程中時,仍存在精度偏低等問題。所以本次研究通過對比多種背景值改良后的灰色系統模型及原始灰色系統模型,通過對模擬值、殘差、相對誤差和平均相對誤差等多個方面進行對比分析,為礦產預測選擇更加合理、精確的預測方法。
模型的初始值、模型的背景值和模型的參數估計方法等是影響GM(1,1)模型的預測精度的常見因素[3],其中背景值構造方法的改良在探索提高GM(1,1)精度的過程中有非常重要的意義,并且一大批學者致力于背景值構造改良方法的研究。劉樂等[4]將x(1)(t)抽象為x(1)(t)=B·exp(A·t)+C,從而構造出更加精確的背景值構造公式,該公式提高了預測精度,同時還適用于高、低指數增長序列的建模。李星毅等[5]利用非齊次指數函數模擬依次累加生成序列,在考慮原始模型誤差出現原因之后,根據序列與累加生成序列的關系重新構造了背景值計算公式,以實際曲線在區間上與x軸圍成的面積作為新背景值。蔣詩泉等[6]基于積分幾何意義,將原區間平分成若干小區間,利用函數逼近的思想,同時利用復化梯形公式代替原公式,提出了新的GM(1,1)模型背景值優化方法,并取得了較好的效果。江藝羨等[7]根據模型的指數性質及積分特點,利用黎曼積分的核心思想,用不規則梯形面積代替傳統梯形面積,從而提出了新的背景值構造方法。徐寧等[8]根據GM(1,1)模型時間響應式的函數形式,利用積分中值定理擬合真實模型背景值,在研究發展系數與背景值之間的關系的基礎上,提出了基于誤差最小化的GM(1,1)模型背景值優化方法。李凱等[9]提出了利用辛普森3/8公式和牛頓插值公式的組合插值方法來構造出新的GM(1,1)模型背景值。雖然改良后的各種模型具有較好的預測穩定性,增強了GM(1,1)模型的適用性,但是對于數據較大且無規律的礦物產量而言,不論是原始GM(1,1)模型還是改良后的GM(1,1)模型都只能進行短期預測,所以本文提出了利用新陳代謝模型與改良后的模型相結合,以便于進行礦物產量的長期預測,從而達到更高的精度。
GM(1, 1)模型的算法如下:
設時間序列x0有n個觀察值:

累加生成新序列:X1={x1(1),x1(2)…x1(n)},其中
X1(k)為X0(k)的一次累加序列,記作1-AGO,有:

(1)式為GM(1,1)模型的基本形式,也稱作灰微分方程;其中a、b分別為發展系數和內生控制灰數為待估計參數變量,通常利用最小二乘法可以解得:
其中:

B矩 陣 中z(1)(k)=1/2{x(1)(k)+x(1)(k-1)};k=2,3,…,n,z(1)(k)即為模型的背景值。

(3)式即為灰微分方程式(1)的白化方程,時間響應式為:

利用(4)式累減得可到還原序列,即預測方程:

計算建模序列的級比:

若數據符合(6)式,則認為建模序列是合格的。其中:

若不滿足上述條件,則需要對數據序列進行一定的變換處理,從而達到建模要求。
灰色模型精度檢驗一般有三種方法:相對誤差大小檢驗法,關聯度檢驗法和后驗差檢驗法。常用的為后驗差檢驗法。

(2)計算殘差。

(3)分別計算原始序列x0的方差S1和殘差e(k)的方差S2。

(4)計算后驗差比。

其中C表示原始數據離散程度的大小。
(5)計算小誤差概率并查表觀察效果(表1)。

表1 精度等級對照表
小誤差頻率:P=P{|ε(k)-ε(k)|<0.6745S1},其中P表示殘差與殘差平均值之差小于0.6745S2的點的數量。
在傳統的GM(1,1)模型的建模過程中,常利用梯形面積代替積分與X軸圍成的面積,從而在預測結果上產生了誤差,同時GM(1,1)模型的預測精度取決于a和b的值,同時模型中a,b的值又取決于背景值z(1)(k),因此本文選取原始GM(1,1)模型以及三種背景值改良后的GM(1,1)模型進行對比分析。
令區間[k-1,k]=[p,q],在區間[k-1,k]中平均插入n-1個點,將區間[k-1,k]平均分成了n個小區間,則每個點的表達式為xk=p+kh;k=0,1,…,n,其中h=(q-p)/nh,對每個小區間進行積分并求和得到:

最終得到背景值公式:



最終根據待定系數A、D、C并結合式z(1)(k)=1/A[x(1)(k)-x(1)(k-1)]+C=[x(0)(k)/A]+C得到新背景值構造公式為:x(1)(k)≠x(1)(k-1)時,


水泥用灰巖2011年至2019年產量數據來自2011年至2019年《四川省礦產資源年報》、《四川省統計年鑒》,具體產量數據可見下表2。

表2 四川省水泥用灰巖2011~2019年產量
利用表2水泥用灰巖2011~2019年9組產量數據進行建模:X(0)={5855.2,6267.9,6789.1,7564.2,7464.7,7811.9,8420.6,8670.9,9355.3}

表3 水泥用灰巖產量預測結果

表4 水泥用灰巖預測產量誤差分析結果
原始GM(1,1)模型及三種基于背景值改良的GM(1,1)模型預測精度都達到了1級,但是水泥用灰巖產量數據較大,所以對精度要求較高,通過對三種改良模型的預測數據的平均誤差進行分析對比后發現,M3改良模型較原始GM(1,1)模型及其他改良模型都有一定優勢,成功降低了水泥用灰巖產量預測的誤差。原始產量數據與M3模型預測值擬合度如圖1所示。
從表4和圖1可以看出原始產量數據與M3模型預測值擬合度較高,M3模型預測值最高相對誤差為5.37%,平均相對誤差為1.72%,預測精度為1級,適合對水泥用灰巖進行中長期預測研究。

圖1 2012~2019年水泥用灰巖原始值與預測值
在原始數據序列中,新預測數據x(0)(n+1)代替舊數據x(0)(1),新預測序列則更新為:

反復進行此過程,直到完成預測任務,這個新數據代替舊數據,并反復利用新序列來進行GM(1,1)建模的過程就是灰色新陳代謝模型,通過這個過程可以提高預測精度。
利用表2水泥用灰巖2011~2019年9組產量數據進行建模,通過預測公式計算得到2020年水泥用灰巖產量為9 819.7萬t。
利用新陳代謝模型將x(0)(10)代替原x(0)(1)形成新的建模序列,計算得到2021年水泥用灰巖產量預測模型:
同理可得未來4年水泥用灰巖預測模型。
2021~2025年水泥用灰巖產量預測模型分別為:

通過上述2021~2025年水泥用灰巖產量預測模型得到預測結果(表5)。

表5 水泥用灰巖產量預測結果
未來五年的產量預測結果表明,水泥用灰巖產量呈上升趨勢。水泥用灰巖在水泥工業中占主導地位,是國民經濟及人民生活必不可少的原料,其工業總產值穩步上升,需求呈現上升的趨勢,水泥用灰巖產量預測結果與需求趨勢一致。
(1)本次研究以四川省第四輪礦產資源規劃為背景,利用表2中水泥用灰巖2011~2019年產量數據,分別采用原始GM(1,1)模型及三種背景值改良后的GM(1,1)模型,利用水泥用灰巖2011~2019年產量對其進行預測,在四種預測模型預測精度都為一級的情況下,對四種模型的預測精度進行對比分析,最終選擇出了更加適合水泥用灰巖產量預測的模型。
(2)礦物產量受政策、價格等因素變化而波動,舊數據已經不再適合繼續作為GM(1,1)建模數據進行研究,新陳代謝模型利用新數據代替舊數據,將改良后的GM(1,1)模型與新陳代謝模型相結合,利用水泥用灰巖2011~2019年產量數據進行建模,成功預測出未來5年水泥用灰巖產量,水泥用灰巖產量預測結果呈現上升趨勢。
此次研究為動態建模過程,提高了對水泥用灰巖產量長期預測的準確性,為其他礦物產量的長期預測提供了方法和思路,也為礦產資源規劃提供了更加精確的數據,合適的預測模型和精確的預測數據是礦產規劃順利完成的有力保障。