張 汛,李 鵬
(1. 天津大學環境科學與工程學院,天津 300072;2. 桂林電子科技大學海洋工程學院,廣西 北海 536000)
在水資源供需平衡、水污染防治規劃研究過程中,工業廢水排放量預測屬于重要工作,將預測結果作為依據可以有效實現環境的科學管理[1]。治理能力、工業結構、管理水平、科技水平以及產品種類等因素都會對工業廢水排放產生影響[2]。工業廢水排放在空間和時間的變化下存在較強的隨機性,因此工業廢水排放預測的難度較高,需要對工業廢水排放量預測方法進行分析和研究。
張金勇[3]等人結合ARIMA模型和馬爾薩斯模型對GDP和人口進行預測,通過排污系數法獲得工業廢水排放量與人口、GDP之間的關系,根據分析結果完成工業廢水排放量的預測,該方法獲取的排放數據中存在大量的缺失數據,導致方法存在數據完整性差的問題。劉鴻斌[4]等人通過偏最小二乘法獲取投影的重要性信息,根據獲取的信息選擇最優變量子集,并將其作為輸入,輸入至軟測量模型中,構建工業廢水排放預測模型,完成工業廢水排放量的預測,該方法用完整度低的數據進行工業廢水排放量預測,導致預測結果的精度較低。
為了解決上述方法中存在的問題,提出基于灰色GM(1,1)模型的工業廢水排放總量預測模型。
獲取的工業廢水排放數據中存在一些缺失數據,對工業廢水排放總量預測結果產生影響[5]。為了提高預測精度,需要對缺失數據進行填補處理。基于灰色GM(1,1)模型的工業廢水排放總量預測模型通過矢量神經網絡根據設定的可信度λp∈[0,1]對缺失數據進行填補。
基于灰色GM(1,1)模型的工業廢水排放總量預測模型在矢量神經網絡中引入可信度λp對矢量神經網絡進行修正,利用修正后的網絡完成缺失數據的填補。

用(n-k-m)描述矢量神經網絡的結構,設f代表的是神經元在網絡中對應的激活函數,基于灰色GM(1,1)模型的工業廢水排放總量預測模型用sigmoid函數代替激活函數,獲得實際的網絡輸出youtput,其表達式如下

(1)


1)前向傳播
區間類型矢量即為所有神經元在前向傳播算法中的輸入,也可以用區間類型的矢量描述網絡輸出,用sigmoid函數代替神經元對應的激活函數,此時輸出節點可通過下式進行描述

(2)

(3)

設Epq代表輸出誤差,其計算公式如下

(4)
對上述公式計算的輸出誤差Epq進行修正,獲得矢量神經網絡對應的輸出總誤差Ep

(5)

2)后向傳播

(6)

用{(xp,dp,λp),p=1,2,…,N}描述訓練樣本集STr;N′代表完備訓練樣本在訓練樣本集STr中存在的數量;STe描述測試樣本集,Sf=STr-Ste代表的是殘缺數據構成的樣本集,用Nf=N-N′描述殘缺數據的數量,填補缺失數據的過程如下:
1)網絡訓練
①初始化處理訓練參數,設置訓練樣本在訓練樣本集Str中的可信度為λp,并將訓練次數的上限設置為Nt,輸出誤差上限設置為Emax,同時設定慣性項系數α和訓練步長η,計數器在訓練過程中的次數設置為1,賦予權值矩陣w(1)、w(2)相應的數值,并將訓練樣本對應的標志p設定為1。
②在訓練過程中將輸出誤差變量E設定為0,并在矢量神經網絡的輸入節點中輸入訓練樣本集Str中存在的訓練樣本。
③通過上述過程獲得修正后的權值矩陣w(1)、w(2),并計算輸出誤差E。
④在訓練樣本集Str中檢查訓練樣本是否完成訓練,如果p 2)填補殘缺數據 ①初始化處理參數以及殘缺樣本標志l=1,設置樣本l對應的填充矩陣Al。 在工業廢水排放總量預測過程中GM(1,1)模型的應用較多[8,9],其主要過程如下: 用{x(0)(t)}描述原始時間序列,其中t=1,2,…,n,用{x(1)(t)}描述新數據序列,可通過累加原始時間序列獲得 (7) 通過下式描述上式的微分方程 (8) 根據式(8)獲得 其中,-a代表的是發展系數,用來描述預測數據序列與原始數據序列之間的發展趨勢;u描述了數據在變化過程中的關系,代表的是灰色作用向量。在此基礎上獲得還原模型 (9) 實際值與上述GM(1,1)模型獲得的預測值之間存在誤差,根據誤差的實際情況對誤差進行劃分,獲得n個狀態?i=[?1i,?2i],設置馬爾可夫過程對應的狀態轉移概率pij(n),當{Xn,n∈T}為齊次馬爾可夫鏈時,n不對轉移概率pij(n)產生影響,此時下一步系統狀態對應的轉移概率矩陣P可通過下式描述 (10) (11) 通過以下兩種方式,在馬爾可夫模型的基礎上改進GM(1,1)模型,構建灰色GM(1,1)模型: (12) 2)根據狀態轉移矩陣和預測狀態對灰色預測相對誤差在下一時刻所處的狀態進行計算,根據計算結果獲得系統灰色預測相對誤差在未來不同時刻對應的狀態,預測區間可通過修正灰色預測結果獲得,預測值即為預測區間對應的中值[10]。 (13) 式中,pijmax對應的jmax即為最大數據在狀態轉移矩陣中對應的列。 通過上述方法預測未來時刻對應的數值,預測結果即為預測數值對應的平均值,構建工業廢水總排放量預測模型 (14) 為了驗證基于灰色GM(1,1)模型的工業廢水排放總量預測模型的整體有效性,需要對基于灰色GM(1,1)模型的工業廢水排放總量預測模型進行測試。分別采用基于灰色GM(1,1)模型的工業廢水排放總量預測模型、基于人口和GDP的主要水污染物排放量預測方法和基于變量選擇的廢水排放總量預測方法進行如下對比實驗。 通過相關系數ρ驗證上述方法獲取數據的完整性,相關系數ρ在區間[0,1]內取值,相關系數ρ越高,表明數據的完整性越高。相關系數ρ的計算公式如下 (15) 不同方法的測試結果如下: 分析圖1可知,在多次工業廢水排放總量預測測試過程中,基于灰色GM(1,1)模型的工業廢水排放總量預測模型獲得的相關系數ρ均在0.8以上,基于人口和GDP的預測方法和基于變量選擇的預測方法獲得的相關系數ρ均低于所提方法獲得的相關系數ρ。因為所提方法在構建工業廢水排放總量預測模型之前,對獲取的數據進行填補處理,獲取的數據中存在缺失數據,通過矢量神經網絡對缺失數據進行填補處理,提高了數據的完整性。 圖1 不同方法的相關系數 通過判定系數R2和相對誤差測試不同方法的整體有效性。判定系數R2描述的是因變量對回歸自變量擬合程度產生的影響,R2的值越接近1表明預測結果的精度越高,判定系數R2的計算公式如下: (16) 上述方法的測試結果如表1所示。 表1 不同方法的判定系數 根據表1中的數據可知,所提方法的判定系數均在0.9以上,判定系數更接近1,表明預測結果的精度較高,通過上述分析可知,所提方法可精準地實現工業廢水排放總量的預測。 采用不同方法對不同年份的工業廢水排放總量進行預測,獲得預測相對誤差如圖2所示。 圖2 預測結果的相對誤差 分析圖2可知,采用不同方法對不同年份的工業廢水排放總量進行預測時,基于人口和GDP的主要水污染物排放量預測方法和基于變量選擇的廢水排放總量預測方法預測結果的相對誤差均高于所提方法,所提方法預測結果的相對誤差均保持在0.1以內,因為所提方法利用填補后的數據構建了工業廢水排放總量預測模型,提高了模型的預測精度,進而降低了預測結果的相對誤差。 水體污染情況隨著我國工業的發展不斷加重,在這種背景下我國政府開始重點控制工業廢水排放總量。通過預測未來工業廢水排放總量相關部門可以制定合理、科學的污染減排方案。目前工業廢水排放總量預測方法存在數據完整性差、預測精度低的問題,提出基于灰色GM(1,1)模型的工業廢水排放總量預測模型,對缺失數據進行填補處理,利用灰色GM(1,1)模型完成工業廢水排放總量的預測,為治理我國工業廢水排放提供了相關依據。



3 工業廢水排放總量預測模型












4 實驗與分析







5 結束語