衛召
(河南理工大學 材料科學與工程學院,河南 焦作 454000)
南水北調中線工程作為世界上最大的自流引水工程,于2009年12月28日在河南省南陽市淅川縣九重鎮陶岔村隆重開工。該工程將從南陽陶岔開閘引水,向河南、河北、北京及天津四省市供水。作為渠首閘所在地,陶岔水質的優良至關重要,對其進行評價及預測也成為專家學者的研究熱點。然而,水質的評價和預測目前仍處于形成、發展階段,由于影響河流水質的因素多,且各因素與水質之間呈現復雜的非線性關系,單一的水質評價方法和基于數學表達式的水質預測方法誤差較大,無法全面反映水質的變化[1-2]。
基于此,本文在實地調研的基礎上,根據陶岔2013~2014年部分水質指標檢測數據,選取pH、溶解氧、高錳酸鹽指數、氨氮作為研究指標,通過建立主成分加權分析的水質評價模型和BP神經網絡的水質預測模型,探討水資源的污染檢測和保護之路。
主成份加權分析法是將原來具有一定相關性的幾組指標,重新組合成互相無關的一組綜合指標來代替原來指標的方法。綜合指標之間既互不相關,又能反映原來的觀察指標的信息。處理方法就是將原來p個指標線性組合,其方差Var(yn)越大,表示yn組合包含的信息越多。
1)變量標準化處理
設檢測數據中水質樣本共有n個,指標共有p個,分別為x1,x2,x3,…xp,令xij為第i個樣本的第j個指標的值,做變換得到標準化的數據矩陣:

2)計算特征值和特征向量
計算相關系數矩陣,及對應的特征向量λ1≥λ2≥…λp≥0,及對應的特征向量u1,u2,…,up,其中uj=(u1j,u2j,…unp)T,由特征向量組成m個新的指標變量。
3)選擇p個主成份,計算綜合評價值
計算特征值λj(j=1,2…m)的信息貢獻率和累積貢獻率。主成份yi的信息貢獻率為

主成份 λ1,λ2,…,λp的累積貢獻率為:

當 bp接近于 1 時,則選擇前 p 個指標變量 y1,y2,…,yp作為p個主成份,代替原來m個指標變量,從而可對p個主成份進行綜合分析。
然后,計算綜合得分:

根據綜合得分就可對樣本數據進行評價。
根據水質評價的一般方法,選取pH、溶解氧(DO)、高錳酸鹽指數(CODMn)、氨氮(NH3-N)作為評價指標。分類標準采用 GB3838-2002《地表水環境質量標準》,其中pH*為無量綱數據,其他指標單位為mg/L。

表1 地表水環境質量標準Tab.1 Surface standards for environment quality
由國家環境保護部公布的全國主要流域重點斷面水質自動監測周報,可得到以南水北調中線工程取水口為斷面的水質監測數據[3]。選取2013年第46周(2013-11-19)—2014年第09周(2014-03-04)的檢測數據作為水質評價樣本,如表2所示。
借助SPSS統計分析軟件可實現主成份分析法的全部計算過程。經過數據標準化、相關矩陣的建立,得到4個成分的特征值。
然后,確定主成分數目。根據因子載荷矩陣,可得到每個主成分的方差,即特征根,它的大小表示了對應主成分能夠描述原來所有信息的多少。由于前3個特征值累計貢獻率達到95.4%,故選取前3個變量來代替原來的4個變量。
根據SPSS得到的成分矩陣,結合主成份貢獻率,可得 3個主成分性組合為:

進而可以得到:

根據主成份線性加權表達式,可以得到16個樣本的綜合得分。再結合表1,可以得到標準數據的綜合得分。以各個樣本的綜合得分參照標準綜合得分,即可得到樣本的水質評價等級,如表4所示。

表2 南陽陶岔斷面水質周報分析樣本數據Tab.2 Monitoring data of water quality report of Taocha

表3 主成份貢獻率Tab.3 Contribution rates of principal component

表4 樣本評價結果Tab.4 Valuation results of water quality at monitoring data
由表4可知,16組樣本中有13組的評價等級與實際等級是一致的,評價的準確率為81.25%,且沒有出現偏差很大的情況,因此在誤差可以接受的范圍內,主成分加權評價法用于水質評價是比較可靠的。
結果表明,陶岔的水質總體較好,普遍達到II級及以上。但也可以發現,陶岔的水質處于波動之中,為了更好地了解并掌握陶岔水質的變化,需要建立預測模型對水質的變化進行檢測和預警。
人工神經網絡作為一種現代優化算法,具有自學習、自組織、大規模信息處理的特點和強大的糾錯能力,常用于處理模糊非線性關系。在求解實際問題時,不必對變量之間的關系做出假設,對問題的結構也沒有要求。在水質預測的研究中具有參數修正自動化、預測精度高等優點,避免了基于數學表達式的預測方法所可能造成的較大誤差[4-6]。
水質預測的BP神經網絡模型設置為3層。輸入神經元數目是 4 個,即 DO、CODMn、NH3-N、pH;隱含層 1 層,神經元數目采用試湊法確定為5個;輸出層神經元數目是1個。
利用Matlab中的神經網絡工具箱,可直接在Matlab中調用相關函數實現BP網絡模型的學習、訓練、擬合及仿真過程。具體步驟為:
1)數據歸一化。利用工具箱中的premnmx函數把數據歸一化到[-1,1]區間。
2)建立網絡。通過newff函數并使用選定的訓練函數trainlm,生成一個前饋的三層BP神經網絡。
3)訓練網絡。通過train函數對已生成的網絡進行學習訓練,學習步長設為200個周期,目標誤差設為0.001,學習速度設為0.05,并每隔20步顯示一次結果。
4)網絡仿真模擬及數據還原。通過工具箱中的sim函數來進行已訓練網絡的仿真模擬,運算結果通過postmnmx函數進行反歸一化處理,得到有效的預測值。
將表2的數據分成兩部分,1~8組數據作為訓練樣本,9~16組數據作為預測樣本[7]。以NH3-N的樣本數據為例,迭代2 197次后,達到目標誤差0.001以下,停止訓練。
得到NH3-N的預測結果及相對誤差如表5所示。
同理,可以得到9~16組pH、DO、CODMn的預測數值和相對誤差,四組指標的預測相對誤差值如圖2所示。
結果表明,預測的最大誤差為4.75%,平均誤差0.70%,預測精度較高,滿足水質預測的要求。BP神經網絡應用于水質預測較為準確可靠,只要能夠即時獲得水質指標的監測數據,運用該模型就能掌握水質的變化趨勢。
與 pH、DO、CODMn的預測相對誤差相比,NH3-N 的誤差偏離稍大,同時也說明了陶岔水質的pH、DO、CODMn的量較為穩定,而NH3-N的量變動幅度相對較大。這可能是由于監測點附近存在氨氮污染源或是人為活動的影響,因此,利用神經網絡對于水質指標變化的靈敏性就可以進行污染的預警和預報。

圖1 訓練精度變化Fig.1 The change of training precision

表5 9~16組NH 3-N樣本預測結果Tab.5 The forecast result of NH 3-N from 9 to 16

圖2 相對誤差變化幅度Fig.2 The margin of relative error
1)主成份加權評價法用于水質評價比較可靠。在對陶岔的水質評價中準確率較高,達到81.25%,且能夠全面合理地反映水質情況。
2)BP神經網絡[8-9]用于陶岔水質預測精度高,迭代速度快。預測中最大誤差為4.75%,平均誤差為0.70%,符合水質預測的精確度要求,能夠應用于水質變化監測預報中,為庫區的水資源保護起到指導性作用。
[1]陳潤羊,花明,涂安國.長江流域水質評價的幾種方法[J].華東理工大學學報,2008,31(2):146-151.CHEN Run-yang,HUA Ming,TU An-guo.Several methods of water environment quality assessment in the yangtze river[J].Journal of East China University of Science and Technology,2008,31(2):146-151.
[2]王曉萍,孫繼洋,金鑫.基于BP神經網絡的錢塘江水質指標的預測[J].浙江大學學報,2007,41(2):361-364.WANG Xiao-ping,SUN Ji-yang,JIN Xin, Prediction of water quality index in qiantang river based on BP neural network model[J].Journal of Zhejiang University,2006,22(5):62-66.
[3]中華人民共和國環境保護部數據中心 [EB/OL].[2014-03-04].http://datacenter.mep.gov.cn/report/getCountGraph.do?type=runQianWater.
[4]Jinsong Guo,Zhe LI.Artificial neural network modeling of water quality of the Yangtze River system:a case study in reachescrossing the city of Chongqing[J].Journal of Chongqing University,2009,8(1):1-9.
[5]Ying Zhao, Jun Nan, Fuyi Cui,etal.Water quality forecast through application of BPneural network at Yuqiao reservoir[J].Journal of Zhejiang University,2007 8(9):1482-1487.
[6]劉國東,黃川友,丁晶.水質綜合評價的人工神經網絡模型[J].中國環境科學,1998,18(6):514-517.LIU Guo-dong,HUANG Chuan-you,DING Jing.Models of artificial neural networks for comprehensive assessment of water quality[J].China Environmental Science,1998,18(6):514-517.
[7]操建華,林宏偉,張實誠.基于BP神經網絡的丹江口庫區水質指標預測[J].電子設計工程,2010,18(3):17-24.CAO Jian-hua,LIN Hong-wei,ZHANG Shi-cheng.Prediction of water quality index in Danjiangkou reserveior based on BPneural network[J].Electronic Design Engineering,2010,18(3):17-24.
[8]魏江濤,陳方濤,姜美雷.BP神經網絡在設備故障診斷方面的應用[J].現代電子技術,2012(19):131-134.WEI Jiang-tao,CHEN Fang-tao,JIANG Mei-lei.Application of BP neural network in fault diagnosis of radar device[J].Modern Electronics Technique,2012(19):131-134.
[9]高原.基于BP神經網絡的文本驗證碼破解[J].電子科技,2012(7):37-42.GAOYuan.Text captchacrack based on BPneural network[J].Electronic Science and Technology,2012(7):37-42.