胡文博,李春青,任淑霞
(天津工業大學計算機科學與軟件學院,天津 300387)
Adaboost-BP在MBR膜污染中的應用研究
胡文博1,李春青2,任淑霞2
(天津工業大學計算機科學與軟件學院,天津 300387)
研究MBR膜通量進行膜污染預測是當今污水處理研究領域的重要課題之一,膜污染直接導致的結果是膜通量的下降。由于傳統BP神經網絡預測MBR膜通量存在局部極小值及模型的泛化能力較差的缺點,本文利用AdaBoost算法優化傳統的BP神經網絡,建立了AdaBoost-BP預測模型,并將該模型運用到MBR膜通量的預測中。通過預測數據和實驗數據的對比,得出該模型的可行性,同時將其對比傳統的BP神經網絡模型,說明AdaBoost-BP預測模型具有更高的預測精度。
MBR;膜通量;AdaBoost-BP;BP神經網絡
本文著錄格式:胡文博,李春青,任淑霞. Adaboost-BP在MBR膜污染中的應用研究[J]. 軟件,2016,37(12):21-25
膜生物反應器(MBR)是將膜分離技術和生物處理單元相結合的一種新型污水處理工藝,它是利用微生物對反應基質進行生物轉化,同時利用膜組件分離反應產物并截留生物體[1]。目前研究MBR模擬仿真系統模型的熱點之一是通過利用膜通量影響因素,結合智能仿真模型來預測膜通量。現階段,對MBR膜通量仿真預測的方法有很多種,例如:數學模型、自回歸、BP神經網絡、支持向量機等。然而,這些傳統的方法預測效果并不是很理想。AdaBoost-BP模型是將BP神經網絡作為弱分類器,通過AdaBoost算法將其升級,使之成為強分類器模型,進而更好對實驗數據進行預測[2]。
目前,傳統的BP神經網絡應用已非常廣泛,它能學習和存貯大量的輸入-輸出模式映射關系,而無需事前揭示描述這種映射關系的數學方程。它采用最速下降法來學習,按誤差逆傳播算法來訓練,在開始訓練前,初始化各層的連接權值及閾值為[0,1]之間的隨機數。為使網絡的誤差平方和最小,它會不斷的調整權值和閾值。然而這種隨機設定的初值,很難把控算法的收斂速度,且訓練出來的最終結果可能為局部最優解,而非全局最優解。其網絡結構如圖1所示。

圖1 BP神經網絡結構Fig.1 BP neural network structure
2.1 基本思路
AdaBoost算法是一種迭代算法,它訓練同一個基本分類器(本文采用的是傳統的BP神經網絡),但每次的訓練集卻不相同,而不同的訓練集是通過改變樣本的權重得到的[3],最終得出的強分類器是通過一定的方式加權基分類器而來的。理論可以證明,只要弱分類器的分類能力大于二分之一時,強分類器的錯誤率會隨著弱分類器個數的無窮增大而趨于零。起初,每個訓練樣本的權重為樣本總數的倒數,即均勻分布。在此基礎上訓練出一個基分類器,然后計算出G1(x)錯分的樣本和正確的樣本,并按照一定的規則增加錯分樣本的權重值而減小其正確樣本的權重值。同時,給基分類器G1(x)一個權重,這樣不僅重新改變了訓練樣本的重要程度,也給基分類器確定了一個重要程度指標。然后,根據新的樣本分布訓練得到基分類器G2(x)和其權重。依次類推,可以得到M個基分類器和M個相應的權重。最后得到的強分類器就是按權重累加求和這M個基分類器[4]。
2.2 AdaBoost-BP預測模型算法
AdaBoost-BP預測模型算法流程如圖2所示,算法過程如下:
輸出:最終分類器G(x)。
過程:

(2)對于m=1,2,…,M,
a. 使用具有權值分布Dm的訓練數據集進行學習(任意選一種模型都可以,這里選用BP神經網絡,并且每一輪迭代都可以用不同的模型),得到一個弱分類器;



d. 更新訓練數據的權值分布;

這里,Zm是規范化因子

將M個基本分類器進行線性組合

得到最終分類器

訓練誤差分析:

圖2 AdaBoost-BP預測模型算法流程Fig.2 AdaBoost-BP prediction model algorithm flow


即訓練誤差的上界會隨M的增加而指數減小。
MBR膜污染主要是指在泥水分離過程中,活性污泥混合液中的細小微粒、膠體顆粒、溶質大分子等物質與膜存在物理的、化學的和機械的作用,從而引起膜面或膜孔內吸附、沉積,最終造成膜孔徑變小甚至膜孔堵塞[5]。膜通量的大小受多種因素的綜合影響,歸納起來主要有MLSS、溫度、操作壓力、總阻力、COD等。采用主成分分析法(PCA)可得,對MBR膜通量起決定作用的因素有:生物動力學參數(混合液懸浮固體MLSS)、操作條件參數(總阻力和操作壓力)[6]。本文將以上三個主要影響因子作為預測模型的輸入條件,膜通量作為輸出。其AdaBoost-BP模型示意圖與MBR膜通量預測模型如3和圖4。

圖3 AdaBoost-BP模型示意圖Fig.3 AdaBoost-BP model diagram

圖4 MBR膜通量預測模型Fig.4 MBR membrane flux prediction model
我們通過實驗得到70組數據,將MLSS、總阻力、操作壓力作為預測模型的輸入,MBR膜通量作為預測模型的輸出。為了更好的驗證該預測模型的有效性,將前60組數據作為訓練樣本,后10組樣本作為測試樣本,建立AdaBoost-BP的MBR膜通量預測模型,通過訓練樣本確定MBR膜通量與其影響因子之間的非線性關系。本文實驗通過Matlab來實現。
4.1 實驗條件
本文采用Matlab語言編寫程序,先將樣本數據按(式12)做歸一化處理,使其值分布在[-1,1]之間,然后調用Matlab神經網絡工具箱建立起傳統的BP神經網絡預測模型和AdaBoost-BP預測模型。其中,BP神經網絡采用3-8-1的結構,神經網絡的其它參數采用默認值,而AdaBoost-BP模型采用10個BP神經網絡作為弱預測器。

4.2 實驗結果與分析
首先,將10組測試數據作為傳統BP預測模型的輸入值,得出10個樣本數據的BP預測結果,并算出每個樣本的預測相對誤差,然后,再將這10組測試數據帶入到AdaBoost-BP預測模型中,得到10個樣本的AdaBoost-BP預測值,同時也算出每個測試樣本在AdaBoost-BP預測模型下的相對誤差。其結果見圖5,數據分析結果見表1,每個弱分類器的權重見表2。最后,根據表一的結果計算出傳統BP模型預測的平均絕對誤差為0.9488,平均相對誤差為3.35%,同理,計算得到AdaBoost-BP預測模型平均絕對誤差為0.4556,平均相對誤差為1.19%,其中,兩個預測模型的誤差比較圖如圖6。可以看出,實驗取得了良好的預測效果,且本文采用的AdaBoost-BP預測模型比傳統的BP預測模型具有更好的預測能力。

圖5 模型預測結果對比Fig.5 comparison of prediction results

表1 預測模型測試結果Tab.1 test results of prediction model

表2 預測模型測試結果Tab.2 weak classifier weights

圖6 絕對誤差結果對比Fig.6 comparison of absolute error results
從表1的數據可以發現,整體上,傳統BP預測模型預測的結果誤差較大,而采用AdaBoost算法改進后,建立的AdaBoost-BP預測模型能將預測精度優化許多。另外,從圖5和圖6的對比中也可以發現,對于10組測試樣本,其中有9組預測數據都是AdaBoost-BP模型更精確些,這也充分體現了該模型的正確性和精準性。從而可以得出本文提出的AdaBoost-BP預測模型具有很好的適用性。此外,AdaBoost算法本身就具備很好的泛化能力[7],且無參數調整,編碼也很簡單,它排除一些不必要的訓練數據特征[8],將其引入到MBR膜污染模擬仿真中,對MBR膜通量的預測提供了一種全新的方法和思路。
[1] Zuthi, M. F. R. Ngo, H. H.; Guo, W. S. Modelling bioprocesses and membrane fouling in membrane bioreactor (MBR): A review towards finding an integrated model framework. BIORESOURCE TECHNOLOGY[J]. 2012, 10(122): 119-129.
[2] YU Jiayuan. The application of BP-AdaBoost strong class-ifier to acquire knowledge of student creativity. Computer Science and Service System (CSSS), 2011International Conference on. 2011.
[3] Gaber T, Tharwat A, Hassanien A E, et al. Biometric cattle identification approach based on Weber’s Local Descriptor and AdaBoost classifier[J]. Computers & Electronics in Agriculture, 2016, 122(12): 55-66.
[4] 劉沖, 張均東, 曾鴻, 等. 基于支持向量機的無窮維Ada-Boost算法及其應用[J]. 儀器儀表學報, 2010, 04: 764-769. Liu Chong, Zhang Jundong, Zeng Hong, Ren Guang, Ji Yulong. Advanced AdaBoost Algorithm Based on Support Vector Machine and Its Application[J]. Journal of Instrumentation, 2010, 04: 764-769.
[5] 閆宏英, 李春青. MBR膜污染的智能模擬預測方法研究[J].計算機測量與控制, 2013, 08期(08). YAN Hong-ying, LI Chun-qing. Study on intelligent simulation and prediction of MBR membrane fouling[J]. Computer Measurement & Control, 2013, 08(08).
[6] 孟凡剛. 膜生物反應器膜污染行為的識別與表征[D]. 大連理工大學, 2007. Meng FANG. Membrane bioreactor membrane fouling behavior identification and characterization[D]. Dalian University of Technology, 2007.
[7] 胡德華, 鄭東健, 付浩雁. AdaBoost-BP模型在大壩變形預測中的應用[J]. 三峽大學學報(自然科學版), 2015, 05: 5-8. Hu Dehua, Zheng Dongjian, Fu Haoyan. Application of AdaBoost-BP model in dam deformation prediction[J]. Journal of Three Gorges University (Natural Sciences), 2015, 05: 5-8.
[8] 高靜. Adaboost-BP方法在企業信用評級中的應用研究蘭州商學院, 2012. Gao Jing. Adaboost-BP method in the application of enterprise credit rating[D]. Lanzhou Business School, 2012.
The Research of Prediction Model Based on AdaBoost-BP in MBR Membrane Fouling
HU Wen-bo1, LI Chun-qing2, REN Shu-xia2
(School of Computer Science and Software Technology, Tianjin Polytechnic University, Tianjin, China, 300387)
Membrane flux prediction is one of the most important topics in wastewater treatment research. Membrane fouling is a direct result of membrane flux decline. Because traditional BP neural network has its own local minimum in predicting the MBR membrane flux and the generalization ability of the model is poor, in this paper, we use AdaBoost algorithm to optimize the traditional BP neural network and establish the AdaBoost-BP prediction model, then apply this model to predict the MBR membrane flux. By comparing the predicted results and experimental results, we can obtain that the model is feasible .At the same time, it is compared with the ordinary BP model, and the results show that the AdaBoost-BP prediction model has higher prediction accuracy.
MBR; Membrane flux; AdaBoost-BP; BP neural network
TP389.1
A
10.3969/j.issn.1003-6970.2016.12.005
受國家自然科學基金項目(51378350);國家自然科學基金項目(50808130)資助
胡文博(1992-),男,碩士生,主要研究方向:MBR計算機模擬仿真,大數據與云計算。
李春青,博士,教授,主要研究方向:MBR計算機模擬仿真,大數據與云計算;任淑霞,女,博士,副教授,主要研究方向:3D片網,大數據分析,大數據可視化數據挖掘。