湯佳 李春青



1 引言(Introduction)
水污染的預防和治理已成為當今世界日益嚴重的熱點問題。膜生物反應器(MBR)作為一種將膜分離技術和生物反應技術相結合的新型高效污水處理技術,已被廣泛應用于生活污水、有機廢水處理等領域[1,2]。膜污染會影響MBR膜分離單元的性能,縮短膜的使用壽命,增加MBR系統的運行成本。因此研究膜污染的機理和預測控制方法,保證膜生物反應器能夠在穩定的低耗能條件下獲得較大膜通量是促進MBR推廣應用的關鍵[3,4]。
目前在MBR膜污染領域,常用的多種預測模型都存在一些缺陷,如對膜污染機理分析不夠透徹,預測精度差等問題。人工神經網絡在預測領域有比較成熟的應用,而相比較傳統的BP神經網絡,RBF網絡具有唯一最佳逼近的特性且無局部極小值的問題,可以做更精準高效的預測分析[5-7]。再引入遺傳算法優化RBF神經網絡的相關參數,彌補單一徑向基網絡模型的缺陷,就可以實現對膜污染更精準的預測。
2 RBF神經網絡(RBF neural network)
人工神經網絡(Artificial Neural Network,即ANN),是由人工建立的,以有向圖為拓撲結構的動態系統,它從信息處理角度對人腦神經單元網絡進行抽象化,建立簡單模型,按不同的連接方式組成不同網絡。人工神經網絡以其特有的非線性適應性信息處理能力,使之在模式識別、自動控制、人工智能、預測估計等方面都有成功的應用,表現出了良好的智能特性。
徑向基函數(RBF)神經網絡是一種高效的前饋式神經網絡,它由輸入層、隱含層和輸出層構成,具有其他前向網絡所不具有的最佳逼近性能,并且結構簡單,訓練速度快。該神經網絡采用RBF作為隱單元的“基”構成隱含層空間,將輸入矢量直接映射到隱空間而不需要權值連接。當RBF的中心點確定后,映射關系也就隨之確定。隱含層空間到輸出空間的映射是線性的。
徑向基神經網絡的網絡結構如圖1所示。
RBF網絡的激活函數采用徑向基函數,以輸入和權值向量之間的距離作為自變量,常見的隱含層節點的核函數為高斯函數。
(1)
其中,σ稱為基函數的擴展常數或寬度,σ越小,徑向基函數的寬度越小,基函數就越有選擇性。
3 遺傳算法(Genetic algorithm)
遺傳算法(Genetic Algorithms,簡稱GA或GAs)是由密歇根大學Joho H.Holland教授及其學生于20世紀60年代末到70年代初提出的一種經典的智能算法。遺傳算法是一種基于群體尋優的方法,具有全局搜索能力,初值無關性以及較快的收斂速度。具體過程如下:
Step1:采用隨機的方法或者其他方法產生一個初始種群。
Step2:根據問題的目標函數構造適值函數(Fitness Function)適值函數用來表征種群中每個個體對其生存環境的適應能力。
Step3:根據適應值的好壞,不斷選擇和繁殖,基因通過交叉和變異得到更新。
Step4:若干代后得到適應值最好的個體即為最優解。
4 遺傳算法優化的RBF神經網絡(Optimization of
RBF neural network based on genetic algorithm)
RBF神經網絡具有最佳逼近性和全局最優性,可以實現對MBR膜通量較為精確的預測。但是為了更好地選取相關參數,引入遺傳算法對RBF神經網絡的參數進行合理優化,其中包含四個參數,分別是誤差、訓練速度、最大神經元數目以及神經元的間隔,經過遺傳算法尋優后得到的最優個體即為進行RBF神經網絡訓練涉及的最優參數。GA-RBF神經網絡模型完成網絡訓練后,再采用仿真數據檢測評估該網絡的優化性能。
5 建立基于PCA的GA-RBF膜污染仿真預測模型
(A simulation model of GA-RBF membrane
pollution based on PCA is established.)
5.1 采用PCA進行模型輸入參數選取
主成分分析(Principal Component Analysis,PCA)是一種掌握事物主要矛盾的統計分析方法,它通過矩陣特征值分析對初始數據進行線性空間投影,從多元事物中解析出主要影響因素,從而達到簡化復雜的問題的目的。
膜污染的影響因素眾多,通過減少RBF網絡的輸入數來簡化RBF網絡結構,從整體上提高RBF網絡的性能。初選的六個膜污染影響因子為X={總阻力,MLSS,操作壓力,COD,PH,溫度}。
主成分分析法步驟為:
Step1:把初選的六個膜污染影響因子組成矩陣X。
Step2:對X數據標準化處理,得到標準化矩陣A。標準化后的數據陣每個列向量的均值為0,標準差為1,數據無量綱。
Step3:計算出協方差矩陣S。
Step4:計算協方差矩陣S的特征值λ與相應的特征向量u,然后將特征值由大到小排列得到特征值矩陣V和特征向量矩陣U。
Step5:對特征值矩陣V分析,計算出貢獻率,確定主成分。通常選取貢獻率為85%—95%的m個主成分進行綜合分析。
通過計算選取出主成分貢獻率在90%以上的三個污染因子即:MLSS、操作壓力及溫度,并以此作為RBF神經網絡的輸入層神經元。膜通量大小是表征膜污染程度的唯一指標,因此以膜通量作為RBF神經網絡的唯一的輸出層神經元。
5.2 建立基于GA-RBF的膜污染仿真預測模型
實驗建立的GA-RBF膜污染預測模型如圖2所示。
實驗步驟如下:
Step1:對RBF神經網絡的四個參數編碼,為方便操作設定誤差、訓練速度為實數編碼,最大神經元數目、神經元間隔為整數編碼,所有編碼得到的基因位串稱為一個個體。
Step2:隨機產生20個個體作為初始種群,構建初始的交配池。
Step3:執行RBF網絡訓練,得到誤差百分比作為每個個體的適應度。個體間基因進行交叉和變異,保證基因多樣性。
Step4:采用輪盤賭選擇方式,篩選出適應度高的個體,淘汰掉適應度低的個體。
Step5:重復進行(3)直到結束循環,得到的個體為最佳個體。
Step6:訓練完畢,最佳個體即為RBF網路最優的參數值,進行仿真測試,將實驗數據與樣本數據對比分析。
6 預測結果與實驗結果對比分析(Comparison of
the predicted results with the experimental
results)
實驗數據全部來自于石家莊市某MBR污水處理廠的實驗以及工業生產的歷史數據,統一采用的是孔徑為0.2um的聚偏氟乙烯微濾膜處理污水方法。從實驗數據中選取6組作為校驗用樣本,其余24組作為神經網絡的訓練樣本。
遺傳算法操作的初始參數為:選擇種群規模:sizepop=20;最大進化代數:maxgen=10;交叉率:pcross=0.8;變異率:pmutation=0.5.RBF訓練誤差范圍是1e-4-1e-3;最大神經元數目范圍值是80—150;顯示神經元間隔范圍值是10—30;速度范圍值是10—25。
試驗中得到遺傳算法代數與誤差曲線如圖3所示。
圖3顯示了網絡訓練的誤差隨著遺傳代數增加表現出來的變化趨勢,隨著進化代數增多誤差降低,進化至第8代誤差僅為0.02871,到第8代以后圖像趨于緩和,基本已達到優化極限,實驗收斂速度很快,優化效果明顯。
為更好地體現優化效果,實驗使用相同的樣本數據進行測試,設置遺傳算法進化到10代,分別對RBF網絡和GA-RBF網絡進行訓練。首先得到基于RBF神經網絡的預測結果,如圖4所示,RBF網絡的訓練結果平均誤差值為0.1130,已經能夠完成初步的膜通量預測。然后再進行GA-RBF網絡訓練,預測結果對比如圖5所示,經過GA優化參數之后的預測模型平均誤差值僅為0.0275.準確度有非常明顯的提高。實驗結果表明,經過遺傳優化過的RBF神經網絡誤差明顯減小,得到的訓練結果明顯優于優化前的結果,預測精度較為理想。預測誤差數據分析見表1。
7 結論(Conclusion)
由于膜污染過程具有非線性、參數時變性、隨機干擾等復雜的機理,造成預測研究過程十分困難,本文在用主成分分析法簡化輸入參數的基礎上,建立了RBF神經網絡仿真模型,實驗取得了良好的預測效果,誤差符合實驗標準。由于預測精度是否準確很大程度上取決于網絡模型參數的選取,因此引入遺傳算法,優化RBF網絡相關參數,建立基于遺傳算法優化的徑向基函數神經網絡預測模型并成功應用于MBR膜污染仿真預測中,研究結果表明,遺傳算法優化后的RBF神經網絡不僅提高了預測速度,還明顯提高了預測精確度,從而能更好地實驗對膜通量的檢測和控制。整個實驗過程具有一定的理論價值和實踐意義,對MBR實際工程應該可以起到積極的指導作用。
參考文獻(References)
[1] Yu Zhang,et al.Risk Assessment of Giardia from a Full Scale MBR Sewage Treatment Plant Caused by Membrane Integrity Failure[J].Journal of Environmental Sciences,2015(04):252-258.
[2] Kun Li,et al.Advanced Treatment of Municipal Wastewater
by Nanofiltration:Operational Optimization and Membrane Fouling Analysis[J].Journal of Environmental Sciences,2016(05):106-117.
[3] Hui Gong,et al.Membrane Fouling Controlled by Coagulation/Adsorption during Direct Sewage Membrane Filtration(DSMF)for Organic Matter Concentration[J].Journal of Environmental Sciences,2015(06):1-7.
[4] 韓永萍,等.MBR膜污染的形成及其影響因素研究進展[J].膜科學與技術,2013(01):102-110.
[5] 劉海萍.神經網絡在CPI預測中的應用[A].中國管理現代化研究會.第五屆(2010)中國管理學年會——市場營銷分會場論文集[C].中國管理現代化研究會,2010:7.
[6] Guo ShengPeng,et al.Task Space Control of Free-floating Space Robots Using Constrained Adaptive RBF-NTSM[J].Science China(Technological Sciences),2014(04):828-837.
[7] 王芹芹,雷曉云,高凡.基于主成分分析和RBF神經網絡的融雪期積雪深度模擬[J].干旱區資源與環境,2014(02):175-179.
作者簡介:
湯 佳(1991-),女,碩士生.研究領域:MBR計算機模擬仿
真,大數據與云計算.
李春青(1962-),男,博士,教授.研究領域:MBR計算機模
擬仿真,大數據與云計算.