王 莉, 張廣明, 周獻中
(1. 南京工業大學 自動化與電氣工程學院, 南京 210009;2. 南京大學 工程管理學院, 南京 210093)
在常規由地表水制取飲用水的工藝過程中,水中雜質微粒的去除一般經過以下工藝流程:凝聚、絮凝、沉淀以及過濾。經過加藥混凝后,水中的微小顆粒在絮凝池內形成易于在沉淀池中去除的絮體,經過沉淀池之后水中絕大部分的懸浮物和絮體被去除,過濾可以進一步去除懸浮物和絮體。可以看出水處理過程是一個復雜的物理、化學過程。出水濁度是衡量水質的重要質量指標,影響出水濁度的因素有很多,主要有源水濁度、流量和投藥量等。不同季節和年份的水質存在一定的差異,特別是源水濁度變化較大;在每一天的正常運行情況下,都會有幾個高峰用水期,源水流量有一定程度的變化[1,2]。基于上述分析,表明水處理過程具有非線性和時變的特點,目前很難通過對其反應機理的研究,建立精確的數學模型,因此,本文提出了一種建立水處理過程模型的新方法。
本文采用基于改進FCM聚類自適應模糊神經網絡建立水處理過程的模型。FCM聚類是一種迭代優化來計算聚類中心,是一種適宜的模糊劃分算法,但是算法的性能依賴于初始聚類中心,聚類的數目也需要人為事先確定。減法聚類是一種用于估計一組數據中聚類個數和聚類中心的快速單次算法,但得到的聚類中心在原始數據點上,故精度不高。因此可以利用減法聚類確定FCM算法的初始聚類中心和聚類數目,從而加快FCM算法的收斂速度,減小陷入局部最優的可能性。利用改進的FCM算法對數據集進行聚類,實現輸入空間的模糊劃分,基于聚類的結果確定T-S模糊神經網絡前件部分隸屬度函數初始值并抽取模糊規則。為了進一步提高模型的精度,采用混合反向傳播(Back Progration, BP)和遞推最小二乘(Recursive Least Square, RLS)學習算法[3]對前件和后件網絡參數進行優化。該方法利用改進的FCM聚類確立模糊神經網絡參數初值,減小了誤差反向傳播(Back Propagation, BP)算法陷入局部極小點的可能性,模型的精度較高,泛化能力也較好。
FCM聚類算法已經在模式識別、圖象處理、模糊建模等領域得到了廣泛的研究與應用,是目前應用最廣泛的模糊聚類算法。
FCM聚類目標函數為如下的形式:

其中m為影響隸屬度矩陣模糊化程度的指數權重,X=[xi]i=1,2,…n為樣本集合,n代表所含樣本數,c為聚類數目,uij表示第j個樣本屬于第i個聚類中心的程度,同時uij還必須滿足以下約束條件:

采用拉格朗日乘子法求解(1)式的極小化問題,可得聚類中心為

這里,根據聚類得到的隸屬度函數定義第k類聚類集合Vk:

Vk是由屬于第k個聚類中心vk程度最大的樣本集合組成。
FCM聚類是通過最小化目標函數的迭代優化來實現劃分,即先給出初始方案,通過式(3)和(4)反復迭代,使得目標函數式(2)達到極小。
從上面的計算過程中可以看出,FCM聚類采用梯度法求目標函數的極值,得到的不一定是全局最優解。FCM算法的聚類中心是隨機初始化的,而初始聚類中心的選擇嚴重影響著算法的性能,聚類數目也需要人為事先確定。減法聚類將每個數據點作為可能的聚類中心,根據各個數據點周圍的數據點密度來計算該點作為聚類中心的可能性。減法聚類是一種用于估計一組數據中聚類個數以及聚類中心的快速單次算法[5],因此可用利用減法聚類計算出FCM算法的初始聚類中心和聚類數目,從而加快FCM算法的收斂速度,減小陷入局部最優解的可能性。綜上所述,改進的FCM算法計算過程如下:
1)設置減法聚類半徑,利用減法聚類計算FCM算法初始的聚類中心
2)設置指數權重m和停止準則ε,記迭代次數k=0;
5)令呂k=k+1,由3),4)式計算聚類中心和隸屬度矩陣uij,轉至第4)步。
由于減法聚類將每個數據點作為聚類中心的候選集,得到的聚類中心在數據點上,因此在計算uij(0)時會出現零除的現象,這里將dij(0)加上一個非常小的正數,使計算能夠繼續下去。
本文采用文獻[6]中提出的T-S模糊神經網絡結構,T-S模型本質是易于表達復雜非線性系統的非線性動態模型,其模糊規則結論部分的隸屬度函數是線性函數或是常數,結論值是精確值,不需要再解模糊化,因而它在樣本建模經常被使用。T-S模型的規則形式為:

其中A1j…Amj為輸入量的模糊子集,m為輸入變量個數,j=1,2,…,r,r為規則總數,pj0,pj1,…,pjm為需要調整的后件網絡參數。
T-S模糊神經網絡的結構[6,7]如圖1所示。

圖1 T-S模糊神經網絡結構圖
由圖1可見,該結構模型由前件網絡和后件網絡兩部分組成,前件網絡用來匹配模糊規則的前件,后件網絡用來產生模糊規則的后件。
前件網絡的隸屬度函數取常用的高斯型:

其中cij,σij為隸屬度函數參數,也即是待學習的前件參數。
對于某個給定的輸入x1,x2,…,xm,輸出y的計算如下:

其中μj表示每條規則的激勵強度。
前件參數初始值選取的不當會導致T-S模糊神經網絡的收斂速度很慢,并可能產生局部最優,因此本文采用改進的FCM聚類將輸入-輸出數據對分成組,一組采用一條模糊規則,即模糊規則的數目等于聚類的數量。根據對輸入空間模糊劃分的結果,以聚類中心作為輸入變量隸屬度函數的中心:

隸屬度函數寬度 的選擇對于模型的泛化能力和精度有影響,過大則會降低模型的精度,過小則會模型的泛化能力。這里采用類內樣本分散程度djiinner確定:

通過改進的FCM聚類,建立了一個初始的T-S模型。為了進一步提高模型的精度,本文采用BP算法調節前件網絡隸屬度函數的中心值cji,σij,前件參數調整后,固定前件參數,后件的連接權值pji用RLS算法辨識。重復上述步驟,直到滿足誤差要求或達到最大迭代次數為止。
本次實驗樣本數據采自杭州蕭山某自來水廠,該水廠總的生產規模達到15萬噸/日,混凝劑采用精制固體硫酸鋁。根據工藝分析結合本廠的實際情況,最終確定模型的輸入量為:源水濁度、加藥量、源水流量,輸出量為出水濁度。選擇150組數據作為模型的訓練樣本,采用另外的50組數據作為模型的檢驗樣本。
變量的量綱不同對FCM聚類結果有影響,這里采用下面的方法[7]事先對數據進行歸一化處理。

式中Xmax,Xmin, 分別為該項參數數據中的最大值、最小值,Xi*為歸一化后的數據。
這里為了說明改進后FCM聚類的優點,將其和FCM聚類進行了比較。設定指數權重m=2,停止準則ε=10?5,聚類數目為不同值時,兩種方法的比較結果如表1所示。

表1 聚類性能比較
從表中可以看出,改進后的FCM聚類算法迭代次數較FCM聚類算法大大減少,收斂速度加快,目標函數值也小些,說明改進的FCM聚類算法求出的聚類中心位置更加合理。
采用上節中的基于改進的FCM聚類自適應模糊神經網絡建立水處理過程的模型,設置最大訓練次數為1000,聚類半徑為0.5,每個變量的論域被劃分成7個模糊子集,通過改進的FCM聚類算法確立了初始的隸屬度,其分布依據聚類的結果,如圖2所示,能夠反映出數據在空間的分布特征。


圖2 初始隸屬度函數
通過BP和RLS混合學習算法對前件和后件網絡參數進行調節,經過學習之后最終得到的隸屬度分布如圖3所示。可以看出經過學習后隸屬度函數的中心和寬度都發生了變化。

圖3 調節后的隸屬度函數
最終得到的模糊模型規則如表2所示。其中x1,x2,x3表示模型的輸入量,分別為源水濁度,加藥量,源水流量,y表示模型的輸出量出水濁度。
將本文的方法和采用FCM聚類方法確定網絡前件參數初始值的方法進行了比較。設置FCM聚類的數目也為7,訓練數據的均方根誤差RSME[7]和訓練次數之間的關系如圖4所示。

圖4 均方根誤差
FCM聚類算法隨機選擇初始中心,因此每次訓練后RSME結果都不一樣,這里選擇了某一次的訓練結果。采用本文方法第1步訓練誤差比較小,收斂的速度也較快些,這是由于改進后的FCM算法設置的隸屬度函數初值比較合理,最終訓練誤差為0.05,FCM聚類方法最終訓練誤差為0.0996。
建立好模型后,采用檢測數據對本文方法建立的水處理過程模型進行了檢驗,結果如圖5和圖6所示。

圖6 檢驗數據結果
從圖5和6中可以看出,模型輸出和實際的數據之間相對誤差很小,絕大多數低于5%,平均相對誤差為3.03%。說明采用改進的FCM聚類方法來辨識模糊神經網絡的結構和前件網絡初始參數是可行的,最終建立的水處理過程模型精度較高,泛化能力較好。
水處理過程具有非線性、大滯后、時變的特點,用傳統的建模方法很難建立其精確的數學模型。本文采用減法聚類確定FCM聚類的初始中心,減少了FCM聚類對初值的敏感性,保證了聚類中心的質量。根據聚類的結果確定合理的T-S模糊模型前件參數的初始值,并且利用混合學習算法對前件和后件參數進行調節,進一步提高模型的精度。將這種方法用于建立某自來水廠的水處理過程的模型,仿真實驗的結果表明,該方法建立的水處理過程模型具有精度高、泛化能力好、收斂快和結構簡單的優點。建立水處理過程精確的非線性模型也對進一步設計水處理的自動控制系統具有指導意義。
[1] J.Evans,C.Enoch,M.Johnson etc.Intelligent Based Autocoagulation Control Applied to a Water Treatment Works[C].UKACC International Conference on CONTROL’98,1998,1(455):141-145.
[2] 白樺,李圭白.凈水廠最佳投藥量的神經網絡控制系統[J].工業儀表與自動化裝置,2002,(4):37-39.
[3] 王莉.基于減法聚類的模糊神經網絡在水處理過程建模中的應用[C].27th中國控制會議,昆明,2008:324-328.
[4] Bezdek J C.Pattern Recognition with Fuzzy Objective Function Algorithms[M].New York :Plenum Press ,1981.
[5] 朱喜林,武星星,李曉梅.基于改進型模糊聚類的模糊系統建模方法[J].控制與決策,2007,22(1):73-77.
[6] T. Takagi, M.Sugeno. Fuzzy identification of systems and its application to modeling and control[J]. IEEE Transactions on Systems, Man, and Cybernetics, 1985,51(1):116-132.
[7] 李國勇.智能控制及其MATLAB實現[M].電子工業出版社,北京,2005.
[8] J.S.R.Jang,C.T.Sun.Neuro-fuzzy modeling and control[J].Proceedings of the IEEE,1995,83(3):378-406.