王曉麗,黃蕾,楊鵬,陽春華(中南大學信息科學與工程學院,湖南 長沙 410083)
?
動態RBF神經網絡在浮選過程模型失配中的應用
王曉麗,黃蕾,楊鵬,陽春華
(中南大學信息科學與工程學院,湖南 長沙 410083)
摘要:鋁土礦泡沫浮選過程中,因礦漿的快速沉淀等原因工藝參數在線檢測困難,且入礦性質變化頻繁,造成浮選過程參數隨入礦的變化而不斷改變。而通常建立的靜態軟測量模型利用固定樣本集訓練得到,當礦源變化時容易發生模型失配現象,使模型不能跟蹤當前對象。針對變礦源下的模型失配問題,本文提出基于隱層節點動態分配和模型參數動態修正策略的RBF神經網絡建模方法,用于鋁土礦浮選過程酸堿度的在線檢測建模。實際生產數據仿真結果表明該方法能夠有效解決模型失配的問題。
關鍵詞:泡沫浮選過程; 動態RBF神經網絡;模型失配;工況遷移
2015-12-21收到初稿,2016-01-05收到修改稿。
聯系人及第一作者:王曉麗(1981—),女,副教授。
鋁土礦泡沫浮選過程中,因礦漿具有快速沉淀特性,礦漿濃度、粒度和pH等過程參數無法在線檢測,使得軟測量技術對浮選過程具有重要作用。由于鋁土礦浮選過程礦石來源復雜,造成礦石性質多變,對浮選過程工藝參數產生重要影響。為保持生產的穩定性,實際生產采用配礦的方式,盡量保證在一段時間內入礦性質是一致的,此種情況下采用靜態的神經網絡模型能夠取得很好的軟測量效果。但由于礦源的復雜性,難以保證長時間的恒礦源供礦,使得礦石性質變化頻繁,過程參數也不斷變化。因而隨著時間的推移,最初建立的靜態神經網絡模型已不能反映當前對象,產生“模型失配”現象。基于數據的建模方法對實際生產過程中的動態問題建模時均存在這樣的問題,因此對動態過程的軟測量建模問題仍是研究的難點和熱點[1]。
處理模型失配問題通常有兩種策略[2-3]:一是采用最近樣本對模型進行重訓練修正,如文獻[3]采用對象重辨識的方法處理對象變化時出現的模型與對象失配問題;二是在原有模型的基礎上對模型的結構和參數加以調整[4-7]。由于重訓練建模的時間空間代價高,難以適用于實時系統,所以工業應用普遍采取第二種策略。
動態神經網絡具有適應變化的能力,包括含反饋環節的神經網絡[8-9]、具有時變參數的神經網絡[10]、節點資源動態調整的神經網絡[11-12]。最初引入動態網絡思想的是Platt[13],他研究了隱層節點資源的動態分配來實現模型的動態調整修正,將該模型用于混沌時間序列中,并獲得了相當好的效果。此后,引起了業界的廣泛關注。但是因為Platt提出的RAN方法采用LMS(least mean squart)算法來對網絡參數進行修正,對大樣本對象會出現收斂速度慢的問題。Kadirkamanathan等[14]采用擴展的卡爾曼濾波器(extend Kalman filter)算法來代替LMS算法,加快了RAN網絡的收斂速度,并可以降低網絡結構的復雜程度,由于使用了擴展卡爾曼濾波器算法,故稱為RAN-EKF。但是RAN神經網絡只能一貫地添加隱層節點,對于在線模型,易導致模型臃腫、計算耗時等。Song等[7]針對RAN網絡中創建隱層節點的新穎性條件太疏松,通過均方根滑動窗口方法(RMS)抑制突發噪聲的影響,達到控制網絡規模的效果。Lu等[15]提出了一種最小資源分配網絡模型(MRAN)用于解決隱層節點過多的問題,從而使動態網絡能夠很好地控制自己的網絡規模。
鑒于礦漿酸堿度對浮選生產的重要性,本文以浮選礦漿的酸堿度為具體對象,提出了基于動態RBF神經網絡的建模方法以解決酸堿度軟測量模型失配問題。針對礦源變化造成的過程參數變化問題,利用動態網絡自身特性來動態地增刪隱節點并修正網絡參數,從而實現模型對對象的實時跟蹤。
浮選實際生產過程中酸堿度的控制存在如下特點:礦石變化會引起酸堿度控制范圍的整體遷移。靜態的神經網絡模型已被用于浮選生產,但在生產換礦時,靜態模型給出的相關軟測量參數往往有很大的偏差,這是因為靜態神經網絡模型沒有考慮對新增樣本不適時的模型結構調整問題,即在整個學習訓練過程中,模型的結構及參數都是固定的。而礦石變化導致模型與當前對象失配,使參數檢測、預測、故障診斷等都會發生異常。
神經網絡適用于內插問題,而對外推問題的適應能力差,即神經網絡只對學習范圍內(不僅僅指離散訓練集,還包括離散集囊括的范圍)的數據有較準確的感知能力,而對學習范圍外的數據基本上沒有識別能力,因此需要一些方法使其適應學習范圍外的樣本。
1.1 樣本失配類別
模型失配是指模型因各種原因隨著時間的遷移無法與對象特性匹配的問題。在此,為了清晰地描述浮選過程的特點,設礦源有A和B兩個不同的時段,RBF網絡模型構建于A時段用于浮選過程酸堿度的在線檢測,則存在如下兩種模型失配情況。1.1.1 內插域中的不一致樣本 在此,不一致樣本是指在正常的生產條件下,具有相同或相似泡沫表面特征向量(模型的輸入)但酸堿度存在顯著差異的樣本。不一致樣本的出現并非偶然因素或系統的異常導致,而是一種因外界條件改變導致工況(如酸堿度)整體性遷移的情況。生產過程可能仍處于正常狀態,但是通過監控系統獲取的工藝參數以及根據這些參數做出的工況判斷可能都是不正常的,此時的數學描述如下。
A時段和B時段的一對樣本SA(xi,yi)、SB(xj,yj),其中x為泡沫表面特征向量(即酸堿度值軟測量模型的輸入向量),y為酸堿度值。采用歐幾里德距離表示其相似性,存在如下關系

式中,μ、ν為大于0的參數,且μ為較小的正數,ν為較大的正數。
即如存在參數μ、ν使式(1)成立,表明樣本SA和SB的特征向量相同或相似,酸堿度值卻有明顯差異。而神經網絡建模方法存在一條原則:相似的條件下相似輸入通常應生成網絡中相似的表示。而上面輸入相似的樣本其輸出不同,體現了礦源變化時存在不相似的條件。
1.1.2 外推域中的樣本 由于神經網絡具有的能力是通過學習得來的,對外推域內的樣本沒有識別能力。如圖1,對于內插域內的和外推域內的,存在(π為較大的正數),此時同樣會產生模型失配的問題。

圖1 內插域空間與外推域空間Fig.1 Interpolation and extrapolation domain space
1.2 基函數神經網絡

式中,φi()是m維空間的一個函數,采用高斯函數為

式中,ci是徑向基函數的中心;K為中心的個數。
為了便于分析,圖2給出了參數c、σ不同時高斯函數?(x )= exp[? (x? c )2/σ2]的變化曲線。

圖2 高斯基函數隨參數變化Fig.2 Gauss function with different parameters
由圖2可知,參數c主要是影響φ(x)的左右位置,參數σ則主要是影響φ(x)的胖瘦程度即密集程度,σ越小點的分布越集中。同時可知,當x與c相等時,φ(x)取最大值;當x與c不等時,隨著x 與c之間的距離變大,φ(x)幾乎趨近于0。由此容易得出,對φ(x)而言,當x與c越相似時,φ(x)越大,能對以c為中心的局部空間做出更好的響應,而對離c遠的輸入空間的響應幾乎可以忽略,從而做到輸入空間的域劃分。因此,如變礦源時出現外推域樣本且網絡無法正常響應時,則可以通過新增中心趨近樣本的隱層節點來解決,這為后文中動態網絡節點的分配提供了理論依據。
1.3 神經網絡節點動態分配算法
RBF神經網絡的建模過程在此不再贅述,本小節主要描述網絡結構失配時的節點動態調節策略。圖3為含隱節點動態分配的RBF網絡。

圖3 隱節點動態分配的RBF網絡Fig.3 RBF network with dynamic allocation of hidden nodes
當出現新增樣本時,判斷是否該為其增加一個隱層節點。RAN通過判斷新穎性條件是否滿足來動態調整隱含層節點的數目,采用經典的新穎性判定規則[13-14,16],即只有當滿足如下關系時需要分配新節點

式中,M為當前隱含層的節點數;ci為隱含層的中心;dk為與xk最接近的ci之間的歐幾里得距離;ek為樣本對應的模型誤差,xk經過歸一化處理,這里ε取0.27,e取0.1。
為了防止個別異常數據構成的病態樣本,再添加誤差頻率規則:在滑動窗口區間內,ηabnormal等于樣本中滿足的數量除以樣本總數。
如果樣本滿足上述新穎性和誤差頻率條件,則為樣本建立一個新隱含層,新增節點參數如下:。
詳細算法[17-18]描述如下:
(1)獲取模型參數,給閾值參數賦值,并考慮新增樣本(xk,yk);
(3)如果ek大于e且ηabnormal大于閾值ηshre同時成立,則進入步驟(4);否則跳出此次檢查;
(4)若dk不滿足新穎性規則,則不增加節點,進入步驟⑥來調整網絡結構參數;否則進入步驟(5);
1.4 相似節點的合并和持續低貢獻節點的剔除1.4.1 相似節點的合并 由圖2高斯函數可知,高斯基函數主要受基函數中c和σ影響。其中c與樣本輸入密切相關,能夠表達出隱節點對樣本的激活能力的強弱。因此,可以利用這點性質考察隱層節點的高斯基函數計算任意兩基函數之間的空間夾角,判斷節點的相似度。為簡化計算,可以近似計算ci與cj之間的夾角來判斷節點的相似度。如果ci、cj之間的夾角θij<θmin(θmin是設定的夾角閾值),則表明二者較相似,然后兩相似隱層節點按如下方式合并合并完成后,即將節點i、節點j用一個節點k

替代。再采用式(5)的最后一個式子調整網絡的權值參數,以使網絡盡量與原網絡相似,能較精準地跟蹤對象。
1.4.2 持續低貢獻節點的剔除 對于網絡中隱層節點的高斯基函數,如果在很大頻度(連續L個樣本)上都處于未激活狀態,則可以考慮將其刪除。刪除后,仍需調整網絡的權值參數使模型與對象匹配。
考慮某一隱節點ci,對于連續L個樣本(xj,yj),如果都存在成立,則表明該隱節點為持續低貢獻節點,可剔除。
刪除低貢獻節點后,用下述方法更新網絡權值參數。定義誤差目標函數為用誤差目標函數來調整神經網絡的參數


式中,m為剔除低貢獻節點后的神經元個數。
以泡沫浮選過程中泡沫表面特征為輸入,以礦漿酸堿度為輸出,采用本文所提出的動態神經網絡對礦漿酸堿度進行在線估計建模。為對比分析動態神經網絡模型的性能,同時對靜態神經網絡模型和基于重訓練的神經網絡模型進行了仿真。為了突出模型的可比性,采用相同的訓練集來建立初始模型,從而體現各模型的優劣。為了驗證模型的適應性,將與訓練集同礦源的部分樣本作為測試集,并將另一時段采集的不同礦源的數據加入作為測試集(共118組數據),也即采用相同的訓練集與測試集進行仿真,得靜態神經網絡、基于重訓練的網絡和動態RBF網絡的仿真結果分別如圖4~圖6所示,動態RBF神經網絡隱含層節點變化如圖7所示。
從圖4可以看出,靜態神經網絡模型沒有考慮對新增樣本不適時的模型結構調整問題,當出現不一樣的礦源時,模型無法對對象進行跟蹤,出現模型失配的現象。
圖5、圖6表明基于重訓練的自適應神經網絡模型和動態神經網絡模型都能對變礦源做出模型的合理調整,但是重訓練模型是基于新入礦下的樣本重訓練得到的模型,雖能有效解決實際對象特性變化帶來的模型失配問題,但每次重訓練耗時較多,不適用于變化較頻繁的實時系統。而動態神經網絡模型是基于新增不適樣本的調整修正,且過程中有許多閾值參數需要確定,主觀性較大,模型好壞較依賴于人的經驗。但在一定的精度允許下,其較簡便的調整在實時系統中具有很大優勢。

圖4 靜態神經網絡模型仿真結果Fig.4 Simulation results of static neural network model

圖5 基于重訓練的自適應神經網絡模型仿真結果Fig.5 Simulation results of adaptive neural network model based on weight training

圖6 動態RBF神經網絡模型仿真結果Fig.6 Simulation results of dynamic RBF neural network model
從圖7可以看出,隱含層節點在開始訓練后一段時間內節點數不變,然后節點數增多,進而剔除低貢獻率節點后有所下降并進入穩定狀態,加入新工況之后,隱含層節點數有所增加,然后剔除合并節點后下降并恢復到穩定狀態。
為了檢驗預測模型的優劣,考慮參數

對各網絡的均方根誤差進行計算得到:靜態RBF網絡為0.142,基于重訓練神經網絡為0.0816,動態RBF網絡為0.0713。可知整體性能上動態RBF最佳,對浮選過程的在線檢測、工況判斷和故障診斷等應用也具有相當大的優勢。

圖7 動態RBF神經網絡隱含層節點數目變化Fig.7 Number of hidden node of dynamic RBF neural network changing with samples
針對鋁土礦浮選過程中礦源變化帶來的工況狀態遷移造成靜態神經網絡模型失配的問題,本文利用動態網絡自身的特性動態地增刪隱層節點以及修正網絡參數,從而實現模型對對象的實時跟蹤。最后通過實際生產數據仿真驗證了該動態神經網絡建模方法能解決礦源變化下模型失配的問題。同時,該建模方法還有待優化的問題,即部分經驗值、閾值的選取方法并不是很完善,需要通過理論與實踐對其進行深入的研究。
References
[1] 曹鵬飛, 羅雄麟. 化工過程軟測量建模方法研究進展 [J]. 化工學報, 2013, 64 (3): 788-800.
CAO P F, LUO X L. Modeling of soft sensor for chemical process [J]. CIESC Journal, 2013, 64 (3): 788-800.
[2] MCBRIDE J, SULLIVAN A, XIA H, et al. Reconstruction of physiological signals using iterative retraining and accumulated averaging of neural network models [J]. Physiological Measurement, 2011, 32 (6): 661-675.
[3] YIN F, WANG H, XIE L, et al. Data driven model mismatch detection based on statistical band of Markov parameters [J]. Computers & Electrical Engineering, 2014, 40 (7): 2178-2192.
[4] 李翔宇, 高憲文,侯延彬. 基于在線動態高斯過程回歸抽油井動液面軟測量建模 [J]. 化工學報, 2015, 66 (6): 2150-2158.
LI X Y, GAO X W, HOU Y B. Online dynamic Gaussian process regression for dynamic liquid level soft sensing of sucker-rod pumping well [J]. CIESC Journal, 2015, 66 (6): 2150-2158.
[5] WALLACE M, TSAPATSOULIS N, KOLLIAS S. Intelligent initialization of resource allocating RBF networks [J]. Neural Networks, 2005, 18 (2): 117-122.
[6] GIANTOMASSI A, IPPOLITI G, LONGHI S, et al. On-line steam production prediction for a municipal solid waste incinerator by fully tuned minimal RBF neural networks [J]. Journal of Process Control, 2011, 21 (1): 164-172.
[7] SONG W, LIANG J Z, HE X L, et al. Taking advantage of improved resource allocating network and latent semantic feature selection approach for automated text categorization [J]. Applied Soft Computing, 2014, 21: 210-220.
[8] BACK A D, TSOI A C. FIR and IIR synapses, a new neural network architecture for time series modeling [J]. Neural Computation, 1991, 3 (3): 375-385.
[9] DELGADO A, KAMBHAMPATI C, WARWICK K. Dynamic recurrent neural network for system identification and control [J]. IEE Proceedings-Control Theory and Applications, 1995, 142 (4): 307-314.
[10] ZHANG Y, JIANG D, WANG J. A recurrent neural network for solving Sylvester equation with time-varying coefficients [J]. IEEE Transactions on Neural Networks, 2002, 13 (5): 1053-1063.
[11] ASH T. Dynamic node creation in back-propagation networks [J]. Connection Science, 1989, 1 (4): 365-375.
[12] BARTLETT E B. Dynamic node architecture learning: an information theoretic approach [J]. Neural Networks, 1994, 7 (1): 129-140.
[13] PLATT J. A resource-allocating network for function interpolation [J]. Neural Computation, 1991, 3 (2): 213-225.
[14] KADIRKAMANATHAN V, NIRANJAN M. A function estimation approach to sequential learning with neural networks [J]. Neural Computation, 1993, 5 (6): 954-975.
[15] LU Y, SUNDARARAJAN N, SARATCHANDRAN P. Performance evaluation of a sequential minimal radial basis function (RBF) neural network learning algorithm [J]. IEEE Transactions on Neural Networks, 1998, 9 (2): 308-318.
[16] 韓麗, 司風琪, 徐治皋. 改進的RAN網絡及其在熱工過程在線建模中的應用 [J]. 鍋爐技術, 2004, 35 (5): 12-15.
HAN L, SI F Q, XU Z G. The improved RAN and its application in thermal processes modeling [J]. Boiler Technology, 2004, 35 (5): 12-15.
[17] 李彬. 一種改進的 RAN 學習算法 [J]. 模式識別與人工智能, 2006, 19 (2): 220-226.
LI B. An improvement of the RAN learning algorithm [J]. Pattern Recognition and Artificial Intelligence, 2006, 19 (2): 220-226.
[18] LI Y, SUNDARARAJAN N, SARATCHANDRAN P. Analysis of minimal radial basis function network algorithm for real-time identification of nonlinear dynamic systems [J]. IEEE Proceedings-Control Theory and Applications, 2000, 147 (4): 476-484.
研究論文
Received date: 2015-12-21.
Foundation item: supported by the National Natural Science Foundation of China (61304126, 61473318, 61134006, 61304019).
Dynamic RBF neural networks for model mismatch problem and its application in flotation process
WANG Xiaoli, HUANG Lei, YANG Peng, YANG Chunhua
(School of Information Science and Engineering, Central South University, Changsha 410083, Hunan, China)
Abstract:It is difficult to measure the process parameters online in the bauxite froth flotation process because the slurry deposits quickly. Especially, frequent change of the characteristics of the ore makes the process parameters change from time to time. So that, the static soft sensing models, such as the neural network model, which was obtained by a fixed set of training samples, may not track the dynamic characteristics of the process caused by change of the ore resource. And, thus, model mismatch problem occurs. In this paper, for model mismatch problem under various ore sources, dynamic RBF neural network modeling method based on the hidden layer node dynamic allocation and model parameters dynamic correction strategy is proposed. And the model is used for online measurement of the pH of the slurry in the flotation process, simulation results show that the dynamic model can solve the model mismatch problem well.
Key words:froth flotation process; dynamic RBF neural network; model mismatch; migration of working condition
DOI:10.11949/j.issn.0438-1157.20151940
中圖分類號:TQ 027.1
文獻標志碼:A
文章編號:0438—1157(2016)03—0897—06
基金項目:國家自然科學基金項目(61304126,61473318,61134006,61304019)。
Corresponding author:WANG Xiaoli, xlwang@csu.edu.cn