摘要: 神經(jīng)網(wǎng)絡(luò)的非線性映射特性、信息的分布存儲(chǔ)、并行處理和全局優(yōu)化能力,特別是其高度的自組織和自學(xué)習(xí)能力,使其成為故障診斷的一種有效方法,已在許多實(shí)際系統(tǒng)中得到了成功的應(yīng)用。神經(jīng)網(wǎng)絡(luò)技術(shù)的出現(xiàn),為故障診斷問(wèn)題提供了一個(gè)新的解決途徑,特別是對(duì)于在實(shí)際中難以建立數(shù)學(xué)模型的復(fù)雜系統(tǒng),神經(jīng)網(wǎng)絡(luò)更顯示了其獨(dú)特的作用。應(yīng)用神經(jīng)網(wǎng)絡(luò)進(jìn)行故障診斷主要是應(yīng)用神經(jīng)網(wǎng)絡(luò)產(chǎn)生的殘差并進(jìn)行殘差分析以及用神經(jīng)網(wǎng)絡(luò)進(jìn)行故障模式識(shí)別。
關(guān)鍵詞: 徑向神經(jīng)網(wǎng)絡(luò) 故障診斷 觀測(cè)器
一、徑向神經(jīng)網(wǎng)絡(luò)
在眾多的神經(jīng)網(wǎng)絡(luò)中,徑向神經(jīng)網(wǎng)絡(luò)是一種結(jié)構(gòu)簡(jiǎn)單、訓(xùn)練速度快并且具有最佳逼近性能的多層前向神經(jīng)網(wǎng)絡(luò)。多年來(lái),人們對(duì)徑向神經(jīng)網(wǎng)絡(luò)進(jìn)行了大量的研究,并成功地應(yīng)用于故障診斷領(lǐng)域。主要原因有:
(1)它能存儲(chǔ)有關(guān)過(guò)程的知識(shí),直接從歷史故障信息中學(xué)習(xí),可以根據(jù)對(duì)象歷史數(shù)據(jù)訓(xùn)練網(wǎng)絡(luò),然后將此信息與當(dāng)前測(cè)量數(shù)據(jù)進(jìn)行比較,比確定故障的類(lèi)型。
(2)它具有濾除噪聲即在噪聲的情況下得出正確結(jié)論的能力,可以訓(xùn)練人工神經(jīng)網(wǎng)絡(luò)來(lái)識(shí)別信息,使其在噪聲環(huán)境中有效地工作。
(3)它具有很強(qiáng)的非線性逼近能力。
(4)它具有分辨故障原因及故障類(lèi)型的能力。
徑向神經(jīng)網(wǎng)絡(luò)(Radial Basis Function Neural Network,RBFNN)是20世紀(jì)80年代提出的一種以函數(shù)逼近理論為基礎(chǔ)的前向神經(jīng)網(wǎng)絡(luò),其設(shè)計(jì)思想就是將徑向基函數(shù)(RBF)應(yīng)用于神經(jīng)網(wǎng)絡(luò)作為激勵(lì)函數(shù)。不同于BP網(wǎng)絡(luò)的全局逼近性能,RBF是一種局部逼近網(wǎng)絡(luò),對(duì)于每個(gè)訓(xùn)練樣本,它只需對(duì)少量的權(quán)值進(jìn)行局部的修正,因此速度很快,具有最佳的逼近性能。RBF神經(jīng)網(wǎng)絡(luò)的機(jī)構(gòu)與多層前向網(wǎng)絡(luò)結(jié)構(gòu)類(lèi)似,其拓?fù)浣Y(jié)構(gòu)如圖所示。
RBF神經(jīng)網(wǎng)絡(luò)是由輸入層、隱含層和輸出層構(gòu)成的三層前向神經(jīng)網(wǎng)絡(luò)。第一層為輸入層,由信號(hào)源節(jié)點(diǎn)組成,其單元個(gè)數(shù)是由所描述問(wèn)題的需要決定的;第二層為隱含層,是由一組徑向基函數(shù)構(gòu)成的非線性映射層,這樣就將輸入矢量直接映射到隱含層空間,當(dāng)徑向函數(shù)的中心確定以后,這種映射關(guān)系也就確定了;第三層為輸出層,提供從隱單元空間到輸出空間的一種線性變換。其中隱含層是網(wǎng)絡(luò)的核心,隱含層神經(jīng)元的變換函數(shù)是一種局部分布的對(duì)中心點(diǎn)徑向衰減的非線性函數(shù),利用徑向基函數(shù)作為隱含層神經(jīng)元的基構(gòu)成隱含層空間,實(shí)現(xiàn)輸入矢量到輸出矢量的映射變換。這里主要研究以高斯函數(shù)為變換函數(shù)的徑向基神經(jīng)網(wǎng)絡(luò)。
RBF神經(jīng)網(wǎng)絡(luò)的輸入與輸出之間可認(rèn)為是一種映射關(guān)系:f(x):R →R
其中式中,i=1,2,…,n為隱含層節(jié)點(diǎn)數(shù),n(y ,…,y ,…, y )∈R 表示神經(jīng)網(wǎng)絡(luò)的輸出,x∈R 為網(wǎng)絡(luò)輸入矢量,w∈R 表示輸出權(quán)值,g∈R 為徑向基函數(shù),g 表示隱層第i個(gè)神經(jīng)元的輸出值,w 表示第i個(gè)神經(jīng)元到輸出層第j個(gè)神經(jīng)元的權(quán)值。
式中,m ∈R 為徑向基神經(jīng)元的中心,r ∈R為徑向基神經(jīng)元的寬度,‖.‖表示2-范數(shù)或歐式距離。
徑向基神經(jīng)網(wǎng)絡(luò)的權(quán)值、中心與寬度是徑向基神經(jīng)元的三個(gè)重要參數(shù)。構(gòu)造和訓(xùn)練一個(gè)RBF神經(jīng)網(wǎng)絡(luò)的就是要是網(wǎng)絡(luò)通過(guò)學(xué)習(xí),確定出每個(gè)隱層神經(jīng)元基函數(shù)的中心m 、寬度r 及隱層到輸出層的權(quán)值w,從而可以完成所需的輸入到輸出的映射。RBF網(wǎng)絡(luò)的三部分參數(shù)在映射中所起的作用是不同的。隱含層的徑向基函數(shù)完成的是從輸入空間到隱含層空間的非線性映射,而隱含層到輸出層的權(quán)值是實(shí)現(xiàn)從隱含層空間到輸出空間的線性映射,所完成的任務(wù)不同,決定了參數(shù)的訓(xùn)練方法和策略不同。
徑向基神經(jīng)元網(wǎng)絡(luò)的學(xué)習(xí)可以看成是誤差準(zhǔn)則下,以誤差函數(shù)f(x)為目標(biāo)函數(shù)的無(wú)約束最優(yōu)化問(wèn)題。
式中,x表示網(wǎng)絡(luò)的三個(gè)待求的參數(shù)(中心、權(quán)值與寬度);y 為網(wǎng)絡(luò)輸出,y 為期望輸出,N為樣本總數(shù)。
對(duì)于解決無(wú)約束最優(yōu)化問(wèn)題,通常采用迭代的方法進(jìn)行計(jì)算,在給定初值x 后,按照等式
逐步修改直至收斂于解,其中為迭代步數(shù),a 為學(xué)習(xí)速度,p 代表搜索方向。當(dāng)用上式進(jìn)行迭代時(shí),函數(shù)f(x)應(yīng)該在每次迭代時(shí)都減小。研究結(jié)果顯示,最簡(jiǎn)單的下降方向就是沿負(fù)梯度的方向,此時(shí)
式中,g 為f(x)在x 處的梯度,這樣我們就得到了最速下降的優(yōu)化算法:
有上面的推導(dǎo)可以看出,算法的關(guān)鍵是梯度的計(jì)算,下面給出梯度的計(jì)算公式。為了便于推導(dǎo)計(jì)算,將RBF網(wǎng)絡(luò)的數(shù)學(xué)模型表示如下:
式中,s=1,2,L,h為輸出變量的個(gè)數(shù);i=1,2,L,n為隱含層的個(gè)數(shù);j=1,2,L,N(N為樣本總數(shù));k為迭代步數(shù);y 為第s個(gè)輸出;w 為輸出層的權(quán)值;m 為神經(jīng)元的中心;r 為神經(jīng)元的寬度;x(j)為輸入樣本。
定義如下的誤差函數(shù):
式中,y 為網(wǎng)絡(luò)輸出,y 為期望輸出。
根據(jù)上述式子,輸出權(quán)值的梯度為: =-e (k)Q (k)(11)
具體步驟為:
(1)隨即給定一組參數(shù)x ∶m ,r ,w ,并給定迭代終止精度ε的值。
(2)令RBF網(wǎng)絡(luò)隱含層數(shù)目n=n ,n =l+m為任意小的正整數(shù)(其中l(wèi)和m分別表示系統(tǒng)輸入輸出的維數(shù))。
(3)根據(jù)所給定的樣本,利用梯度法計(jì)算網(wǎng)絡(luò)的三個(gè)參數(shù)值,根據(jù)參數(shù)值計(jì)算網(wǎng)絡(luò)的輸出。
(4)根據(jù)樣本數(shù)據(jù)和網(wǎng)絡(luò)輸出計(jì)算誤差e(n),如果‖e(n)‖≤ε轉(zhuǎn)到下一步,否則讓n=n +△n(其中n >0為整數(shù)),判斷是否n≤n (n 為預(yù)先設(shè)置的最大隱含層數(shù)目),滿足條件則轉(zhuǎn)上一步,否則轉(zhuǎn)下一步。
(5)記錄此時(shí)的n,m ,r ,w ,則得到RBF網(wǎng)絡(luò)隱含層的數(shù)目、網(wǎng)絡(luò)的中心、寬度和權(quán)值。
上述是基于最速度下降梯度法的徑向神經(jīng)網(wǎng)絡(luò)算法可以看出,網(wǎng)絡(luò)結(jié)構(gòu)的構(gòu)建與參數(shù)調(diào)整可以同時(shí)完成,具有學(xué)習(xí)時(shí)間短、計(jì)算量小等特點(diǎn)。
二、神經(jīng)網(wǎng)絡(luò)觀測(cè)器的建立
通常情況下,非線性系統(tǒng)的狀態(tài)空間模型可以表示如下:
x(k+1)=f(k,x(k))+g(k,x(k))u(k)+v(k)(14)
y(k+1)=h(k+1,x(k+1)+σ(k+1))(15)
式中,k為離散時(shí)間變量;x(k)∈R 為狀態(tài)變量;u(k)∈R 為輸入變量,y(k)∈R 為輸出向量;f:R →R ,h:R →R 為映射函數(shù);v(k)和σ(k)分別為噪聲和模型不確定性函數(shù)。
根據(jù)RBF網(wǎng)路的最佳逼近性能,可以建立神經(jīng)網(wǎng)絡(luò)辨識(shí)模型,對(duì)于任意小的ε,存在RBF網(wǎng)絡(luò)逼近于系統(tǒng)的實(shí)際輸出:
e=‖y -y ‖<ε(16)
式中,y 為網(wǎng)絡(luò)輸出,y 為期望輸出,ε為輸出殘差。當(dāng)無(wú)故障時(shí),殘差信號(hào)由狀態(tài)估計(jì)的誤差和噪聲所決定,如果狀態(tài)估計(jì)的誤差足夠小,則殘差通常趨近于零。當(dāng)傳感器故障時(shí)系統(tǒng)的狀態(tài)方程變?yōu)椋?/p>
x(k+1)=f(k,x(k))+B(k,x(k))u(k)+v(k)(17)
y(k+1)=h(k+1,x(k+1))+σ(k+1)+D (k)(18)
式中,D ∈R 為傳感器故障分配矩陣,此時(shí)輸出殘差r(k)發(fā)生了很大的變化,所以根據(jù)殘差向量的改變進(jìn)行傳感器的故障監(jiān)測(cè)與隔離。
在構(gòu)造出系統(tǒng)的觀測(cè)器之后,就可以將其用于系統(tǒng)的故障隔離。在本文中神經(jīng)網(wǎng)絡(luò)觀測(cè)器是作為一個(gè)無(wú)故障的正常的模型來(lái)使用。基于神經(jīng)網(wǎng)絡(luò)的故障診斷系統(tǒng)結(jié)構(gòu)如圖所示:
三、故障診斷
基于神經(jīng)網(wǎng)絡(luò)的系統(tǒng)故障診斷的基本思想就是建立系統(tǒng)的辨識(shí)模型,根據(jù)模型輸出和實(shí)際系統(tǒng)輸出的殘差進(jìn)行故障檢測(cè)與隔離,所以建立系統(tǒng)的辨識(shí)模型是研究的重點(diǎn)與核心。
針對(duì)于傳感器,使用如下的方法來(lái)進(jìn)行故障診斷;
由于神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的自學(xué)習(xí)能力,因此可以通過(guò)學(xué)習(xí)來(lái)獲得傳感器測(cè)量值,從而為故障診斷提供有效的信息。
首先,應(yīng)用傳感器組中的任一個(gè)輸出信號(hào)和系統(tǒng)輸入作為神經(jīng)網(wǎng)絡(luò)的輸入信號(hào),將所有傳感器的輸出信號(hào)作為神經(jīng)網(wǎng)絡(luò)的輸出信號(hào),構(gòu)成輸入樣本集合,應(yīng)用RBF網(wǎng)絡(luò)離線訓(xùn)練如下m個(gè)神經(jīng)網(wǎng)絡(luò)模型:
y (k)=F [y (k),u(k)],i=1,2,…,m(19)
然后應(yīng)用神經(jīng)網(wǎng)絡(luò)觀測(cè)器可獲得m組,,…,,其中=[,,…,] 是第i個(gè)觀測(cè)器得到的,網(wǎng)絡(luò)的輸入和訓(xùn)練時(shí)的輸入相同。在系統(tǒng)正常運(yùn)行條件下,也即無(wú)故障時(shí),接近系統(tǒng)傳感器輸出y 。當(dāng)?shù)趇個(gè)傳感器故障而其余的m-1個(gè)傳感器正常運(yùn)行時(shí),由第i個(gè)神經(jīng)網(wǎng)絡(luò)觀測(cè)器所得的傳感器的輸出估值將會(huì)偏離的輸出估值,而其他神經(jīng)網(wǎng)絡(luò)觀測(cè)器的輸出則不受影響,仍接近實(shí)際輸出。那么利用下面的邏輯檢測(cè)實(shí)現(xiàn)傳感器故障診斷。
定義閥值ε >0,j=1,2,…,m,計(jì)算判別函數(shù)。
式中,y 為第i個(gè)傳感器測(cè)量值,為由第i個(gè)傳感器的測(cè)量值獲得的第j個(gè)傳感器輸出的估計(jì)值。則有下面的邏輯:
四、小結(jié)
徑向神經(jīng)網(wǎng)絡(luò)具有最優(yōu)的逼近性能,可以精確地對(duì)系統(tǒng)進(jìn)行辨識(shí)。利用神經(jīng)網(wǎng)絡(luò)觀測(cè)器進(jìn)行系統(tǒng)故障診斷,需要建立精確的神經(jīng)網(wǎng)絡(luò)辨識(shí)模型。在精確模型的基礎(chǔ)上可完成對(duì)系統(tǒng)的故障診斷,這種抗干擾能力很強(qiáng),對(duì)不確定、非線性系統(tǒng)有很好的效果。
(指導(dǎo)老師:何曉薇教授)
(作者系中國(guó)民航飛行學(xué)院飛行技術(shù)學(xué)院研究生)
注:“本文中所涉及到的圖表、注解、公式等內(nèi)容請(qǐng)以PDF格式閱讀原文。”