趙新宇,汪文濤,張麗麗,夏宏兵
(蚌埠學(xué)院 電子與電氣工程學(xué)院,安徽蚌埠,233030)
可重構(gòu)機(jī)器人由多個(gè)標(biāo)準(zhǔn)模塊組合而成,能夠根據(jù)任務(wù)或環(huán)境的變化而增刪模塊以改變自身構(gòu)形來適應(yīng)地形完成傳統(tǒng)機(jī)器人無法完成的復(fù)雜任務(wù)。由于其具有構(gòu)形重建,成本低廉,通用性等優(yōu)勢(shì),近年來它在精密制造、災(zāi)難救援、高溫/壓環(huán)境等場(chǎng)景中發(fā)揮著重大作用[1]。
但長(zhǎng)期工作在此類復(fù)雜惡劣的環(huán)境中,系統(tǒng)發(fā)生故障的可能性日益頻繁,尤其是執(zhí)行器故障問題,若不能有效地及時(shí)處理,系統(tǒng)整體的性能將會(huì)受到嚴(yán)重影響,同時(shí)也會(huì)帶來經(jīng)濟(jì)財(cái)產(chǎn)損失。近年來專家學(xué)者們提出了很多關(guān)于執(zhí)行器發(fā)生故障的容錯(cuò)控制方案,以提高系統(tǒng)的可靠性。文獻(xiàn)[2],設(shè)計(jì)一種魯棒預(yù)測(cè)切換控制方案,解決了工業(yè)過程中經(jīng)常發(fā)生的未知擾動(dòng)、不確定性的執(zhí)行器隨機(jī)故障問題。盡管諸如此類的方法使得系統(tǒng)具有良好的控制性能和穩(wěn)定性能,但忽略了容錯(cuò)控制系統(tǒng)的最優(yōu)性能指標(biāo),即有效的簡(jiǎn)化控制器的結(jié)構(gòu)設(shè)計(jì)和減少控制輸入的代價(jià)消耗。針對(duì)此類容錯(cuò)優(yōu)化問題,往往采用自適應(yīng)動(dòng)態(tài)規(guī)劃(ADP)算法進(jìn)行求解,以獲取系統(tǒng)的近似最優(yōu)解。
ADP作為一種智能控制算法,被廣泛應(yīng)用于各領(lǐng)域中[3-4],由于其可以有效解決最優(yōu)控制問題且不產(chǎn)生“維數(shù)災(zāi)”現(xiàn)象。但在容錯(cuò)控制方面,相關(guān)的研究方案較少。文獻(xiàn)[5]利用在線補(bǔ)償技術(shù),結(jié)合名義控制器與反饋控制器提出了一種故障補(bǔ)償控制策略。
值得指出的是,這些方案[5]大多都是利用補(bǔ)償控制技術(shù),而該技術(shù)實(shí)際也是被動(dòng)容錯(cuò)的一種范疇。自適應(yīng)觀測(cè)器是一種有效實(shí)現(xiàn)主動(dòng)容錯(cuò)的技術(shù)手段,可以在線估計(jì)故障信息值,并反饋給控制器進(jìn)行容錯(cuò)控制,無需進(jìn)行故障檢測(cè)與隔離環(huán)節(jié),結(jié)構(gòu)設(shè)計(jì)簡(jiǎn)單,因此該類方法被廣泛應(yīng)用研究[6]。另一方面,現(xiàn)在的大多研究采用的代價(jià)函數(shù)都是傳統(tǒng)的二次型函數(shù),而如何設(shè)計(jì)將觀測(cè)的故障信息考慮到系統(tǒng)的代價(jià)函數(shù)中,構(gòu)成一種新型的代價(jià)函數(shù),進(jìn)而迭代求解近似最優(yōu)控制策略將是我們探索和研究的一個(gè)方向。
基于此,本文將觀測(cè)器技術(shù)與ADP算法相結(jié)合,針對(duì)執(zhí)行器發(fā)生突變故障的可重構(gòu)機(jī)器人系統(tǒng),為了有效處理故障引起系統(tǒng)的性能衰減,提出一種基于改進(jìn)代價(jià)函數(shù)的容錯(cuò)優(yōu)化控制方法。采用自適應(yīng)觀測(cè)器技術(shù),設(shè)計(jì)一種顯含故障值的代價(jià)函數(shù)。通過構(gòu)建評(píng)價(jià)神經(jīng)網(wǎng)絡(luò),利用策略迭代求解HJB方程得到反饋控制律,并結(jié)合標(biāo)稱控制律,實(shí)現(xiàn)系統(tǒng)的安全優(yōu)化控制。該方法通過觀測(cè)器在線估計(jì)故障信息,無需進(jìn)行故障檢測(cè)與隔離。并通過設(shè)計(jì)執(zhí)行器發(fā)生突變故障的形式進(jìn)行了仿真實(shí)驗(yàn)驗(yàn)證。



由于HJB方程(8)求解難的特殊性,因此,接下來我們將建立自適應(yīng)觀測(cè)器與評(píng)價(jià)神經(jīng)網(wǎng)絡(luò),進(jìn)而將容錯(cuò)控制問題轉(zhuǎn)化為最優(yōu)控制問題處理。




為了驗(yàn)證提出方法是否有效,采用構(gòu)形A的可重構(gòu)機(jī)器人模型(見文獻(xiàn)[5])進(jìn)行數(shù)值實(shí)驗(yàn)。

仿真結(jié)果如圖1~圖4所示。圖1表示的是設(shè)計(jì)的故障觀測(cè)器對(duì)執(zhí)行器故障的在線估計(jì)曲線,虛線和實(shí)線分別表示故障實(shí)際值和估計(jì)值。可以看出在系統(tǒng)運(yùn)行初期,由于神經(jīng)網(wǎng)絡(luò)訓(xùn)練需要時(shí)間,故兩條曲線存在較大偏差,估計(jì)值未能及時(shí)跟蹤上實(shí)際值。當(dāng)t=20s和t=45s時(shí)系統(tǒng)發(fā)生故障后,由于觀測(cè)器的持續(xù)作用,兩條曲線在較短的時(shí)間內(nèi)就可以重疊,說明了所設(shè)觀測(cè)器可以準(zhǔn)確的觀測(cè)故障信號(hào),進(jìn)而減少傳統(tǒng)故障檢測(cè)方法的故障診斷時(shí)間。圖2、圖3分別反映的是關(guān)節(jié)1、2的跟蹤性能曲線。可以看出,即使系統(tǒng)在兩段時(shí)間內(nèi)遭遇故障,系統(tǒng)仍可以良好的運(yùn)行,且保持系統(tǒng)原有的穩(wěn)定性能。說明了該方案具有良好的容錯(cuò)性,能夠保證系統(tǒng)的安全可靠性。圖4是兩個(gè)關(guān)節(jié)的控制力矩。

圖1 故障估計(jì)曲線

圖2 關(guān)節(jié)1跟蹤曲線

圖3 關(guān)節(jié)2跟蹤曲線

圖4 控制力矩
本文融合故障觀測(cè)器與ADP算法,提出一種容錯(cuò)優(yōu)化控制方法,有效地解決了系統(tǒng)發(fā)生執(zhí)行器突變故障的控制問題。根據(jù)在線觀測(cè)的故障值,改進(jìn)傳統(tǒng)的二次型代價(jià)函數(shù)。構(gòu)建評(píng)價(jià)神經(jīng)網(wǎng)絡(luò),采用一種新型的自適應(yīng)學(xué)習(xí)律近似代價(jià)函數(shù),進(jìn)而求解得到反饋控制律,結(jié)合標(biāo)稱控制律,實(shí)現(xiàn)系統(tǒng)容錯(cuò)控制。該方法利用觀測(cè)器技術(shù),規(guī)避了傳統(tǒng)檢測(cè)方法的故障檢測(cè)與隔離過程,大大減少了容錯(cuò)時(shí)間。仿真實(shí)驗(yàn)表明,該容錯(cuò)方案可以很好地追蹤上系統(tǒng)的期望軌跡即使系統(tǒng)發(fā)生故障,具有良好的容錯(cuò)性能,能夠保證系統(tǒng)的安全可靠性。