楊金寶 梁 勇 曹現(xiàn)憲
(1.海軍工程大學(xué)信息安全系 武漢 430033)(2.91878部隊(duì) 湛江 524000)(3.92916部隊(duì) 三亞 572425)
隱馬爾科夫(HMM)模型是一種描述隨機(jī)過程統(tǒng)計(jì)特性的概率模型,是由馬爾可夫鏈演變發(fā)展而來[1]。馬爾科夫鏈?zhǔn)且粋€(gè)離散變量的隨機(jī)過程,其一系列狀態(tài)之間的聯(lián)系,通過一個(gè)狀態(tài)轉(zhuǎn)移概率矩陣來描述。狀態(tài)之間轉(zhuǎn)變具有相應(yīng)的轉(zhuǎn)移概率,并且狀態(tài)轉(zhuǎn)移概率僅僅依賴于當(dāng)前的狀態(tài),與過去的狀態(tài)無關(guān)。與馬爾科夫鏈不同,HMM是一個(gè)雙重的隨機(jī)過程,一個(gè)隨機(jī)過程是具有有限狀態(tài)的馬爾科夫鏈,描述狀態(tài)的轉(zhuǎn)移;另一個(gè)隨機(jī)過程描述每個(gè)狀態(tài)和觀察值之間的統(tǒng)計(jì)對應(yīng)關(guān)系[2]。不僅狀態(tài)之間的轉(zhuǎn)移是隨機(jī)的,而且每個(gè)狀態(tài)的觀察值也是隨機(jī)的,站在觀察者的角度只能看到觀察值,不能直接看到狀態(tài),而是通過一個(gè)隨機(jī)過程去感知狀態(tài)的存在及其特性。因此對觀察者而言,實(shí)際的狀態(tài)序列不能直接觀察,而被隱藏起來,因此稱為隱馬爾科夫模型。
灰色理論認(rèn)為任何隨機(jī)過程都是在一定幅值范圍和一定時(shí)區(qū)變化的灰色量,并把隨機(jī)過程看作灰色過程。該理論認(rèn)為盡管客觀系統(tǒng)數(shù)據(jù)表現(xiàn)離亂,但它總是有整體功能的,因此必然蘊(yùn)含某種內(nèi)在規(guī)律。灰色系統(tǒng)是通過對原始數(shù)據(jù)的整理來尋求其變化規(guī)律即稱為灰色序列生成[3]。一切灰色序列都能通過某種生成弱化其隨機(jī)性,顯現(xiàn)其規(guī)律性。因此本文嘗試將灰色理論與HMM模型結(jié)合,用于某型裝備的狀態(tài)監(jiān)測與故障預(yù)測研究。
灰色系統(tǒng)是通過對原始數(shù)據(jù)的整理來尋求其變化規(guī)律即稱為灰色序列生成。理論上一切隨機(jī)過程,不管其系統(tǒng)原始測量數(shù)據(jù)表現(xiàn)有多離亂,但它總是有某種內(nèi)在規(guī)律性,關(guān)鍵在于如何選擇適當(dāng)?shù)姆绞饺ネ诰颍趸潆S機(jī)性,顯現(xiàn)其規(guī)律性。而這個(gè)顯現(xiàn)規(guī)律性的過程稱為“變白”[16]。
灰色系統(tǒng)在建模時(shí)常用以下幾種序列緩沖算子對原始數(shù)據(jù)進(jìn)行生成處理,使生成的數(shù)據(jù)序列具有一定規(guī)律。也就是逐步由灰變白的基本方法。
l)累加生成
累加生成[43]是使灰色過程由灰變白的一種方法,通過數(shù)據(jù)累加來弱化數(shù)據(jù)信息的隨機(jī)性,顯示出數(shù)據(jù)中蘊(yùn)涵的規(guī)律,從而建立系統(tǒng)預(yù)測模型。對于非負(fù)序列,累加生成次數(shù)越多,數(shù)列的隨機(jī)性就弱化得越多,在GM模型中一般只對數(shù)據(jù)作一次累加生成。

稱D為X(0)的一次累加生成算子,記為1-AGO(Accumulating Generation Operation,AGO),稱 r階算子Dr為 X(0)的r次累加生成算子r-AGO,習(xí)慣上記為

非負(fù)序列經(jīng)過上述累加生成后都會(huì)減少隨機(jī)性,呈現(xiàn)出近似的指數(shù)增長規(guī)律。原始序列越光滑,生成后的指數(shù)規(guī)律也越明顯。
2)累減生成
累減生成[43]是在獲取增量信息時(shí)常用的生成,與累加生成是一對互逆的序列算子,設(shè)有原始序列為序列算子

稱D為X(0)的一次累減生成算子,r階算子Dr為X(0)的r次累減生成算子記為

3)均值生成
由于一些不可預(yù)知的外界因素有時(shí)會(huì)導(dǎo)致數(shù)據(jù)序列出現(xiàn)空缺,或數(shù)據(jù)雖完整但某個(gè)點(diǎn)的數(shù)據(jù)為明顯異常數(shù)據(jù),刪除該數(shù)據(jù)也會(huì)導(dǎo)致原有數(shù)據(jù)序列出現(xiàn)空缺,均值生成成為填補(bǔ)空缺數(shù)據(jù)的有效方法。設(shè)序列 X=(x(1),x(2),…,x(n)),若x*(k)=0.5x(k)+0.5x(k-1)則稱x*(k)為緊鄰信息的均值生成,由緊鄰均值生成數(shù)構(gòu)成的序列稱為緊鄰均值生成序列。
由上述灰色序列生成方法,我們采用累加生成來構(gòu)建灰色模型。

計(jì)算GM(1,l)模型的背景值:
HMM作為一種信號(hào)動(dòng)態(tài)時(shí)間序列統(tǒng)計(jì)模型,非常適合處理連續(xù)動(dòng)態(tài)信號(hào),并且它具有學(xué)習(xí)功能、自適應(yīng)能力,能夠通過訓(xùn)練獲取知識(shí)來監(jiān)測系統(tǒng)的狀態(tài)[4]。隱馬爾可夫模型在工業(yè)過程性能監(jiān)控和故障分類領(lǐng)域,都獲得不錯(cuò)的效果。
1)HMM的基本參數(shù)
HMM根據(jù)觀測信號(hào)的性質(zhì)分為兩類:連續(xù)隱馬爾可夫模型(CHMM)和離散隱馬爾可夫模型(DHMM)。HMM包括具有狀態(tài)轉(zhuǎn)移概率陣A的Markov鏈和輸出觀測值的隨機(jī)過程,其狀態(tài)是不確定或不可見的(即隱藏的),只有通過觀測序列的隨機(jī)過程才能表現(xiàn)出來(即通過觀測概率矩陣B相聯(lián)系)[6]。一個(gè)HMM可以由下列參數(shù)描述[23]:
N:模型中馬爾可夫鏈的狀態(tài)數(shù)目。記N個(gè)狀態(tài)為S1,S2,…SN,記t時(shí)刻馬爾科夫鏈所處的狀態(tài)為 q 且
M:每個(gè)狀態(tài)對應(yīng)的可能的觀測值數(shù)目。記M個(gè)觀測值為O1,O2,…OM,記t時(shí)刻的觀測值為Oj且

式(7)中q1,表示初始時(shí)刻1的狀態(tài);


對于連續(xù)HMM,B是一組觀測值概率函數(shù)即:

故一個(gè)HMM可記為:λ=(N,M,π,A,B),簡寫為:λ=(A,B,π)。
預(yù)測就是確定方法來調(diào)整模型參數(shù)λ=(A,B,π),使得出現(xiàn)某一個(gè)給定的觀察序列的概率最大。用解方程的方法來求解是行不通的。對給定一個(gè)有限的觀察序列作為學(xué)習(xí)集,估計(jì)模型參數(shù)的最好的方法并不存在。但是我們可以找出參數(shù) λ=(A,B,π)使得 P(O|λ)局部最大化[7]。
首先確定在給出模型參數(shù)和觀察序列的前提下,t時(shí)刻為狀態(tài)qi,j時(shí)刻為狀態(tài)Sj的概率,即:

從前向及后向變量的定義,可以將ξt(i,j)寫成以下形式:


如果將γt(i)關(guān)于t求和,則可得從狀態(tài)Si轉(zhuǎn)出的次數(shù)期望,即除了t=T時(shí)刻外,從狀態(tài)Si中轉(zhuǎn)出的次數(shù)的期望。類似的,將關(guān)于t從1到T-1求和,則可得從狀態(tài)Si到狀態(tài)Sj轉(zhuǎn)移的次數(shù)的期望[8],用式子表示如下:=從狀態(tài)Si轉(zhuǎn)出的次數(shù)的期望=從狀態(tài)Si轉(zhuǎn)到 Sj的次數(shù)的期望
設(shè)原始序列為

式中:x0(k)≥0;k=0,1,…,n。
對x0作一階累加處理,有

對x1作緊鄰均值生成,生成后的數(shù)列為

作最小二乘估計(jì),計(jì)算GM(1,1)的模型參數(shù)a,u。
則GM(1,1)模型 x0(k)+az1(k)=b的最小二乘估計(jì)參數(shù)列滿足:


通過時(shí)間響應(yīng)式得到估計(jì)值序列為


灰色模型的檢驗(yàn)主要有四種檢驗(yàn)方法:平均相對誤差檢驗(yàn)、關(guān)聯(lián)度檢驗(yàn)、均方差比值檢驗(yàn)、小誤差概率檢驗(yàn)。上述四種檢驗(yàn)方法都是通過殘差對模型的精度進(jìn)行判斷,其中平均相對精度誤差、均方差檢驗(yàn)都要求值越小檢驗(yàn)結(jié)果越好,關(guān)聯(lián)度檢驗(yàn)、小誤差概率要求值越大檢驗(yàn)結(jié)果越好。常用的等級(jí)標(biāo)準(zhǔn)見表1。

表1 精度檢驗(yàn)等級(jí)參照表
對 于 p0≤0.70,C≤0.65,ε0≤0.70,Δ≥0.10 的模型,一般被認(rèn)為是不合格的模型。如果建立模型的平均相對誤差、關(guān)聯(lián)度、均方差比值或小誤差概率中有兩個(gè)或兩個(gè)以上在允許的范圍內(nèi),則認(rèn)為模型是合理的。如果全部不合格,則需要進(jìn)行修正。
本文提出的基于馬爾科夫和灰色理論的裝備故障預(yù)測流程如下。
首先用灰色預(yù)測模型GM(1,1)得出的預(yù)測值與實(shí)際值比較,得出誤差,形成一個(gè)殘差數(shù)列,然后對該數(shù)列再進(jìn)行馬爾科夫預(yù)測,增加模型的預(yù)測精度。運(yùn)用馬爾科夫預(yù)測法進(jìn)行預(yù)測,主要工作就是馬爾科夫預(yù)測模型的構(gòu)建,即利用初始狀態(tài)的概率向量和狀態(tài)轉(zhuǎn)移矩陣來推測預(yù)測對象未來某一時(shí)間所處的狀態(tài)。
用Pij(k)表示預(yù)測對象由狀態(tài)θi經(jīng)過k次轉(zhuǎn)移至狀態(tài)θj的概率,即k步轉(zhuǎn)移概率:

式中:Mij(k)為自由狀態(tài)θ經(jīng)過k次轉(zhuǎn)移至狀態(tài)θj的原始數(shù)據(jù)樣本數(shù);Mi為處于狀態(tài)θi的原始數(shù)據(jù)樣本數(shù)。Pij(k)構(gòu)成的矩陣為

P(k)稱為k步轉(zhuǎn)移概率矩陣。
馬爾科夫預(yù)測的步驟如下:
1)劃分預(yù)測對象的狀態(tài)。為了構(gòu)建狀態(tài)轉(zhuǎn)移概率矩陣,首先要進(jìn)行狀態(tài)劃分,即將數(shù)據(jù)序列分成若干狀態(tài)。對GM(1,1)模型預(yù)測后的殘差序列進(jìn)行狀態(tài)劃分,其任一狀態(tài)θi可以表達(dá)為:。對于 θi的含義、狀態(tài)劃分?jǐn)?shù)目n和灰

計(jì)算后得出狀態(tài)轉(zhuǎn)移矩陣P(k)。
4)建立模型進(jìn)行預(yù)測。通過一步轉(zhuǎn)移概率矩陣,確定了系統(tǒng)未來的轉(zhuǎn)移狀態(tài)后,也就確定了灰元 θ1i,θ2i,即 確 定 了 預(yù) 測 值 的 變 動(dòng) 區(qū) 間 為預(yù)測值可由下式計(jì)算:元θ1i,θ2i的確定,可以根據(jù)研究對象和原始數(shù)據(jù)來確定。

2)統(tǒng)計(jì)狀態(tài)轉(zhuǎn)移情況,即統(tǒng)計(jì)Mij(k)。它表示狀態(tài)在θi,經(jīng)過k次轉(zhuǎn)移至狀態(tài)θj的原始數(shù)據(jù)樣本數(shù)。該模型中k的取值為1,表示一步轉(zhuǎn)移。
3)計(jì)算轉(zhuǎn)移概率和狀態(tài)轉(zhuǎn)移概率矩陣。計(jì)算公式為
我們通過“某裝備遠(yuǎn)程維修支援系統(tǒng)”以及相關(guān)調(diào)研活動(dòng)獲取并整理得某樣本區(qū)域2008年至2016年的某型裝備故障發(fā)生率(見表2)。

表2 某樣本區(qū)域某型裝備故障發(fā)生率(%)
由式(13)~(18)計(jì)算得預(yù)測結(jié)果(見表3)。

表3 某樣本區(qū)域某型裝備故障發(fā)生率預(yù)測過程及結(jié)果(%)
由式(5)~(12)計(jì)算得預(yù)測誤差(見表4)。
選取具有代表性的相對誤差檢驗(yàn)和均方差比值檢驗(yàn)兩種方法進(jìn)行檢驗(yàn),精度都達(dá)到了一級(jí)標(biāo)準(zhǔn)。分別選取2015年和2016年的故障發(fā)生率估計(jì)值用馬爾科夫進(jìn)行殘差修正,得新的估計(jì)值、相對誤差和未修正之前對比見表5。由表5看到,灰色模型經(jīng)過馬爾科夫鏈修改過后,精度明顯提高[16]。
對2017年該樣本區(qū)域某型裝備故障發(fā)生率進(jìn)行預(yù)測。從2008年t為0算起,此時(shí)t=9。計(jì)算得:


表4 某樣本區(qū)域某型裝備故障發(fā)生率預(yù)測誤差(%)

表5 馬爾科夫修正后誤差對比(%)

該樣本區(qū)域某型裝備故障發(fā)生率預(yù)測結(jié)果為

利用灰色預(yù)測模型計(jì)算出2017年在該樣本區(qū)域某型裝備故障發(fā)生率的預(yù)測值與實(shí)際值存在誤差,將誤差值構(gòu)成新的數(shù)列。由于這些數(shù)據(jù)的單位過大,為保證預(yù)測精確度和計(jì)算的方便性,結(jié)合幾年來該樣本區(qū)域某型裝備故障發(fā)生率的具體情況,將數(shù)據(jù)序列劃分為五個(gè)狀態(tài),這些狀態(tài)界限都是上界限包含在區(qū)間內(nèi),下界限不包含在區(qū)間內(nèi),具體見表6。

表6 狀態(tài)劃分表

通過對2015年和2016年某樣本區(qū)域某型裝備故障發(fā)生率的預(yù)測的馬爾科夫修正可以看出GM(1,1)模型和馬爾科夫預(yù)測的科學(xué)性和合理。同時(shí),根據(jù)歷史數(shù)據(jù)可以得出2017年該樣本區(qū)域某型裝備故障發(fā)生率預(yù)測值為12.605%。
針對復(fù)雜電子裝備由于系統(tǒng)復(fù)雜性、故障關(guān)聯(lián)性以及監(jiān)測信息不完備而引起的系統(tǒng)故障樹或多信號(hào)模型很難建立的情況,提出利用HMM作為分類器,實(shí)現(xiàn)對早期故障因素模式的識(shí)別,并對HMM的類型、結(jié)構(gòu)和相關(guān)參數(shù)的選擇進(jìn)行了分析[15]。在此基礎(chǔ)上提出了基于馬爾科夫模型(HMM)與灰色理論相結(jié)合的某電子裝備故障發(fā)生率的預(yù)測方法,通過詳細(xì)分析其、故障發(fā)生率、故障類型與潛在故障因素之間的統(tǒng)計(jì)關(guān)系和特點(diǎn),對預(yù)測模型的參數(shù)進(jìn)行優(yōu)化,從而建立其符合該型裝備故障發(fā)生率的灰色-馬爾科夫預(yù)測模型,通過實(shí)例驗(yàn)證了該預(yù)測模型具有一定的狀態(tài)預(yù)測精度。由于各種條件限制,預(yù)測模型還存在不足,一是數(shù)據(jù)采集量還很小,數(shù)據(jù)質(zhì)量不夠高;二是對于故障模式的識(shí)別算法在數(shù)據(jù)有限的情況下,分析和識(shí)別準(zhǔn)確度偏低,還難以達(dá)到很高的精度。下一步將繼續(xù)深入地研究基于HMM的模式識(shí)別模型,實(shí)現(xiàn)在不同數(shù)據(jù)量情況下的參數(shù)優(yōu)化。同時(shí)研究基于多傳感器的裝備狀態(tài)監(jiān)控和信息采集技術(shù),彌補(bǔ)人工信息采集的局限,建設(shè)標(biāo)準(zhǔn)化、通用化的故障信息數(shù)據(jù)庫,以進(jìn)一步提高預(yù)測精度。