陳家超, 陳慶奎
(上海理工大學 光電信息與計算機工程學院, 上海 200093)
隨著信息化產業快速發展,智能設備的規模不斷增長、集成化水平也在提升,故障發生已然成為一種常態[1],例如無人機傳動器故障[2]、鐵路牽引器故障[3]、同步發電機濾波器故障[4]等。 車載終端是提供車輛位置信息、視頻監控等功能的智能設備[5],由于設備運作時間長,且經常受到車輛行駛顛簸等環境因素的影響,其內部功能模塊容易產生損耗,從而引發故障,例如:定位模塊故障、4G 模塊故障等。
本文將車載終端傳感數據的異常或丟失作為證據,行車異常事件作為現象,建立包含證據、現象和故障的分層模型。 傳感數據易受信號干擾,為了減少故障誤報,保證模型的容錯能力,結合模糊邏輯與累計度變化規律構建知識庫,通過知識庫中的規則[6-7]實現由若干種證據累計形成現象、再由若干種現象累計形成故障的推導過程,從而有效檢測車載終端故障。 考慮到根據專家經驗設置的規則初始參數存在估計偏差,在模型運行過程中采用修正算法動態調節參數,進一步提升模型的可靠性。
現階段,工人仍然采用定期巡檢的方式來維護車載終端,導致故障發現不及時,整體檢測效率較低,該模型減少了工人巡檢大批設備所需的工作量,能夠可靠檢測設備故障,因此具有重要的實際意義。
模糊邏輯與傳統二值邏輯相比,更符合人對客觀事物的思維認知,能夠針對具備模糊不確定性概念的問題給出有效解決方法,在故障檢測及故障診斷領域中被廣泛使用。 文獻[8]提出一種基于模糊邏輯的輸電網絡定向接地故障檢測方法,將電壓測量數據匹配模糊規則,從而實現故障分類檢測。 文獻[9]提出一種基于直覺模糊脈沖神經P(IFSNP)系統的設計方法,能夠有效診斷電力系統中復雜故障的成因。 文獻[10]提出一種融合多尺度模糊熵的特征提取方法,實現了旋轉機械的軸承故障診斷。文獻[11]針對道路施工裝備存在故障人工處理難度大、成本高等問題,采用T-S 模糊故障樹實現了基于GPRS 網絡的遠程故障診斷系統及方法。 文獻[12]提出一種將多分辨率分析與模糊-ARTMAP 神經網絡相結合的方法,實現了電氣設備故障的檢測及分類。 文獻[13]提出一種神經網絡與模糊PID控制相結合的方法,從控制角度定位自動駕駛車輛的執行器故障。
本文的故障檢測模型區別于上述文獻,通過對證據、現象和故障三種事件類型進行定義,采用累計的方式實現模型分層推導,并以此檢測車載終端故障,其特點包括:
(1)具有包含證據、現象和故障的分層結構,相比神經網絡的“黑箱”模型[14],整個故障推導過程更加清晰,可解釋性更強。
(2)針對若干種證據形成現象、若干種現象形成故障的變化規律,根據不同時間粒度實現累計,使故障檢測過程更具層次性。
(3)結合反饋結果修正模型參數,通過運行時參數的不斷優化,提升了模型的可靠性。
分層故障檢測模型的總體結構如圖1 所示。 首先,對時間段內的若干種證據進行累計,并計算相應的證據累計度;其次,為證據累計度設置關聯權重,匹配證據-現象規則并推導現象;然后,結合現象反饋動態修正證據-現象規則;最后,通過若干種現象同理推導故障,并動態修正現象-故障規則。

圖1 分層故障檢測模型總體結構Fig. 1 Overall structure of layered fault detection model
分層模型包含若干種事件,例如:GPS 定位數據異常、車輛不定位、定位器模塊故障等。 按不同事件類型將其分為證據、現象和故障。 對此擬做闡釋分述如下。
(1)證據:車載終端提供多種傳感數據,且不同數據類型具備相應的傳輸協議,當數據不滿足協議傳輸標準時產生證據。 證據按性質可分為異常類證據和丟失類證據,前者表示傳感數據不符滿足協議約定的數值范圍,后者表示傳感數據不滿足協議約定的數據傳輸頻次。 例如:協議標準要求GPS 定位數據不能超過行駛線路sm 的范圍外,若當前GPS定位數據超出該范圍,形成“GPS 定位數據異常”證據;協議標準要求每ts 完成一次通訊鏈路數據上傳,若遠端未能在規定時間內接收到該數據,形成“通訊鏈路數據丟失”證據。
(2)現象:現象表示車輛或設備的異常工作狀態,例如:車輛定位漂移、視頻監控圖像閃爍等。 若干種證據頻繁出現時可以說明現象產生。 例如:“GPS定位數據異常”證據和“通訊鏈路數據丟失”證據頻繁出現時,可以說明“車輛定位漂移”現象產生。
(3)故障:車載終端包含多個傳感模塊,例如:定位模塊、通訊模塊等。 若干種現象頻繁出現時可以說明故障產生。 例如:“車輛定位漂移”現象和“車輛不定位”現象頻繁產生時,可以說明“定位模塊”故障產生。
累計度表示時間片段中同一事件的累計數量程度,根據事件的不同類型,分為證據累計度和現象累計度。
設時間片段W大小為p,證據類別數為n,對于第j種證據Cj(1 ≤j≤n),建立累計窗口SWj,并將W劃分為q個等長子片段,SWj={sj,ta,sj,ta+1,…,sj,ta+q}(a≥1),其中ta表示W中的第a個子片段(1 ≤a≤q),sj,ta表示ta中證據Cj的產生標志,若證據Cj產生,sj,ta=1;否則sj,ta=0。 統計SWj中q個子片段的證據產生標志,可知證據Cj的總累計數。在長度為p的時間范圍內,根據專家經驗估計證據Cj的總累計數λj,p, 記證據Cj對應的累計度為cj,SWj中cj的計算方法如式(1)所示:
其中,sum表示SWj中所有sj,tq的數值總和。
車載終端傳感數據具備時效性,SWj中證據的產生標志隨著時間片段變化不斷更新,證據累計度亦不斷更新。 若初始狀態下SWj={sj,t1,sj,t2,…,sj,tq},在當前時刻超出子片段tq作用的時間范圍時,第t1個子片段中證據Cj的產生標志sj,t1失效,同時形成第tq+1個子片段,對應證據Cj的產生標志sj,tq+1,此時SWj更新為{sj,t2,sj,t3,…,sj,tq+1}。 累計窗口SWj在時間軸上的位置動態變化,其不斷移動的過程實現了證據累計度的連續計算。
通過統計時間片段中的現象產生標志可以完成現象累計度的連續計算,其計算方法和累計窗口更新過程同理。
2.3.1 知識庫結構
知識庫是用于表示事件之間關聯的集合[15],對于證據、現象和故障三種事件,集合包含了證據與現象,以及現象與故障之間的多對多關聯及對應關聯的強弱。
證據與現象之間存在多對多關聯,在表1 證據與現象的示例中,“GPS 定位數據異常”證據和“通訊鏈路數據丟失”證據可能與“車輛定位漂移”現象有關,也可能與“車輛不定位”現象有關。 證據與現象之間存在關聯強弱,例如:“GPS 定位數據異常”證據與“通訊鏈路數據丟失”證據相比,前者對“車輛定位漂移”現象的關聯更強,而后者對“車輛不定位”現象的關聯更強。

表1 證據與現象示例Tab. 1 Evidence and phenomenon samples
記證據和現象的類別數分別為n和m,對于第j種證據Cj與第i種現象Di(1 ≤j≤n,1 ≤i≤m),采用關聯權重αi,j來表示證據Cj與現象Di之間的關聯強弱,其滿足約束條件越大表示關聯越強;反之亦然。 當αi,j=0 時,說明證據Cj與現象Di之間不存在關聯;當0<αi,j<1 時,說明證據Cj與現象Di之間存在關聯;當αi,j=1 時,說明證據Cj與現象Di之間是唯一關聯。
若干種證據通過累計形成現象,當證據累計度不足時,對應現象無法產生,例如:“GPS 定位數據異常”證據與“通訊鏈路數據丟失”證據的累計度都很低時,說明證據沒有頻繁出現,該情況下現象不會產生。 根據式(1)中證據累計度cj的計算方法,當SWj中證據Cj的產生數量和專家估計值相同時,標準累計度值為1,此時證據Cj相對于現象Di的標準加權累計度可以直接表示為αi,j。 累計度并不是精確的、固定的,其取值大小具備模糊不確定性[16-17],即累計度可能稍高,也可能稍低。 記bi,j為αi,j的初始中心偏移量,為加權累計度閾值區間,bi,j]。 證據-現象規則結構如式(2)所示:
其中,“⊕”表示若干個證據條件項之間的“與”關系,ωi表示現象Di產生的可能性,即現象Di的可信度,其滿足0<ωi≤1。
現象與故障之間存在多對多關聯,在表2 現象與故障的示例中,“車輛定位漂移”現象和“車輛不定位”現象可能與“定位模塊”故障有關,也可能與“4G 模塊”故障有關。 現象與故障之間存在關聯強弱,例如:“車輛定位漂移”現象與“車輛不定位”現象相比,前者對“定位模塊”故障的關聯更強,而后者對“4G 模塊”故障的關聯更強。

表2 現象與故障示例Tab. 2 Phenomenon and fault samples
現象-故障知識庫由若干條現象-故障規則組成,其結構與證據-現象知識庫同理。
2.3.2 規則推導
若干種證據計算加權累計度后匹配證據-現象規則。 當n種證據的加權累計度分別隸屬于加權累計度閾值區間時,認為該規則的條件生效,得到ωi可信度的現象Di。在證據-現象知識庫中存在使多條規則同時生效的情況,進而導致多種現象同時形成。 設置數量閾值e(1 ≤e≤m),表示選取最可能產生的e種現象。 由于證據累計度的浮動偏差會影響現象實際產生的可能性。 記第i種現象的加權可信度為的區間上限為, 區間下限為。α^i,j越接近,說明現象Dj越可能產生,對應的取值也就越大。 將的重要度記作βi,j,βi,j的計算方法可寫為如下公式:
(1)擴張法。 用于增大加權累計度分布點覆蓋范圍,提升規則適用性,即保持覆蓋范圍中心不變,減小的同時增大,如圖2 所示;但若覆蓋范圍過大,則會摻雜較多的異常分布點,導致規則準確性降低。

圖2 采用擴張法修正閾值區間Fig. 2 Using expansion method to modify the threshold interval
(2)收縮法。 用于減小加權累計度分布點覆蓋范圍,提升規則準確性,即保持覆蓋范圍中心不變,增大的同時減小,如圖3 所示;但若覆蓋范圍過小,則會遺漏較多的正常分布點,導致規則適用性降低。

圖3 采用收縮法修正閾值區間Fig. 3 Using shrinkage method to modify the threshold interval

圖4 平移法修正閾值區間Fig. 4 Using translation method to modify the threshold interval
現以證據-現象規則為例,根據3 種閾值區間修正方法,給出加權累計度閾值區間,j的修正算法迭代步驟:
Step 1首先,將區間 [0,1] 等分為r段,每個子區間的大小為,將其作為區間單側擴張或收縮的步長。 然后,在各子區間中初始化區間計數器tcnt、fcnt及循環計數器qnt, 初始值均為0。將第k(1 ≤k≤r) 個子區間對應tcnt、fcnt記作tcntk,fcntk。 其中,tcntk用于統計正常分布點命中了第k個子區間的次數;fcntk用于統計異常分布點命中了第k個子區間的次數。 最后,建立集合S存放中的正常分布點,執行Step 2。
Step 2根據累計窗口SW計算若干種證據的累計度,并根據加權累計度匹配證據-現象規則。當通過規則推導出現象時,qnt =qnt +1,同時由專家確認該現象是否實際發生。 若實際發生,將該添加到集合S中,若其對應第k個子區間,tcntk=tcntk+1;若實際未發生,fcntk=fcntk+1。由于初始狀態下的個數較少,無法有效估計點位分布情況,因此重復執行Step 2,直到qnt滿足迭代啟動閾值QTHRESHOLD,執行Step 3。
Step 3假設當前,分別對覆蓋 范 圍 下 的 若 干 個tcnt和fcnt求 和。 若>ωi,說明的覆蓋范圍較小,采用擴張法增大覆蓋范圍,執行Step 4;若<ωi,說明的覆蓋范圍較 大 或 覆 蓋 范 圍 中 心 偏 離, 執 行 Step 5; 若,執行Step 8。
Step 4以ε的步長擴張區間上下限,擴張后閾值區間為[hs- ε,hl+ε], 且滿足約束條件hs- ε≥0,hl+ε≤1。 然后,執行Step 8。
Step 5在左半區間和右半區間中 分 別 統 計sum(tcnt), 記 作lsum(tcnt) 和rsum(tcnt) 。 若或時,說明正常分布點主要集中在區間左側或右側,采用平移法更新的覆蓋范圍中心,執行Step 6,其中T表示比例閾值,T越接近1,說明分 布 越 均 勻; 若且時,說明正常分布點并未出現左偏或右偏的情況,采用收縮法減小覆蓋范圍,執行Step 7。
Step 6在集合S中查找隸屬于當前的若干個分布 點并計 算覆蓋 范圍中 心,記S =, 更 新 后 的 中 心 點 為, 平 移 后 的 閾 值 區 間 為,且滿足約束條件1。 然后,執行Step 8。
Step 7以ε的步長收縮區間上下限,收縮后的閾值區間為[hs+ε,hl- ε], 且滿足約束條件hs+ε≤hl- ε。 然后,執行Step 8。
Step 8將循環計數器qnt置為0,本輪修正結束,開始下一輪迭代,執行Step 2。
3.1.1 實驗數據集
實驗數據集由某車載終端公司提供,包含100臺車載終端的300 日歷史數據,數據類別有:GPS 數據、到離站數據、通訊鏈路數據和DVR 數據。 表3、表4 和表5 分別就不同數據類別給出證據、現象和故障的實例。

表3 證據實例Tab. 3 Evidence examples

表4 現象實例Tab. 4 Phenomenon examples

表5 故障實例Tab. 5 Fault examples
3.1.2 準備工作
這里,結合專家經驗初始化證據-現象知識庫和現象-故障知識庫中若干條規則的標準加權累計度和中心偏移量,參數見表6、表7,表6、表7 的每行代表規則,其中αi(1 ≤i≤6) 表示規則中第i個條件項對應的初始權重,ω表示可信度。 初始權重的中心偏移量b均設置0.1。 以表7 中的現象-故障知識庫中的規則No.1 為例,即表示當“車輛定位漂移”現象的加權累計度在0.3 ~0.5 范圍內,且“車輛不定位”現象的加權累計度在0.5~0.6 范圍內時,產生“定位模塊”故障的可信度為0.8。

表6 證據-現象知識庫初始參數Tab. 6 Evidence-phenomenon knowledge base initial parameters

表7 現象-故障知識庫初始參數Tab. 7 Phenomenon-fault knowledge base initial parameters
3.2.1 區間偏差率
區間偏差率是衡量閾值區間修正前后偏差程度的單位。 記初始閾值區間為[a,b],修正后的閾值區間為[c,d]。 閾值下限偏差LB、 閾值上限偏差HB的計算方法可用式(6)、式(7)來表示:
根據LB和HB計算區間偏差率BR,研究推得公式為:
3.2.2 查準率和查全率
模型的可靠性通過知識庫中規則的查準率PC和查全率RC來體現。 對于證據-現象知識庫,其評價指標具體描述如下:
車輛從起點場站行駛至終點場站的時間片段稱為全程。 將車載終端歷史數據按全程進行劃分,設全程數為M,現象類別數為N,對于第i次全程中的第j種現象(1 ≤i≤M,1 ≤j≤N),γi,j表示規則推導出的現象結論。 當通過規則得出現象時,γi,j=1,否則表示實際的現象結論,當實際現象存在時,,否則。
真正例TP、 假正例FP、 假反例FN和真反例TN的計算方法的數學公式可寫為:
其中,A∈{TP,FP,FN,TN}。 當γi,j=1 且時,TPi,j=1;當γi,j=1 且時,FPi,j=1;當γi,j=0 且時,FNi,j=1;當γi,j=0 且時,TNi,j=1。 平均查準率和查全率的計算方法可用式(10)、式(11)進行描述:
對于現象-故障知識庫,將車載終端歷史數據按日進行劃分,其評價指標的計算方法同理。
實驗涉及4 種現象和3 種故障,對于多條證據-現象規則同時生效時的數量閾值e, 將e設置為4,表示選取所有可能產生的現象;對于現象-故障規則,將e設置為1,表示只選取最可能產生的故障。經過前期測試,加權累計度閾值區間的子區間大小ε設置為0.01,比例閾值T設置為2,即兩側分布點在呈現2 倍數量差時認為出現了左偏或右偏。

圖7 證據-現象規則No.1 的1,3閾值區間Fig. 7 Evidence-phenomenon rule No.1 for threshold interval1,3
根據60 臺車載終端的300 日歷史數據,分別以證據-現象規則No.1 和現象-故障規則No.1 為例,當αi,j≠0 時(αi,j即規則No.j對應的αi),給出2種規則在20 次迭代過程中加權累計度閾值區間的修正過程,圖5 ~圖8 展示了證據-現象規則No.1 中各條件項對應閾值區間的變化。從圖5 中可知,對于“GPS 定位數據異常”證據的加權累計度閾值區間1,1, 在第1 次和第2 次迭代修正后,由于若干個實際加權累計度分布點1,1在1,1中散布得較為均勻,且通過算法得出的可信度未達到初始可信度取值0.8,因此區間發生了收縮;在第3 次迭代修正后,閾值上下限和中心位置都呈現相同幅度的增長,這是因為此時1,1主要集中于1,1的右側區間,即分布點右偏,因此中心位置發生了平移;在第7 次迭代修正后,可以看出閾值下限減小、閾值上限增大,說明通過算法計算出的可信度已經超過了0.8,認為1,1收縮得過小,因此區間發生了擴張。

圖8 證據-現象規則No.1 的1,4閾值區間Fig. 8 Evidence-phenomenon rule No.1 for threshold interval1,4

圖6 證據-現象規則No.1 的1,2閾值區間Fig. 6 Evidence-phenomenon rule No.1 for threshold interval1,2

表8 證據-現象知識庫的閾值區間修正結果Tab. 8 Results of threshold interval modification of evidencephenomenon knowledge base
圖9 和圖10 展示了現象-故障規則No.1 中各條件項對應閾值區間的變化,表9 展示了現象-故障知識庫在20 次迭代后的閾值區間修正結果、即。 迭代修正過程的解釋同理,不再贅述。

表9 現象-故障知識庫的閾值區間修正結果Tab. 9 Results of threshold interval modification of phenomenonfault knowledge base

圖9 現象-故障規則No.1 的1,1閾值區間Fig. 9 Phenomenon-fault rule No.1 for threshold interval1,1

圖10 現象-故障規則No.1 的1,2閾值區間Fig. 10 Phenomenon-fault rule No.1 for threshold interval1,2
根據40 臺車載終端的300 日歷史數據,結合相關評價指標給出規則閾值區間修正前后的對比分析。 表10 展示了針對證據-現象知識庫的各閾值區間實驗結果,對于每種現象,第一行數據是采用初始閾值區間得出的評價指標,第二行是采用修正后閾值區間得出的評價指標,其中,AVG(BR) 表示規則各條件項區間偏差率的平均值。

表10 證據-現象知識庫相關評價指標對比結果Tab. 10 Comparative results for related evaluation indicators of evidence-phenomenon knowledge base %
觀察表10 的第二列數據可以發現,修正后的查準率更高,通過平均區間偏差率AVG(BR) 可知,當偏差率越高時,查準率修正后的增幅越大,這說明專家經驗給出的初始參數準確性較低,而對區間進行修正后,通過規則推導出的現象更為準確,即更接近專家給出的可信度(表6 中的ω)。 表10 的第三列數據表示修正前后的查全率,總體變化幅度不大,對于“車輛不定位”現象(Y2) 和“車輛監控無圖像”現象(Y4), 查全率有所下降,這是因為準確率較高時,規則往往會忽略距離集中分布范圍較遠的數值點,造成規則泛化能力的下降。
表11 展示了現象-故障知識庫中各規則閾值區間修正前后的實驗對比結果,表中相關數據的解釋同理,不再贅述。

表11 現象-故障知識庫相關評價指標對比結果Tab. 11 Comparative results for related evaluation indicators of phenomenon-fault knowledge base %
根據表10 和表11 中修正后的規則閾值區間,分別統計現象和故障的查準率和查全率,模型在當前數據集上的現象平均查準率和查全率約為85%和69%,故障平均查準率和查全率約為81%和72%,對比修正前的評價指標計算結果(現象平均查準率和查全率約為75%和70%,故障平均查準率和查全率約為73%和72%),修正前后平均查全率相接近,平均查準率顯著增長,能夠說明模型可靠性的提升。
本文通過統計時間片段中的若干種證據實現證據累計度計算;對證據累計度設置關聯權重,結合模糊邏輯實現規則匹配與現象推導;根據修正算法動態調整規則的閾值區間。 若干種現象推導故障與修正規則的過程同理。 模型通過證據、現象和故障之間的累計變化規律,實現車載終端故障檢測,且在運行過程中不斷修正參數,在現有數據集上具備較好的表現效果。 作為初步研究結果,仍有部分問題有待探究,如規則可信度調整問題,規則擴充與篩選問題等。