



【摘要】汽車智能化技術的快速發展使整車功能日益復雜化、文件開發數激增,對傳統車輛電氣故障解析提出新挑戰。為了提升電子電氣故障分析與診斷能力,利用智能診斷技術,構建電氣數據分析模型,輔助人工實現汽車電氣系統故障的智能分析與定位。模型構建分為兩步:一是電氣測試數據的收集與預處理,包括報文解析、數據清洗及特征提取;二是利用深度學習算法構建故障分析模型,通過模型訓練實現智能故障分析與定位。提出基于智能診斷技術的汽車電氣數據分析模型,能夠高效解析復雜電氣測試數據,實現故障智能分析與定位,為電子電氣故障排查提供有力支持。
關鍵詞:大數據分析;智能輔助診斷;故障分析建模
Research on Fault Analysis Model of Electrical Appliance Large Data Based on Deep Learning
Jiang Li1, Cui Ming2
(1.China Auto Information Technology Co., Ltd., Tianjin 300300;2. China Center for Automotive Strategy and Policy Research, Tianjin 300300)
【Abstract】The rapid development of automotive intelligent technology has led to increased complexity of vehicle functions and a surge in the number of document developments, posing new challenges for the analysis of traditional vehicle electrical faults. In order to enhance the capability of electronic and electrical fault analysis and diagnosis, an intelligent diagnostic technology is utilized to construct an electrical data analysis model, which aids in the intelligent analysis and localization of faults in the automotive electrical system. The model construction is divided into two steps: first, the collection and preprocessing of electrical test data, including message parsing, data cleaning, and feature extraction; second, the use of deep learning algorithms to build a fault analysis model, achieving intelligent fault analysis and localization through model training. The proposed automotive electrical data analysis model based on intelligent diagnostic technology is capable of efficiently parsing complex electrical test data, realizing intelligent fault analysis and localization, and providing strong support for the troubleshooting of electronic and electrical faults.
Key words: Big data analysis; Intelligent assisted diagnosis; Fault analysis modeling
中圖分類號:TP311.1;U471.1""" 文獻標志碼:A"""""""" DOI: 10.19822/j.cnki.1671-6329.20230115
引言
隨著整車智能化趨勢日益顯著,車輛智能駕駛的各項功能不斷突破完善。車輛電子功能的增多和設計邏輯的復雜性提升,導致故障排查難度增加,為電氣功能的品質提升增加挑戰。電氣問題的返修除借助原理圖、線束圖和診斷故障代碼(Diagnostic Trouble Code,DTC)外,還需借助車載網絡通信信號、喚醒睡眠機制、傳感器與執行器硬線信號等復雜數據文件進行診斷分析。面對未來整車電氣領域技術的不斷發展,電氣類數據的未來發展趨勢主要體現在以下3個方面:(1)整車功能復雜化。隨著開發文件不斷增多,電氣生準范圍及內容不斷增多,整車電氣診斷不斷復雜化,車輛電氣故障解析的排查點將由2位數攀升至3位數,傳統方式下的解析方式應對艱難。(2)電氣測試數據持續增加。整車電氣測試數據由MB級增長至GB級甚至TB級,數據解析工作不斷復雜化,且車輛故障解析面臨更多的電控喚醒機制、標定自學習機制等,對報文解析和邏輯判斷技術提出更高的能力要求。(3)整車總線數據幾何式增長。整車監聽數據由GB級別增長至TB級甚至PB級別。數據解析工作復雜化,類似于高壓互鎖故障,在借助總線監聽、總線開發環境(CAN open environment,CANoe)解析總線故障時,數據收錄、轉譯和分析周期由1個月增加至2個月。因此,在智能診斷技術背景下研究電氣數據分析,構建一套電氣數據分析工具,運用數字化技術輔助人工開展數據分析,實現電氣系統故障智能分析,可以顯著提升故障分析及診斷能力。
在電氣大數據故障分析模型的研究中,國內外的研究方法存在很多相似之處。兩者均采用了傳統統計方法和深度學習方法,并且注重數據的收集、預處理和特征工程等環節。其區別在于國外研究通常具有更大規模的數據集,包含更多樣的設備和故障情況,為模型的建立和評估提供了更多信息,且國外的研究更加注重學術研究和算法的發展。國內研究更注重與實際工業應用的結合,對于故障分析模型的實際部署和應用具有更豐富的經驗。國內外對電氣大數據故障分析模型的研究均取得了一定進展。本文研究成果基于硬件在環仿真(Hardware-in-the-loop Simulation,HIL)臺架試驗,應用深度學習模型,實時進行故障診斷與預測。著力于實際汽車生產制造過程的電氣故障排查,對車輛質量提升具有更高經濟價值與社會價值。
技術架構
本文提出的技術架構主要包括電氣數據智能分析與展示、基于深度學習的多目標優化故障識別模型以及基于現有HIL測試臺架的故障智能診斷系統3個部分。(1)電氣數據的智能分析和大數據展示旨在提升數據查詢和比較的便捷性,為電子電氣故障智能診斷、數據智能分析以及電氣故障排查提供可視化分析和更加可靠的數據支持。通過對電氣設備監測數據處理和分析,實現對電氣運行參數、運行狀態等數據的實時監控和預報警推送。在系統內注入電氣故障信號后,系統基于故障預測模型快速反饋故障的電氣設備和電氣故障的原因,并基于計算的概率進行排序,給業務人員維護建議。(2)基于深度學習的多目標優化故障識別模型旨在提供故障分析的決策優化建議[1-8]。通過分析監測到的電氣數據,利用故障預測模型預測設備運行狀態。針對故障電氣設備或元件,智能分析工具根據電子電氣系統邏輯、預訓練的電子電氣系統故障模式模型、故障知識庫以及電子電氣維修知識庫,采用多目標優化技術(如Pareto優化、遺傳算法、免疫算法、多梯度下降算法),快速確定故障原因、故障元器件,以及滿足目標條件(如維修時間最短、維修成本最低)的最優維修策略建議。(3)故障智能診斷系統開發旨在實現對現有HIL測試臺架數據的無縫連接并進行數據分析[11-12]。電子電氣故障智能診斷是一個開放的故障預測和智能診斷平臺,支持多種數據接入形式。對于在線設備信息接入,該系統能夠提供多種標準化接口(Application Programming Interface,API),主要包括REST API、SOAP API以及SQL/No-SQL數據接口。通過數據接口將設備信息快速接入故障智能診斷系統,用于數據分析和故障預測。對于基于文檔的離散數據,該系統提供了常用文件格式數據提取,如Excel、CSV、JSON、TXT。針對現有的HIL測試臺架數據,該系統可以通過標準化接口直接讀取臺架測試數據,進行臺架數據的智能分析、故障預測、以及故障分析和決策。
技術方法與模型構建
基于智能診斷技術,開發了一套適應整車電子電氣系統的電氣數據分析工具,可以實現電氣故障智能診斷分析及電氣數據的智能分析和大數據展示,便于數據查詢和比對。基于深度學習的多目標優化,建立故障預測模型,該模型旨在為故障分析提供決策優化建議。
1.7數據采集融合
多源數據融合對于電氣數據分析和數據建模具有重要作用[13-17]。存儲在不同系統或磁盤中的數據可通過前文提及的多源數據提取組件實現從離散數據到流數據(Streaming Data)格式的轉換。流數據是指以實時或連續的方式生成和傳輸的數據,具有實時性、高速性、多樣性以及大規模性的特點。流數據的處理需采用特定的技術和工具,如流處理引擎、復雜事件處理(Complex Event Processing,CEP)系統、實時分析和深度學習算法。本文采用實時分析和機器學習算法對流數據進行實時處理和分析,實現數據的實時洞察和響應功能。數據存儲具有分散性,但其存在一定關聯性。為了更有效地分析和處理數據,本研究采用數據融合方法,將分散的數據整合為結構化的表格,便于進行綜合分析與利用。
數據融合方法的基本原理為將參考參數相同的數據聚合在一起。本項目中,根據使用場景和數據類型,開發了4種多源數據融合組件。(1)合并數據(Merge Data)。合并來自不同數據源的具有相同參數值的數據,形成一條數據記錄,針對不同數據源的數據設置參考參數。(2)連接數據(Join Data)。根據指定的參數,在參數值一致的情況下,將多個數據源的數據擴展至現有數據記錄中,使用Join Using參數指定參考參數。(3)分組數據(Group Data)。將具有相同參數值的所有數據記錄分組到單一數據記錄中,需要指定參考參數,使用Group Using指定分組操作。(4)透視數據(Pivot Data)。透視數據是將狹窄的數據轉換為寬數據表的方法。根據指定的列,將列的值轉換成列名,將另一列的值轉換為列值,并使用鍵屬性值進行合并。
1.8特征參數與建模
在接入電氣故障診斷系統時,由于數據來源和格式具有多樣性,首先需基于數據結構和特點,采取數據預處理步驟,如數據合并、數據拆分和數據轉化,將相關數據聚合成一個標準化、結構化的表格形式。完成數據聚合后,需對整合后的數據進行進一步處理,對其中異常數據和無效數據等進行清洗、填充或者替換處理,提升數據質量。獲得高質量的電氣數據后,使用數據分析模塊對數據進行初步的探索分析(如聚類分析、統計分析),了解數據的分布情況以及分布趨勢,輔助確定特征參數。可選數據獲取途徑包括通過汽車車載自動診斷系統(On-Board Diagnostics,OBD)接口獲取CAN總線上的數據,或者基于HIL臺架獲取一段時間內電氣系統的運行數據。
本研究采用基于深度學習的檢測模型構建汽車電氣系統運行狀態特征。該模型采用深度學習框架下的自編碼器,對輸入數據進行降維,得到表征汽車電氣系統運行狀態的特征。由于上述獲取的運行數據類型較多且汽車各模塊耦合運行,不同類型的運行數據間存在強相互聯系,因此運行數據中保留的噪音、細節和重復信息較多。本研究采用自編碼對運行數據進行編碼,可以減少數據類型。為了明確區分和描述數據處理過程,將自編碼器的輸入定義為“數據”,輸出定義為“特征”,輸出特征的維度低于輸入數據的數據類型,實現了數據的降維。
1.9模型訓練與優化
(1)構建正常運行數據樣本庫
正常檢測模型的特性在于其能夠識別正常運行數據。若輸入該模型的運行數據為正常運行數據,其輸出特征與正常特征庫中的特征相匹配。基于該特性,構建正常運行數據樣本庫,對待訓練模型進行訓練,從而優化待訓練模型的編碼器參數,使其自編碼器滿足上述特性,成為正常檢測模型。
(2)模型訓練
在對待訓練模型進行訓練過程中,將第一組正常運行數據樣本和第二組正常運行數據樣本先后輸入至所述待訓練模型,通過最小化所述第一組正常運行數據樣本與編解碼后數據的距離以及所述第二組正常運行數據樣本的編碼后特征與所述第一組正常運行數據樣本的編碼后特征的距離,優化所述待訓練模型的編碼器參數。解碼器的參數采用預設參數,或在每次訓練中與自編碼器一起進行優化。
訓練過程中構建損失函數,用于訓練正常檢測模型:
(1)
式中:L為損失量,a為損失偏置,i為第i次量,n為一組正常運行數據樣本中數據類型的總數,xi為第一組正常運行數據樣本的編解碼后數據,yi為第一組正常運行數據樣本,d為一組正常運行數據樣本的編碼后特征的維度總數,zi為第一組運行數據樣本的編碼后特征,z'i為第二組正常行數據樣本的編碼后特征,表示正常運行對應的損失權重。
在具體實施過程中,根據所述多個輸出特征構建正常特征庫。從所述多個輸出特征中,選取相關性最強的輸出特征(至少1個)構成正常特征庫。在特征比對過程中,采用相關性度量標準判斷特征匹配情況。若一特征與正常特征庫中的任一特征的相關性足夠高(例如歐式距離lt;0.01),則判定該特征與正常特征庫中的特征匹配。在模型應用中,若輸入正常檢測模型的正常運行數據樣本為正常運行一段時間產生的運行數據,則正常檢測模型輸出的特征為多條曲線或二維矩陣。每條曲線反映輸出特征中的一個維度隨時間的變化規律,如當d=4時,存在4條曲線,維矩陣的行和列分別為輸出特征的不同維度和不同時刻。正常特征庫中的特征也可以是多條曲線或二維矩陣。在特征比對過程中,若某特征中包括的每條曲線與正常特征庫中任一特征的每條曲線均匹配,則該特征與正常特征庫中的特征匹配;若某特征對應的二維矩陣與正常特征庫中任一特征對應的二維矩陣中每個元素均匹配,則該特征與正常特征庫中的特征匹配。
1.10數據識別
根據特征參數構建預測模型和故障分析及決策優化的對訓練數據質量和數量的要求,系統支持使用內置或開發的標準模塊構建臺架試驗測試用例工作流,基于設定范圍自動化生成對應的HIL/試車測試工況場景[18-23]。具體故障數據識別流程如圖1所示。
本研究采用了3類結構相同但參數不同的自編碼器,每個自編碼器對應一種運行狀態。正常檢測模型的特性是若輸入該模型的運行數據為正常運行數據,則該模型輸出的特征與正常特征庫中的特征匹配。故障種類的故障檢測模型的特性是若輸入該模型的運行數據為出現該種故障時的運行數據,則該模型輸出的特征與該故障種類對應的特征庫中的特征匹配。故障種類組合對應的故障檢測模型的特性是若輸入該模型的運行數據為出現該故障種類組合時的運行數據,則該模型輸出的特征與該故障種類組合對應的特征庫中的特征匹配。
首次使用所述正常檢測模型的輸出特征與正常特征庫進行比對,若所述正常檢測模型的輸出特征與正常特征庫中的特征不匹配,表明電氣發生了故障。為了確定具體故障種類或組合,分別將每個故障檢測模型輸出的特征與對應的特征庫進行比對。
本文中所開發的電子電氣故障智能診斷系統包含多數據源數據接入、數據分析、數據清洗、數據模型開發、多參數優化以及數據展示等模塊。數據提取工具集通過數據接口實現在線數據和離線數據的接入,實時基于監測電氣數據進行預測未來1小時或3小時內電氣設備發生故障的可能性。針對可能發生故障或已發生故障信息,故障分析模型基于進化算法,或Pareto多參數優化算法,以及故障知識庫快速反饋引起故障的原因和故障電氣元器件。此外,基于監測的電氣數據和基于模型預測的電氣故障信息,使用數據可視化模塊中預定義的各種圖表進行智能展示,如熱力圖和趨勢圖。
故障智能診斷系統實現
汽車電控域故障智能診斷系統采用目前比較成熟的統計分析、深度學習等大數據挖掘技術構建電氣系統電氣系統數據智能分析、故障預測、故障智能診斷分析模型,具體電氣故障預測模型如圖2所示。根據監測到的電氣數據,利用故障預測模型預測設備運行狀態。對于故障電氣設備或元件,故障智能分析工具及根據電子電氣系統邏輯,預訓練的電子電氣系統故障模式模型、故障知識庫、電子電氣維修知識庫等,采用多目標優化技術(如Pareto優化、遺傳算法、免疫算法、PSO、多梯度下降算法),快速給出故障原因、故障元器件,以及滿足目標條件(如維修時間最短、維修成本最低)的最優維修策略建議。實現電氣系統數據在線智能分析,動態展示設備運行參數、運行狀態、故障發生概率以及故障發生原因和故障電氣元件指認,縮短電氣系統監聽數據收錄、轉譯和分析周期,提高故障維護效率,降低安全事故發生概率。
(1)無縫連接HIL測試臺架數據并設計對應的HIL/試車測試工況場景。電控域故障智能診斷是一個開放的故障預測和智能診斷平臺,平臺支持多種數據接入形式。對于在線設備信息接入,能夠提供多種標準化API接口,如REST API、SOAP API以及SQL/No-SQL數據接口。通過數據接口將設備信息快速接入故障智能診斷系統,用于數據分析和故障預測,如圖3所示,可在平臺中選擇車型及控制器,導入臺架數據。對于基于文檔的離散數據,該系統提供了常用文件格式數據提取,如Excel、CSV、JSON、TXT等。針對現有的HIL測試臺架數據,該系統可以通過標準化接口直接讀取臺架測試數據,進行臺架數據的智能分析、故障預測以及故障分析和決策。根據系統構建預測模型和故障分析及決策優化的對訓練數據質量和數量的需要,系統支持使用內置或開發的標準模塊構建臺架實驗測試用例DOE工作流,基于設定范圍自動化生成對應的HIL/試車測試工況場景。
(2)故障信息采集、數學模型分析、分析結果智能呈現[24-25]。整車電控域系統故障智能診斷系統提供的數據分析工具包含多數據源數據接入、數據分析、數據清洗、數據模型開發、多參數優化以及數據展示等模塊。如圖3所示,數據提取模塊通過數據接口實現在線數據和離線數據的接入與查詢,包括故障數據和待識別數據。實時基于監測電氣數據預測電氣設備發生故障的可能性。針對可能發生的故障,或者已經發生的故障信息,故障分析模型可以基于多參數優化算法和故障知識庫快速反饋故障原因。此外,基于監測的電氣數據和基于模型預測的電氣故障信息,使用數據可視化模塊中可預定義的各種圖表進行智能展示,如熱力圖、趨勢圖,如圖4所示。
結束語
本項目成功設計并開發了電氣故障診斷智能化分析軟件系統,該系統基于大數據分析技術,實現了對接入系統電氣數據的全面管理與高效利用。系統能夠實時展示數據變化、電氣設備運行狀態,精確捕捉發生故障的時間點,并智能分析故障原因。通過對出現故障的電氣設備進行深度剖析,系統能夠導出所有故障信息,并有效識別出引發故障最為頻繁的電氣設備及其主要原因。這一工具充分利用數字化技術,極大地輔助了人工數據分析工作,實現了電氣系統故障的智能分析,顯著提升了電子電氣領域的故障分析及診斷能力,為汽車電氣故障排查與維護提供了強有力的技術支持。
參考文獻
[1]楊慶川. 基于深度學習的發動機故障檢測[D]. 杭州: 杭州電子科技大學, 2021.
[2]單凱旋. 基于深度學習的發動機故障預測方法研究[D]. 天津:中國民航大學, 2019.
[3]梅本祥. 基于MVC模式的車載服務平臺監控管理系統研究[D]. 廣州: 廣東工業大學, 2018.
[4]余志生. 汽車理論[M]. 5 版. 北京: 機械工業出版社, 2009.
[5]胡天杰. 基于模型的 ECU 硬件在環仿真研究[D]. 昆明: 昆 明理工大學, 2020.
[6]王望予. 汽車設計[M]. 4 版. 北京: 機械工業出版社, 2004.
[7]張文杰, 李長龍, 洪宇, 等. 基于大數據技術的遠程診斷系統在汽車上的應用[J]. 汽車文摘, 2022(4): 30-33.
[8]張佳琪. 基于Java Web的車輛試驗管理信息系統的設計與實現[D]. 北京: 北京交通大學, 2016.
[9]盧紹兵. 基于Python的混合語言編程及其實現研究[J]. 科技資訊, 2022, 20(14): 31-33.
[10]張巍. 基于Python的車輛檢測算法的實現[J]. 機械管理開發, 2019, 34(12): 258-261.
[11]程學旗, 靳小龍, 王元卓, 等. 大數據系統和分析技術綜述[J]. 軟件學報, 2014, 25(9): 1889-1908.
[12]趙力. 基于大數據處理的車輛監控系統的設計與實現[D]. 北京: 北京交通大學, 2019.
[13]曾憲宇. 基于大數據技術的車輛監控系統的優化與實現[D].長春: 吉林大學, 2016.
[14]李國杰, 程學旗. 大數據研究:未來科技及經濟社會發展的重大戰略領域——大數據的研究現狀與科學思考[J]. 中國科學院院刊, 2012, 27(6): 647-657.
[15]曾雷. 大數據研究綜述[J]. 軟件導刊, 2015, 14(8): 1-2.
[16]付巖, 李洪茹. 關于整車企業數字化轉型系統架構的研究[J]. 汽車文摘, 2022(7): 20-26.
[17]王茹葳. Java編程語言在大數據開發中的應用[J]. 電子技術, 2022, 51(1): 160-161.
[18]郭陽, 常英賢. 淺談Java語言在計算機軟件開發中的應用[J]. 數字通信世界, 2022(1): 88-90+94.
[19]張佳琪. 基于Java Web的車輛試驗管理信息系統的設計與實現[D]. 北京: 北京交通大學, 2016.
[20]李健. 基于深度學習的變循環發動機氣路故障診斷[D]. 上海: 上海交通大學, 2019.
[21]洪驥宇. 基于深度學習的航空發動機可靠性分析[D]. 南京:南京航空航天大學, 2018.
[22]周亦人, 邱小林, 郭志強. 基于深度學習理論的發動機氣門機構故障識別[J]. 制造業自動化, 2017, 39(11): 89-93.
[23]嚴冰. 深度學習在航空發動機故障診斷中的應用[D]. 上海:上海交通大學, 2017.
[24]Ostrowski K, Birman K, Dolev D. Extensible Architecture for High-Performance, Scalable, Reliable Publish-Subscribe Eventing and Notification[J]. International Journal of Web Services Research, 2007, 4(4): 18-58.
[25]YANG J. Web Service Componentization[J]. Communications of the ACM, 2003, 46(10): 35-40.