999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于人工智能的高鐵動車組智能運維數據分析系統的構建

2022-08-08 07:29:18吳文波楊友蘭馬毅華宗智誠
鐵路計算機應用 2022年7期
關鍵詞:特征

王 平,吳文波,楊友蘭,馬毅華,許 江,宗智誠

(中國鐵路上海局集團有限公司 信息技術所,上海 200071)

近年來,我國高速鐵路(簡稱:高鐵)事業飛速發展,高鐵動車組列車保有量快速增長,服役車型種類日益增多,高鐵產業正由制造為主的階段轉向全壽命周期運營維護(簡稱:運維)為主的階段。因此,提高動車組運行的安全性和可靠性,降低運維成本,具有重大意義。

目前,動車組故障預測與健康管理(PHM ,Prognostic and Health Management)系統[1]已在全國鐵路投入使用[2],基于對24種動車組關鍵部件傳感器數據的分析,構建了預警預測、視情維修等故障診斷和預測應用。2021年,動車組PHM系統(由中國鐵路上海局集團公司開發的部分)生成故障診斷預警數據近3萬條,準確率約為80%,預報了動車組聯軸節脫開、軸箱軸承故障、蓄電池燒損等典型故障,有效保障了動車組運行安全;針對動車組的散熱裝置進行健康度預測,動車組濾棉更換次數、散熱裝置清潔沖洗次數顯著下降,降低了維修成本。

現階段的動車組PHM系統運維算法模型尚存在如下問題:(1)模型設計依賴于專家經驗,具有主觀性[3-4];(2)模型主要基于動車組系統運行機理構建,對較復雜的部件故障難以進行有效預測;(3)利用傳統故障診斷方法難以構建動車組部件“健康”與“非健康”的狀態分界面,不利于健康管理的深化;(4)利用監督學習構建算法需要高質量的數據標注,但動車組關鍵部件的故障標注數據尚在積累階段,健康度標注則還在研究中。

為深化發展高鐵動車組智能運維算法,亟需在基于人工智能(AI ,Artificial Intelligence)的高鐵動車組智能運維算法研究平臺中構建數據分析系統,將AI算法引入特征工程和數據標注環節,利用AI算法打通高鐵動車組智能運維算法研究的全過程。

1 系統概述

1.1 平臺概述

高鐵動車組智能運維算法研究平臺包括數據分析系統和建模分析系統,如圖1所示。動車組PHM系統將動車組車載信息無線傳輸系統(WTDS ,Wireless Transmission Device System)數據存入離線數據倉庫,作為平臺的數據支撐,數據接入平臺后,經過數據處理、特征工程、數據標注、模型訓練和模型驗證等步驟,反復迭代、優化形成穩定可靠的模型,最終部署至動車組PHM系統。

圖1 高鐵動車組智能運維算法研究平臺總體架構

數據分析系統負責進行數據處理、特征工程和數據標注,包括數據管理、數據處理、特征管理和數據標注功能模塊;建模分析系統負責進行模型訓練和模型驗證[5-6],包括算法管理、任務管理、模型管理和成果管理功能模塊。數據分析系統作為建模分析系統的前置環節,可為建模分析系統作好特征工程與數據標注準備。

1.2 數據處理流程

動車組部件的數據海量而繁雜,在現階段數據標注較為匱乏的情況下,難以進行高效的算法探索與模型分析,針對此問題,數據分析系統設計了具體的處理流程,如圖2所示。系統的特征工程部分細分為降維聚類和結果分析2個流程。降維聚類后的結果需經專業人員分析確認后才能作為特征工程環節的輸出。數據特征數量較多時,高維度數據樣本在空間的分布呈現稀疏性,難以進行進一步分析,在數據處理中被稱為“維數災難”[7],降維是解決維數災難的重要方法,降維的目的是在壓縮數據的同時讓信息損失最小化。在降維的基礎上,聚類算法可顯著降低數據分析的復雜性,提高聚類結果的可解釋性。經“降維—聚類”后的數據可更加直觀地反映數據間的潛在關系,有助于后續的數據標注和建模分析。

圖2 數據分析系統的處理流程

2 關鍵算法

2.1 降維算法

2.1.1 主成分分析

主成分分析(PCA ,Principal Component Analysis)是一種經典的線性降維方法[8]。PCA的主要思想是將高維數據通過線性變換投影到低維空間中,并期望在所投影維度上數據的信息量最大(方差最大)。

2.1.2 t-分布隨機鄰域嵌入

t-分布隨機鄰域嵌入(t-SNE ,t-distributed Stochastic Neighbor Embedding)是一種非線性降維算法[9]。該算法的基本思想是保持樣本點在高維空間和低維空間中的概率分布盡量相似,以達到降維的目的。

2.1.3 均勻流形逼近和投影

均勻流形逼近和投影(UMAP ,Uniform Manifold Approximation and Projection)是一種基于黎曼幾何和代數拓撲理論框架構建的非線性流形學習算法[10]。UMAP依據高維空間映射到低維空間相似度的定性結論,將高維數據的拓撲結構進行低維映射以達到降維結果,主要包含構造1個特殊的加權K鄰域圖和計算該圖低維表示2個階段。

2.2 聚類算法

2.2.1 K-means

K-means算法是一種劃分聚類算法。給定一個數據點集合和需要的聚類數目K,該算法根據距離函數反復把數據分入K個聚類中。

2.2.2 Louvain

Louvain算法[11]是一種基于圖數據的社區發現算法,優化目標為最大化整個數據的模塊度,模塊度的計算公式為

其中,m為圖中邊的總數量;ki、kj分別表示所有指向節點i、j的連邊權重之和;Ai,j表示節點i、j之間的連邊權重,Ci表示節點i所屬的社區,當Ci=Cj時 , δ (Ci,Cj)=1,否則 δ (Ci,Cj)=0。 通過Q值可確定社區的分類度,其取值范圍為 [0,1],Q值越大,分類度越好。

2.2.3 變分自編碼器

變分自編碼器(VAE ,Variational Auto-Encoder)是自編碼器(AE,Auto Encoder)在生成模型上的變體。基于深度學習的聚類模型選用不同的神經網絡提升聚類效果,AE、VAE、生成式對抗網絡(GAN ,Generative Adversarial Networks)用于聚類的原理類似。

VAE要求AE的中間特征服從給定的高斯分布,通過變分推斷法推斷出樣本概率的最大下界,最大化下界的過程會使樣本的中間特征逼近給定的先驗分布。

3 系統應用與分析

故障的發生具有突發性和隱蔽性,故障診斷和預測有較大難度。本文采用“PCA+Louvain+UMAP”的降維聚類算法,以高鐵動車組客室空調的數據分析為例,說明高鐵動車組智能運維數據分析系統的應用。高鐵動車組客室空調故障是動車組夏季常見的故障之一,動車組在運行過程中車體呈全密閉式,當空調制冷系統發生故障時,車內室溫不斷升高,將影響車內乘客的乘車環境,甚至可能導致動車組無法繼續運行,嚴重影響動車組運行秩序[3]。

3.1 數據處理

本文選取動車組客室空調相關部件傳感器數據用于分析其健康狀況的特征,數據來源為20列CRH380B型和20列CRH380BL型動車組在2020年6月~8月運行期間的客室空調相關WTDS數據,共4 725 120條記錄,每條記錄的10維特征選取如表1所示。

表1 客室空調特征列表

本文對選取的10維特征進行缺失值處理、去量綱等數據預處理,并結合業務知識和經驗[12]對其進行特征擴展,新的特征與客室空調故障有更好的相關性,有助于進行數據分析。最終將特征從10維擴展至16維,擴展后的特征如表2所示。

表2 擴展后的客室空調特征列表

3.2 降維聚類

(1)降維:對擴展后的16維特征數據,利用PCA方法進行線性降維,降維結果如圖3所示,橫坐標代表主成分的序號,縱坐標代表主成分對應的標準差。由圖3可知,大部分信息在前9個主成分中捕獲,因此,選擇前9個主成分進行后續分析。

圖3 PCA降維的成分分析

(2)聚類:選擇降維后數據的前9個主成分作為輸入,利用Louvain算法進行基于圖的聚類,其中resolution參數為0.5。

(3)可視化:對于聚類后的數據進行UMAP降維,在2維空間上進行可視化展示,如圖4所示,以供專業人員進行結果分析。

圖4 動車組客室空調健康狀況降維聚類結果

3.3 結果分析

對16維特征數據進行“PCA+Louvain+UMAP”降維聚類分析的結果如圖4所示,數據被聚類為12個類別,不同的顏色代表不同的類別。專業人員通過對結果的分析發現,可將圖中的12個類別劃分為4類區域A、B、C和D,各類數據的主要特征如表3所示。

表3 各類數據對應的主導特征列表

A類數據為一級故障預警;B類數據為二級故障預警;C類數據為三級故障預警;D類數據為客室空調健康狀態下的數據,可被分類為正常[12]。

3.4 數據標注

根據圖4的聚類效果和結果分析,發現動車組客室空調健康狀況是可劃分的,并且劃分后的4類區域可反映不同程度的客室空調健康狀況,說明16維特征的選取是合理的,可作為特征工程環節的輸出。在建模分析階段可將這16維特征作為特征池,形成客室空調健康度判定算法。同時,可將A、B、C、D這4種分類的聚類結果轉換為客室空調健康度的數據標簽。標注后的數據作為模型分析系統的輸入,利用監督學習的方法,形成客室空調故障診斷和預測方法。

4 結束語

本文概述了高鐵動車組智能運維算法研究平臺的總體架構,著重闡述了高鐵動車組智能運維數據分析系統的構建,包括關鍵算法和數據處理流程。并以高鐵動車組客室空調故障的數據分析為例進行了應用研究與分析,證明了該系統的可用性。

下一步應進行的工作包括:(1)利用“降維—聚類”的算法框架完成塞拉門、軸承類等部件的特征工程和數據標注;(2)利用特征工程和數據標注的結果,建立有監督的客室空調健康評估模型,實現客室空調故障診斷和預測。

猜你喜歡
特征
抓住特征巧觀察
離散型隨機變量的分布列與數字特征
具有兩個P’維非線性不可約特征標的非可解群
月震特征及與地震的對比
如何表達“特征”
被k(2≤k≤16)整除的正整數的特征
中等數學(2019年8期)2019-11-25 01:38:14
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
詈語的文化蘊含與現代特征
新聞傳播(2018年11期)2018-08-29 08:15:24
抓住特征巧觀察
基于特征篩選的模型選擇
主站蜘蛛池模板: 亚洲第一成年免费网站| 热99re99首页精品亚洲五月天| 一级全免费视频播放| 亚洲AV电影不卡在线观看| 538精品在线观看| 精品午夜国产福利观看| 试看120秒男女啪啪免费| 亚洲色成人www在线观看| 伊人91视频| 国产屁屁影院| 蜜芽一区二区国产精品| 国产精品成人AⅤ在线一二三四| 国产日本欧美亚洲精品视| 在线精品亚洲国产| 欧美精品高清| 国产精品人莉莉成在线播放| 久久国产精品影院| 日韩天堂网| 亚洲人网站| 波多野结衣视频一区二区 | 亚洲精品国产日韩无码AV永久免费网| 成AV人片一区二区三区久久| 亚洲欧美另类日本| jizz在线免费播放| 国产精品永久不卡免费视频| 久久久久亚洲AV成人人电影软件 | 青草国产在线视频| 亚洲无码37.| 亚洲欧洲AV一区二区三区| 亚洲综合亚洲国产尤物| 亚洲欧美精品在线| 国产美女精品在线| 国产美女自慰在线观看| 欧美a级在线| 亚洲天堂视频在线观看免费| 性视频一区| 亚洲精品卡2卡3卡4卡5卡区| 久久国产精品无码hdav| 欧美一级专区免费大片| 亚洲欧美在线精品一区二区| 一级毛片网| 欧洲av毛片| 亚洲国产天堂在线观看| 日本亚洲国产一区二区三区| 天天做天天爱夜夜爽毛片毛片| 丰满的少妇人妻无码区| www.国产福利| 国产无码制服丝袜| 国产黄色片在线看| 国产精品亚洲а∨天堂免下载| 日本少妇又色又爽又高潮| 97免费在线观看视频| 国产一级在线播放| 国产高清无码第一十页在线观看| 国产一级特黄aa级特黄裸毛片| 亚洲天堂首页| 日韩欧美亚洲国产成人综合| h网站在线播放| 亚洲国产av无码综合原创国产| 久久人人爽人人爽人人片aV东京热| 亚洲国产av无码综合原创国产| 香蕉综合在线视频91| 91小视频在线观看| 蜜芽国产尤物av尤物在线看| 99re热精品视频国产免费| 狠狠v日韩v欧美v| 国产男人的天堂| 国产成人久视频免费 | 激情乱人伦| 亚洲AV成人一区国产精品| 国产欧美精品一区二区| 99久久亚洲精品影院| 香蕉久人久人青草青草| 免费精品一区二区h| 综合网天天| 波多野结衣在线se| 凹凸国产分类在线观看| 午夜视频免费一区二区在线看| 青青青国产精品国产精品美女| 国产成人精品综合| 亚洲全网成人资源在线观看| 久久毛片网|