999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

鐵路基礎設施檢測數據綜合治理技術研究

2021-03-01 15:48:12郭劍峰劉金朝陶凱代春平高佳佳張川
鐵路技術創新 2021年6期
關鍵詞:檢測

郭劍峰,劉金朝,陶凱,代春平,高佳佳,張川

(中國鐵道科學研究院集團有限公司基礎設施檢測研究所,北京 100081)

0 引言

隨著信息技術的飛速發展與業務數據的不斷積累,國內外各行各業在數據應用之前都面臨著對數據進行綜合治理的實際問題。近年來,數據成為一種無形資產的概念逐漸深入人心,數據綜合治理和數據資產管理的重要性也愈發凸顯。

國內外諸多學者研究了數據綜合治理技術,并將這種技術應用在對鐵路基礎設施檢測數據的綜合治理過程中。1995年,新西蘭懷卡托大學的Garner等[1]開發了懷卡托智能分析環境(Waikato Environment for Knowledge Analysis),研發了首個JAVA環境下的開源數據挖掘軟件,具有簡單的數據治理功能,可以實現數據清洗、集成、規約、變換等基本功能。1998年,美國IBM公司研發了IBM Intelligent Miner工具[2],支持對商業數據的清洗、統計挖掘和關聯分析等數據處理功能,利用模糊邏輯和神經網絡技術處理原始數據中的不規范表達式等問題,使用數據的前后邏輯關系進行推理,自動填補數據中的缺失值。2005—2010年,美國谷歌公司先后研發了 Google Sawzall[3]、Google Dremel[4]和Google Flume Java[5]等工具,實現了對PB級海量結構化數據的快速查詢統計、數據格式轉化和數據清洗等治理功能,借助于Hadoop大數據分布式系統架構,支持簡單的并行計算,形成了一系列的通用數據治理工具。利用這些交互式的通用數據治理工具,可以組建成規模上千的集群,對PB級的海量數據快速治理。

上述通用數據治理工具存在數據治理手段較為簡單、對數據各個維度之間的關聯關系和每一個維度時間序列的歷史變化等關系處理不足等缺點,導致了通用數據治理工具對專業數據治理的操作能力不足。

在鐵路基礎設施檢測數據綜合治理技術研究方面,國內外諸多學者將上述通用數據治理思想引入到鐵路基礎設施檢測數據綜合治理問題的研究中。徐鵬[6]提出軌檢車檢測數據里程偏差修正的數據治理方法,利用閾值處理、地圖匹配、相關分析和動態規劃等技術建立了一個修正軌檢車檢測數據里程與線路設備里程之間偏差的模型,初步解決了對軌檢車軌道幾何檢測數據的里程治理問題。許貴陽等[7-8]基于相關系數最大化,提出對檢測數據里程自動修正的數據治理方法,并通過對高速鐵路大量實測數據的處理驗證了方法的有效性和實用性。王同軍[9]分析了我國鐵路在大數據時代面臨的數據治理手段缺乏等問題,提出中國鐵路大數據應用頂層設計。Karakose等[10]提出接觸網檢測數據中網壓和網流數據的治理方法,通過對網流數據低通濾波消除網流數據中的高頻噪聲,并在一定頻率范圍內取這些數據的絕對值確定無噪聲數據的峰值,利用峰值對數據歸一化,之后使用線性插值方法將這些點組合得到一個新的數據,利用生成的新數據對受電弓拉弧進行準確檢測。秦航遠等[11]提出里程偏差二次修正的檢測數據治理方法,使用五點迭代法提高參考里程與待校準里程相關性分析的計算效率。武威等[12]研究了高鐵運營安全規律分析數據的治理及應用方法,構建了面向高鐵運營安全規律分析的數據治理架構。

雖然上述專業的鐵路基礎設施檢測數據治理技術可以解決一些問題,但我國在鐵路基礎設施檢測數據綜合治理方面仍面臨著各專業單獨發展、缺少統一綜合治理技術規劃和標準等問題。數據綜合治理包含很多內容,從數據智能清洗到數據評估模型,企業數據的綜合治理越來越受到重視。因此,亟需研究一套完整的鐵路基礎設施檢測數據綜合治理技術。

1 總體技術路線

鐵路基礎設施檢測數據綜合治理總體技術路線見圖1,包括數據預處理、里程修正、無效識別和質量評估4個部分。在數據預處理部分研究了基于臺賬信息的基準文件自動生成技術;在里程修正部分研究了基于最大相關系數的多次檢測數據里程自動對準技術;在無效識別部分研究了基于人工智能的無效數據智能檢測技術;在質量評估部分分別研究了數據的完整性、有效性和一致性評估技術。

圖1 鐵路基礎設施檢測數據綜合治理總體技術路線

2 數據預處理

在數據預處理過程中,首先要基于線路的臺賬信息自動生成檢測數據的基準文件。因為現有的鐵路基礎設施檢測數據治理過程中,首先需要人工配置一個基準文件,用于后續對檢測數據的里程修正。人工配置基準文件的工作量較大,并且不能根據臺賬的變化自動更新基準文件。人工配置基準文件的準確性與操作人員的經驗水平等因素密切相關,因此配置結果具有較大的個體化差異,無法建立統一的配置標準。人工配置的基準文件見圖2。

圖2 人工配置基準文件

人工配置基準文件時,需要逐一手動添加索引點,例如圖中需要根據線路的曲線臺賬信息,結合超高通道的波形變化情況,人工將檢測數據中的1 611.840檢測點里程修正為1 611.844。當人工配置的基準文件不夠準確時,后續數據治理算法可能不會得到滿意的治理結果,可見后續數據治理算法對基準文件的依賴性較強。若能基于臺賬信息自動生成檢測數據基準文件,可有效解決人工配置基準文件效率較低、標準不統一和配置差異性較大等問題。

為解決上述問題,研究了基于臺賬信息的基準文件自動生成技術。人工配置基準文件時,通?;谂_賬中的曲線信息,結合檢測數據的超高信息,手動尋找對應的索引點?;谂_賬信息的檢測數據基準文件自動生成技術通過將檢測數據的超高通道與曲線臺賬信息使用5點迭代法尋找最佳匹配點[10],再對匹配后的數據做插值處理,從而實現對基準文件的自動生成預處理。

某高速鐵路的曲線臺賬信息自動生成的檢測數據基準文件示意見圖3。

圖3 基于臺賬自動生成的檢測數據基準文件示意圖

圖中紅色實線為臺賬的原始信息,綠色虛線為自動生成的基準文件,兩線高度重合,基準文件包含自動獲得的超高通道里程信息。

基于臺賬信息的檢測數據基準文件自動生成技術可徹底解決人工配置基準文件效率低和差異性大等問題,不僅提高了配置基準文件的工作效率,且具有較高的配置精度和配置結果唯一性。

3 多次檢測數據里程自動對準技術

由于檢測車在不同時期運行過程中會產生一定范圍內的里程偏差,因此對于同一條鐵路線路不同時期采集的多次檢測數據,通常存在著一定范圍的里程偏差(見圖4)。

圖4 多次檢測數據里程偏差示意圖

對多次不同時期采集的檢測數據進行里程修正是開展數據分析工作的前提,準確的里程信息可以輔助養護維修人員快速、準確地定位病害所在位置,此外還可輔助數據分析人員利用多次檢測數據對比分析軌道幾何狀態變化趨勢、利用大數據技術深度挖掘數據價值等研究工作。

3.1 算法實現

多次檢測數據里程自動對準技術的總體流程見圖5。主要包括自動生成基準文件、定時獲取數據、里程重構、里程校正、斷鏈里程調整和校正效果評價6個部分。

圖5 多次檢測數據里程自動對準技術總體流程

基于相關系數最大化原理,提出一種更加穩健的多次檢測數據里程自動對準算法。使用軌距、超高、左右高低等通道,計算多次檢測數據各通道對應的相關系數。設基準文件片段x有m個數據點,目標文件片段y有n個數據點,考慮到多次檢測數據的里程誤差,通常建議m≥800,n≥4m,則相關系數r的計算方法為:

式中:r(k)為第k次比較得到的相關系數;i為數據片段中的第i個數據點;k為比較次數;x(i)為基準文件片段中第i個數據點的值;y(i)為目標文件片段中第i個數據點的值;為基準文件片段的平均值;為目標文件片段的平均值。

計算得到相關系數后,尋找最大相關系數所在位置。為提升算法的穩健性,由于數據中存在著無效數據的干擾,會導致在計算過程中出現各通道的最大相關系數位置差異較大?;诋惓z測技術,將差異較大的通道進行剔除,從而減少對里程修正結果的干擾,確保了算法的穩健性。此外,測試結果表明該算法即使在未對檢測數據中的無效區段進行預處理的情況下,仍可減少無效數據對里程修正算法的影響。

3.2 實驗結果

利用上述基于最大相關系數的檢測數據里程自動對準算法對某條高速鐵路的多次實際軌道幾何檢測數據進行里程自動修正,實測結果見圖6。

圖6 里程修正前后超高通道對應波形

圖6中所示為算法對超高通道里程修正結果,圖6(b)上方紅色曲線為根據線路曲線臺賬自動生成的基準文件超高數據,下方曲線為里程修正后的多次檢測數據目標文件的超高數據。

基于最大相關系數的多次檢測數據里程自動對準算法與目前已有檢測數據里程自動修正算法相比,具有如下兩方面的優勢:

(1)準確性提高。通過對軌距、超高、左右高低等通道的相關匹配,可以準確找到基準文件中所有的里程修正點,提高了里程修正算法的準確性。使用新算法和傳統算法對某高速鐵路軌道幾何檢測數據進行里程修正時的計算結果比較見表1。

表1 兩種算法計算結果比較 km

從表1中可見,在預設的10個修正點中,傳統的里程修正算法未找到其中4個修正點,會導致后續里程校準工作在插值時整個區段的匹配精度降低。新算法能找到全部預設里程修正點,可更加準確地進行后續里程修正工作。

(2)計算效率提高。以不同線路長度的高速鐵路實測軌道幾何檢測數據為例,分別使用傳統算法和新算法對檢測數據進行里程修正,計算時間對比見圖7。

圖7 算法計算時間對比

圖7中所示的計算結果是利用Jupyter Notebook運行在Win10 64位操作系統、Intel Core i7處理器、8G RAM的實驗環境下得到的結果。與已有算法相比,新算法在處理短線路時具有更高的計算效率。

4 基于人工智能的無效數據智能檢測技術

由于在檢測過程中,陽光、雨雪天氣和電磁環境等因素會對傳感器造成干擾,部分傳感器可能會發生故障,因此鐵路基礎設施檢測數據中通常存在部分無效數據。目前對這些無效數據識別通常采用特征提取方式,通過匹配無效特征來識別無效數據。隨著人工智能技術的發展,深度學習為無效數據的智能檢測提供了一條新的途徑。傳統的特征提取方法在一些特征明顯的單通道數據無效識別上有較好的應用效果,但在對具有復雜特征和復合特征的無效數據上識別效果有待提高。此外,基于特征提取的單通道無效識別方式較難識別出多通道數據的復合無效。深度學習作為目前人工智能領域中有效的特征提取和分類手段,已被廣泛應用到數據治理無效識別的實際工程問題中,并取得了較好的應用效果。

基于全卷積神經網絡架構深度學習的無效數據智能檢測技術,可根據輸入的鐵路基礎設施檢測數據自動識別數據中的無效區段,并輸出相應的無效類型、判斷為無效的概率和無效的里程范圍。該全卷積神經網絡架構見圖8。

圖8 全卷積神經網絡架構

以多通道的軌道幾何檢測數據為例,使用圖8中所示深層神經網絡訓練模型,以包含有效數據和無效數據的數據集作為輸入,對這些輸入數據進行切片處理,以256個測量點的多通道檢測數據為一個片段,混合這些片段得到處理后的數據集,以其中80%的片段作為訓練集,20%的片段作為測試集訓練深層神經網絡,對雨雪干擾、電磁干擾、左右高低加速度計故障、軌距攝像機故障引起的無效數據進行識別,結果見圖9。

圖9 基于人工智能的無效數據智能檢測結果

5 檢測數據質量自動評估技術

5.1 數據完整性評估

數據完整性通常指歸集存儲的檢測數據的所有數據值均應處于完整的狀態,如果數據中缺少了某些數據值,例如檢測系統在死機重啟后部分數據未正常采集,則該數據集喪失了部分完整性。由于鐵路基礎設施檢測數據通常以一定的時間或空間采樣頻率進行采樣,例如:軌道幾何和接觸網幾何檢測數據的空間采樣頻率通常為0.25 m,可結合線路的臺賬信息,估算出檢測數據文件的樣本數量,再與實際檢測數據的樣本量進行比較,定義閾值ε,一旦比較結果超過定義的閾值,則認為檢測數據完整性缺失,并可量化評估檢測數據的完整性。檢測數據完整性評估示例見圖10。

圖10 不完整檢測數據波形圖

圖中K37+400—K50+600區段,由于檢測設備處于死機狀態,造成了部分檢測數據缺失。結合臺賬信息,該線路區段的實際檢測里程應為496 km,其中缺失數據13.2 km,則可計算出該線路檢測數據的完整性為97.34%。

5.2 數據有效性評估

數據完整性是對檢測數據樣本數量的定量評估方法,而數據有效性則是對檢測數據樣本質量的定量評估方法。利用人工智能的無效數據智能檢測技術,可以自動獲得某次檢測數據中的無效區段列表,進而對檢測數據的有效性進行量化評估。

例如對某條實際線路,首先利用基于人工智能的無效數據智能檢測算法得到無效數據所在區段后,分別統計無效和有效區段的長度、檢測數據長度、無效數據和有效數據占比,然后可進行數據有效性評估,結果見表2。

表2 數據有效性評估結果

從表2中可以看出,對于某條線路的某次檢測數據,根據人工智能的無效數據智能檢測技術識別出的無效區段結果,可以自動統計計算出該次檢測數據的檢測有效率,用于對數據的有效性進行量化評估。

5.3 數據一致性評估

經過里程修正處理后的鐵路基礎設施檢測數據之間具有較好的數據一致性。已有的里程修正算法,僅能夠從修正之后的圖形效果上觀察修正結果的準確性,因此里程修正效果評估受個人主觀因素的影響較大,不僅不能直觀反映數據的一致性,且不能準確地對修正算法做出評價。由于缺少數據一致性評估標準,需要設計數據一致性評估方法,從數值上量化評估數據的一致性。

在對多次檢測數據一致性評估過程中,通過計算對比對準前后檢測數據通道的平均誤差值評估數據的一致性。由于不同檢測數據樣本數量存在差異,因此在計算平均誤差值時不可逐點計算誤差值,應通過兩次檢測數據曲線包圍的區域計算每公里波形面積差值作為平均的誤差值。對某高速鐵路軌道幾何檢測數據一致性評估結果見圖11。

圖11 里程修正前后數據一致性對比

從圖11中可以看出,與基準文件相比,里程修正后偏差減少,數據一致性提高。數據一致性評估方法的計算效率遠高于逐點計算的效率,并且不影響評估結果的準確程度,因此可以量化評估數據的一致性。

6 結論與展望

圍繞鐵路基礎設施檢測數據中的里程偏差、無效數據和質量評估等共性數據管理問題,研究了一套鐵路基礎設施檢測數據綜合治理技術。在數據預處理階段,首先基于臺賬信息自動生成基準文件,之后利用自動生成的基準文件基于最大相關系數原理實現多次檢測數據里程自動對準,并利用人工智能深度學習研究檢測數據的無效區段自動識別方法,最終初步實現對鐵路基礎設施檢測數據完整性、有效性、一致性的質量評估目標。

數據的自動化和智能化處理是數據分析處理技術發展的趨勢,目前鐵路基礎設施檢測數據綜合治理的研究仍處于起步階段,自動化和智能化程度仍有待提高。伴隨著大數據和人工智能等新技術的發展,未來鐵路基礎設施檢測數據綜合治理技術研究將借助大數據平臺、云計算等手段,向高效、并行、智能的方向發展。

猜你喜歡
檢測
QC 檢測
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
“幾何圖形”檢測題
“角”檢測題
“有理數的乘除法”檢測題
“有理數”檢測題
“角”檢測題
“幾何圖形”檢測題
主站蜘蛛池模板: 乱人伦99久久| 精品国产成人三级在线观看| 97国产成人无码精品久久久| 国产超碰在线观看| 国产在线一区二区视频| 欧美成人午夜在线全部免费| 婷婷在线网站| 无码 在线 在线| 亚洲国产精品无码久久一线| h网站在线播放| 免费无码AV片在线观看中文| 国产高潮流白浆视频| 国产福利大秀91| 亚洲开心婷婷中文字幕| 国产精品久线在线观看| 超清无码一区二区三区| 免费在线观看av| 最新加勒比隔壁人妻| 亚洲综合婷婷激情| 欧美精品成人一区二区在线观看| 国产日韩欧美中文| 亚洲免费毛片| 国模私拍一区二区| 国产凹凸视频在线观看 | 欧美在线视频不卡第一页| 国产成人a毛片在线| 99re在线观看视频| 国产一在线| 欧美激情视频二区| 18禁黄无遮挡网站| 亚洲欧美天堂网| 99r在线精品视频在线播放| 麻豆精品在线播放| 自拍偷拍欧美| 亚洲欧美另类专区| 久久综合亚洲鲁鲁九月天| 尤物亚洲最大AV无码网站| 中文字幕 91| 国产在线97| 午夜国产大片免费观看| 一本一道波多野结衣一区二区 | 国产裸舞福利在线视频合集| 亚洲中文精品人人永久免费| 成人日韩视频| 熟妇丰满人妻av无码区| 国产欧美日本在线观看| 国产精品尤物在线| 国产精品所毛片视频| 国产国产人成免费视频77777| 国产拍揄自揄精品视频网站| 人妻中文久热无码丝袜| 精品视频免费在线| 无遮挡国产高潮视频免费观看| 亚洲自拍另类| 亚洲第一中文字幕| 国产全黄a一级毛片| 亚洲欧洲日产无码AV| 二级特黄绝大片免费视频大片| 国产在线拍偷自揄观看视频网站| 麻豆AV网站免费进入| a级毛片免费看| 精品视频一区在线观看| 国产精品自拍露脸视频| 成人在线观看不卡| 日韩在线播放中文字幕| 国产午夜精品一区二区三区软件| 成色7777精品在线| 亚洲精品黄| 成人午夜视频网站| 99久久亚洲精品影院| 无码国产伊人| 国产精品三级av及在线观看| 99999久久久久久亚洲| 国产精品久久久久久搜索| 四虎亚洲精品| 亚洲综合专区| 538国产在线| 四虎亚洲精品| 丝袜亚洲综合| 国产在线欧美| 九一九色国产| 婷婷亚洲最大|