王若昆,何浩洋,張霆偉
(1.南京鐵道職業技術學院,南京 210031;2.中電十四所國??萍脊煞萦邢薰?南京 210039)
隨著我國現代化都市圈建設和新型城鎮化建設的不斷深入,城市軌道交通(簡稱:城軌)行業迅猛發展。截至2022 年底,已有55 個城市開通308 條城軌線路,總里程達10 291.95 km,預計到2025 年,我國城軌交通線網總里程將達到14 000 km[1]。
城軌的發展,帶動城軌信號專業技術的飛速進步和變革[2-3]。從傳統的基于通信的列車控制系統(CBTC ,Communication Based Train Control System)向全自動運行列車控制系統(FAO,Fully Automatic Operation ),并逐步向列車自主運行系統(TACS ,Train Autonomous Circumambulation System)過渡[4]。目前,城軌信號系統的設計理念伴隨著計算機技術的發展,已經從具體線路數據與控制邏輯一體化設計,向一般通用控制邏輯與具體線路配置數據相分離的設計方案轉變,正確、完整的線路配置數據是保證一般通用控制邏輯實現各項功能的前提[5]。應答器精確安裝數據是線路配置數據的重要組成部分,對列車運行有重要影響[6],主要作用包括:(1)列車需要獲取地面精確安裝的應答器位置,在列車運行中對列車位置進行校準,消除運行過程中因各種傳感器誤差而造成的列車偏移量誤差;(2)列車在停車過程中,需要不斷讀取應答器位置,確認列車距離停車窗的間距,以滿足《地鐵設計規范》中對列車精確停車時停車誤差在 ±30 cm 的停車要求;(3)在列車位置初始化過程中,列車需要與應答器組進行通信,實現列車位置初始化。
目前,應答器精確安裝數據受工程實際影響較大,往往難以通過數據生成的方式直接給出應答器精確安裝數據生成結果,需要在調試過程中不斷對應答器精確安裝情況進行調整,耗費的調試時間較長[7]。
本文針對上述問題,采用神經網絡算法,研究應答器精確安裝數據生成與驗證方法。通過整理目前應答器精確安裝的基本原則,設計基于CAD 二次開發的應答器精確安裝數據自動生成方法,對應答器是否需要精確安裝進行分類。針對分類結果中部分數據不服從約束條件的情況,構建一種基于深度神經網絡 (DNN,Deep Neural Networks)的模型,保障數據準確性。
應答器精確安裝數據受多種因素影響,主要考慮應答器類型、位置是否處于車站范圍內和偏移量等,因此,快速、準確地獲取上述數據是應答器精確安裝數據生成的前提。本文設計了一種基于CAD二次開發的應答器精確安裝數據自動生成方法,該方法分為數據提取、數據清洗、對象生成和數據生成等4 個階段,如圖1 所示。

圖1 應答器精確安裝數據自動生成方法步驟
城軌信號圖紙以圖的形式對城軌信號系統設備的拓撲結構進行展示,因此,數據提取的對象是城軌信號圖紙。數據提取過程主要包括圖紙分析和設備識別兩部分。
1.1.1 圖紙分析
城軌信號圖紙對具體的繪制要求沒有作出約定,本文明確了城軌信號圖紙中所有對象的繪制要求。部分元素的繪制原則如表1 所示。

表1 圖紙繪制原則(部分)
通過統一圖紙繪制原則,應答器數據被分成自有數據和相關數據。自有數據指應答器固有信息,包括應答器的類型和位置等,類型可通過屬性塊種類進行區分,位置可通過應答器公里標圖層獲?。幌嚓P數據指應答器與其他設備間的關聯數據,包括應答器所處虛擬區段的編號、位置、偏移量、坡度等信息,可通過虛擬區段類別、坡度類別等獲取對應信息。
1.1.2 設備識別
城軌信號圖紙通常采用.dwg 格式文件進行繪制,本文采用CAD 軟件二次開發的方式對.dwg 文件進行讀取,并基于.Net 對城軌信號圖紙進行數據提取,提取分為初始化階段、點設備識別階段和線設備識別階段。
提取數據后,需要對其進行篩選和清洗。數據清洗主要包括無效數據刪除和低關聯數據刪除2 個階段。
(1)無效數據刪除。無效數據是指圖紙中存在,但對于應答器精確安裝無意義的數據。例如:點元素中記錄的圖紙繪制信息(創建時間等)。需要刪除此類數據。
(2)低關聯數據刪除。低關聯數據是指信號系統需要但與應答器精確安裝沒有關聯的數據。例如信號機數據中存在信號機的邏輯類型數據,需要刪除此類數據。
對象生成的目的是整合散亂的數據。在數據清洗后,需要整合數據間的關系。采用面向對象的整合方式,為不同的元素類型創建類,在每個類中附著屬性(可以是一個值,也可以是另一個類的對象),形成基礎對象池。對象關系示例如圖2 所示。

圖2 對象關系示例
圖2 中,應答器、信號機和軌道是對象,每一個對象均有若干屬性,其中,應答器對象有4 個屬性,主信號機、所處區段屬性又分別是信號機和軌道對象的屬性,由此體現數據間的關系。
形成基礎對象池后,根據應答器精確安裝邏輯,輸出應答器是否需要精確安裝。應答器需要精確安裝與否取決于以下約束條件。
(1)應答器的類型是主信號應答器;
(2)應答器的類型是補充應答器;
(3)應答器的位置位于運營的站臺軌上,且應答器距離站臺軌兩端運營停車點的距離≥3.65 m;
(4)應答器的位置位于列車自動監控系統(ATS,Automatic Train Supervision)規定的可折返的折返軌上。
若應答器滿足以上任意一個條件,即可被認定為需要進行精確安裝的應答器。基于該方法,可自動快速進行應答器精確安裝數據生成。
1.4 節中給出了應答器精確安裝數據生成的方法,但通過現場工程調試發現,除滿足上述約束條件的應答器外,仍有部分應答器需要進行精確安裝,這部分應答器難以通過某一固定精確安裝原則進行總結。本文采用DNN 算法對自動產生的應答器精確安裝數據進行驗證和修正。
神經網絡的基本單元稱為神經元,每個單獨的神經元被稱為感知器或感知機[8]。神經元對輸入數據的處理機制,即工作原理如圖3 所示。

圖3 神經元工作原理
圖3 中,x1、x2、x3是不同的輸入,可用輸入矩陣X來表示。X為
不同輸入的權重值為w1、w2、w3,可組成權重矩陣W。W為
添加偏置項b,該神經元的輸出函數為
神經元雖然可較好地反應輸入的線性關系,但將大量簡單的神經元進行堆疊,僅起到調整參數的作用。因此,需要在神經元中加入非線性激活函數,即
式中,g(x)為某一激活函數。一個神經元的輸出可以是另一個神經元的輸入,這就增加了神經網絡的深度,當大量神經元進行有效深度組合后,就形成了DNN 模型,如圖4 所示。

圖4 DNN 模型
完成DNN 模型構建后,需要進行模型訓練。在訓練初始階段,需要初始化DNN 模型內部的所有連接權重[9]。手動將應答器是否需要精確安裝作為標簽,標記對應的應答器,每個應答器可視為一個樣本,大量樣本構成了模型的訓練集。訓練集中包括樣本特征和樣本標簽2 部分。樣本特征為從基礎對象池中提取的部分數據,包括應答器ID、是否為終端應答器、是否具有點式列控數據編碼、對應的主信號機方向、應答器類型(普通應答器、補充應答器、主信號應答器)等。將訓練集輸入模型,對模型進行訓練[10]。每完成一次訓練后,將模型給出的計算結果與訓練集中樣本的標簽進行比對,不斷調整權重,使得在某一權重矩陣下,該模型在訓練集上獲得最好結果。模型訓練過程如圖5 所示。

圖5 模型訓練過程
本文將上述應答器精確安裝數據自動生成與驗證方法應用于南昌地鐵3 號線中,進行驗證。
依據本文設計的應答器精確安裝數據自動生成方法,對南昌地鐵3 號線城軌信號圖紙進行數據提取、數據清洗、對象生成和數據生成。最終生成的應答器精確安裝數據如圖6 所示(畫紅框部分)。其中,“1”表示該應答器需要進行精確安裝;“0”則表示不需要進行精確安裝。

圖6 應答器精確安裝數據
3.2.1 模型深度對驗證結果的影響分析
依據本文提出的數據自動驗證過程,對南昌地鐵3 號線城軌信號圖紙進行建模,根據線路實際情況,建立了3 種不同深度的DNN 模型,并進行了模型訓練。南昌地鐵3 號線應答器精確安裝數據集共有575 個樣本,每一個樣本均進行了手動標簽標注。本文使用ADAM(Adaptive Moment Estimation)優化器,采用Relu 激活函數,訓練次數為100 次,訓練集與驗證集分割比例為7∶3。圖7 給出了Batch Size為64 時不同深度的DNN 模型對訓練結果的影響。
圖7 (a)(b)(c)分別是3 層、4 層、5 層神經網絡模型的準確度和損失度曲線。每張圖左側為訓練集和驗證集上的準確度曲線,右側為訓練過程中訓練集和驗證集上的損失度曲線,對比3 種模型的準確度和損失度曲線可知,模型深度越深,損失度曲線收斂越快;模型深度增加可能導致過擬合,使得測試集上的準確度降低。
3.2.2 訓練集樣本對驗證結果的影響分析
由圖7(a)可知,3 層DNN 模型已可取得較好的準確率,但其收斂速度有待加強,且在訓練末尾也已出現輕微過擬合的情況。因此,須調整每次訓練的訓練集樣本數,實驗結果如圖8 所示。

圖8 調整訓練集樣本數后模型的準確度和損失度曲線
圖8 是3 層DNN 模型在Batch Size 為256 時的訓練結果,可看出,在整個訓練過程中,驗證集上的準確率均高于訓練集,沒有出現過擬合現象。但該模型的收斂速度進一步變慢,在上圖中,進行到100 次訓練時,依然存在下降趨勢,可能與訓練次數不足有關。進一步增加訓練次數,從100 次增加到250 次,實驗結果如圖9 所示。

圖9 增加訓練次數后模型的準確度和損失度曲線
圖9 中,將訓練次數從100 次增加到250 次,對比圖8 可發現,在訓練末期(200 次訓練后),下圖整體區趨于平緩,模型準確度達95.45%,未出現過擬合現象,并與南昌地鐵3 號線現場實際情況相符。說明本模型可較好地預測應答器是否需要精確安裝。
本文通過對城軌信號系統設備布置結構和屬性進行分析,借助CAD 二次開發技術,進行數據提取,設計了應答器精確安裝數據的自動生成方法,提高了數據配置效率。針對數據準確性保障問題,提出了一種基于DNN 模型的應答器精確安裝數據自動驗證模型,可對自動生成的數據進行驗證。最后,以南昌地鐵3 號線為例進行了實驗驗證。未來,將進一步擴大模型訓練樣本,增強模型適應性,使模型具有更廣的應用場景,推動模型的工程應用。