湯立新



摘要
為保障列車運行安全,機務部門陸續投入使用了各種行車音視頻監控設備,為確保行車安全發揮了重要作用,逐步建立了安全音視頻監控設備記錄數據分析制度,為規范機車乘務員標準化作業取得了較好效果,但目前對于海量的機車音視頻的分析工作主要由人工完成,分析效率低等問題,展開對機車音頻文件智能化分析的研究,以自動識別機車音頻文件中的各類語音信號,一個是將分析人從繁雜而枯燥的任務解脫出來,由機器來完成這部分工作;另夕1—個是可以在海量的音頻數據中快速定位,及時發現問題有效處置,從而能夠高效的完成各種日常音頻文件的分析工作,全面提升分析工作效率,大幅度提高機務安全管理水平。
【關鍵詞】數據智能化 語音識別 系統自動校時 標準化作業管理
1引言
隨近年來,隨著鐵路交通的發展,列車的數量不斷增加,列車的速度不斷提高,對于列車運行安全提出了更高的要求。為保障列車運行安全,機務部門陸續投入使用了各種行車音視頻監控設備,為確保行車安全發揮了重要作用,逐步建立了安全音視頻監控設備記錄數據分析制度,為規范機車乘務員標準化作業取得了較好效果。由于錄音筆、機車視頻監控設備和LKJ監控記錄裝置各具時鐘系統,時間難免產生誤差,分析時存在時間混亂,數據失真的情況。同時機車乘務員的值乘狀態預警分析是鐵路安全運輸的重要環節,是保障鐵路安全運輸的關鍵,目前對機車乘務員值乘狀態的預警分析主要是人工盯控,缺少智能化設備。此外,機車乘務員作業過程中的關鍵項點,如分相前,呼喚“過分相注意”,禁止雙弓標前,呼喚“單弓好了”等發生時,需要對關鍵項點進行相應的呼喚應答。為了檢查機車乘務員是否作業規范,需判斷機車乘務員是否在關鍵項點是否進行相應的呼喚。然而在目前鐵路系統中,普遍使用人工方式完成,不僅浪費人力成本,且耗時長,易出錯,效率低下。針對以上現狀,有必要開展對機車音頻文件自動分析系統的研究。該系統代替傳統人工操作,高效完成各種日常音頻文件的分析工作,實現對機車乘務員標準化作業過程進行有效的卡控和管理,全面提升分析工作效率,大幅度提高機務安全管理水平。
2主要系統構成與研究內容
2.1主要系統構成
機車音頻文件自動分析系統包括錄音筆、數據服務器、機車音頻分析臺。
在機車駕駛室裝配錄音筆,采集行車期間駕駛室內音頻信息。通過該系統綜合分析機車乘務員作業音頻數據、LKJ運行記錄數據,準確定位關鍵時間、關鍵地段和關鍵項點,自動糾正錄音文件的時間偏差,判斷機車乘務員呼喚應答情況,智能分析機車乘務員的作業情況。
在機務段信息中心部署數據服務器,用于音頻數據、作業數據分析結果的存儲,并向各個查詢端提供音頻數據信息的流媒體傳輸服務。
在機務段音頻分析中心和各運用車間,安裝部署機車音頻分析臺,可進行機車乘務員作業現場音頻信息與LKJ運行記錄文件關聯分析和智能分析。
2.2系統主要功能
(1)利用己配備的錄音筆對機車乘務員的呼喚應答標準化作業狀況進行錄音。實現機車乘務員作業過程中關鍵事件的自動提取分析功能,能夠自動讀取機車乘務員當次作業的LKJ運行記錄文件,根據設定邏輯規則,自動提取作業過程中關鍵事件信息,如:進入調車事件、出入庫事件、車位對中事件、降級、開車、停車、側線運行、臨時限速等事件信息,并可根據事件自動定位播放當時的音頻信息。
(2)實現機車乘務員作業過程中關鍵項點呼喚應答的自動分析,根據LKJ運行記錄文件定位關鍵項點時間,在錄音文件中,限定在關鍵項點的時間段內,用語音分析技術來判斷音頻信號流中的語音和非語音信號。根據呼喚應答語句(根據字數、語句)的最短時間來規定各關鍵項點的呼喚應答時間的閥值,短語閥值,說明機車乘務員沒有按要求進行呼喚應答。
(3)實現作業項點分析記錄網絡化存儲功能,項點的分析結果和相應的音頻信息采用網絡化的方式集中存儲,管理人員可以使用系統平臺通過網絡對各個分析結果、音頻文件進行集中查看、分類查詢、驗證。
(4)實現基于音視頻分析結果的大數據分析;系統自動分析數據進行整理、分析、和推斷。找出對應的規律和趨勢,對應一些關鍵人、關鍵車隊、關鍵地點進行預警提醒,同時為制定作業規范、提供數據支持,從而采取預防措施,避免事故重復。
2.3關鍵技術研究
2.3.1錄音文件數據與LKJ運行記錄的相互關聯
將錄音筆的數據與LKJ運行記錄文件數據的相互關聯,充分考慮機務各個部門的業務需要,充分保證數據的共享和功能互操作,本系統采用統一的基礎平臺,包括操作系統平臺、數據庫平臺和應用平臺。采用統一平臺,可避免不必要的系統間數據的轉換、功能的接口、以及系統升級擴展時大量的維護工作量,保證系統的一致性和穩定性。
2.3.2錄音文件的降噪處理
由于機車駕駛室內聲源環境復雜,錄音筆在采集音頻信息中往往會包含各種噪聲信息,干擾后續的系統分析工作,影響分析結果。本系統采用一種快速降噪方式,根據公式(1),采用時遇到頻域的變換方式,估算出噪聲的頻域與能量特征。然后根據公式(2)的條件,對音頻文件中的每一幀信號進行分析,去除其中的噪聲部分,保留主要信息。
上式中,N為音頻文件的總幀數,Xi(k)為音頻文件中第i幀信號,D(k)為噪聲估計值,α為過減因子,β為補償因子,降噪效果如圖(1)所示。
2.3.3機車乘務員作業過程中關鍵項點呼喚應答的自動分析
人在發音時,根據聲帶是否震動可以將語音信號分為清音跟濁音兩種。濁音又稱有聲語言,攜帶者語言中大部分的能量,濁音在時域上呈現出明顯的周期性;而清音類似于白噪聲,沒有明顯的周期性。發濁音時,氣流通過聲門使聲帶產生張弛震蕩式振動,產生準周期的激勵脈沖串。這種聲帶振動的頻率稱為基音頻率,相應的周期就成為基音周期。基音周期作為語音信號處理中描述激勵源的重要參數之一,在語音合成、語音壓縮編碼,語音識別和說話人確認等領域都有著廣泛的應用。endprint
首先定位LKJ運行記錄文件中的關鍵項點的時間。同時與錄音文件中該關鍵項點時間關聯。以基音周期為主要特征,結合時域特征中能量、過零率、熵、等參數和頻域特征中的頻譜能量、頻譜幅度、共振峰等參數以及它們的衍生參數,來判斷音頻信號流中的語音和非語音信號。同時與關鍵項點呼喚應答時間的相關參數進行對比,實現機車乘務員關鍵項點呼喚應答的自動分析。
2.3.4機車錄音筆和LKJ監控裝置的時間同步
如圖2所示,首先從接收機車錄音筆輸入的語音信號中采集LKJ監控裝置發出的語音提示信號;然后對輸入的語音信號和語音提示信號進行端點檢測,其目的是要在一段輸入的音頻信號中將語音信號同其他非語音信號分類開來。語音信號在長時間內表現為一個非平穩過程,具有較強的時變性,但在短時內具有平穩性。采用短時自相關函數,語音信號的xi(N)的短時自相關函數Rw(k)可由式(3)定義。
由圖3所示。帶噪語音的短時自相關系數具有明顯的周期性,每個峰值點較為明顯。而噪聲信號的自相關函數不具備明顯的周期性,且除了在零點處出現的最大值為1的峰值外,其余峰值均不明顯。利用自相關系數特征,可以較好的區別每一幀語音信號是否包含語音信息。端點檢測結果如圖4所示,語音時長4minl5s。
選取目前工業界主流應用的梅爾系數特征(MFCC)如圖5,即計算信號的能量普并使用一組梅爾三角帶通濾波器進行帶通濾波后所得的特征參數,結合其他輔助特征如基音周期,共振峰估計等提取語音提示信號的特征。然后使用機器學習算法進行訓練,級聯多個分類器得到一組分類器模型。
利用一個滑動時間窗口(如圖6),計算窗口內輸入語音信號的特征與訓練模型進行匹配和識別,識別出輸入語音信號中的語音提示信號及該語音提示信號在錄音記錄中的時刻;最后將檢測到的錄音記錄中的語音提示信號所在時刻與LKJ運行記錄文件中該語音提示信號所在的時刻進行同步,從而實現機車錄音筆和LKJ的時間同步。
5結束語
隨著我國鐵路規模的不斷擴大,機車數量的不斷增加,各類日常機車信息管理工作的要求與難度也與日俱增。對機車音頻文件自動分析系統的研究,可提高日常工作效率,減少人力成本,便于管理。借助鐵路大數據平臺的不斷完善,對該系統的深入研究將提升機務安全管理智能化水平,在實際工作中具有重要的實用價值。
參考文獻
[1]陳澤偉,曾慶寧,謝先明,龍超.基于自相關函數的語音端點檢測方法[J/0L].計算機工程與應用,2017(03):13.
[2]曹正鳳.隨機森林算法優化研究[D].首都經濟貿易大學,2014.endprint