覃劍永 朱明增 陳極萬 周素君


[摘? ? 要]在社會生產、人們的生活中,電力系統所起到的作用越來越明顯,尤其是隨著能源轉型,電能在社會發展中的作用更為明顯,而支持大部分電能傳輸與能量轉化實現的電網則成為電力系統正常運行不可或缺的重要部分。由于電網承擔著傳輸、調度電能的重要職責,平時電網運行壓力大,容易出現停電事故等。而停電事故發生之后,勢必會對生活與生產產生不利影響,故提高電網管控水平具有十分重要的意義。近年來隨著人工智能等技術的不斷發展,一些先進的智能化技術在電網管理中逐漸得到應用,為電網調度等管控質量提供助力。文章基于人耳聽覺特性,分析在電網運維中語音識別預處理相關技術及應用設計,以進一步助推電網管控智能化發展。
[關鍵詞]語音識別;人耳聽覺特性;預處理;電網管控
[中圖分類號]TN912.34 [文獻標志碼]A [文章編號]2095–6487(2021)09–0–03
[Abstract]In social production, life and other activities, the role of the power system is becoming more and more obvious, especially with the energy transition, the role of electric energy in social development is more obvious, and most of the power transmission and energy conversion are supported The realized grid has become an important part of the normal operation of the power system. As the power grid bears the important responsibility of transmitting and dispatching electric energy, the power grid is under high pressure in normal operation, and it is prone to power outages. After a power outage occurs, it will inevitably have an adverse impact on life and production, so it is of great significance to improve the level of power grid management and control. In recent years, with the continuous development of artificial intelligence and other technologies, some advanced intelligent technologies have gradually been applied in power grid management, providing assistance to the quality of power grid dispatching and other management and control. Based on the characteristics of human hearing, analyze the related technology and application design of speech recognition preprocessing in power grid operation and maintenance to further promote the intelligent development of power grid management and control.
[Keywords]speech recognition; human hearing characteristics; preprocessing; power grid control
電網管控的主要內容涉及電網調度、電網維護等,其中電網調度是電網管控中最為重要的內容,提高電網調度管理智能化水平,對于推動整個電網管控智能化發展具有積極意義。當前語音識別技術在電網調度智能化管控中應用較為廣泛,給電網智能化調度提供保障。電網調度領域同其他領域相比有很高的特殊性,一般電網調度指令交互可靠性要求較高,且存在區域性口音問題,為語音的正確識別增加了難度,因此研究一種可以準確識別語音并進行科學預處理的語音識別語言模型,可有效識別調度員在下達指令時的口誤或者漏步,提升電網智能化管控質量。
1 基于人耳聽覺特性的語音識別與預處理模型的初步構建
為構建科學的語音識別預處理模型,則需要模仿人耳,確保語言識別可以更加貼近真實人耳聽到的內容,確保指令傳達的準確性,避免由于語言識別同人耳出入過大,影響電網調度等相關指令的正確傳達?;谌硕犛X特性構建的語音識別模型主要由以下幾個部分組成。
1.1 仿人耳聲音信號接收、分離、處理
當人耳接收到聲音信息后,會對聲音信號進行預處理,提取其中重要的語音信號,之后通過對提取的語音信號進行端點檢測—加窗—分幀等處理后,提取其中的MFCC參數,并建立相關聲學模型,確保語音識別得以實現。
構建的語音識別與預處理模型仿照人耳結構,將預處理模型分為耳蝸基底膜模型、提取語音信息、腦下丘細胞模型等,不同的模型組成部分在語音識別與預處理中發揮的作用不同,其中耳蝸基底膜模型可以實現將接收到的各類語言信號劃分為不同的通道,之后利用相應的橄欖模型(同側內側、同側外側)對經過分類的語言信號進行提取處理,對信號預處理過程進行管控,確保信號預處理質量。
1.2 耳蝸基底膜模型
仿照人耳設計的耳蝸基底膜模型可以實現對各類語音信息的處理,根據語音信號的不同將語音進行分類,并從中提取重要的語音信號,實現對語音信息的分離處理,為下一步信號處理等提供必要技術支持??紤]到聽覺神經特性,為更為真實地實現語言識別,選擇16個信號通道,對收集到的語言信號進行分離,一般頻率范圍設置在100 Hz~4 kHz之間,實現對雙耳聲音通道(左耳、右耳)語音信號的全面分解,便于通過設計的耳蝸基底膜模型實現信號的科學處理。
1.3 信息提取與識別
(1)信息的提取是語音識別最為重要的環節,此環節語音識別的結果將直接影響下一步的語言信息處理。
①考慮到電網調度領域語言特殊性,采用詞向量等設計,實現對電網調度中專業性比較強的詞匯等進行科學處理,以準確確定語音信號傳達的真正含義,確保語言識別與預處理模型的質量。
②采用Word2vec技術實現對專業語言信號的識別與處理。Word2vec技術可以將離散的語言信號轉變為計算技術可以處理的數值向量,將原本無法進行計算的語言轉化為可以計算的語言向量信息,便于語言之后的處理。Word2vec技術運用中,詞向量的出現需要依賴一定的語料庫。
③由于當前語言模型語料庫并不完備,因此利用循環神經與深度學習相關技術,構建智能化語料庫,為語音信息提取提供相應的語料庫。采用的詞向量生成方法為可以對詞典中任意詞指定固定的定值向量,詞向量是對詞典中的任意指定一個固定長度的實值向量v(W)∈Rm,W的詞向量用v(W)表示,m維的實數向量空間采用Rm表示,之后利用已經編輯好的計算機學習算法對語音進行處理與識別,實現自然語言處理。
(2)在此環節語言識別中,需要構建相應的向量庫,以通過向量庫詞匯的運用實現深度學習,提升系統語音識別能力。采用Word2vec技術,考慮到調度業務語句語境與調度詞匯具體情況,參照下述流程構建詞匯庫。
①語料庫信息收集。電網調度相關信息的全面收集包括事故預案、調度規程、運行方式、歷史調度日志等非結構化數據文檔信息的收集,并構成相應全面的歷史語料庫,該語料庫屬于開放式語料庫,可以持續性存儲豐富內容。
②語料庫信息預處理。對已經構成的語料庫數據進行處理,處理內容包括對歷史語料庫中的數據進行去除停用詞、去除標點符號、中文分詞等處理,形成電網調度領域語言識別與預處理的初始詞典。
③調度詞匯訓練。當初始調度詞典構建完成后,可以通過調度詞匯相關搜索,鎖定相應搜索的詞匯在詞典中的位置,同時進行One-Hot編碼,并結合歷史詞典的實際情況,將形成的語料送入Word2vec模型中進行深度學習,獲得更多詞向量,對當前調度語料庫進行持續性更新,為電網調度相關語音信息的識別與處理提供支持。
④詞向量評估。當詞料庫經過更新之后,需要采用詞向量之間的計算、詞匯之間夾角余弦值來衡量詞匯之間的相似程度等方式對詞匯向量進行評估,確定詞向量的合理性及簡單詞匯之間的邏輯關系。
1.4 語音預處理模型——腦下丘細胞模型
待信息識別結束后,通過語音預處理系統對已經獲取的語音進行處理,確保相關語音指令執行,確保智能化電網語音識別與處理模型可以真正發揮出效用。
語音處理模型與電網調度智能系統相連,通過預處理的語音信息,直接轉變為電網調度系統的操作指令,由電網智能操作系統輸入端口輸入,實現電網調度系統的智能化管控。
在語音預處理上,采用Onsetcell模型,該模型包括兩個狀態,一個狀態為激活狀態,一個狀態為非激活狀態。此模型設計類似于突觸模型的神經元,通過激活與非激活狀態實現信息的處理。
在該模型設計上對雙耳信號輸入無限制,當接收到信號時模型進入激活狀態,反之信號進入非激活狀態,通過激活實現信息的傳遞與處理。Onsetcell模型的具體工作原理如圖1所示。
2 基于電網調度語音識別與交互系統設計
為了進一步提高語音識別技術在電網調度中應用的價值,延伸語音識別系統設計,完善整個電網調度語音識別與交互系統。
在現有語音識別與預處理模型的基礎上,增加交互系統設計,實現相關調度人員通過語音文件錄入、麥克風即時錄入等方式,實現對電網調度的科學控制。
交互系統設計時,主要涉及電網調度語音識別與預處理系統、語音輸入系統。在語音輸入系統上采用計算機相關軟件實現,相關調度工作人員借助語音輸入或者麥克風語音輸入的方式,便可以將語音信息輸入到電網調度語音識別與預處理系統,被輸入的語音信號進入語音識別與處理程序后,感覺語音識別與處理結果進行相應指令操作。
設計的電網調度語音控制系統,除了可以進行單個語音控制外,還可以實現調度后臺指令的實時播報,及時將語音十倍于預處理結果告知電網調度管控人員,便于管控人員可以全面、快速地掌握電網運用具體狀態,實現對電網的全方位管控,提高電網調度質量。
3 基于人耳聽覺特性的語音識別預處理模型測試
從基礎的語料庫中選取左轉、前進、后退、停止、右轉等單詞各125個樣本,作為訓練樣本,訓練樣本的環境設置分別為0 dB、5 dB、10 dB、15 dB、20 dB的噪聲環境下對人耳聽覺特性、語音增強、譜減法等情況進行觀察,利用預處理語音識別與處理模型,對數萬條重復指令進行試驗,試驗結果顯示人耳聽覺特性0 dB、5 dB、10 dB、15 dB、20 dB的噪聲環境下語音識別準確率明顯高出語音增強、譜減法的方式。如表1所示。
在噪聲的環境下,人耳聽覺特性語音識別與處理的語音識別準確性依舊很高,0 ~20 dB下,語音識別準確率在94.23%~97.86%之間,說明此種方式具有很好的語音識別與處理能力,且受噪聲干擾識別率下將較為緩慢,說明此種語音識別方式具有更好的魯棒性。
為了進一步提高該模型電網調度語音識別與處理的效率與質量,對當前模型進行進一步優化,采用高質量語音輸入設備,確保語音接收質量。
4 結束語
綜上所述,基于人耳聽覺特性的語音識別預處理模型設計,可以更為真實模仿人耳結構,形成科學的全面的語音識別與預處理模型,為電網調度的智能化控制提供必要技術支持。且在采用基于人耳聽覺特性的語音識別預處理模型基礎上,可以進一步對調度人員交互系統進行設計,輔助糾正調度員在口述操作票時產生的人為失誤,實現電網智能化調度,促進電網管控效率與質量的提高。
參考文獻
[1] 史燕燕,白靜.融合CFCC和Teager能量算子倒譜參數的語音識別[J].計算機科學,2019,46(5):286-289.
[2] 周琳,趙一良,朱竑諭,等.基于雙耳語音分離和丟失數據技術的魯棒語音識別算法[J].聲學技術,2019,38(5):67-75.
[3] 張延琛.基于人耳聽覺特性瞬態信號的提取方法研究[J].礦山機械,2019,47(7):58-63.