向東旭,劉慶節,吳 丹,付俊強,傅 琳
(1.國網浙江省電力有限公司常山縣供電公司,浙江 常山 324299;2.杭州久益電力科技有限公司,浙江 杭州 311215)
分布式光伏在發電模式上,具有就近發電、靈活性強等特點,可實現發電用電并存,即在就地消納電能后將多余的電能并入電網,提供給更多的用戶使用。因此,電網調度要更重視分布式光伏供電的數據動態化監控和獲取技術。在實際操作中,能夠借助合適的軟件系統,及時獲取相關運行參數,保證分布式光伏穩定可靠運行,有效提高分布式光伏供電協調性。
目前為了方便電網工作人員對分布式光伏進行數據查詢,有研究人員開發了基于第三方平臺的手機端操作軟件[1]。該技術在一定程度上提供了實時查詢數據的便捷,但其查詢方式依托第三方平臺與數據庫的鏈接,查詢速度和準確性不能得到保證,且當需要將數據獲取進行計算時導出方式較為局限。
本文就基于語音技術的分布式光伏交互查詢技術進行研究,將分布式光伏數據有效集合,使用語音技術快速查詢并獲取所需信息,在提高分布式光伏信息查詢便捷性的同時,保證所獲得信息的準確性和完整性。
本研究從為調度人員獲取分布式光伏有效數據的需求出發,以快速便捷查詢目標信息為目的,改變目前分布式光伏數據存在于不同系統中的現狀,從系統中提取分布式光伏完整的設備電氣參數、線路量測數據、拓撲模型等數據,并將數據與圖形模型進行統一,建立用以查詢的完整數據庫。
當調度人員需要獲取分布式光伏數據時,首先通過語音輸入設備將查詢內容以音頻文件的方式錄入系統,再利用語音識別技術將錄入的語音進行文字化識別,基于語言習慣和與系統數據相關性進行轉化,以獲得輸入語音的文字數據。然后根據文字轉化的結果對所需查詢的信息進行分析,并提取關鍵詞轉成計算機語言用于搜索。當查詢內容在數據庫中匹配到相應數據時,會將數據以圖形、列表等形式展示,有助于人員更直觀清晰地分析數據,同時也可將數據下載輸出用以進一步的運行計算分析。若在數據庫中無法匹配到相關數據或輸出數據準確性不夠,也可人工輸入文字進行查詢,以獲得有效準確的數據,流程如圖1所示。

圖1 語音檢索流程圖
語音作為一個模擬信號,經過語音輸入設備采樣后,處理成為計算機可讀取的數字信號,再通過特征提取,將特征向量進行模式匹配,轉化為文本形式。模型匹配環節的聲學模型和語言模型決定了識別結果,中文語句中斷句方式和一詞多義的問題是模型匹配中的巨大挑戰,分詞部分可以用數學算法解決,而具體詞義往往需要根據語句前后關聯來理解,采用監督學習算法可以用于詞義消歧,根據訓練數據獲得一個多義詞在不同語境中與特定詞義的對應關系,對模型進行標注后的數據進行訓練。
在語音識別中,除去人工輸入時自身語言表述對于模型匹配的影響,還考慮語音輸入時整體環境帶來的影響。目前深度神經網絡的聲學建模得到大量研究并在各軟件中得到應用,利用深度神經網絡獲得排除噪音對語音識別的影響。通過對含有噪音的語音添加窗口函數獲取噪聲估值,然后對語音中的短時音頻進行增強,在獲得增強后的語音中將噪音頻譜減去,即可獲得更加純凈的語音頻譜[2]。
針對分布式光伏數據檢索存在不同層面的業務需求,即根據電壓等級檢索不同容量的光伏供電量,根據饋線統計光伏容量和實際供電量,根據變電站或母線統計出光伏的供電量,根據計算要求按時段或類別進行數據統計。但是目前分布式光伏的量測數據分屬于各光伏電站的系統中,因此首要工作是開發接口來獲取數據。
由于分布式光伏數據相較于傳統電網數據更加多樣化,在搜索時通過單一關鍵字容易產生結果偏差,因此在分布式光伏數據語音檢索中,將對輸入語音指令進行多樣拆分,獲取多個關鍵詞并在各個相關聯的字段使用并行關聯查詢[3],最后匯總合并以獲得準確完整的所需數據。
對于查詢所得的數據,根據不同數據類型進行相應展現,輸出方式具有多樣性,對于單一搜索結果的數據可以使用最為直接的語音輸出,具有統計需求的數據以文本或列表方式輸出,便于直觀分析及后續相關計算。
語音查詢技術可以便捷獲取分布式光伏各項數據,節約人員用于運行計算的數據獲取時間。在應用中語音技術還可以根據實際應用場景,不斷訓練更新以適應方言口音、語言用詞習慣等因素對其文字轉換的影響,進一步提高信息查詢的準確性。在分布式光伏數據呈現方面,可以進一步探索應用于電網運行的相關數據自動化計算,更好地幫助電網人員快速直觀地對運行狀態進行分析和決策。