國網江蘇省電力有限公司南通供電分公司 仲 偉 邵建新
隨著自動化技術和智能化技術的快速發展和廣泛應用,變電站的數量以及規模日益增多,同時變電站機器人巡檢的任務測點量更是數以萬計。傳統的變電站在導入機器人操作票任務時,需工作人員在上千個測點任務中逐個選擇,這樣不僅要求工作人員擁有很高的操作熟練度且耗時嚴重,很易出現錯導入和誤導入情況,因此研究操作票復核系統很有必要。
在電網系統操作票自動生成方面,大多研究集中在利用電網調控中心提供的電網公共信息模型(CIM),分析CIM 中的設備模型和拓撲連接關系,按照一定的布局、布線算法自動生成一次設備接線圖。文獻[1]研究了基于CIM 數據和可伸縮矢量圖形格式的配電單線圖自動構圖;文獻[2]介紹了節點布局問題的數學模型并應用罰函數法進行求解;文獻[3]采用蟻群算法,實現了電網自動布局。目前大多數研究的重點偏向于電網操作票的自動生成,此類研究的前提是調控中心提供的CIM 包含了應用所需的元件模型和連接關系,針對操作票的多樣性和易變性略顯不足。
目前在變電站操作票識別和任務導入領域的研究少之又少,另外變電站機器人巡檢對操作票的正確性要求尤為嚴格,本文設計了一種新型的變電站操作票復核系統,服務器平臺采用圖像識別技術對高拍儀采集的操作票實時視頻進行文字識別、內容分析和關鍵字提取,并將提取后的文字進行生成巡檢任務列表,并導入機器人巡檢任務中。整個過程工作人員只需將操作票放置高拍儀下,在服務器平臺側點擊圖像識別、生成列表、任務執行即可,避免了操作票誤導入和錯導入的情況,為變電站機器人測點巡檢節約了大量時間。
近年來人工智能識別技術已取得較大進展,尤其是在圖像識別和分析技術上更是明顯。巡檢變電站操作票復核系統由應用層、服務器、物理層組成,其中所有算法流程都是在服務器平臺操作。物理層采集模塊由高拍儀和網線組成,負責實時拍攝操作票視頻,并通過網線將實時視頻上傳到服務器。服務器模塊包括圖像識別與分析、關鍵字提取、生成任務列表、執行任務,主要負責對上傳視頻進行分析和處理,處理后的數據會導入到機器人巡檢任務中,工作人員只需在服務器平臺側點擊執行任務即可控制機器人進行巡檢任務。物理層主要是采集模塊。

圖1 巡檢變電站操作票復核系統框圖
圖像特征包括顏色特征、紋理特征、形狀特征以及局部特征點等。圖像特征提取是圖像分析與圖像識別的前提,是將高維的圖像數據進行簡化表達最有效的方式。2004年Lowe 提出高效的尺度不變特征變換算法(SIFT),利用原始圖像與高斯核的卷積來建立尺度空間,并在高斯差分空間金字塔上提取出尺度不變性的特征點[4]。該算法具有一定的仿射不變性、視角不變性、旋轉不變性和光照不變性,所以在圖像特征提高方面得到了最廣泛的應用。服務器可根據SIFT 和操作票顏色特征,將操作票實時視頻中的文字全部提取出來,并生成操作票文本。
圖像識別與分析算法為關鍵字提取提供操作票文本,其步驟依次為:初始化網絡,為網線傳輸操作票實時視頻提供可用接口;打開實時視頻錄像;判斷視頻縮放尺寸是否等于原始操作票縮放尺寸,若相等則輸出操作票固有特征尺寸;判斷操作票字體顏色特征是否為黑色,若為黑色則輸出操作票模板;操作票模板識別并輸出操作票上的文字;生成操作票文本;判斷文本的字體并更新文本。
無論是對于長文本還是短文本,往往可通過幾個關鍵詞窺探整個文本的主題思想。關鍵詞提取的準確程度直接關系到推薦系統或者搜索系統的最終效果。基于統計特征的關鍵詞抽取算法[5]的思想是利用文檔中詞語的統計信息抽取文檔的關鍵詞。通常將文本經過預處理得到候選詞語的集合,然后采用特征值量化算法的方式從候選集合中得到關鍵詞。詞權重的特征量化主要包括詞性、詞頻、逆向文檔頻率、相對詞頻、詞長等。關鍵字提取流程為:操作票文本(預處理)-候選詞(算法)-候選詞權重計算(抽?。?關鍵字。
特征值量化算法為生成列表提供關鍵字,其提取關鍵字的具體實現為:識別文本;根據詞性、位置、頻率、詞長對文本預處理,并生成候選詞;根據詞權重的特征量化的特點從候選詞集合抽取所需關鍵字;生成關鍵字列表。
LDA 主題模型采用了詞袋模型的方法簡化了問題的復雜性。在LDA 主題模型中,每一篇文檔是一些主題的構成的概率分布,而每一個主題又是很多單詞構成的一個概率分布。同時,無論是主題構成的概率分布還是單詞構成的概率分布也不是一定的,這些分布也服從狄利克雷先驗分布(Dirichlet)。操作票復核系統的關鍵在于巡檢任務列表的生成,任務列表中的關鍵字也服從狄利克雷先驗分布。巡檢任務列表為機器人執行任務提供指令依據,其生成的具體實現為:初始化任務列表;設定狄利克雷分布規則,對關鍵字進行分類和排序等操作;生成新的巡檢任務列表;導入列表指令到機器人巡檢任務中。
根據上述算法生成的巡檢任務指令會導入到機器人巡檢任務中,工作人員只需將要操作票放置于高拍儀下,在服務器平臺側點擊圖像識別與分析、提取關鍵字、生成列表和執行任務即可,巡檢機器人便會按照任務列表上的內容進行巡檢作業。
基于尺度不變特征變換算法、統計特征的關鍵詞抽取算法和LDA 主題模型思想,采用Eclipse、Oracle9i 和Python 數據開發和處理實現了變電站操作票復核系統。下面通過實驗來驗證此系統。
為評估操作票復核系統的性能,采用8臺服務器,安裝QUnit 軟件模擬真實運行環境,同時使用了均方根誤差(RMSE)作為評估指標,其定義如下:

其中fi為算法實際運行次數,為實際成功次數,根據公式可知,計算的RMSE 值越小性能越優。1~8服務器性能評估測試的實測次數、成功次數、均方根誤差為:1000/996/0.065%、2000/1996/0.063%、3000/2994/0.061%、5000/4992/0.059%、8000/7988/0.057%、10000/9988/0.053%、15000/14956/0.052%、20000/19920/0.051%。隨著實測次數的遞增成功次數遞增,同時成功次數所占比也遞增,其均方根誤差也趨向于穩定,性能越優。
一個大型的變電站具有上千個任務測點,在人工導入操作票時經常會遇到難以尋找對應測點、錯導入和誤導入的問題,而操作票復核系統可通過服務器的多種算法對應巡檢測點,在時間和準確性上具有明顯優勢。該系統在某變電站實際運用中的操作票任務數量(個)、人工耗時(秒)、系統耗時(秒)分別為:5/100/32、10/300/36、15/600/39、20/900/41、25/1100/42、30/1500/42、35/1900/45、40/2400/45。隨著操作票任務數量的增加,人工耗時的明顯增加,系統耗時較為穩定。人工耗時與系統耗時的差距更是明顯。
綜上,隨著人工智能與現代生活的關聯愈加密切,人工智能在生活中的應用將會愈加廣泛。導入操作票損耗的時間對變電站來說十分寶貴,損耗的時間越多,變電站巡檢的時間便越少,許多電廠出現意外都是缺乏足夠的巡檢時間而導致的,本文提出了一種變電站操作票復核系統,服務器平臺采用圖像識別技術對高拍儀采集的操作票實時視頻進行文字識別、內容分析和關鍵字提取,服務器將提取后的文字進行生成巡檢任務列表,并導入機器人巡檢任務中。整個過程工作人員只需將操作票放置于高拍儀下,在服務器平臺側點擊圖像識別與任務執行即可,為變電站巡檢機器人測點任務導入節約了大量時間。