付連宇
(1.天津工業大學,天津 300000;2.國網天津市電力公司信息通信公司,天津 300000)
由于智能電網不斷發展,電力通信網絡規模迅速變大,因此產生了很多通信線纜配線標簽,電力通信線纜作為數據信息交互的重要介質,對其配線標簽進行管理至關重要,對通信資源的合理調度和管理具有重要影響。一般通過配線標簽對人工進行排查和校驗,因為網絡資源種類多、線纜數量多且基站分布廣,所以采用傳統的識別方法進行標簽排查和校驗會浪費較多的人工和時間成本。將人工智能技術和標簽識別相結合,可以有效提高標簽文本的識別精度和識別效率,并降低人工成本。為了保證充分利用電力通信數據,提高通信數據信息的質量,實現通信資源管理的信息化和精益化,需要對電力通信線纜配線標識進行智能化識別技術研究,保障電力通信網運行安全[1]。
基于對神經網絡技術的深入研究,對數據信息的深度學習可以采用神經元模擬的方法來實現,各個隱含層間的密切關系為多層感知學習網絡構建提供了條件,為了提取數據特征,采用基于神經網絡的方法對數據維度進行調整,從而刷新數據表達方式。
LSTM采用連接眾多小模塊的方式來構建時間遞歸神經網絡,通過數據訓練提取時間序列中的延遲事件,并依托神經網絡存儲相關事件。LSTM通過引入遺忘門和輸入門為子模塊的長期記憶功能提供保障,輸入門可以對RNN輸入補充新記憶,遺忘門可以遺忘沒有價值的信息,通過遺忘門和輸入門的協作更新和剔除數據信息,從而實現遺忘和保留的功能。
對LSTM進行專業設計,可以使輸入門、輸出門、遺忘門和更新門相互交互,LSTM對上述門結構進行組合,形成1個稱為cell的處理器。
當輸入門有外界數據進入時,cell根據一定的規則對進入cell的數據信息進行判定,并對其進行保留或者遺忘,即1個輸入對應2個輸出,通過多次計算可以有效避免發生神經網絡自有的長序依賴現象。LSTM的適應性較強并且具有較高的靈活性,LSTM依托模型中各個cell間的結構實現了長時間記憶,可以保證數據信息和誤差信號的無衰減傳遞,數據經過長時間訓練后仍然可以通過LSTM進行保留,同時可以實現對當前狀態進行更改的功能[2]。
LSTM單元結構如圖1所示,當數據信息特征差異較大時,LSTM單元在多次計算后可以明顯改善特征值,具有較好的效果。

圖1 LSTM單元結構
通過上述介紹可知,LSTM能適應各種數據結構,具有很高的靈活性,為了開發一種與LSTM單元結構匹配的訓練算法,引入反向傳播算法(Back Propagation Through Time,BPTT),當該算法的回傳特性應用于數據訓練過程時,可以為數據信息的完整傳遞提供重要保證。當誤差數據在cell間傳遞時,當前cell會保存其數據信息,并朝更前的時間狀態反向傳播數據[3]。
當輸入/輸出門以及cell輸入有誤差數據時,繼續以反向傳播的方式進行數據傳遞,為了達到理想的數據訓練目的,還需要對當前cell的各模塊的權值進行修正。
標簽在通信線纜的端子處粘貼,容易受軟體線纜的影響而出現扭曲和層疊現象,同時受環境因素、標簽文本方向不同和文本變形等干擾因素的影響,現有的標簽識別技術性能發揮受到限制,因此需要開發一種基于深度學習的智能識別技術。
基于LSTM實現電力通信線纜配線標簽識別需要對其識別模型進行構建,主要包括文本檢測和文本識別。首先,對標簽矩形區域的文本信息進行提取,從而實現定位任意區域文本信息的功能。其次,對任意區域的文本信息進行識別,從而實現獲取文本信息的功能。最后,對文本信息進行校準,以獲取準確的標簽信息。
采用YOLO v5版對文本進行預檢測,包括文本框選取和坐標點選取。通過文本框選取識別標簽信息所在區域,并對該區域的圖像進行剪切,文本框包括除了文本外的其他變形的圖像信息。坐標點選取可以定位文本框區域的圖像坐標。
通過獲取圖像的左上、左下、右上和右下4個點坐標來確定圖像所在矩形區域的位置,并對其長度、寬度和高度進行測量,從而構建新圖像的4個坐標點,將其視為所要識別的圖像矩形區域坐標。通過變換矩陣將源圖像所在區域透視化處理為目標圖像所在的矩形區域,從而生成校準后的圖像。
數據預處理是進行文本檢測的關鍵步驟,采集文本信息對正確識別標簽具有重大影響。該文采用近鄰補全算法對缺失的數據和質量差的數據進行修正。序列數據具有相鄰數據相似的特點,如果序列中的一段數據丟失,該段數據的前后具有連續性,定義一個中間變量,并提取相鄰的k個數據信息,對其求平均值并用該值替換丟失的數據[4]。
為了獲取缺失數據在數據序列中的距離,采用歐式距離法判斷數據遠近,如公式(1)所示。
式中:Xi為第i個樣本點前m維數據,Xi={xi1,xi2,xi3,...,xim};Xj為第j個樣本點前m維數據,Xj={xj1,xj2,xj3,...,xjm};xjn為第j個樣本點的第n維屬性;xin為第i個樣本點的第n維屬性。
通過上述計算完成數據遠近判斷后,需要對數據序列進行為歸一化處理,從而使數據在[0,1]變化,如公式(2)所示。
式中:yi為經過歸一化處理后的輸出值;xi為輸入值;max(x)為數組的最大值;min(x)為數組的最小值。
完成LSTM單元的輸入數據預處理后,需要對輸入量進行挑選,合理選擇數據及標簽是搭建線纜標簽識別模型的重要步驟,通過選取輸入量來實現重復訓練神經網絡的功能。影響線纜標簽識別的因素有很多,對傳統的物理識別方法來說,其輸入量通常選擇眾多因素中最關鍵的一個,采用基于深度學習的方法識別線纜標簽,不需要對大量的數據進行篩選,減少了工作量。LSTM網絡在數據進行迭代計算的過程中會遺忘權重影響小的特征值。
采用PSEnet模型定位任意形狀文本框并提取圖像特征,通過分割特征圖得到多個預測區域,采用擴展算法對較大區域的像素進行擴展,從而實現文本檢測的功能[5]。
如果線纜標簽所處的環境相對復雜,那么對其進行檢測時同一個文本行會被分成多個區域,存在多次檢測現象,為了解決上述問題,需要對這些區域進行合并,避免發生過分割現象。
對上述若干個小區域進行合并需要滿足以下2個條件:1) 要保證所合并的文本區域行高接近。2) 要保證所合并的文本區域距離相近。
文本區域的行高是否接近可以通過公式(3)進行度量。
式中:D(M)為M元素的方差;q為文本行的區域個數;Mi為待合并的一個小區域的上、下邊緣線的中位數;Mj為待合并的另一個小區域的上下邊緣線的中位數。
其中,Mi上、下邊緣線中位數如公式(4)所示。
式中:Tyj、Byj分別為小區域的上邊緣和下邊緣線的Y坐標。
文本區域的距離是否接近可以通過公式(5)進行度量。
式中:ωw為文本區域一個字的寬度;T1為某區域上邊緣的坐標;T'100為該區域上邊緣的右坐標;B1為某區域下邊緣的左坐標;B'100為該區域下邊緣的坐標。
根據上述條件對多個小區域進行合并,通過線性插值的方法對出現斷層的區域進行補齊修復,對交叉的區域來說,采用MeanShift方法對該區域進行融合處理。在合并文本行多個小區域后,根據薄板樣條插值原理(Thin Plate Spline,TPS)和變換矩陣對圖像進行矯正,從而通過提高像素值實現對文本行進行水平矯正的功能。
LSTM模型可以對字符序列進行推理并對其特征進行提取,該文通過密集神經網絡對預測的文本框區域的圖像特征進行提取,通過Seq2Seq提取相鄰像素間的特征,并在Attention中引入額外權重信息,從而建立文本識別模型[6]。
LSTM通過反向傳播算法對循環神經網絡進行訓練,為了提高文本識別的精度,同時兼顧LSTM模型的復雜度,對模型的相關參數進行優化配置,主要參數包括單神經元的偏置和多神經元間的連接權重,利用梯度下降算法對其進行調整,如公式(6)所示。
式中:C為代價;a為神經元輸出值;y為實際值;ω為神經元間連接權重;b為神經元偏置;x為序列數據樣本;z為神經元輸入;σ為激活函數[7]。
為了保證識別標簽信息的正確性,通過糾錯模型對文本進行糾錯,包括傳統的糾錯模型和深度學習糾錯模型。其中,常見的低級別錯誤通過傳統模型進行糾正,而復雜的高級別錯誤通過深度學習模型進行糾正。文本糾錯模型如圖2所示。

圖2 文本糾錯模型
糾錯模型主要由N-gram模型、Seq2Seq_Attention模型和Transformer模型構成,N-gram模型主要是對常見的低級別錯誤進行糾正,模型表達式如公式(7)所示。
式中:l為文本總詞數;n為參考的詞數;w為各個詞;P(w)為詞概率。
由圖2可知,文本糾錯模型中的Seq2Seq_Attention模型是基于Seq2Seq模型實現Attention功能的,模型收斂效果好,并且更適用于對長文本進行糾錯;Transformer模型采用Attention結構,與LSTM結構相比,它可以更好地提取文本信息特征。分別通過Seq2Seq_Attention模型和Transformer模型對文本信息進行糾正并各自生成備選句子,再通過N-gram模型對上述備選句子的疑難度進行分析,最終的文本糾正結果以疑難度最低的備選句子為準。
為了驗證該文提出的配線標簽識別算法的可行性,以某變電站的現場文本數據為支撐,對其進行建模并識別標簽。首先,采集數據集中的圖像樣本,包括文字方向不一致、變形扭曲以及光照不均等文本。其次,根據數據集對所建標簽識別模型進行訓練,結合現場實際情況,提取60個歷史數據作為1個批處理進行預測,并對其輸入層維度進行確定,該文輸出層采用單維度,LSTM識別模型的輸出為單通道,結合統計方法并通過深度學習算法建立電力通信線纜配線標簽識別模型,配線標簽識別模型的計算流程如圖3所示。

圖3 標簽識別模型計算流程圖
挑選1 000個數據序列的圖像樣本,經分析發現,樣本中數據信息變化較大,因此需要采用Adam優化器對標簽識別模型進行優化處理,以保證識別精度。首先,對采集的樣本數據進行清洗。其次,按照6∶4的比例進行拆分,將歸一化處理后的圖像數值作為LSTM的輸入,模型學習率設為0.001,時序隱藏元個數設為59,隱藏層數設為3,批尺寸設為30?;诮⒌淖R別模型對電力通信線纜配線標簽進行識別,通過實際文本信息與識別結果的對比驗證了該文提出的通信電纜配線標簽識別方法的可行性和準確性[8]。
配線標簽的準確識別可以充分利用電力通信數據信息,實現精益化管理通信資源的目標。該文基于深度學習對電力通信線纜配線標簽識別方法進行研究,詳細介紹了深度學習網絡模型,分析了影響標簽識別結果的各種因素。為了滿足文本檢測和文本識別的需求,該文基于LSTM算法對標簽識別模型進行建模并驗證了其功能,該識別技術為標簽的自動化和智能化識別提供了數據支撐,有利于提高電力通信的運行管理效率,該技術還可以推廣應用到物流包裹等領域,具有一定的通用性。