林磊
(中國南方電網深圳供電局有限公司 客戶服務中心渠道運營部, 廣東 深圳 518000)
智能網絡客服的建設發展,逐步促進了語音識別方法下的智能網絡化客服終端應用,設計智能客服語音識別對提升網絡客服的針對性和介入性方面具有重要意義[1]。研究智能客服語音識別系統,結合計算機信息處理和語音信息處理技術,通過高速語音信號處理芯片,優化設計智能客服語音識別系統終端優化設計,提高智能客服語音識別性能,相關的智能客服語音識別系統設計方法受到人們的極大關注[2]。
針對上述問題,本文提出基于BLSTM網絡的智能客服語音識別系統。構建智能客服語音的多傳感信號采集模型,在時域和頻域空間內進行智能客服語音信號的譜特征提取和波束集成處理,采用分段卷積濾波方法進行智能客服語音信號增強和降噪處理,濾除智能客服語音信號的干擾信號,在BLSTM網絡中進行智能客服語音識別系統的硬件集成設計。仿真實驗驗證了本文方法能夠有效提高智能客服語音識別能力。
為設計基于BLSTM網絡的智能客服語音識別系統,結合優化的語音信息處理算法,在BLSTM(Bidirectional Long-short Term Memory,雙向長短期記憶)網絡模式下,識別智能客服語音,采用智能客服語音信號分析和特征融合方法,建立智能客服語音信號的檢測模型,通過特征匹配和智能客服語音信息編碼[3],檢測智能客服語音,系統總體設計構架如圖1所示。

圖1 系統總體設計構架
在上述系統總體設計構架基礎上,設計系統的硬件,采用PPI_CONTROL作為智能客服語音識別系統的總線接口,采用I/O口進行程序引導加載,并在外部存儲器中實現程序加載控制。利用PCI9054進行語音識別系統的集成DSP控制,采用低功耗的GT834032進行智能客服語音識別的集成語音信息處理和指令加載,系統的硬件集成設計如圖2所示。

圖2 系統硬件設計
1.2.1 信號增強和濾波處理
1.2.2 信號的譜特征提取和波束集成處理

(1)
(2)
其中,1≤j≤J,AFB為各類非線性處理下的濾波函數;C(j)、W(j)分別為智能客服語音識別的閾值函數,結合空間波束集成方法,對客服語音信號進行時頻變換,得到特征變換序列為式(3)、式(4)。
C(J)×W(j)←DFT{c(J)}×DFT{w(j)}
(3)
C(j-1)←SFB(C(j),N(j))×DFT-1{C(0)}
(4)
其中,1≤j≤J,采用BLSTM網絡協議,完成語音識別和信號檢測,得到優化目標函數,分幀處理語音信號,得到語音信號檢測的概率密度函數為式(5)。
(5)
其中,m為幀數;sgn(x)為符號函數,即式(6)
sgn[x]∈(-1,1)

(6)
采用多層小波特征分解,控制智能客服語音識別過程,得到譜特征提取結果En如式(7)。
(7)
輸出信號的波束集成處理門限值如式(8)。
(8)
其中,N為智能客服語音信號的長度;J為非參數化核密度,采用零值對稱變換,實現信號的譜特征提取和波束集成處理,提高智能客服語音識別能力。
通過網絡信道均衡調制方法均衡控制智能客服語音傳輸,結合穩定性測試方法進行智能客服語音識別,原始輸入的智能客服語音特征序列為x=[x(0),…,x(N-1)],其中x(n)為概率密度估計的光滑程度,n≥0,則x的智能客服語音識別系統的離散特征變化(DWT)定義為式(9)。
(9)
其中,k表示非參數化核密度,0≤k≤N-1,設一組觀測樣本x(n)經離散傅里葉變換得到的語音信號的頻域分布用X=DFT{x}來表示,得到智能客服語音識別的有限時間序列如式(10)。
(10)

(11)
其中,j為特征分辨率,且1≤j≤J;α為信號特征指數。利用以上步驟完成智能客服語音識別的特征提取。
采用非參數化的信息融合方法,完成智能客服語音識別和信號濾波,得到濾波函數[7]為式(12)。
(12)

(13)
其中,dj(k)表示智能客服語音傳輸節點的分布距離,結合穩定性測試方法進行智能客服語音識別的穩定特征提取和定位檢測,得到檢測的閾值函數[9]如式(14)。
(14)
式中,λ表示閾值函數參數值。統計語音信號特征優化函數[10]如式(15)。

(15)
根據上述對語音信號的優化函數結果,實現智能客服語音信號特征優化。
為測試本文方法在實現智能客服語音識別中的應用性能,設計仿真實驗。設定語音信號采樣的長度為2 000,信號的檢測門限為0.82,對語音信號識別的迭代次數為200,測量噪聲的信噪比為-12 dB,語音信號分布的時寬為10 s,根據上述參數設定,進行智能客服語音識別,得到智能客服語音識別系統中傳輸的語音信號,如圖3所示。

圖3 語音樣本信號
分析圖3可知,本文方法能準確識別智能客服語音識別系統中傳輸的語音信號,識別效果較好,以圖4的信號為測試對象,進行語音識別定位,對語音信號進行多尺度分解定位,得到識別結果如圖4所示。

圖4 語音識別結果
分析圖4得知,本文方法能夠有效識別不同信噪比區域內智能客服語音,語音信噪比識別定位性能較好,測試智能客服語音識別的精度,得到對比結果如表1所示。

表1 智能客服語音識別精度對比
分析表1得知,在迭代次數相同的情況下,本文方法識別精度在90%以上,在迭代次數為400時,識別精度達到100%;采用文獻[4]、文獻[5]和文獻[6]方法進行語音識別的精度較低,由此可知,采用本文方法進行智能客服語音識別的精度較高,誤差較小。
結合語音識別方法,設計智能網絡化客服終端,為提高遠程網絡服務質量,本文提出基于BLSTM網絡的智能客服語音識別系統。在BLSTM網絡模式下,采用多層小波特征分解,控制智能客服語音識別過程,采用零值對稱變換,增強語音信息,提高智能客服語音識別能力。采用PPI_CONTROL作為智能客服語音識別系統的總線接口,采用I/O口進行程序引導加載,在集成DSP下進行系統的硬件設計和軟件開發。實驗驗證了本文方法具有較高的智能客服語音識別精度,應用性更強。