金豪圣
(國網浙江省電力有限公司信息通信分公司,浙江杭州 310000)
人們對于人工智能已經進行了數十年的研究,在人工智能領域,智能機器人是重要的研究課題之一。智能機器人研發主要包括語音識別、圖像識別、語言處理等內容,隨著語音搜索的不斷普及,語音搜索的重要性也越來越高,因此相關學者針對語音信號特征參數提取這一問題進行了深入研究[1-3]。
對于智能機器人的語音信號特征參數提取的方法,文獻[4]采用融合遞歸求逆濾波識別技術,解決復雜場景識別辦法,通過對全場景的準確識別確定語音濾波效果,但是需要頻繁使用濾波器。文獻[5]采用廣義交叉閾值同步壓縮小波方法,估計降噪的閾值水平。通過基于峭度測量的預處理和基于自適應硬閾值的后處理,能夠精確地提取超聲信號特征,但該方法的提取時間較長。
為了解決上述三種方式的缺陷,文中提出了基于VMD 的智能機器人語音信號特征參數提取方法。
為了提取智能機器人語音信號的特征參數,文中提出了智能機器人語音信號特征參數數學模型[6-7]。由于智能機器人大多具有統一性,因此智能機器人的語音信號的脈沖模型G(z)表示如式(1)所示:
其中,z表示分析的數字信號;? 表示脈沖系數。
智能機器人語音信號中的激勵信號在實時性系統中進行數據傳輸,其中的傳遞函數通常為極點模型,因此,如果智能機器人的語音信號含帶噪音,便會用AR-MA 模型進行表述,因此實時性系統頻率H(z)的定義如式(2)所示:
其中,A(z)表示濾波器系數,系數的大小由實際運算情況而定。
當智能機器人發出語音信號時,聲波頻率會發生諧振作用,語音信號調制函數計算公式如(3)所示:
其中,V(z)表示得到的語音信號調制函數;B表示信號聲波頻率;C表示諧振函數常量。通過以上公式建立智能機器人語音信號特征參數的數學模型,計算智能機器人語音信號的特征參數[8-9]。
為了確保提取效果,文中在30 Hz 頻率下進行采樣,從而解決外界干擾這一問題。通過VDM 建立分子程序化模型,將采樣數據進行分析[10-12]。在對智能機器人語音信號的采樣中,通常為三個不連續的信號為一組,因為在采樣過程中,會產生不穩定的振幅,導致智能機器人的語音信號變得離散化,因此不能采樣到連續的語音信號,通過離散化的語音信號防止語音信號失真。在對語音信號進行預處理前,文中對智能機器人的語音通道進行采樣和量化。采樣的點數也會隨著采樣頻率的增加而變得密集,當采樣頻率降低時,采樣點數便變得稀疏散亂,離散信號與原始信號混淆在一起,發生混亂,因此文中在30 Hz 的采樣頻率下工作,有效防止語音信號出現混亂重疊現象[13]。
特征參數處理過程如圖1 所示。

圖1 特征參數處理過程
根據圖1 可知,語音信號不具備穩定性,因此在識別過程中,經過三次處理,確保處理信號的準確性。在分析智能機器人語音信號時,不穩定性會帶來很大的困難,文中采用VDM 技術建立一個分子可視化程序,將不穩定的語音信號拆散開來進行分析處理。
當語音信號處在一定的限制范圍內時,智能機器人的語音信號特征參數便不會發生太大的物理量的變化,因此當使用VDM 分子可視化程序將語音信號拆散時,就會給特征提取帶來很大的便利。通過利用平穩隨機的理論對智能機器人的語音信號進行分析,分幀處理語音信號。將在一個時間段的語音信號進行離散化處理,通過使用連續分幀、交叉重疊分幀等方法,對語音信號進行加窗處理,以此得到處理后的數據,進行提取[14]。
在經過VMD 分子可視化程序將語音信號處理完后,去除對于語音信號識別無關的雜質信息,獲得關鍵識別語音信號的重點信息數據。從關鍵信息獲取更多的信號特征參數,對數據進行信息壓縮,由于智能機器人的語音信號會發生動態變化,因此對于語音信號特征參數的提取必須在一小部分語音信號上進行,稱為短時效提取,這一小部分語音信號稱為平穩信號區間[15-16]。基于VMD 的智能機器人語音信號特征參數提取如圖2 所示。

圖2 基于VMD的智能機器人語音信號特征參數提取流程
根據圖2 可知,文中提出的基于VMD 的智能機器人語音信號特征參數的提取方式主要由三步組成,分別為自我相關分析、LPC 分析以及倒譜分析。抽取的語音信號特征參數數據在VDM 分子可視化程序進行處理后,抽取語音信號特征參數樣本進行自我相關分析,利用線性預測倒譜系數對數據確定,是對加窗語音信號頻譜的極點模型的近似模型系數[17-18]。文中采用了舒爾遞推的方式進行求解,在遞推的過程中,所有所求量都小于1,因此非常適用于語音信號特征參數的提取推算。具體公式如下:
根據式(4)設置自我相關方程作一變換,定義變量為Qm;r為歸一化系數常數,i為線性預測倒譜系數。同時根據Qm的性質以及正相關定理證明語音信號特征系數Km與Qm的關系為:
在求出系數后,根據倒譜原理求得倒譜特征系數,倒譜特征系數是一種高效的語音信號度量標準,經過VMD 分子可視化進行提取,得到了智能機器人的語音信號特征參數。通過以上步驟完成對智能機器人語音信號特征參數的提取。
為了驗證文中提出的基于VMD 的智能機器人語音信號特征參數提取方法的實際應用效果,設定如下實驗。
由于在特征參數提取過程中,很容易受到外界的沖擊,因此應用文中提出的基于VMD 的智能機器人語音信號特征參數提取方法對信號進行處理,通過對語音信號進行加幀處理,確保數據提取效果,處理過程如圖3 所示。

圖3 加幀處理
根據圖3 可知,加幀處理出現在第一幀和第二幀中間的位置,加幀處理后,得到的實驗結果如圖4所示。

圖4 加幀處理實驗結果
根據圖4 可知,加幀處理能夠很好地完成數據處理,通過文中提出的方法進行加窗處理,確保通過理想數據窗抵消外界的沖擊響應,從而保證提取效果。
特征參數提取時間實驗結果如表1 所示。

表1 特征參數提取時間實驗結果
根據表1 可知,為了保證實驗的準確性,進行了10 次實驗,并與文獻[3]方法和文獻[4]方法進行實驗對比。對比結果表明,文中設計的提取方法具有很強的提取能力,能夠在短時間內提取出特征參數。對于智能機器人語音信號的提取,必須滿足三個要求:提取的語音信號特征參數數據真實有效,能夠代表智能機器人的語音特征、提取的語音信號特征具有明顯的區分性、語音信號參數之間具有獨立性,計算方便。基于VMD 分子可視化程序所用的智能機器人語音信號特征參數主要有兩種系數:倒譜系數以及線性預測系數。這兩種系數主要為了模仿智能機器人的發聲裝置,不考慮智能機器人的聽覺系統,對于語音信號有較好的識別能力,計算量小、易于實現。
提取準確率實驗結果如圖5 所示。

圖5 提取準確率實驗結果
根據圖5 可知,在最初提取過程中,文中提取方法和文獻[3]方法、文獻[4]方法都存在提取準確率較低的問題,但是隨著提取時間的增加,文中提取方法提取能力顯著增加,在短時間內,文中設計的提取方法就能夠完成數據提取。
綜上所述,文中通過建立智能機器人語音信號數學模型來計算智能機器人語音信號的特征參數,再通過VMD 建立分子可視化程序,對智能機器人語音信號的特征參數進行處理,并結合自我相關模塊、LPC 模塊以及倒譜系數,對智能機器人的語音信號特征參數進行提取,解決了文獻[3]方法和文獻[4]方法中誤差率大、提取速度慢、提取參數不精確等問題。
智能機器人語音信號特征參數的提取一直是智能機器人領域和語音信號領域的重點問題,現有方法都有著各種缺陷,例如誤差率高、提取速度慢、提取的參數不準確等。文中提出的基于VMD 的智能機器人語音信號特征參數提取方法可以有效提高檢測準確率,縮短特征參數提取時間,并為后續對于智能機器人領域以及語音信號領域的研究提供參考。