趙 萍
(上海電力學院計算機與信息工程學院,上海 200090)
基音周期的估計稱為基音周期檢測,基音周期檢測的最終目的是得到與聲音振動頻率吻合較好的基音周期變化軌跡曲線.在語音信號的處理中只有準確捕獲語音信號參數,才能高效地識別語音.而在這些語音信號參數中,基音周期提取的精確性和效率直接影響到合成語音能否真實快速地再現原始語音信號.本文在基音周期檢測一般方法的基礎上,對自相關運算過程加以修改,并給出使用該種方法對兩段語音信號進行基音周期檢測的結果.
語音信號基音周期檢測的一般處理過程[1]如圖1所示.

圖1 基音周期檢測的處理過程
圖1 中各部分的功能及原理主要有:
(1)帶通濾波模塊 語音信號包含非常豐富的諧波分量,基音頻率最低可達80 Hz,最高可達500 Hz,但基音頻率大多數分布在100~200 Hz,為了提高檢測的準確度,算法中引入了一個60~500 Hz的帶通濾波模塊濾除語音幀的高次諧波分量;
(2)取樣模塊 從頻率為8 000 Hz的語音信號中截取Length(樣點數)長的個樣點值,一般取樣點數設計成幀長度的整數倍;
(3)分幀模塊 主要將語音去樣點分割為若干個語音幀,語音信號屬于短時平穩信號,一般認為在10~30 ms內語音特性基本上是不變的,或者變化緩慢,因此可從中截取一段進行頻譜分析,在范例中取一幀信號的長度為30 ms,即每幀為240點;
(4)短時能量分析 對分割好的語音幀信號進行清濁音的判斷,知道濁音變清音的時刻,提取濁音段;
(5)自相關分析 計算濁音段信號的自相關函數,根據自相關函數的周期性計算語音信號的基音周期.
用8 000 Hz的采樣頻率采集到兩個人的聲音,經過濾波、取樣、分幀后,進行短時能量分析.短時能量為:

N——窗長;
h(n)=w(n)2.
算法中采用布萊克曼窗,具體實現代碼如下:

兩個語音信號短時能量分布如圖2所示.濁音有基音周期,而清音的基音周期為零,因而清濁音判斷是基音周期檢測的第一步.語音濁音段的短時平均能量遠遠大于清音段的短時平均能量,因此通過短時能量En的計算可以區分清音段與濁音段,即En(濁)>En(清).

圖2 語音信號短時能量分析
根據圖2中的曲線變化情況,短時能量由高到低的跳變可定出濁音變為清音語音的時刻.濁音段語音信號1為4 901~5 140(一幀240個點),語音信號2為8 001~8 240.
對于兩個長度相同,能量有限的語音信號自相關函數[2]:

自相關函數反映了信號x(n)與其經過一段延遲后的x(n+m)的相似程度.如果序列x(n)具有周期Np,則其自相關函數是準周期函數,周期性變化與x(n)序列相同[3].濁音信號具有準周期性,濁音信號的自相關函數在基音周期的整數倍位置上出現峰值,而清音信號的自相關函數沒有明顯的峰值.對于濁音信號,只要檢測到N的位置,就可以估計語音信號的基音周期值.
由于乘法運算的工作精度和頻率較低,為了提高運算速度,采用1 bit量化的方法將進行相關運算的信號進行簡化[4].這樣,式(2)由兩信號的乘法運算轉化為x(m)的加法運算.信號的1 bit量化公式為:

圖3是采用極性相關算法計算出來的基音頻率.由圖3可知,其結果與直接計算的結果相同.實現方法如下:
x12=y13(4901:5140);%對語音信號1的濁音段截取;


圖3 自相關基音周期檢測結果
自相關函數是準周期函數,各個峰值隨時間的增加而逐漸變小,因而在自相關運算中可以采用兩次計算的方法來進一步減少自相關運算的點數,以達到提高運算速度的目的.具體方法如下:
(1)進行隔點自相關運算,估計出峰值大概位置,如峰值位置為Tmax;
(2)進行精確計算,使自相關運算的點數N≥2Tmax-1,以減少誤差.
圖3中,對聲音1和聲音2若隔點自相關運算時隔4點進行,則其自相關運算的點數為60;若進行精確計算的點數分別為101和61,則兩次共進行相關運算點數分別為161和121,計算的點數分別減少至原來的67%和51%.
此外,在搜索峰值的過程中,由于基音頻率分布在80~500 Hz之間,所以相關運算的峰值在16~100點之間搜索即可.采用以上方法檢測出聲音1的基音頻率為205.128 2 Hz(周期為4.8 ms),聲音2的基音頻率為307.692 3 Hz(周期為3.25 ms).
本文利用信號的自相關運算實現了兩個語音信號的基音周期檢測.在檢測過程中采用極性相關和峰值估計法,一方面可降低相關計算中乘法的計算量,另一方面也降低了進行自相關運算的點數,從而提高了基因周期檢測的效率.這種極性相關和峰值估算的方法還可應用到信號的互相關峰值搜索過程中,使利用互相關運算對流量和速度等進行檢測的系統具有更好的實時性.
[1]付青青,吳愛平.基于Matlab的語音信號自相關基音檢測[J].長江大學學報,2006,3(4):99-101.
[2]萬永革.數字信號處理的MATLAB的實現[M].北京:北京航空航天大學出版社,2007:65-66.
[3]王秀君,和應民,木建一.一種有效的語音基因周期提取算法[J].應用科技,2006,33(1):7-9.
[4]徐秉錚,歐陽景正.信號分析與相關技術[M].北京:科學出版社,1981:94-95.