韓大偉 熊欣
摘 要:語音是人類傳遞信息的一種最主要、最有效、最方便的交流形式。語言是人類特有的交流方式,而聲音又是人類比較常用的交流工具,是傳遞信息的主要手段,所以,語音信號是人們感情交流以及思想溝通的主要途徑。目前,人們已經進入到了信息時代,利用一些現代先進的技術方法分析語音信號,加強對語音信號采集與處理的研究,使人們可以更加方便的傳輸、獲取、存儲以及使用相關的語音信號,對于加快社會的發展與進步有著非常重要的現實意義。
關鍵詞:語音信號;采集;處理
對于語音信號的采集與處理一直就沒有斷過研究,不僅僅是因為其具有一定的實用性,還有一個非常重要的原因就是,其始終與信息科學中最前沿的學科有著緊密的聯系,并且能夠共同發展。語音信號的采集與處理是一門涉及范圍比較廣的綜合性學科,其是以語音語言學以及數字信號處理為基礎,并且與計算機技術、信息技術以及通信技術等均有緊密的聯系。所以,加強對語音信號采集與處理方法的分析與研究,有助于促進社會的不斷發展以及科學技術的不斷進步。
1 語音信號具有的特點
通過對大量實際語音信號的分析,我們可以明顯發現語音信號具有兩大特點:一是從時域方面而言,語音信號具備“短時性”特點,也就是說,從總體上而言,語音信號的特點是隨著時間的延續而發生不斷改變的,但是在一段比較短的時間范圍之內,語音信號還是可以保持不變的。通常情況下,在清音段表現出來的特點就是隨機噪聲,在濁音段表現出來的特點就是周期信號。二是從頻域方面而言,語音信號頻率主要集中的范圍就是300-3400赫茲之間。通常情況下,就可以利用這一特點,采用帶通濾波器將這一區間的語音信號頻率提取出來,之后根據8千赫茲的采樣頻率對提取出來的語音信號開展相應的采樣工作,這樣就可以得到相對比較離散的語音信號。
2 語音信號的采集
將語音信號轉變為數字信號,就一定要采集到語音信號,也就是要進行語音信號的采樣與量化,進而得到在幅度以及時間上都是離散的數字信號。采樣可以稱之為抽樣,是語音信號在時間上的離散過程,采樣的時候一定要滿足奈奎斯特定理,才可以對語音信號進行有效的采樣。在語音信號采樣的時候,一定要重視采樣間隔的設定以及相關語音信號的混淆,也就是說,對語音信號的采集首先就要明確采樣間隔。通常情況下,采樣的頻率越高,采樣的點數就會越加密集,所得到的離散信號也就越加接近于原始的語音信號。但是采樣的頻率也不要太高,對于一些固定長度的語音信號,采集到太多的語音數據,可能會給計算機系統帶來許多不必要的分析工作量以及占據過大的存儲空間;如果限定了數據量,而采樣的時間又太少,就會致使一些數據被排斥在外。采樣的頻率太低,采樣點的間隔距離又太遠,就會導致離散信號不足,無法反映原有語音信號的特征,進而無法復原語音信號,導致出現信號混亂的情況。根據相關的采樣定理,可以將采樣的頻率設置為大于語音信號的2倍帶寬,這樣在采樣的過程中就不會出現丟失信息的情況。量化就是對幅度進行離散,也就是將振動幅度用二進制量化的方式予以表現,其量化電平主要是根據級數進行改變的,實際振動的值是一種比較連續的物理量。完成語音信號的采集之后,就可以對其進行相關的處理。
3 語音信號的處理
語音信號處理可以簡單稱之為語音處理,是在數字信號處理以及語音學的基礎之上建立的一門綜合性比較強的學科,對其進行處理的目的就是獲取一些語音參數,進而完成語音的傳輸或者存儲,通過某種計算的處理,以此來實現某種用途的具體要求,比如:辨識說話人、人工合成語音、識別講話內容等。其包含了四大部分,語音編碼、語音識別、語音合成以及說話人識別。語音是由人類發音器官發出來的聲音,并且具有一定的現實意義與社交作用,可以表達一部分特定的含義,這就是語音與自然界其它聲音的根本區別所在。語音與其所表達的現實意義是互相依賴的統一體,從一方面而言,發音器官發出來的聲音一定要帶有一定的現實意義,并且與現實意義緊密的聯系在一起,這樣的聲音表達才可以稱之為語音;從另外一方面而言,現實意義的表達一定要借助聲音的形式,才可以被人們感知以及接受,沒有聲音的表達,就不會有相應現實意義的體現。
4 語音信號采集與處理的方法
4.1 計算機系統中錄音機程序
計算機系統的附件中有一個錄音機程序,其可以驅動聲卡進行語音信號的采集、播放以及處理。對于語音信號的采集可以直接用麥克風錄制人的語音,也可以利用人工輸入數據線或者音頻線將磁帶或者電視中的語音信號采集輸入到計算機當中,這樣就可以根據輸入文件的屬性進行文件格式、位數以及采樣頻率等方面的設置,同時也可以根據實際需要對語音信號進行簡單的處理,比如:加大或者減小音量、添加回音效果、加快或者減慢語音的速度以及聲音反轉等,其中加速或者減速完全可以實現變音的效果,反轉可以實現聲音文件加密的目的。利用錄音機程序采集與處理語音信號的優點就是不需要進行相應的編程就可以實現語音的錄制與播放,并且對錄音材料的編輯與處理也比較方便、靈活,比如:復制、插入、剪切、回音、混響以及反轉等,同時還可以轉換聲音文件的格式,選擇相應的壓縮方式以及采樣頻率等。其缺點就是一次錄制語音的時間不可以多于1分鐘,除此之外,對采集的語音信號處理一定要進行另外的編輯工作或者利用其它相關軟件予以處理。
4.2 PRAAT語音學軟件程序
PRAAT語音軟件程序是由阿姆斯特丹大學大衛·威寧克和保羅·博爾斯馬這兩位語音學教授一起研發出來的,可以對語音進行分析、合成以及轉換。利用PRAAT語音學軟件程序可以直接將語音錄制下來,可以從磁盤上直接讀取聲音文件或者使用算式的方法創建聲音,可以對一段聲音開展頻譜特征分析、音強曲線分析、共振峰曲線分析以及音高曲線分析等工作,同時對語音的參數進行變換與調整,對聲音進行標注。大部分的語音分析均可以在PRAAT語音學軟件程序中完成,并且不需要進行編程,因此,受到許多語音處理人員的喜愛。
4.3 計算機系統中MATLAB軟件程序
MATLAB軟件程序是由美國Math Works公司推出的一種交互式計算機軟件,應用的范圍非常廣泛,主要包括通訊、測量與測試、計算生物學、財務建模、控制系統設計以及信號與圖像的處理等眾多方面。在附加工具箱當中擴展了MATLAB環境,因此,可以在此環境當中,通過不同的編程方式驅動聲卡,以此來達到采集與播放語音信號的目的,其語音信號的分析與處理工具箱可以為分析語音信號提供非常充足的功能函數,進而利用功能函數對語音信號進行相應的分析與處理,不僅非常方便,還非常的快捷。利用MATLAB軟件語言編程程序可以將需要的聲音文件轉換成相應的離散數據文件,之后利用非常強大的矩陣計算能力對轉換的數據進行一定的處理,比如:數字濾波、聲音回放、時域及頻域的分析、呈現各種分析圖以及傅里葉變換等。
總而言之,通過對這三種方法的介紹,我們可以看出,錄音機程序對于語音信號的采集非常方便,但是在處理方面就有一些欠缺,只能進行簡單的操作,不能深入的進行相關的處理;PRAAT語音學軟件程序對于語音信號的采集與處理不需要編程就可以實現,并且也可以通過編程完成復雜語音信號的采集與處理,深受大家的喜愛;MATLAB軟件程序對于語音信號的采集與處理,可以通過控件工具箱以及相應的函數實現,同時對于復雜語音信號的處理就需要通過編程予以實現。
5 結束語
綜上所述,通過對語音信號采集與處理方面的研究,使得我們更加了解語音信號,對于語音信號的一些采集與處理方法也有了一定的認識與了解,以及對語音信號的相關知識與作用也有了一定的掌握,所以,一定要加強對語音信號采集與處理方法的分析與研究,進而推動相關科學技術的發展與進步,提出更多的新處理方法,進一步應用到其它相關的領域。
[參考文獻]
[1]張桂香,高愛國.語音信號采集和處理方法的研究[J].高師理科學刊,2007(02).
[2]項勇,吳謹.語音信號采集和播放的TCL 320 AD 50的實現[J].科學技術與工程,2008(12).
[3]齊子元,謝桂海,劉毅,等.一種實時語音信號采集處理系統的設計與實現[J].計算機工程與應用,2005(09).
[4]齊子元,謝桂海,劉毅,等.基于TMS 320 C 30的實時語音信號采集與處理系統[J].測控技術,2004(11).
[5]蔡蓮紅,黃德智,蔡銳.現代語音技術基礎與應用[J].中國新技術新產品,2003(03).
[6]張明照,劉政波,劉斌.應用MATLAB實現信號的分析和處理[J].哈爾濱學院學報,2006(06).