摘 要:在AMR的基礎上介紹了一種用來提高系統(tǒng)容量的源自適應(SA-AMR)算法。簡要闡述了算法編解碼原理,分析了在無線通信系統(tǒng)中引入SA-AMR技術的優(yōu)點,并與AMR進行性能比較,測試結果表明:SA-AMR編碼速率和模式可變,能夠提高語音質量和發(fā)射穩(wěn)健性,有效增大系統(tǒng)容量,性能優(yōu)于AMR。
關鍵詞:自適應多速率;源自適應多速率;語音活動性檢測;GSM系統(tǒng)容量;載干比
PerformanceAnalysisandResearchofSA-AMRAlgorithm
LV Feng,CHENG Min
(School of Information Engineering,Wuhan University of Technology,Wuhan,430070,China)
Abstract:Based on existing AMR codecs,a new technique named Source-Adaptive Adaptive Multi-Rate(SA-AMR) is introduced to improve system capacity in this paper.It briefly describes the SA-AMR speech coding and decoding principle and analyses the improvement of using this technique.And performance analysis comparison is described between SA-AMR and AMR.Finally,the result is presented that SA-AMR codec,with variable code rate and mode,seems to have better overall performance than the AMR codec and can be used to improve speech quality and transmission robustness.
Keywords:adaptive multi-rate;SA-AMR;voice activity detection;GSM system capacity;CIR
1 引 言
GSM技術是世界上最為廣泛使用的移動通信技術,目前已經有超過200個國家使用該技術。GSM占據了78%的無線通信市場,并在即將到來的很長一段時間內持續(xù)保持其優(yōu)勢,在移動通信市場上起到不可忽視的作用。
在當前應用廣泛、前景廣闊的GSM移動通信系統(tǒng)中,采用變速率語音編解碼算法對系統(tǒng)的容量和通話質量有非常大的影響,不僅能滿足語音通信業(yè)務快速增長的要求,而且能為新的數(shù)據服務業(yè)務的發(fā)展提供空間。GSM技術中的自適應多速率(Adaptive Multi Rate,AMR)語音編解碼技術能提高頻譜效率,使系統(tǒng)容量增加一倍,從而使得GSM在語音業(yè)務上可與CDMA2000相競爭。
基于AMR技術,介紹了一種能靈活控制GSM系統(tǒng)容量,使通話質量和系統(tǒng)容量達到某種程度的均衡的SA-AMR技術。通過使用該技術,不僅能夠提高通話質量,而且能有效擴大系統(tǒng)容量。SA-AMR技術與CDMA2000標準中的可選模式語音編解碼(Selectable Mode Vocoders,SMV)技術相比,可以獲得更好的性能。
2 SA-AMR語音編解碼技術
2.1 SA-AMR的提出
目前,AMR語音編解碼已經成為GSM和WCDMA系統(tǒng)中的語音壓縮標準。它支持8種不同的編解碼模式,編碼速率從4.75~12.2 kb/s。AMR編解碼器能夠根據信道質量動態(tài)切換編碼速率,從而提高資源利用率。當信道質量差時,采用低的編碼速率,這樣信道編碼中的冗余比特就會增加,從而對信息更好的保護;當信道質量好時,可以采用高的編碼速率來提高語音的質量。從整個系統(tǒng)而言,通過采用AMR技術,話音質量和系統(tǒng)容量都能獲得提高。
AMR算法基于載干比(Carrier-to-Interference Ratio,CIR),根據接收端所測得的CIR,選擇當前信道干擾情況下最適合的編碼模式。但從擴大系統(tǒng)容量方面而言,不需要對信號中的所有語音幀以最大編碼速率進行編碼來獲得高的語音質量,可根據語音源特性,對某些幀采用較低的編碼速率,同時不會或只在很小程度上降低語音質量,這種方法稱為源自適應語音編解碼技術(Source Adaptive AMR,SA-MR)。
隨著話音和數(shù)據通信業(yè)務的快速增長,GSM容量的增長受到干擾限制。SA-ARM算法可根據自身的特點解決這一問題,例如,通過使用SA-AMR算法,在幀刪除率(Frame Erasure Rate,F(xiàn)ER)較低情況下,語音質量也能夠保持在一定程度上,增強了系統(tǒng)的抗干擾性,同時也可以在維持給定的FER均值時增加系統(tǒng)負載(FER也是計算無線通信網絡容量的主要標準之一)。因此,通過使語音傳輸更能抗干擾,SA-AMR可增加GSM網絡系統(tǒng)容量。
2.2 SA-AMR原理
當前GSM標準中,不連續(xù)發(fā)送(Discontinuous Transmission,DTX)也代表一種源自適應算法。兩人在交談時,總是一方講,一方聽,如果兩人同時講就會造成混亂。當GSM話音編解碼器檢測到話音間隙后,在間隙期間不發(fā)送,這就是DTX。為了實現(xiàn)DTX,還要在發(fā)射端使用語音活動性檢測(Voice Activity Detector,VAD)來確定使用者是否在通話。通話期間,根據AMR算法所確定的編碼模式對語音信號進行編碼;通話停頓期間,則對使用者的背景噪聲進行編碼。
SA-AMR算法在AMR的基礎上更進一步,語音源可根據當前語音幀結構的信息內容選擇適用的編碼模式,從而避免對所有的幀結構使用同一速率進行編碼。例如,某些含信息量較低的語音序列可以選用較低的編碼速率,同時不會降低語音質量。通過使用更精確的語音檢測技術,SA-AMR算法速率判決更符合語音幀特性,從而進一步降低編碼速率,同時提高語音質量。SA-AMR算法框架圖如圖1所示。

由圖1可知,SA-AMR編解碼模式的選擇主要取決于以下兩方面:
(1) VAD所提供的信號。VAD將語音信號劃分成幾個子帶,計算每個子帶的能量等級并估測背景噪聲。SA-AMR算法通過對輸入的語音信號進行子帶能量等級規(guī)范化、幀結構分析、長期能量預測以及低能量閾值轉換等過程,根據對當前語音幀所包含的信息能量進行分析,為每個語音幀選擇所需編解碼模式。
(2) 目標編碼率。它是SA-AMR的輸入參數(shù)之一,通過選擇該參數(shù),就能根據需要調整發(fā)射穩(wěn)健性和語音質量。SA-AMR對每幀內的平均編碼率進行估測,并把它與給定的目標編碼率進行比較和調整,再進行模式選擇,從而將平均編碼率轉換為最適合的編碼速率。
SA-AMR模式的選擇還取決于激活碼元設置,該設置是由碼元操作模式而定的。SA-AMR有4種可選操作模式,分別為12.2,7.40,5.90和4.75 kb/s。其中操作模式為4.75 kb/s時,激活碼元不能轉換為其他設置情況,與無源自適應時情況相同。不同的操作模式對應不同的操作范圍,包括了使用該模式時從最小到最大的編碼速率,表1列出了SA-AMR在不同操作模式時所對應的激活碼元設置和操作范圍。

2.3 SA-AMR的應用
根據GSM協(xié)議要求,在上行鏈路中,移動臺(MS)必須遵循基站收發(fā)信機(BTS)所發(fā)送的編解碼模式命令,因此,SA-ARM只適用于模式無改變的下行鏈路。同時,下行鏈路容量也是制約整個系統(tǒng)容量的重要因素,研究SA-AMR在下行鏈路系統(tǒng)性能情況,同時也代表著整個系統(tǒng)性能。圖2展示了SA-AMR算法在下行鏈路中的應用。
基于對接收端MS的CIR的估測,算法選擇在當前干擾情況下最可能穩(wěn)定發(fā)射的編碼速率,將所選擇的模式在編解碼模式命令中發(fā)送給BTS,BTS的發(fā)射端通過對語音源特性進行分析,選擇一個最適合的編解碼模式。

3 SA-AMR算法性能分析
SA-AMR是在AMR的基礎上提出的,其性能優(yōu)于AMR。下面對采用SA-AMR語音編解碼算法與采用AMR算法的系統(tǒng)進行分析,分別在編碼速率、算法復雜度、語音質量和系統(tǒng)容量這4個方面對兩者進行比較,并給出比較結果。
3.1 編碼速率
AMR支持8種不同的編碼速率,分別是:4.75 kb/s,5.15kb/s,5.9kb/s,6.7kb/s,7.4kb/s,7.95kb/s,10.2kb/s和12.2 kb/s。根據當前信道質量改變編碼速率,信道質量好時,采用較高的編碼速率以提高語音質量;反之則采用較低的編碼速率對信息進行更好的保護,在典型的通話模式下,平均編碼速率約為8.2 kb/s。AMR聲碼器不會自動在8種工作模式間進行切換,只是根據外部命令才進行速率切換。
SA-AMR包括4種操作模式,不同模式對應著不同的操作范圍。先根據當前信道干擾情況在4種可能模式中選擇一種操作模式,確定對應的激活碼元設置。例如,在這4種操作模式中選擇7.40 kb/s,則對應的激活碼元設置為(7.40,5.90,4.75),操作范圍為5.80~7.10 kb/s。平均編碼率根據當前語音幀所包含的信息量多少在操作范圍內自動轉換取值(碼元可以轉變成同一激活碼元設置內的鄰碼元模式),從而確定最適合的編碼速率。相比之下,SA-AMR在提高編碼速率和效率方面更為靈活。
3.2 編解碼復雜度
編解碼復雜度與語音編碼質量、編碼速率三者之間存在著密切的關系,通常可以彼此轉化,采用復雜度高的算法可以在相同的編碼速率下獲得更高的語音編碼質量,或在相同的編碼質量下實現(xiàn)更低的編碼速率。語音編碼的算法復雜度主要由以下幾個部分構成:運算所需的指令周期;數(shù)據存儲量;程序存儲量。
對兩種算法的復雜度進行估算,用加權每秒百萬次操作(wMOPS)來定量。AMR的復雜度為17.85 wMOPS;SA-AMR的復雜度因模式的不同而不同,由于在每種模式下,編碼器在處理信號時還會依據語音特性選擇不同的編碼速率,因此每一種模式的復雜度有較大的差別,取4種模式中復雜度最大值20 wMOPS。由比較可知:從算法復雜度而言,SA-AMR的復雜度比 AMR大,這從SA-AMR的自適應原理中也可看出。正是因為應用了比較復雜的算法,才使得SA-AMR能在較低的編碼速率下實現(xiàn)較好的語音質量,從而提高系統(tǒng)性能。
3.3 語音質量
通過使用GSM系統(tǒng)模擬器進行仿真實驗,以考察SA-AMR和AMR對系統(tǒng)性能的影響,可得到結果圖如圖3所示。圖中橫坐標表示頻率的有效負荷率,即每個頻點所負載的通信業(yè)務量,是對系統(tǒng)負載的測量(只考慮語音業(yè)務,且所有業(yè)務都分配給跳頻頻點)。縱坐標表示在FER保持恒定值時(FER>0%),4個GSM復合幀中錯誤語音信號所占的比率。由結果圖可知,隨著系統(tǒng)負載的增加,SA-AMR的錯誤語音采樣信號少于AMR,故使得語音質量在AMR的基礎上有所提高。

3.4 系統(tǒng)容量
根據語音測試實驗對SA-AMR和AMR在系統(tǒng)容量方面進行比較,可得結果如表2和表3所示。

測試實驗中,在無噪聲情況下,測量語音信號的平均意見分(Mean Opinion Scores,MOS);在有噪聲(SNR 15 dB)的情況下,測量語音信號的失真平均意見分(Degradation Mean Opinion Scores,DMOS)。由表可知,在保持語音質量不變的情況下,SA-AMR算法采用比AMR更低的編碼速率,可以用剩余碼元增加編碼冗余,從而擁有更好的語音幀,同時在幀擦除率取值較低時,語音質量能夠維持在一定程度上,增加了系統(tǒng)的抗干擾性,從而擴大GSM網絡系統(tǒng)容量,使系統(tǒng)性能更優(yōu)。
4 結 語
為滿足GAM無線網絡不斷增長的需要,在AMR的基礎上提出能夠有效擴大系統(tǒng)容量的源自適應語音編解碼(SA-AMR)技術,并在編碼速率、算法復雜度、語音質量和系統(tǒng)容量這四個方面與AMR技術進行比較,由比較結果可知,SA-AMR在各方面的性能優(yōu)于AMR。SA-AMR的優(yōu)點主要在于編碼速率和碼元模式可變,能夠靈活控制系統(tǒng)容量,從而使通話質量和系統(tǒng)容量達到某種程度的均衡,非常符合未來移動通信的高質量、高容量的要求,因此,SA-AMR語音編解碼技術將會在未來的移動通信中發(fā)揮重要的作用。同時,與CDMA2000的變速率語音編解碼SMV技術相比,SA-AMR能夠更靈活地提高編碼效率,有效提高語音質量,但兩者性能的比較還有待進一步研究。
參 考 文 獻
[1]胡偉,蔣鈴鴿.AMR技術在無線通信系統(tǒng)中的應用\\[J\\].通信技術,2003(6):5-6.
[2]郭毅峰,謝鑫.一種在無線網絡中有效保證話音質量的AMR方法\\[J\\].北京電子科技學院學報,2007,15(2):23-26.
[3]Makinen J,Vainio J.Source Signal-based Rate Adaptation for GSM AMR Speech Codec.ITCC 2004.International Conference on,2004,2:308-313.
[4]Makinen J,Ojala P,Toukomaa H.Performance Comparison of Source Controlled GSM,AMR and SMV Vocoders.ISPACS 2004,2004:151-154.