李會超,劉 鵬,劉志紅,儀垂杰
(青島理工大學 機械工程學院,山東 青島 266033)
目前的各種壓縮方法在處理現實問題時會出現不足和缺陷,壓縮感知理論應運而生。由于壓縮感知理論在數據處理領域具有突出優勢,所以一經問世就引起了相關領域的廣泛關注,該理論指出了將模擬信號直接采樣壓縮為數字形式的有效途徑,可以實現信息的直接采樣。從理論上講,冗余在所有的信號中都會存在,因此任何信號都具有可壓縮性,只要能找到合適的稀疏基,就能夠對信號進行有效地壓縮采樣,然后通過優化計算重建出原始信號。壓縮感知理論突破了傳統方法對信號壓縮采樣的限制,利用信號的稀疏性將算法的復雜性問題徹底解決,為信號后期的處理奠定了基礎。在運動聲源的識別過程中,從圖像、語音信號的數據獲取到傳遞,再到數據處理,每個過程都涉及到大量的數據。針對研究中大量數據存在導致處理過程復雜的問題,提出了在聲源識別的數據處理過程中運用壓縮感知理論,并通過實驗證明了通過壓縮感知處理后的數據可以更清晰的實現聲源識別。壓縮感知流程圖,如圖1所示。

圖1 信號壓縮感知流程圖Fig.1 Signal Compressed Sensing Flow Chart
由壓縮感知理論描述可知,如果信號在某個變換域上是可壓縮的,那么原來的信號就可以通過一個觀測矩陣實現從高維信號到低維空間的轉換。然后在求解優化問題的基礎上,將原始信號從少量的稀疏表示中重構出來。信號稀疏定義是:信號x∈Rn×1,對于正交基(Ψi:i=1,2,3…n,Ψi∈Ψ),信號在基上的投影(即變化因子)為 Si=<x,Ψi>,若存在某個正實數 0<p<2,以及正實數 E>0,使≤E,則稱信號在變換域Ψ上是稀疏的;從廣義上講,如果信號s中存在K個非零元素,則稱信號x為K的稀疏信號。
信號x(t)的稀疏性或可壓縮性是應用壓縮感知理論的重要前提,因此,首先要知道信號的稀疏表示。傅里葉變換可以有效地稀疏表示時變信號,離散傅里葉變換(DFT)是傅里葉變換在時域和頻率都呈離散的形式,將信號的時域采樣變換為其DFT頻率采樣。對于 N 點序列{x[n]}0≤n≤N的離散傅里葉變換為:

此,DFT矩陣具有正交性,能稀疏完整地表示時變信號。
壓縮感知過程的本質是將一個信號在測量矩陣的基礎上進行處理,實現由高維空間到低維空間的映射轉換。因為有些情況下信號的恢復程度受限制,為了盡可能精確的從測量值中恢復原始信號,E.Candès和T.Tao提出壓縮感知矩陣必須滿足約束等距性條件(RIP),并給出了相關定義。對于稀疏度為K的稀疏信號α,RIP定義如下:

式中:矩陣Θ=ΦΨ為感知矩陣,δK—K階約束等距常數,如果δK∈[0,1),那么可以判斷出這個感知矩陣可以滿足約束等距性條件。
若一個感知矩陣是已經確定好的,要想運用公式或者數學方法來驗證這個矩陣能不能滿足約束等距性的條件非常困難,為了解決這一問題,Baraniuk在之后提出了約束等距特性的等價條件,也就是壓縮測量矩陣Φ與稀疏表示矩陣Ψ不相關,同樣可以滿足重構的要求。相關的系數定義為:

Φ與Ψ的列向量之間的相關性由相關系數進行了定義,Φ與Ψ之間的相關系數取值范圍為兩者之間的相關系數與原始信號被壓縮測量值所攜帶的信息量有密切關系,相關系數越小則攜帶的信息量就越大,準確重構原始信號的可能性也就越大。
要驗證一個矩陣是不是能作為壓縮測量矩陣可以用約束等距性條件和相關特性檢驗,但是不能由這兩個約束性來指導壓縮測量矩陣的構造。
在傳感矩陣中的大多數的元素來自獨立同分布的隨機變量。而正因為這些元素服從一些預定的分布,所以其產生的隨機矩陣滿足約束等距性的概率也會比較高,所需的測量次數也隨之減少。隨機高斯、伯努利或部分傅里葉矩陣等已經通過實驗證明,均能滿足約束等距性,且所用的測量次數與稀疏度成線性關系。
現將一幀512點語音信號作為實驗樣品,通過相同數據恢復算法,在觀測矩陣和壓縮比不同的情況下比較數據,得到結果,如圖2所示。其中,USE、RSE、RST分別表示隨機高斯觀測矩陣、隨機貝努利觀測矩陣、部分傅里葉矩陣,并作為觀測矩陣,再經過BP(基追蹤算法)進行信號重構,并得到重構以后的重構語音信噪比曲線圖,如圖2所示。

圖2 基于不同觀測矩陣重構語音信信噪比曲線Fig.2 Reconstructed Speech Signal to Noise Ratio Curve Based on Different Observation Matrix
從圖2的曲線比較中可得:當觀測矩陣選擇USE、RSE、RST時,在壓縮比M/N增大的同時,語音的重構信噪比也不斷提高;相比而言,選用RST作為觀測矩陣時重構語音性能較差。考慮到隨機高斯矩陣的優越性,而且是目前最常用并能同時滿足RIP約束性的觀測矩陣,所以在后期的實驗數據處理階段將以隨機高斯矩陣(USE)作為觀測矩陣。
下面以四種算法分別在采樣率為(0.1~0.8)時的峰值信噪比(PSNR)、相對誤差(Relative-error)、匹配度(Mat-rat)以及運行時間(Time)的曲線圖進行直觀比較分析,如圖3、圖4所示。

圖3 峰值信噪比曲線圖Fig.3 Peak Signal to Noise Ratio

圖4 相對誤差曲線圖Fig.4 Relative Error Curve
由圖3可以看出,當采樣率較低時四種算法的峰值信噪比都比較低。隨著采樣率的增大,各種算法的峰值性噪比也逐漸增大,其中以ROMP算法增大的速率最快。采樣率較高時,ROMP算法的PSNR值和其它三種算法相比明顯較高,因此在采樣率較高的情況下選用ROMP算法進行信號重構最為合適。峰值信噪比較低時,這幾種算法都適用。由圖4中曲線可以得出,當采樣率較低時,相對誤差都很接近。而且可以看出以上四種算法的相對誤差在采樣率不斷提高的同時逐漸減小。由此可以得出算法的誤差性能可以通過采樣數目的增加得到改善。從圖中可以明顯看出當采樣率較高時,ROMP算法的相對誤差下降速度最快。匹配度與運行時間曲線圖,如圖5、圖6所示。

圖5 匹配度曲線圖Fig.5 Matching Degree Curve

圖6 運行時間曲線Fig.6 Running Time Curve
從圖5中曲線可以看出,四種算法的匹配度都比較高,但是ROMP算法的匹配度隨著采樣率的上升趨勢更明顯,由此看出同等情況下ROMP算法優于其它三種算法。
從圖6可以看出,SP算法的運行時間太長,而MP、OMP、ROMP三種算法的運行時間變化較小,且三種算法的時間差距不大。
統籌考慮以上所有分析結果,ROMP算法無論在重構質量還是在重構的速度方面都是實現信號重構應該首先考慮的選擇。
分別以500Hz、1kHz、3kHz的聲源進行測試,每個頻率做三組實驗,最后對同頻率的實驗結果以偏移距離、區域面積作為參考因素進行比較、分析。
實驗1通過聲像儀進行聲源識別,針對三個頻率,得到的聲場圖,如圖7所示。

圖7 聲相儀識別下的不同頻率聲場圖Fig.7 The Different Frequency of Sound Field Sound Identification Under Phase Diagram
實驗2讓聲源以相同的速度運動,通過LMS系統獲取實驗數據實現聲源識別,最終得到的識別效果,如圖8所示。

圖8 LMS測試系統識別下的不同頻率聲場圖Fig.8 The Different Frequency of Sound Field Map Recognition Based on LMS Test System
實驗3首先通過LMS系統獲取實驗數據,利用離散余弦變換以采樣率0.2對收集到的原始圖像和語音信號進行稀疏化處理,再以高斯隨機矩陣作為測量矩陣得到原始信號的測量值,然后通過ROMP重構算法得到處理后的信號。最后通過模擬軟件對壓縮重構的信號進行分析,實現到聲源識別,經過處理后得到的效果圖,如圖9所示。
以上數據是不同頻率的聲源在運動過程中隨機選取的一點,并用三種不同的方式對聲源識別研究得到的結果。下面分別以偏移距離、區域面積以及測量聲壓級范圍來判斷聲源識別效果的優劣,其中偏移距離表示的是識別的聲源所在位置與麥克風陣列中心點位置的偏移量,數值越小說明聲源點越接近理想的中心位置。區域面積是對聲源識別性能的判斷,首先可以判斷是否存在虛假聲源,因為本實驗在消聲室進行,可以不考慮虛假聲源。其次在偏移距離一定的情況下,區域面積越大說明對聲場的描述越詳細即識別的效果越好。下面分別對500Hz、1kHz以及3kHz聲源的整個運動過程選取具有一定代表性的點做分析,結果,如圖10、圖11所示。

圖10 不同頻率下的偏移距離圖Fig.10 The Offset Distance Map Under Different Frequency

圖11 不同頻率下的區域面積圖Fig.11 Regional Area Map at Different Frequencies
從以上數據分析得出:基于壓縮感知理論實現的聲源識別相對于其他兩種實驗方法而言,產生的偏移量較大,但是隨著時間的變化,信號的收集趨于穩定,在第8s以后,偏移距離幾乎不再變化,且從數據來看和其它兩種方法幾乎可以達到相同的偏移量。從區域面積的角度分析,面積也是隨著時間在變化,并逐步趨于穩定。
通過對常見的幾種稀疏字典,測量矩陣以及重構算法的分析研究,得出了適用于運動運動聲場的壓縮和重建的最佳理論基礎,即用離散傅里葉變換作為稀疏基矩陣,用高斯隨機矩陣作為測量矩陣,用ROMP算法作為重構算法。通過三種不同的實驗方法針對相同條件下的運動聲源進行識別,實驗結果表明經過稀疏重構以后的數據可以更加清晰的實現運動聲源的識別,尤其是高頻聲源。為將來的高速、變速、多點聲源的識別研究提供指導意義。
[1]Lustig Metal.Compressed sensing MRI[J].IEEE Signal Processing Magazine,2008,25(2):722-732.
[2]E.Candes.Compressive sampling Proceedings of the International Congress of Mathematicians[J].Madrid,Spain,2006,3(2):1434-1452.
[3]David L Donoho.Compressed Sensing[J].IEEE Transactions on Information Theory,2006,52(4):289-306.
[4]D.L.Donoho,Y.Tsaig,I.Drori,J-L.Starck.Sparse solution of under determined linear equations by stage-wise Orthogonal Matching Pursuit[J].IEEE Trans.Inf.Theory,2012,58(2):1094-1121.
[5]E.J.Candes,Y.Eldar,D.Needell,P.Randall.Compressed sensing with coherent andredundant dictionaries[J].Applied and Computational Harmonic Analysis,2011,31(1):59-73.
[6]F.Krahmer,R.Ward.New and improved Johnson-Linden embed-dings via the Restricted Isometrics Property[J].SIAMJ.Math.Anal.,2011,43(3):1269-1281.
[7]石光明,劉丹華,高大化.壓縮感知理論及其研究進展[J].電子學報,2009,37(5):1070-1081.(Shi Guang-ming,Liu Dan-hua,Gao Da-hua.Compressive sensing theory and its research progress[J].Electronic Journal,2009,37(5):1070-1081.)
[8]李樹濤,魏丹.壓縮傳感綜述[J].自動化學報,2009,35(11):1369-1377.(Li Shu-tao,Wei-Dan.Summary of compressive sensing[J].Journal of Automation,2009,35(11):1369-1377.)
[9]劉志紅,儀垂杰.旋轉運動聲輻射的解析方法[J].機械設計與制造,2015,(12):65-68.(Liu Zhi-hong,Yi Chui-Jie.The analytical method of mechanical design and manufacture of[J].Machinery Design&Manufacture,2015(12):65-68.)