羅仕樂,郭星東
(韶關學院 數(shù)學與統(tǒng)計學院,廣東韶關512005)
Fourier變換在物理學、數(shù)論、組合數(shù)學、信號處理、概率、統(tǒng)計、密碼學、聲學、光學等領域都有著廣泛的應用[1-4].數(shù)字信號處理是Fourier變換眾多應用中比較重要的一類,運用Fourier變換,可以得到周期性數(shù)字信號的時域和頻域,從而提取信號特征[5].快速Fourier變換(Fast Fourier Transform,簡稱FFT)是20世紀的十大算法之一,F(xiàn)FT運用二分技術改進了Fourier變換在計算機上實現(xiàn)的效率,已成為目前流行的Fourier變換快速算法[6-7].
由于實際應用中的數(shù)字信號往往含有噪聲,運用FFT對數(shù)字信號進行處理的結果會有一定程度的誤差,影響計算結果的有效性.為了盡可能減小誤差的影響,本文結合FFT和聚類分析方法建立信號特征降噪算法,并通過數(shù)值試驗展示算法的有效性.
在后續(xù)討論中,用i表示虛數(shù)單位.
考慮正弦波的疊加情形:

其中:t為時間變量,Ak,hk(k=1,2,…,N)分別表示第k個信號的振幅和頻率,帶有隨機噪聲的函數(shù)ˉf(t)=f(t)+ε其中ε為隨機噪聲.
數(shù)字信號通過Fourier變換,可以轉換到頻域上進行研究.函數(shù)f(t)在N個點{}上的最小二乘離散Fourier變換為:


為了避免受到Fourier變換結果誤差的影響,對Fourier變換結果進行聚類分析[8],期待通過聚類過程能把由隨機噪聲造成的無關頻率過濾,從而留下真實的頻率信息.聚類分析是經(jīng)典的多元統(tǒng)計分析方法,其應用的難點在于聚類數(shù)的確定.計算Fourier系數(shù)的誤差可得:

式(1)表明,F(xiàn)ourier變換所得到的頻域向量的誤差與初始噪聲ε是線性關系.這意味著利用初始隨機噪聲的方差上界來給出聚類數(shù)量的上界,會是一個較好的準則.綜合以上討論,給出信號特征降噪算法如下:
第1步:對信號函數(shù)進行FFT,得到頻域分布向量和振幅向量;
第2步:對頻域分布向量進行聚類,根據(jù)聚類結果去除噪聲,得到更新的頻域分布向量;
第3步:利用振幅和頻域分布向量還原得到原數(shù)字信號.
注 算法第2步的聚類過程,可采用經(jīng)典的K-Means聚類方法,根據(jù)式(1),參數(shù)K的選擇可結合輸入信號的噪聲方差水平來設定,可見數(shù)值試驗的細節(jié).
通過MATLAB數(shù)值試驗展示數(shù)字信號降噪算法的有效性.
考慮由兩個正弦波疊加得到的如下數(shù)字信號:

給上述信號加上隨機噪聲:

其中ε表示服從一維標準正態(tài)分布的隨機變量,κ是給定的參數(shù),用于控制誤差的變化幅度.從t=0開始,以0.001為間隔,取50個時間節(jié)點用于FFT的計算.
在后續(xù)試驗中,取A1=0.8,A2=1,h1=80,h2=120,ε使用MATLAB的randn函數(shù)隨機生成,借助MATLAB的聚類函數(shù)clusterdata,聚類算法鏈接生成的層次樹中保持的最大簇數(shù)設置為3,分別令κ=1,2,3,4,5,6,上節(jié)算法的運行結果分別如圖1、圖2和表1所示.

圖1 信號恢復對比圖(κ=1,2,3)

圖2 信號恢復對比圖(κ=4,5,6)

表1 不同情形下聚類降噪后所得頻率結果
由計算結果可見,當κ=1,2,3,4時,經(jīng)過聚類降噪處理后,F(xiàn)FT結果信號恢復的效果較好,振幅和頻率都跟真實值吻合;而當κ=5,6時,信號恢復效果較差,第二個正弦波的頻率估計結果都出現(xiàn)了誤差.
由于該信號的噪聲方差為κ2,當κ=5,6時,該信號的方差已遠遠超過了該信號函數(shù)的最大理論振幅值2≈2.56,因此,頻率的估計出現(xiàn)誤差是正常的.注意到,在κ=3,4時,本文的算法仍然得到了很好的信號還原效果,這表明了引入聚類分析所建立算法的有效性.
本文利用FFT和聚類分析構建了信號特征降噪算法,結合高效的FFT方法,聚類方法的引入可以過濾原數(shù)字信號的噪聲,數(shù)值試驗展示了新算法的有效性.本文的分析方法和數(shù)值試驗思路可以推廣到其他類型的數(shù)字信號應用中.