王曉盼,王 梅,王 潔
(河北科技大學信息科學與工程學院,河北石家莊050000)
數字音頻水印技術就是將標志版權所有者信息的標識(如圖像、音頻、文字以及作品的相關信息),在不影響原始音頻載體的前提下嵌入到數字音頻載體上,嵌入之后水印信息和音頻信息結合在一起,通常水印是不可感知的,能夠抵抗各種非正常攻擊的干擾。本文給出了基于DCT域的數字音頻水印算法,采用擴頻技術對水印信號進行預處理,并選用DCT域的中頻系數作為水印嵌入位置,按照水印和音頻1∶8的比例進行水印的嵌入[1],同時實現水印的非盲提取。
為了進一步提高水印圖像的抗干擾能力,利用偽隨機序列(PN碼)對水印圖像進行擴頻調制。PN碼的自相關特性和白噪聲類似,是由0和1組成的編碼序列。
利用擴頻技術的數字音頻水印算法就是在宿主信號中傳送水印信息,宿主信號為音頻,可以把音頻視作寬帶的信道,水印信號是標識版權所有者的信息,視為窄帶信號。數字音頻水印算法利用了擴頻通信的思想,即將水印的頻譜進行擴展,在一個寬帶信道中傳送頻譜擴展的水印信號。
音頻信號是一維的,可以采用一維DCT變換對數字音頻信號進行處理。由于DCT變換除了具有正交變換的性質外,它的變換域還能很好的描述語音信號的相關特性,所以說DCT變換被認為是準最佳變換。
在數字音頻處理中應用一維DCT,對于一維信號f(x),其DCT和IDCT[2]變換為:
一維DCT變換的正交核定義為:

式中,u,x=0,1,2,…,N-1。
對應的離散余弦變換表示為:

式中,u,x=0,1,2,…,N-1。
一維DCT的逆變換IDCT定義為:

式中,u,x=0,1,2,…,N-1。
可見一維DCT的逆變換核與正變換核是相同的。
數字音頻水印(Digital Audio Watermarking)算法就是將標志版權所有者的一些隱秘信息(即水印信息)在不影響原始音頻的前提下,通過一定的方式嵌入到數字音頻載體上。嵌入的水印信息與數字音頻載體緊密結合并隱藏在其中,通常水印是不可感知的且不會影響原始音頻載體的自身使用價值,能夠抵抗各種非正常的攻擊,也不容易被非法檢測和修改重構,即具有較強的魯棒性和安全性。本文采用大小為64×64的二值灰度圖像作為水印信號,原始音頻信號為單聲道、長度為40 s、采樣率為32 k Hz、量化位數為16 bit。
水印嵌入的步驟如下:
(1)對大小為64×64的二值灰度水印圖像進行降維處理,得到一維水印序列;
(2)為了進一步提高抗干擾能力,利用PN碼對降維后的水印序列進行擴頻處理;
(3)對原始數字音頻信號作分段處理,即待嵌入水印音頻信號(Ae)和與水印嵌入無關部分(Ar);
(4)在原始數字音頻信號中嵌入水印圖像:
a.對待嵌入水印音頻信號作離散余弦變換(DCT);
b.在離散余弦變換域內確定數字音頻信號的中頻系數[3,7];
c.修改選定的中頻系數,利用加法策略嵌入水印[4,8],按照水印和音頻為1:8的比例進行水印的嵌入;
d.對嵌入水印序列元素的音頻信號進行離散余弦反變換(IDCT),得到含有水印信息的音頻信號部分;
e.將含有水印信息的音頻信號部分代替原始的音頻信號,得到了含有水印信息的數字音頻信號。
水印提取時需要原始音頻信號,實現水印信息的非盲提取:
(1)對于待提取水印的音頻信號分段為(Te和Tr)和原始音頻信號分段為(Ae和Ar);
(2)在離散余弦變換域內利用基于閾值的方法提取出水印序列[5];
(3)對提取出的水印序列進行解擴頻和解密處理;
(4)將解密后的水印圖像進行升維處理,最終得到提取的水印圖像。
圖1、圖2為數字音頻水印嵌入和提取原理框圖。

圖1 水印圖像的嵌入

圖2 水印圖像的提取
實驗中采用大小為64×64的二值灰度圖像作為水印信號,原始音頻信號為單聲道、長度為40 s、采樣率為32 k Hz、量化位數為16 bit。將水印圖像嵌入到音頻載體離散余弦變換后的中頻系數上,在Matlab2008a上運行,對于提取出的恢復水印圖像,用峰值信噪比(PSNR)和歸一化相關系數(NC)[6]比較以評價文中算法的穩健性。PSNR和NC的表達式分別為:

式中,MAX為圖像灰度級數,通常為255。

式中,w(i,j)為原始水印圖像;w′(i,j)為提取的水印圖像;M1×M2為水印圖像的大小。
原始音頻信號和嵌入水印后的音頻信號以及嵌入和未受攻擊時提取的水印圖像如圖3所示,此時PSNR=18.6417,NC=0.9351。實驗中還對嵌入水印圖像的音頻信號進行常見的攻擊實驗,實驗結果如圖4所示。
通過實驗檢驗水印算法魯棒性,圖4(f)所示為對嵌入水印后的音頻信號進行攻擊后提取出的水印。攻擊實驗對應的PSNR和NC,說明水印的魯棒性,如表1所示。

圖3 原始水印和提取水印以及原始音頻信號和嵌入水印的音頻信號的波形圖

圖4 常見的攻擊實驗

表1 攻擊實驗數據
從表1中可以看出,NC值接近于1,PSNR值較高,而低通濾波、上采樣還有dct壓縮等攻擊實驗的NC值都接近1,說明了文中算法水印的魯棒性好。
綜上所述,在水印嵌入音頻信號后,人耳感知不到明顯的失真,即具有不可感知性;在水印嵌入前先對其進行擴頻加密處理,目的是增強其抗干擾能力;在水印提取時要正確的密鑰才可以把水印順利地提取出來;對于攻擊實驗有較好的魯棒性。
本文給出了一種基于DCT域數字音頻水印算法,采用擴頻技術對水印圖像進行預處理提高其抗干擾能力,選用DCT域的中頻系數作為水印嵌入位置,按照水印和音頻1:8的比例進行水印的嵌入。實驗結果表明該算法有較好的不可感知性和魯棒性;同時對于水印圖像進行擴頻加密處理,提高了水印的安全性。
[1]談華斌.數字音頻水印算法的研究[D].吉林:吉林大學,2004.
[2]姚 磊,王 冰.一種基于DCT中頻的數字水印算法[J].計算機技術與發展,2008,18(1):192-195.
[3]Mauro B,Franco B,Vito C,et al.A DCT-domain system for robust image watermarking[J].Singnal Processing,1998,66(3):357-372.
[4]黃繼武,SHI Y Q,程衛東.DCT域圖像水印:嵌入對策和算法[J].電子學報,2000,28(4):57-60.
[5]李 慧.基于變換域的數字音頻零水印算法研究[D].江西:江西理工大學,2013.
[6]閆麗君,康寶生,岳曉菊.改進的基于DCT的自適應水印算法[J].計算機工程與應用,2011,47(8):197-200.
[7]劉雪梅,蘇廣州.基于擴頻序列嵌入水印的音頻信號[J].重慶郵電學院學報(自然科學版),2006,(1):9.
[8]劉 芳.基于離散小波變換的音頻數字水印研究[D].北京:北京化工大學,2010.