許曦月,劉 亮,高 勇
(四川大學(xué),四川 成都 610065)
互聯(lián)網(wǎng)的廣泛普及促進(jìn)了多媒體數(shù)據(jù)的傳輸和分發(fā),使得數(shù)字水印受到了人們的廣泛關(guān)注,并成為數(shù)據(jù)安全領(lǐng)域的研究熱點(diǎn)。將水印嵌入到原始載體對(duì)象(如音頻、視頻和圖像)的過程,被廣泛用于版權(quán)保護(hù)、廣播監(jiān)控和數(shù)據(jù)認(rèn)證等領(lǐng)域。
文獻(xiàn)[1-2]介紹了數(shù)字水印音頻隱藏技術(shù)的背景、發(fā)展現(xiàn)狀及其相關(guān)應(yīng)用。大多數(shù)水印音頻方案使用了時(shí)域[3]或變換域,如傅里葉變換[4]、離散余弦變換和離散小波變換[5]等。Bassia 等人[3]提出了一種通過直接修改音頻樣本幅度來嵌入水印的方案,但嵌入容量較低。Wang 等人[6]提出一種基于DCT 的水印方案,但未討論在不同攻擊(如低通濾波、重采樣和重量化等)下水印的魯棒性。Chen 等人[7]提出了一種對(duì)攻擊具有良好魯棒性的能量比例方案的水印算法,但該算法中載體音頻與含水印音頻的信噪比較低。最近,將SVD 與多種變換域結(jié)合的方案得到了廣泛應(yīng)用[8-11],但現(xiàn)有水印音頻技術(shù)的主要局限是難以在透明性、魯棒性和嵌入容量之間獲得有利的權(quán)衡。
為了克服上述局限性,本文研究了一種基于SVD、EO-LO、DCT-DWT 以及量化的盲水印音頻隱藏方案。該方案主要特點(diǎn)包括:(1)結(jié)合了SVD、EO-LO、DCT-DWT 和量化;(2)水印預(yù)處理采用含有混沌特征的高斯映射[12],以提高方案安全性;(3)水印提取過程是全盲的;(4)在透明性、魯棒性和嵌入容量之間實(shí)現(xiàn)了良好的權(quán)衡。
本文提出的方案中,載體音頻與含水印音頻的信噪比均值為29.858 dB。該方案在抗攻擊方面,誤碼率均值范圍在0%~2.041%,而相關(guān)研究方案中誤碼率范圍為0%~4.720%。此外,該方案的嵌入容量為172.270 b/s。
SVD 是一種數(shù)學(xué)工具,主要用于分析矩陣。在SVD 變換中,給定矩陣H={Hij}N×N被分解為3 個(gè)矩陣,即H=USVT。其中,U和V是N×N正交矩陣,S是具有非負(fù)元素的N×N對(duì)角矩陣。S的對(duì)角線各項(xiàng)稱為H的奇異值,有S=diag(σ1,σ2,…,σN);U的列稱為H的左奇異向量;V的列稱為H的右奇異向量[13]。
水印應(yīng)先進(jìn)行預(yù)處理,以增強(qiáng)魯棒性,提高安全性。本文利用包含混沌特征的高斯映射對(duì)二進(jìn)制水印信息進(jìn)行加密,以提高該算法的安全性。它的定義如下[12]:

式中,y(i)∈(0,1)m和n是實(shí)參數(shù)。
然后,使用式(2)計(jì)算二進(jìn)制序列b(i):

式中,λ是預(yù)定義的閾值。
二進(jìn)制水印信息為d={d(i),i=1,2,…,P×P},最后,d(i)使用b(i)按以下規(guī)則進(jìn)行加密:

式中,⊕是異或運(yùn)算。經(jīng)過這種隨機(jī)混沌加密后,原始水印被轉(zhuǎn)換,使得攻擊者無法通過隨機(jī)搜索找到。在本算法中,y(1)、m和n用作密鑰K。
在提出的算法中,S(n)={s(n),1 ≤n≤L}是具有L個(gè)樣本的原始載體音頻信號(hào)。水印嵌入過程如圖1 所示。

圖1 水印信息的嵌入框
實(shí)現(xiàn)步驟以下。
(1)對(duì)載體音頻信號(hào)S分幀F(xiàn)={F1,F2,…,FP×P}。
(2)EO 應(yīng)用于每個(gè)音頻幀F(xiàn)i上,以計(jì)算每個(gè)音頻幀相應(yīng)的指數(shù)系數(shù):
式中,i表示幀編號(hào),q表示每幀樣本總數(shù)。
(3)每個(gè)指數(shù)系數(shù)EFrame轉(zhuǎn)換為DCT 域,以計(jì)算DCT 系數(shù)
(5)取出近似系數(shù)CAi(k),其中1 ≤k≤N×N,N=q/2r+1。選擇此段是因?yàn)樗乔度胨?shù)據(jù)的重要波段。將CAi(k)從1×N2的行矩陣重新排列為N×N方型矩陣Hi。
(6)執(zhí)行SVD 將每個(gè)矩陣Hi分解為Ui、Si和Vi這3 個(gè)矩陣。SVD 操作公式如下:
(7)二進(jìn)制水印信息使用混沌特征的高斯映射進(jìn)行加密。
(8)選擇每個(gè)矩陣Si的最大奇異值Si(1,1)。水印信息應(yīng)嵌入到音頻信號(hào)最重要的感知部分,以保證該算法的魯棒性和透明性。該方法使用量化函數(shù)將水印位嵌入到每個(gè)矩陣Si的最大奇異值Si(1,1)中。量化嵌入方程[11]如下:

(9)將每個(gè)修改后的最大奇異值S′i(1,1)重新插入矩陣Si,通過式(7)得到H′i:


(11)最后,所有含水印的音頻幀連接在一起,以計(jì)算水印音頻信號(hào)S′。
該算法的水印檢測過程不需要原始載體音頻信號(hào),屬于盲水印提取,具體操作如圖2 所示。

圖2 水印信息的提取過程
提取過程有以下步驟。
(5)水印序列提取如下:

(6)使用以下規(guī)則查找隱藏的二進(jìn)制序列,從而執(zhí)行混沌解密:

(7)最后,通過將二進(jìn)制序列d*(i)重新排列到大小P×P的方形矩陣W*中獲得水印信息。
本節(jié)中選擇采樣率為44.1 kHz、16 位單聲道的4 組不同類型的音頻作為原始載體音頻信號(hào)進(jìn)行若干組實(shí)驗(yàn),包含流行音樂、爵士音樂、古典音樂和人聲對(duì)話各20 個(gè)片段。
每個(gè)音頻文件包含262 144 個(gè)樣本,將其分成256個(gè)樣本大小的幀。W={w(a,b),1 ≤a≤P,1 ≤b≤P}是嵌入到原始載體音頻信號(hào)中的二進(jìn)制標(biāo)志圖像,w(a,b)∈{0,1}是點(diǎn)(a,b)處的像素值。在音頻信號(hào)的每一幀中嵌入二進(jìn)制標(biāo)志圖像的一個(gè)比特水印信息,根據(jù)透明性、魯棒性和嵌入容量來評(píng)估該方案性能。在該方案中,任何二值標(biāo)志圖像都可以作為水印信息。
所提出的水印算法的透明性和魯棒性不受任何二值水印圖像頻率分量的顯著影響。
二進(jìn)制標(biāo)志圖像和相應(yīng)的混沌加密圖像大小為P×P=32×32=1 024,如圖3 所示。

圖3 水印圖像信息
研究中,密鑰K的y(1)、m和n和λ的值分別選為0.60、5.90、-0.39 和0.50。選擇這些參數(shù)是為了更好地權(quán)衡透明性、魯棒性和嵌入容量。
數(shù)字水印音頻隱藏旨在將不可感知和安全的水印信息嵌入到原始載體音頻信號(hào)中,因此方案應(yīng)具有良好的透明性。
信噪比(Signal to Noise Ratio,SNR)廣泛用于測量水印音頻信號(hào)的客觀質(zhì)量,計(jì)算公式為:

式中,s(n)和s*(n)分別為時(shí)域中的原始載體音頻信號(hào)和含水印音頻信號(hào)。根據(jù)國際唱片業(yè)聯(lián)合會(huì)標(biāo)準(zhǔn)[13],當(dāng)SNR>20 dB 時(shí)水印不可察覺。測試結(jié)果如表1 所示,它們的信噪比均值為29.858 dB。

表1 不同載體音頻信號(hào)的信噪比
表2 給出了本文方案與一些相關(guān)研究[13-14]的信噪比比較結(jié)果。可以看出,本文方案在信噪比方面體現(xiàn)出了更好的性能。

表2 與其他文獻(xiàn)方案的信噪比比較
圖4 顯示了原始載體音頻信號(hào)與含水印音頻信號(hào)的時(shí)域表示,其中載體音頻使用的是“人聲對(duì)話”。從誤差函數(shù)可以看出,加入水印信息后的含水印音頻和原始載體音頻間誤差很小,水印是不可察覺的。

圖4 水印音頻透明性
歸一化相關(guān)系數(shù)(Normalized Correlation,NC)可以用來比較原始水印W與提取的水印W*的相似性,計(jì)算公式如下:

式中,a和b為水印圖像的索引。如果NC(W,W*)接近1,則W和W*之間的相關(guān)性非常高;如果NC(W,W*)接近于0,則W和W*之間的相關(guān)性非常低。
誤碼率(Bit Error Rate,BER)可以用來衡量水印方案的魯棒性,計(jì)算公式如下:

式中,⊕為異或運(yùn)算。
下面將對(duì)含水印音頻進(jìn)行攻擊,運(yùn)用NC 和BER 來評(píng)估該方案的魯棒性。具體需要進(jìn)行的攻擊操作如下:(1)無任何攻擊;(2)加入信噪比為20 dB 和30 dB 的加性高斯白噪聲到音頻信號(hào);(3)將含水印音頻信號(hào)降采樣到22.05 kHz,再升采樣到44.1 kHz;(4)將含水印音頻信號(hào)重量化為8 bit,再恢復(fù)到16 bit;(5)對(duì)含水印音頻信號(hào)采用截止頻率為6 kHz 的低通濾波;(6)采用MPEG-1 layer 3 壓縮含水印音頻信號(hào)以64 kb/s 的比特率被壓縮,然后解壓縮得到恢復(fù)的波形格式;(7)將10%的含水印音頻信號(hào)用高斯分布的白噪聲進(jìn)行隨機(jī)修改。
表3 反映了不同含水印音頻信號(hào)受到攻擊時(shí)的魯棒性結(jié)果。從實(shí)驗(yàn)數(shù)據(jù)來看,該算法在添加30 dB噪聲、重量化、MP3 壓縮和剪裁幾種攻擊下,誤碼率可達(dá)到為0%,實(shí)現(xiàn)了對(duì)原始水印信息的無損恢復(fù),說明該算法對(duì)這幾種攻擊具有不錯(cuò)的抵抗能力。另外,對(duì)載體音頻為“爵士音樂”的含水印音頻而言,添加20 dB 噪聲攻擊時(shí),BER 值最大為3.123%;對(duì)載體音頻為“人聲對(duì)話”的含水印音頻而言,進(jìn)行降采樣攻擊時(shí)BER 值最大為0.122%,進(jìn)行6 kHz低通濾波攻擊時(shí)BER 值最大為0.195%。從解碼后的水印信息來看,仍然可以準(zhǔn)確提取水印,說明該方案對(duì)音頻加噪和低通濾波具有較好的對(duì)抗效果,驗(yàn)證了該方案具有較高的魯棒性。
嵌入容量的定義是在一單位時(shí)間內(nèi)可以嵌入原始音頻信號(hào)的比特?cái)?shù),并以每秒比特?cái)?shù)來衡量。嵌入容量的計(jì)算公式為:

式中,T為原始音頻信號(hào)持續(xù)時(shí)間,單位為s;B為嵌入到原始音頻信號(hào)中的水印位數(shù),單位為bit。本文的嵌入容量Cap為172.270 b/s。
為了更好地說明本文方案的嵌入容量和魯棒性,將文獻(xiàn)[13-14]中的結(jié)果與本文方案中的測試數(shù)據(jù)平均值進(jìn)行對(duì)比,結(jié)果如表4 所示。

表3 魯棒性分析

表4 算法間的性能比較
本文方案中,被攻擊的含水印音頻在加噪20 dB、重采樣和6 kHz攻擊下的平均誤碼率分別為2.041%、0.049% 和0.108%,其余攻擊平均誤碼率均為0%。從嵌入容量可以看出,本文方案的嵌入容量172.270 b/s 優(yōu)于文獻(xiàn)[14],與文獻(xiàn)[13]相同。
在魯棒性測試中,通過對(duì)含水印音頻加入20 dB的高斯白噪聲這一攻擊類型可以發(fā)現(xiàn),其他幾種方案在抗噪性方面的BER均高于2.041%,文獻(xiàn)[13]中BER高達(dá)4.720%,為本文算法的2 倍,非常不利于對(duì)水印信息的提取。對(duì)于加噪30 dB、重量化以及MP3 壓縮的攻擊,本文方案的BER均為0%,其余文獻(xiàn)在這3 種攻擊下BER均大于等于0%。通過對(duì)比可以發(fā)現(xiàn),本文方案在嵌入容量和魯棒性中得到了很好的平衡,是具有高嵌入量和高魯棒性的一種盲水印音頻隱藏方案。
本文提出了一種基于SVD 和EO-LO 的變換域盲水印音頻隱藏方案。仿真結(jié)果表明,該方案對(duì)多種攻擊具有較高的魯棒性。擁有較好的透明性和較大的嵌入容量。此外,與一些相關(guān)水印方案相比,它在透明性、魯棒性和嵌入容量方面做到了更好的平衡,對(duì)音頻版權(quán)保護(hù)具有有效性。