摘 要:針對現有數字音頻水印算法不能同時滿足隱蔽性與魯棒性的問題,在添加水印之前,先將水印的二值圖像與隨機密鑰進行加密操作,再對載體進行三級小波變化和DCT變換,最后對比加密后的水印信息與載體信號,得到密鑰值,并將密鑰嵌入到載體音頻的DCT中頻系數中。實驗結果表明,該算法能在隱蔽性和魯棒性之間達到一個較好的平衡。
關鍵詞:音頻;小波變換;離散余弦變換;水印算法
中圖分類號:TP309 文獻標志碼:A
1 引言
數字水印技術是將數字、序列號、文字、圖像標志等信息嵌入到多媒體數據中,以起到版權保護、秘密通信、數據文件的真偽鑒別和產品標志等作用,音頻水印作為數字水印技術的一個重要分支,日益引起了人們的關注。
目前應用較廣的音頻水印算法有最低有效位算法(LSB)和基于DCT變換域的數字水印算法。LSB是最不重要比特位(Least Significant Bit)的縮寫,其原理是用秘密信息(水印)直接替換載體數據的最不重要比特位,這是一種脆弱水印,但是隱蔽性較好。DCT域水印算法的核心思想是在載體文件的DCT系數上添加水印信息,而DCT系數可分為高頻、中頻、低頻三種。其中,與LSB方法等效的做法是把水印嵌入到高頻系數中。這對音頻水印載體的聽覺質量非常有利,但由于音頻信號的高頻區對常見的信號處理和噪聲比較敏感,這些算法產生的水印魯棒性較差。為提高魯棒性,Cox等人[1]提出水印應放在聽覺系統最重要的分量上(對應于DCT域中的低頻系數[2]),其理由是聽覺上最重要的分量是音頻信號的主要成分,攜帶較多的信號能量,在音頻信號有一定失真的情況下仍能保留主要成分。綜合以上兩點,一些學者對其進行了折衷[3],把水印放在DCT域的中頻系數上,文獻[3]將中頻系數定義為每一段的第2個DCT系數,但也有人認為音頻的中頻分量為第3~6個系數。選擇的嵌入分量不同,所產生的水印性能也不相同,而且目前對于各個分量具體位置的定義也沒有統一的標準[4]。
2 現有算法描述
5.逆變換還原載體音頻
對添加水印后的音頻信息進行逆DCT變換和小波逆變換,再將所有分段組合到一起,即可得到添加水印后的音頻文件。
3.4 算法仿真
音頻水印算法可以使用以下三種評價方法:
(1)主觀聽覺測試:使用客觀的Diff級(SDG)來判斷該性能,SDG為0.0時表示水印的不可聽性最好,其值越大,算法性能越差,4.0即表示隱蔽性最差,這種情況下,水印基本是不合格的。
(2)信噪比(Signal to Noise Ratio, SNR):信號的有用成分與噪聲的強弱對比,這個一般是用來衡量數字信號的保真程度,其值越大即表示噪聲對信號的影響越小。
(3)相似度sim:數字水印中提取的水印與原始水印的相似程度。通常將sim值與設定的門限值T進行比較,若sim大于T,則表示該水印是魯棒的,否則即是脆弱水印。
對本文提出的算法在Matlab環境下進行了編程實現,基本參數說明如下:
(1)選取aud.wav作為載體音頻,比特率為1411kbps,時長11秒,量化位數為16bit,采樣頻率為44.1Hz。
(2)選取 的位圖圖像mark.bmp作為水印圖像,如圖4所示。
(3)嵌入強度D的取值為0.035。
算法仿真結果如圖5所示,水印嵌入時間為0.7020秒。
該算法與文獻[11]的性能對比如表1所示,由此可知,添加水印后,使用客觀的Diff級(SDG)來進行主觀聽覺測試,產生的音頻信號幾乎不存在可感知的差別。同時,由SNR的值可知,該算法的隱蔽性確實有一定程度的提高。
4 總結
本文根據已有音頻水印算法的優缺點,提出了一種基于小波變換和DCT變換的數字音頻水印算法。該算法根據Cox算法魯棒性較好而隱蔽性較差的特點,對其進行了修改,將水印信息添加到DCT變換的中頻系數中,使其在隱蔽性和魯棒性之間達到一個較好的平衡,同時,在此基礎上,引入了小波變換和水印圖像預處理,增加算法的安全性。實驗結果表明,經過該算法添加水印后,產生的音頻信號與原始載體幾乎不存在可感知的差別,而且添加水印后的載體音頻對于添加噪聲、重新量化和重新采樣等攻擊,都具有較好的魯棒性。
參考文獻:
[1] I J Cox, J Kilian, T Leighton, T Shamoon. Secure spread spectrum watermarking formultimedia [J]. IEEE Transaction on Image Processing, 1997, 6(12): 1673-1687.
[2] H Tewfik, M Swanson. Data hiding formultimedia personalization, interaction, and protection [J]. IEEE Signal Processing Magazine, 1997, 14(4): 41-44.
[3] 王秋生, 孫圣和. 一種在數字音頻信號中嵌入水印的新算法[J]. 聲學學報, 2001, 26(5): 464-467.
[4] 馬冀平, 韓紀慶. DCT域音頻水印:嵌入對策和算法[J]. 電子學報, 2006, 34(7): 1260-1264.
[5] 田運金, 殷凱, 周輝. 一種基于DCT變換的音頻隱藏算法研究. 裝備指揮技術學院學報, 2006, 17(4): 64-67.
[6] 金燦. 一種基于Cox算法的分塊DCT圖像水印算法研究. 計算機安全, 2011(7): 17-19.
[7] B Zhang, S N Srihari, C Huang. Word image retrieval using binary features[J]. Document Recognition and Retrieval, 2004, 43(3): 37-40.
[8] 李慎, 夏良正, 顧宗愨. 一種新的二維最大熵圖像閾值分割方法[J]. 南京航空航天大學報, 1994, 26(3): 151-157.
[9] M M M Fahmy. Computer Vision Application to Automatic Number Plate Recognition[J]. Proceeding of 26th. International Symposium on Automotive Technology and Automation, 1993, 13(2): 625-633.
[10] 景曉軍, 蔡安妮, 孫景鰲. 一種基于二維最大類間方差的圖像分割算法. 通信學報, 2001, 22(4): 71-76.
[11] 凡超, 王忠, 肖留威等. 改進的DCT域音頻水印算法[J]. 計算機工程與設計, 2011, 32(4): 1351-1355.