劉昌鑫 歐陽春娟 郭 鳴 唐衛東
(井岡山大學計算機科學系,江西 吉安 343009)
AutoCAD 是當前最為流行的工程圖設計軟件,廣泛應用于機械、電子、建筑、航天和紡織等制造業領域。為了保護設計的工程圖形的版權,目前提出了一些針對工程圖的信息隱藏方法[1],但是專門針對工程圖的隱藏檢測的研究相對很少。
圖像隱寫分析是檢測給定的載體圖像中是否含有隱藏信息。圖像隱藏盲檢測由于不需要原始載體圖像的信息,通過分析隱寫圖像的特征,利用分類器區分出載體圖像和隱寫圖像,因此圖像隱藏盲檢測方法適用性更強,已經成為目前隱寫分析的研究熱點。Farid等[2]提取DCT 域中的小波高階統計量作為特征,采用Fisher 線性分類器進行分類,利用小波子帶系數抽取72 個高階統計量作為特征,取得了一定的檢測效果。Avcibas[3]使用回歸分析法對隱寫前后的圖像質量進行分析,從而區分未隱藏信息的載體圖像和隱藏信息的載密圖像。Fridrich[4]提出了針對JPEG 圖像的通用隱寫分析方法,提取23 個對數據隱寫比較敏感的特征,實驗中取得很好的效果,但是特征提取算法比較復雜,運算量大。Wen -Nung Lie[5]分別從空域和DCT域提取像素的梯度能量和Laplacian 參數作為特征量,對BMP 圖像有較好的檢測效果。
上面的圖像隱藏盲檢測方法都是使用標準圖像庫的圖像,專門針對AutoCAD 工程圖的檢測方法很少涉及。本文采用常用的Farid 提出的高階統計量和空域的圖像梯度能量作為特征,把所有選擇的特征輸入SVM 訓練分類,實驗結果顯示該方法也能夠檢測圖像是否隱藏信息。
文獻[5]提取圖像的梯度能量作為空域特征來進行盲檢測。對于一幅N ×M 大小的圖像,設圖像的像素值為I(x,y),則圖像能量定義為

梯度能量反映了局部區域像素值變化的大小和方向,梯度的大小反映了像素值變化的快慢,梯度的方向反映了區域內像素變化的趨勢。數據嵌入后圖像的梯度能量增加,導致相鄰像素值之間的偏離度變化,所以可以將梯度能量作為空域特征。基于梯度能量的圖像空域特征f1計算如下:
(1)計算垂直梯度能量GEV

其中NH和NW分別代表興趣區域(ROI)的寬度和高度,I(x,y)表示在(x,y)位置的像素值。
(2)計算水平梯度能量GEH

(3)計算總梯度能量f1

文獻[2]對每個圖像進行n 級Haar 小波分解,各級分解的3 個垂直、水平和對角子帶用Vi(x,y)、Hi(x,y)和Di(x,y)表示,其中i 為小波分解的尺度。對小波分解后每層的垂直、水平和對角子帶系數分別計算均值、方差、偏斜度、峰值4 個高階統計量,共得到4×3 ×(n-1)維小波子帶系數高階統計量,這些特征標識了小波分解后各子帶系數的分布特性。
由于圖像小波分解子帶各方向和各層間小波系數具有相關性,可以利用小波系數的線性預測誤差分別計算對角、垂直和水平子帶的誤差,得到一組小波域特征值。第i 層小波垂直子帶系數的線性預測誤差模型用式(5)表示,其中wk為權重。

式(5)用矩陣形式表示為

其中,V 是所有系數Vi(x,y)組成的列向量;矩陣Q 為式(6)相鄰系數組成的列向量;w=(w1,…,w7)T。由式(6)可得向量V 的均方誤差為

為了使線性預測誤差最小,對式(7)求導后令其等于零,可求出w 向量為

得到線性預測誤差為

同理可以計算出水平子帶和對角子帶的線性預測誤差。依次對水平、垂直和對角子帶的線性預測誤差系數計算均值、方差、偏斜度和峰值4 個高階統計量。高階統計量對嵌入信息很敏感。
選擇AutoCAD 工程圖作為載體圖像,對載體圖像進行預處理,圖像格式轉化為JPEG 圖像,圖像的大小為1207 ×533,如圖1 所示。采用JSteg Shell 2.0 隱寫工具,隱藏圖像是大小為64 ×64 的二值圖像。實驗結果顯示隱藏信息后的圖像(圖略)與原圖一樣,人眼無法區別。

隨機選擇多幅載體圖像,使用隱寫工具Jsteg 分別以0.2,0.5,0.7 的嵌入率在載體圖像中嵌入隱密信息,得到相應的含密圖像。含密圖像用于訓練和測試。對圖像進行3 級小波分解,每層3 個子帶LH、HL 和HH,分別對每層的每個子帶求4 個高階統計量(均值、方差、偏斜度和峰值),可得到36 個小波子帶系數高階統計特征值。利用小波線性預測誤差可以得到另外36 個特征值。加上圖像的梯度能量特征值,總共73個特征值。實驗采用SVM(Support Vector Machine)[6]來分類圖片,72 維輸入,核函數為RBF,輸出即為判斷待檢測工程圖是否含有隱藏信息的一維向量數據。實驗顯示采用本文算法和SVM 分類器,可以區分載體工程圖和載密工程圖。
雖然采用小波域高階統計量和圖像梯度能量作為特征,可以檢測出含密工程圖是否含有隱藏信息,但是由于CAD 圖形相對于JPEG 圖像具有數據冗余小、容易受到攻擊等特點,本文算法并沒有考慮CAD 圖形獨特性,同時提取72 維特征,運算量也較大。因此,必須開發更有效的檢測算法,判斷CAD 圖形中是否含有隱藏信息。
[1]彭飛,孫星明.一種利用HVS 與標注特征的2 維工程圖信息隱藏算法[J].中國圖象圖形學報,2009,14(6):1102 -1107.
[2]H.Farid.Detecting hidden messages using higher-order statistical models[C]// Proc.Of IEEE International Conference on Image Processing,New York,2002,2:905 -908.
[3]I.Avcibas,N.Memon,B.Sankur.Steganalysis using image quality metrics[C]//Proc.SPIE Electronic Imaging,Security and Watermarking of Multimedia Contents II,2001,4314:523 -531.
[4]J.Fridrich.Feature-based steganalysis for JPEG images and its implications for future design of steganographic schemes[C]//6th Information Hiding Workshop,LNCS,Springer-Verlag,2004,3200:67 -81.
[5]W.N.Lie,G.S.Lin.A feature -based classification technique for blind image steganalysis[J].IEEE Transaction on Multimedia,2005,7(6):1007 -1020.
[6]C.C.Chang,C.J.Lin,LIBSVM -a library for support vector machines,http://www.csie.ntu.edu.tw/~cjlin/libsvm.