武警工程大學 孫 娜
圖像隱寫分析技術研究
武警工程大學孫娜
隱寫分析作為信息隱藏的對抗技術得到了很大的發展,尤其是計算機多媒體技術和處理能力的提高更加帶動了這一學科的飛越。數字信息時代方便了人們生活的同時,也在一定程度上威脅著人們的信息安全,通過信息隱藏和加密技術來實現隱秘通信顯得尤為重要,人們也開始逐漸依賴這些技術。數字圖像是一種非常常見的數字媒體,由于其本身冗余度高、處理方便等特點,成為隱藏信息的理想載體,應用十分廣泛。為了更加深入的掌握信息隱藏技術和分析含密媒體中的重要數據,推動我國在信息隱藏領域的研究,增強國家信息安全和防范網絡失泄密的能力,有效應對數字信息時代面臨的嚴峻挑戰,必須加大此學科的研究力度。
信息隱藏;隱寫分析;數字圖像
信息隱藏技術與隱寫分析技術是一對矛盾關系,其發展是相互影響和相互促進的,并且呈現出一種螺旋式上升的狀態。自從信息隱藏技術出現后,隱寫分析技術也在同步發展。當一個新的隱寫算法出現后,針對這種算法進行分析與探索,可以進一步推動隱藏算法在性能和安全方面的改進,以此來發明更加高效的隱藏算法。
信息隱藏技術與隱寫分析技術是一對矛盾關系,其發展是相互影響和相互促進的,并且呈現出一種螺旋式上升的狀態。自從信息隱藏技術出現后,隱寫分析技術也在同步發展。當一個新的隱寫算法出現后,針對這種算法進行分析與探索,可以進一步推動隱藏算法在性能和安全方面的改進,以此來發明更加高效的隱藏算法。
2.1隱寫分析原理
信息隱藏通用的過程可表示如下[1]:
S =f(C,M)
在式中表示了信息隱藏的過程,即將待嵌入的隱秘信息M,通過嵌入算法f( ),嵌入到載體文件C中,最終形成載密消息S。相比之下,隱寫分析的過程就是從載密消息S中檢測出隱秘信息M甚至出提取秘密信息M。如式,其中f()表示提取隱秘信息的算法。在提取過程中可分為需要載體還是不用載體。
M=f-1(S)或M=f-1(S,C)
隱寫分析可以分為以下兩個步驟[2]:第一步(被動分析)根據隱寫前后特征的變化來判斷是否含有秘密;第二步(主動分析)是在第一步的基礎上更進一步,估計嵌入信息的位置、大小和密鑰,從而提取出秘密信息。第二步由于缺少先驗知識,其難度還比較大,分析技術仍停留在第一步。

圖1 隱寫分析的通用模型[3]
2.2隱寫分析的分類
當前,國內外學者提出了很多隱寫分析方面的算法,分類的方法和研究的重點方向也不盡相同。
主要包括通用盲隱寫分析、特征碼隱寫分析、統計隱寫分析和視覺隱寫分析等[4]。
(1)視覺隱寫分析主要依靠人的視覺系統對秘密信息隱藏后的圖像的識別進行分析[5]。其過程為可以劃分為三個步驟,第一步,對數字圖像進行預處理,可以采用位平面分解的方法來完成;第二步利用人眼觀察并進行分析判斷。正是由于使用的是肉眼進行觀察,不能深入細致的發現問題,往往會受到一些限制和約束。
(2)所謂特征碼隱寫分析[6],就是在隱藏信息的同時,將一些具有某種含義的特征碼嵌入到圖像中,那么分析者便可以檢測特征碼來判斷載體中是否含有秘密信息即可,而無須對隱藏的所有信息進行分析提取。基于這個原理,特征碼隱寫分析檢測具有速度快、精度高、內容多的優點。如今,由于新的信息隱寫軟件已經不用特征碼了,因此特征碼隱寫分析也將退出歷史舞臺。
(3)統計隱寫分析是統計學在信息隱藏領域的具體應用[6]。數字圖像本身就具有一些特征,如果在圖片中嵌入了秘密信息,那么圖像的某些統計特征會發生變化,其理論的頻率分布和隱秘圖像的分布存在差異,通過檢測便可以進行判斷是否存在秘密信息。
以上幾種隱寫分析方法只能對特定的隱寫算法有效,但不具有通用性。
(4)通用盲隱寫分析利用已知信息隱藏前后圖像的變化進行學習訓練,來調整閾值門限。這種方法具有通用性,適用于多種隱寫算法的檢測,逐漸成為隱寫分析算法的研究熱點之一。
3.1 卡方檢測原理及步驟
卡方分析的步驟是:自然圖像在沒有隱寫前其圖像相關性是很強的,但像素值h2i和h2i+1的大小會相差很大,可是經過嵌入后,由于秘密0、1比特流經過加密后隨機分布于整個圖像,造成h2i和h2i+1的大小比較接近[8]。
下面專門對最低位完全嵌入秘密信息的情況進行分析。直方圖的分布會因為信息的嵌入而發生改變,這種差別往往由很大而變得近似相等,但是h2i和h2i+1的值卻不會發生改變,其原因是樣值只在h2i和h2i+1之間改變或者干脆不改變。
如果某個樣值為2i,那么它對參數q貢獻為1/2;如果樣值為2i+1,對參數q的貢獻為-1/2。載體中2i或2i+1有2h2i個,假設若秘密信息為1比特,那么每個樣點為2i或2i+1的概率就是0.5。如果2h2i的值非常大時可以用中心極限定理來近似表達:

式中:→N(0,1)表示近似服從正態分布。因此:

服從卡方分布。r是用來衡量是否含有秘密信息可能性大小的值,它越小,說明可能性越大。載體隱寫可能性可以表示為:

其值越接近于1,含有秘密信息的可能性越大。
3.2RS檢測原理及步驟
RS隱寫分析方法的核心思想是:數字圖像具有一定的空間性,圖像的隱寫會破壞這種相關特性。由于圖像經過了隱寫,那么0和1的概率都為1/2。對于一幅8bit的灰度圖像,像素取值為P={0,1,2,···,255}。可以將這些像素分為大小相同的若干個塊,比如是n個(n的大小不固定,視情況而定,如n取為8),用Zigzag排列成向量。基于圖像的相關性,可以利用相鄰像素的差值絕對值來衡量這種大小,并通過求和來總體上判斷是否對圖像進行了更改,如下式:

表1 p值分布大小

f的作用就是將分塊出來的每個小塊用上式進行計算,其值大小可以衡量圖像相關性,所以可以說明圖像是否發生了變化。f的值越小,說明相鄰塊之間的變化程度越小,圖像塊之間的空間相關性就越強。
因此,就整個的變換過程可以總結三個函數與此相對應:
(1)交換函數f1:即需要變換時,將奇偶數互換。
(2)偏移函數f-1:與上述同理。
(3)恒等變換f0:,即其不發生變化,下面將會舉例說明。
當秘密比特與載體比特位相同時運用f0翻轉,當秘密比特與載體比特位不相同時運用f1翻轉。引入偽裝M,它的取值范圍是-1,0,1。對應著f-1、f0、f1三個變換函數。記對于偽裝M的R組數量為RM,類似的S組記為SM。例如G={18,17,15,16},M=(0,1,0,1),則-M=(0,-1,0,-1)。于是就得到(G)=(18,16,15,17),(G)=(18,18,15,15)。
對于非負(f1,f0)翻轉記:
Rm=(相關性增加的圖像塊個數)/(圖像塊總個數);
Sm=(相關性減少的圖像塊個數)/(圖像塊總個數),且Rm+Sm≤1;
同理對于非正(f-1,f0)翻轉記:
R-m=(相關性增加的圖像塊個數)/(圖像塊總個數);
S-m=(相關性減少的圖像塊個數)/(圖像塊總個數)R-m+S-m≤1;
當不包含隱藏信息的載體時,非正和非負翻轉所體現出來的作用是相同的,但是翻轉會破壞圖像原來的空間相關性,即:

當包含隱藏信息的載體時,非負與非正翻轉明顯不同,即:

檢測時,對圖像進行非正翻轉和非負翻轉,分別計算RM、R-M、SM、S-M的值,通過比較四個統計量之間的大小關系,如果R-M-S-M明顯大于RM-SM,則可以說明載體中含有秘密信息。
4.1實驗準備
為了對隱寫圖像進行有效的分析檢測,本文利用LSB隱寫算法對圖像進行了隱寫,得到了隱寫之后的圖像,如圖示。LSB替換嵌入算法有兩種方式,一種是連續嵌入算法,另一種是隨機嵌入算法。連續嵌入是按照一定的方向和順序進行全部嵌入,隨機嵌入是由種子事先生成隨機數,并按照這些數據進行選擇性的嵌入。前者實現起來比較簡單方便,但也容易遭受到攻擊者破壞和受到外界環境影響。后者是對前者的一種進步和改進,因此較前者更加安全保密。本文采用了連續嵌入算法,目的是分析檢測時能夠有效針對算法優劣進行判定,得出一般規律。

圖2 未嵌入秘密信息圖像與嵌入秘密信息圖像比較
4.2實驗結果
通過實驗,我們得到了卡方檢測p值和RS檢測R與S的分布情況,如表1和圖3所示。

圖3 R與S分布情況
4.3比較分析
RS檢測也是一種針對圖像相關性的一種方法,因此,要設計出合適的隱寫算法,就要考慮使用一種方法來測量這種相關性,并對前后兩種情況進行比較。
RS檢測方法的使用也比較有限,適于偽隨機LSB嵌入算法隱藏圖像。它能檢測出圖像是否含有秘密信息,而且還能比較準確地估算出隱藏的信息長度。
卡方檢測基于整個圖像嵌入的情況時具備很好的性能,但是在現實生活中,這種方法只能作為一種試探性工具來使用,很多情況下也會受到各種因素的影響,造成檢測的效果與其它檢測方法有很大差距。但是就RS檢測方法來說,這種方法比卡方檢測復雜,運用的理論比較成熟,無需考慮隱寫率的問題,但其對操作過程要求很高,實驗的結果與分塊大小、方法、多少以及載體的選取都有很大關系,這就需要結合載體和實際的需要進行實驗。
[1]張淞.基于圖像的信息隱寫與分析技術研究[D].電子科技大學,2012.
[2]B.Li,Y.M.Fang,J.W.Huang.Steganalysis of Multiple-Base Notational System SteganograPhy.IEEE Signal Processing Letters.2008,15:493-496.
[3]梁小萍,何軍輝,李健乾.隱寫分析——原理、現狀與展望[J].中山大學學報,2004,43(6):93-96.
[4]Liu C L,Shiang Rong Liao.High-performance JPEG steganography usingcomplementary embedding strategy.Pattern Recognition,2008,41(9):2945-2955.
[5]趙艷榮,平西建,熊鋼.計算機應用研究[J].2011(05):1001-3695.
[6]諶文芳.圖像隱寫分析算法研究[D].湖南大學,2011.
[7]劉祖根.圖像隱寫分析算法研究[D].浙江大學,2007.
[8]沈紅雷.多載體信息隱藏技術研究[D].中北大學,2011.