邢 楠,朱 虹,王 棟,侯浩錄
西安理工大學 自動化與信息工程學院,西安 710048
基于多分類器融合的圖像真偽鑒別方法
邢 楠,朱 虹,王 棟,侯浩錄
西安理工大學 自動化與信息工程學院,西安 710048
照片始自于1826年,新聞報道、個人證件、甚至呈堂證供中都少不了它的身影。為篡改事實或者增強視覺效果,被篡改的照片和圖片始終都與人們相伴。當前,由于各種功能強大的圖像處理軟件的廣泛使用,使得制作一張逼真的偽造圖像變得非常簡單,這甚至不需要造假者具有專業的知識。隨著互聯網時代的到來,偽造的照片會被迅速傳播到世界的各個角落,產生廣泛的影響。圖1就是兩張著名的涉嫌偽造的照片,而一些被篡改的照片甚至會引發諸多民事糾紛或法律問題。
針對數字圖像真偽鑒別問題,國內外已經做了一些相應的研究,其中根據圖像中不同景物光照方向是否存在不一致,來檢測圖像的真偽[1];以及利用雙一致性對拼接的圖像進行檢測[2];還有根據單幅圖像中不同色彩之間的邊緣像素反推響應函數,對所得到響應函數的特殊狀態進行分析,從而判斷圖像是否經過合成處理[3]。
為提高圖像真偽鑒別的準確率和適應性,本文通過使用濾波器,將數碼相機中廣泛存在的一類噪聲檢測出來,使其作為相機的特征信息,通過分類器對其加以區分,并融合多個分類器的結果,最終對圖像的真偽作出判斷。
根據Luká? J,Fridrich J等人的研究[4-5],在數碼相機的內部普遍存在著一種反映相機本身物理特性的噪聲,被稱為模式噪聲(Pattern Noise),它由固有模式噪聲(Fixed Pattern Noise,FPN)和光響應非均勻性噪聲(Photo Response Non-Uniformity noise,PRNU)兩部分構成,其中,PRNU是指圖像傳感器中基本單元對光照的不同敏感度,對于不同的圖像傳感器它又存在差異,因此,可以將其看作是圖像傳感器的固有屬性。

圖1 有偽造嫌疑的數碼照片
對于PRNU這種傳感器采集圖像時引入的微量噪聲,需要性能良好的濾波器才可以獲得。得益于小波變換本身所具有的低熵性、多分辨率、去相關性等特點,小波濾波器能夠在保持原始圖像特征的基礎上,更加精確地獲得細微的圖像噪聲。因此,本文采用基于小波系數隨機模型[6]構建的小波濾波器。
受噪聲干擾的小波系數模型如圖2所示。其中,n(k)是均值為0,方差為σn2的高斯白噪聲;X(k)是無噪聲干擾圖像的小波系數,每個小波系數都被認為是獨立的,來自一個均值為0,方差為σ2(k)的高斯源;Y(k)表示觀測到的受噪聲干擾的圖像小波系數。

圖2 受噪聲干擾的小波系數模型
在上述模型中,小波系數滿足局部的獨立同分布,而且其方差所在區域是光滑的,為了獲得“干凈”的小波系數 X(k),采用最佳線性預測器進行估計,其表達式如下:


通過對樣本圖像進行五層小波分解,采用db8小波進行小波變換,可以得到各個小波子帶中的HH、HL、LH區域的小波系數,采用最大似然估計(ML)的方法,根據受噪聲干擾的小波系數周圍的鄰近區域,對每一個小波系數的方差進行估計,并通過最小均方誤差估計(MMSE)獲得最優解,最終,將它代入公式(2),得到圖像各點小波系數X(k)的估計值Xˉ(k),濾掉了樣本圖像的噪聲。圖3所示為小波去噪算法的示意圖。

圖3 小波去噪算法的示意圖
如圖4所示,以標準測試圖LADY為例,將小波濾波器與中值濾波器、空間維納濾波器[7]進行對比測試,可以發現,只有小波濾波器對正常拍攝的圖像進行處理后得到的殘差圖與原始圖像內容不相關,即:通過濾波器所獲得的噪聲,僅僅反映相機內部固有噪聲特性。

圖4 三種濾波器去噪效果的對比
同時,為了更加客觀地比較各個濾波器的性能,引入一系列圖像參數指標對其進行評判,這些參數包括:峰值信噪比PSNR,信噪比SNR,均方誤差MSE,相似度FNC等。表1列出了上述三種濾波器各項參數指標的的對比情況。其中,小波濾波器的各項參數指標均優于其他兩類濾波器。
在獲得圖像固有噪聲之后,通過分類器對噪聲信息進行劃分,以便為鑒別圖像真偽提供依據。在進行真偽鑒別時,雖然圖像所包含的信息量非常大,但是往往關注的只是一些局部的區域,將這些可疑區域標記出來,對其進行鑒別,可以大大減少運算量。如圖5所示,圖像中包含房屋、綠地、文字等多種信息,而在進行圖像真偽鑒別時,只有兩個人物頭部特征相同的區域是最需要關注的,因此選擇該區域為可疑區域,對其真實性進行判別。

表1 各項參數指標的對比情況

圖5 在待測圖像中選取可疑區域
3.1 BP神經網絡分類器
本文采用三層結構的BP神經網絡構建分類器[8],其拓撲結構包括輸入層、隱層和輸出層。其輸入層為選定的可疑區域的噪聲圖像,其像素點作為BP神經網絡的輸入節點;輸出層節點數是2個,由輸出節點狀態可以判斷圖像的真和假;而隱層節點可以由公式(3)確定:

其中,mid表示隱層節點數,in表示輸入節點數,out表示輸出節點數,a取整數1。
對BP神經網絡進行訓練時,采用不同相機型號來源的樣本圖像共計1 000張,其中真實圖像和偽造圖像所占各半。對所有樣本圖像中與可疑區域位置相同的部分進行濾波處理,獲得該區域的噪聲圖像,將其輸入網絡進行訓練并使網絡收斂,從而可以進行圖像真偽的判別。
實驗測試表明,BP神經網絡對于真實圖像的識別效果很好,而對偽造圖像識別率則偏低。經過分析發現,這是因為偽造區域所占可疑區域的面積比例較小而導致的。如圖6(a)所示,偽造的海鷗只占可疑區域面積較小的一部分。為了提高偽造圖像的檢出率,本文采用交互的方式,如圖6(b)所示,將待測圖像中可疑區域的核心目標物框定,將框定范圍內的區域作為BP神經網絡的輸入節點,通過網絡進行判別。即:通過提高可疑目標所占區域的面積比,來提高BP神經網絡的識別準確率。

圖6 在可疑區域中框定核心目標物
3.2 廣義高斯特征分類器

其中,R為所選擇的可疑區域,PC(R)為某相機在R區域的噪聲圖像,它是相機大量樣本圖像在對應可疑區域噪聲的平均值,n(R)為待測圖像在R區域的噪聲圖像,(R)和ˉ(R)分別為PC(R)和n(R)的均值,ρ(n(R),PC(R))為相關系數,表示兩者的相關程度,‖·‖則表示二范數。
實驗測試表明,通過給相關系數設定一個閾值,對待測圖像加以判斷,其檢出率并不高。由于待測圖像噪聲和某相機圖像噪聲并不滿足完全獨立同分布的高斯模型,它們之間存在一定相關性,因此,引入廣義高斯分布[9]對噪聲之間的相關系數進行判斷。廣義高斯分布的概率密度函數表達式如下所示:

待測圖像在可疑區域的固有噪聲與該相機在對應區域固有噪聲的統計規律的一致性判別,可以通過相關系數來實現,以相關系數的大小來判斷待測圖像是否系偽造。其計算公式如下:

進而得到判斷真偽的條件,也就是得到隨機變量 ρ(即:相關系數)在已建立的模型中的概率值P,即P= G(ρ),通過概率值的大小,可以對待測圖像的真偽作出判斷[11]。該方法相較于對相關系數給定閾值,檢測偽造圖像和真實圖像的準確率均有所提升。
由于BP神經網絡分類器以及廣義高斯特征分類器具有各自不同的特點,并且,它們對于真實圖像和偽造圖像的檢測效果也各有側重。因此,本文將這兩個分類器進行融合,對對分類結果加以綜合判斷。
其中,參數 μ,σ2,β,α分別對應廣義高斯分布的均值,方差,形狀參數以及尺度參數。對于一組樣本,其主要參數α和 β可以利用牛頓迭代法獲得其最優解[10]。根據估計的分布參數,就可以得到相應的廣義高斯分布的概率密度函數。在已知概率密度函數 f(x,α,β,μ)的情況下,對其積分可以求得分布函數:
3.3 分類器綜合
使用多個分類器對事件進行分類時,為了實現不同分類器的優勢互補,通常是將不同分類器的分類結果進行融合,以提高分類識別效果以及魯棒性。進行分類器融合時,經常會采用“一致通過”準則、“大多數同意通過”準則等投票組合規則[12-13]。本文針對兩種分類器的結果進行融合時,采用了部分投票組合的規則。
兩個分類器對待測圖像的真偽進行判斷時,如果BP神經網絡分類器和廣義高斯特征分類器的判斷結果是一致的,則按照“一致通過”準則,接受兩者的判斷結果。如果BP神經網絡分類器和廣義高斯特征分類器的判斷結果是相互矛盾的,即:廣義高斯特征分類器判斷待測圖像是假圖,而BP神經網絡分類器判斷是真圖,接受廣義高斯特征分類器的判斷結果,反之,則接受BP神經網絡分類器的判斷結果。
在BP神經網絡分類器的實驗中,選取五種不同型號相機:佳能A80,佳能IXUS75,柯達LS420,美能達Z6,尼康E2000拍攝的照片作為樣本進行測試。其中,真實圖像500張(來自佳能A80型相機)和偽造圖像500張(其他四種型號相機),合計1 000張樣本圖像。使用上述樣本圖訓練BP神經網絡并使其收斂。隨后,對200張待測圖像進行鑒別,其中,偽造圖像100張,真實圖像100張。實驗結果顯示,BP神經網絡分類器對于真實圖像具有較高的檢出率,而通過交互方式進行處理后,偽造圖像的檢出率得到大幅提升。
在廣義高斯特征分類器的實驗中,選取10種不同型號的相機:佳能A80,尼康L1,索尼T3,佳能A570,柯達LS420,美能達Z6,尼康E2000,尼康E950,索尼T3,索尼α200,佳能IXUS75。在上述型號相機拍攝的圖像中,共選取1 000張樣本圖像,計算其關于相關系數 ρ的廣義高斯分布情況,并利用概率P進行判斷。使用200張待測圖像進行鑒別,其中,偽造圖像100張,真實圖像100張。實驗結果顯示,采用廣義高斯分布對相關系數加以判斷,相較于給定閾值的相關系數判斷,偽造圖像和真實圖像的檢出率均有所提升,特別是對于偽造圖像的提升更加明顯。
將兩種分類器進行綜合后,很好地實現了兩種不同分類方法的相互補充。對200張待測圖像進行鑒別,其中,100張偽造圖像的檢出率達到95%,100張真實圖像的檢出率為93%。具體鑒別結果見表2。

表2 不同方法實驗的結果 (%)
本文采用小波濾波器提取數碼相機所固有的噪聲特征,將BP神經網絡和廣義高斯特征兩種分類器的判斷結果進行融合,對待測圖像的真偽進行鑒別。實驗結果表明,算法對于采用復制、模糊等手段得到的偽造圖像均具有較高的檢出率。
[1]Johnson M K,Farid H.Exposing digital forgeries by detecting inconsistencies in lighting[C]//Proceedings of the 7th Workshop on Multimedia and Security,2005:1-10.
[2]Ng T T,Chang S F,Sun Q.Blind detection of photomontage using higher order statistics[C]//Proceedings of the 2004 International Symposium on Circuits and Systems,2004,5:688-691.
[3]Lin Z,Wang R,Tang X,et al.Detecting doctored images using camera response normality and consistency[C]// IEEE Computer Society Conference on Computer Vision and Pattern Recognition,2005,1:1087-1092.
[4]Luká? J,Fridrich J,Goljan M.Detecting digital image forgeries using sensor pattern noise[C]//SPIE,2006:362-372.
[5]Lukas J,Fridrich J,Goljan M.Digital camera identification from sensor pattern noise[J].IEEE Transactions on Information Forensics and Security,2006,1(2):205-214.
[6]Mihcak M K,Kozintsev I,Ramchandran K.Spatially adaptive statistical modeling of wavelet image coefficients and its application to denoising[C]//1999 IEEE International Conference on Acoustics,Speech,and Signal Processing,1999,6:3253-3256.
[7]Wiener N.Extrapolation,interpolation,and smoothing of stationary time series:with engineering applications[M]. [S.l.]:MIT Press,1964.
[8]Rumelhart D E,McClelland J L.Parallel distributed processing:explorations in the microstructure of cognition,volume 1:foundations[M].[S.l.]:MIT Press,1986.
[9]Chang S G,Yu B,Vetterli M.Adaptive wavelet thresholding for image denoising and compression[J].IEEE Transactions on Image Processing,2000,9(9):1532-1546.
[10]Do M N,Vetterli M.Wavelet-based texture retrieval using generalized Gaussian density and Kullback-Leibler distance[J].IEEE Transactions on Image Processing,2002,11(2):146-158.
[11]Birney K A,Fischer T R.On the modeling of DCT and subband image data for compression[J].IEEE Transactions on Image Processing,1995,4(2):186-193.
[12]Kimura F,Shridhar M.Handwritten numerical recognition based on multiple algorithms[J].Pattern Recognition,1991,24(10):969-983.
[13]Xu L,Krzyzak A,Suen C Y.Methods of combining multiple classifiers and their applications to handwriting recognition[J].IEEE Transactions on Systems,Man and Cybernetics,1992,22(3):418-435.
XING Nan,ZHU Hong,WANG Dong,HOU Haolu
College of Automation and Information Engineering,Xi’an University of Technology,Xi’an 710048,China
By applying the filter which is in the wavelet domain,a certain noise is extracted which can reflect the camera physical characteristic and it further serves as the key feature to detect the authenticity of digital image.The noise characteristics of suspicious region in the image are determined and aggregated by the generalized Gaussian classifier and BP neural network classifier,to detect forgeries in digital images.The experimental results show the approach provides a relative high accuracy on detecting digital images that are forged in various ways.
camera noise;wavelet domain filter;generalized Gaussian;Back Propagation(BP)neural network;authenticity of digital image detection
針對數字圖像的真偽鑒別問題,通過在小波域上構造的濾波器,提取反映相機本身物理特性的某種特定噪聲,將其作為判斷圖像真偽的關鍵特征。在待測圖像中選取出可疑區域,將其噪聲特征通過廣義高斯分類器以及BP神經網絡分類器進行判斷和融合,從而實現圖像的真偽鑒別。實驗結果表明,該方法對多種不同偽造方式的數字圖像均具有較高的識別正確率。
相機噪聲;小波域濾波器;廣義高斯;反向傳播(BP)神經網絡;圖像真偽鑒別
A
TP391
10.3778/j.issn.1002-8331.1304-0460
XING Nan,ZHU Hong,WANG Dong,et al.Authenticity of digital image detected algorithm based on multiple classifiers aggregation.Computer Engineering and Applications,2014,50(24):164-167.
陜西省教育廳科學研究計劃項目(No.11JK1047)。
邢楠(1980—),男,博士研究生,講師,主要研究領域為數字圖像處理;朱虹(1963—),女,博士,教授,博士生導師,主要研究領域為模式識別、數字圖像處理;王棟(1979—),男,講師,主要研究領域為數字圖像處理;侯浩錄(1973—),男,講師,主要研究領域為信號處理。E-mail:sportsman_xing@163.com
2013-05-03
2013-07-17
1002-8331(2014)24-0164-04
CNKI網絡優先出版:2014-03-07,http∶//www.cnki.net/kcms/doi/10.3778/j.issn.1002-8331.1304-0460.html