山東煙臺生產力促進中心 王勇亮 鄭學通 戚 鵬 郭 艷
圖像取證技術及其相關問題的研究
山東煙臺生產力促進中心 王勇亮 鄭學通 戚 鵬 郭 艷
由于數碼圖像的普及,以及圖像處理和信息提取等技術的快速發展,使人們對圖像本身有了更高的要求,并且圖像在越來越多的司法或其它鑒定場合成為關鍵證物,如何在紛亂復雜的圖像中去偽存真,提取更完備更正確信息成為了當前數字圖像研究中的一個熱點。圖像取證正是在這個背景下應運而生。
自進入二十一世紀以來,隨著個人電腦和其他數碼設備的大規模普及,圖像幾乎成了人們每天都能接觸到的東西,成為了人們生活中有意或無意都會留下的一個參照物,所以其中包含的巨量的信息是我們取之不盡用之不竭的資源。在司法或其它鑒定領域,只要我們能合理的利用圖像直接或間接包含的信息,我們就能獲取我們能夠想了解的任何一個方面,所以,對圖像取證技術的研究具有重大現實意義。只要擁有優越的圖像取證方法,我們就能夠從圖像中看出端倪,進而獲取方方面面我們可能用到的信息,為進一步的司法舉證或者其他鑒定工作打下良好基礎,同時在這個信息時代中借助高科技提供充足的線索,使鑒定人員能夠事半功倍的還原現場,大幅度的提升判斷速度和工作效率。
人們應用圖像取證技術去解決問題的追求主要有以下五個方面:
一是原始證據圖像品質達不到需求,需要對圖像進行各種優化處理來對圖像中的細節信息進行分辨,以便更加細致的對照。在現實生活中,我們經常會遇到數碼設備由于光線、環境以及設備自身性能的問題而得到的不清晰的圖像,導致圖像中的關鍵目標無法進行分辨,這類圖像亟需一種有效的優化方法來區分其中的關鍵目標,以便為司法或者其他鑒定工作服務;
二是圖像資料數量巨大,人們需要更加智能的技術來對圖像中感興趣的信息進行快速檢索。當前的軟硬件條件下各式各樣的圖像信息數量龐大,尤其是各種監控設備的廣泛應用使得圖像數量規模變得更加令人嘆為觀止,有統計顯示,對于一段時長6小時的監控錄像,有時甚至需要使用其時長60%以上的工作時間才能完成取證工作,所以人們在這些紛繁復雜的圖像信息中尋覓自己關注的特定信息步履維艱,非常需要一種有效的針對圖像內容的檢索方法來快速的識別自己感興趣的圖像;
三是隨著各種圖像處理技術的發展和圖像處理工具大規模應用,圖像變得越來越容易被篡改和偽造,網絡上的PS風氣日益流行,并且這種修改是肉眼無法覺察的,使得我們在這些真假難辨的圖像面前如墜云霧,更有甚者,一些圖片偽造者別有用心,希望借其“作品”擾亂視聽,歪曲事實,如大名鼎鼎的“華南虎”事件,這類問題造成諸多方面的負面影響,導致政府公信力或者公眾判斷力下降,破壞社會的安定團結,造成許多惡劣后果。另外許多擁有嚴格版權的圖像也有被侵權之憂,人們需要一種有效的區分圖片真偽和來源的方法;
四是圖像資料中隱含的間接信息的提取,比如圖像中物體的速度或者景深等三維信息,這些都是圖像所能提供的間接信息,我們可以根據圖像的成像原理,來對其間接信息進行分析和提取,檢測圖像中目標的位置或速度,來實現一些極具現實意義的應用,比如汽車超速檢測等;
五是在有足夠的線索時將其他信息轉換為圖像信息,比如模擬畫像和合成照片等參考物證,這些應用是另一個意義上的圖像取證。
以上五個方面的應用是建立在當前的硬件應用環境之上的,可概括為增強取證、圖像篡改檢測、圖像間接信息提取、圖像內容智能檢索、基于信息的圖像構建五個方面,對圖像取證技術的研究能夠在目前這個環境下為人們提供充足的證據,以便對某一事物進行全方位的考察。
本文論述的圖像取證問題范圍涵蓋圖像,下面對這圖像取證五個方面問題的研究方法與現狀分別進行介紹。
從信號圖像出現開始,人們便致力于改善圖像顯示效果,最早的圖像增強可追溯到1921年美國和歐洲進行海底電纜通信時,為了改善模擬信號圖像的還原效果,研究人員將圖像的灰度等級從5個增加到了15個,大大改善了圖像復原的效果。到了20世紀60年代,第一臺可以進行數字圖像處理的計算機研制成功,人們開始用幾何校正和灰度變換等方法進行圖像增強,到了70年代初,研究者已經將圖像增強技術應用到醫學圖像、地球遙感監測和天文學圖像等領域,80年代之后,硬件的快速發展讓人們有更充足的圖像增強算法來進行選擇,進入90年代之后,圖像增強技術更廣泛的應用到人們的生活和生產等領域,研究者們開始嘗試將這些算法嵌入到數碼設備中。
目前國內外關于圖像增強方法主要有基于空域的方法、基于變換域的方法和基于機器學習或貝葉斯統計的方法等。其中基于空域的方法主要是從子圖像乃至像素級別對圖像進行直方圖均衡[1-2]、線性對比度調整、反銳化掩膜、自適應優化[3]等處理,前兩者主要對圖像亮度對比度進行優化,后兩者主要針對圖像邊緣細節進行優化。基于變換域的方法包括傅里葉(Fourier)變換、小波(Wavelet)變換、曲波(Curvelet)、脊波(Redgelet)和輪廓波(Contourlet)變換、離散余弦(Discrete Cosine Transform)變換等,其原理是將圖像變換到其他空間,然后利用此空間對信號處理的優勢進行處理,然后再將此空間里的信號重構為空域圖像的形式,以實現優化處理。
較之空域圖像增強方法不同,變換域增強方法有其獨到的優勢。基于空域的圖像增強方法往往針對性較強,如直方圖均衡方法主要針對圖像的對比度進行優化增強,自適應優化和反銳化掩膜主要將圖像的邊緣細節進行效果提升,而變換域方法有時候能夠取得一舉多得的效果。
隨著數學理論的發展,又出現了許多新的圖像增強方法,其中最具代表性的有基于數學形態學的方法、基于模糊數學的方法、基于人工智能的方法和基于偏微分方程的方法等。
自1814年第一張照片問世之后不久,便出現了對照片的修改和加工,1865年著名攝影家Mathew Brady拍攝的一張照片在后期人為的增加了一個人物,從此之后,各種出于政治或者其他目的的圖像篡改便流行開來,大部分都是通過拼接手段對照片中的人物或者物品進行增加或者移除,進入數碼時代之后,圖像篡改變的更加簡單易行,隨著數碼技術和工具的普及,對圖像是否為篡改和偽造的甄別成為了計算機領域又一個前沿課題,由于圖像篡改檢測涉及到司法、輿論、政府公信力和傳媒等多方面的利害關系,當前學術界開始對圖像篡改檢測投入更多的精力進行研究。
Shih-fu chang等人通過研究CCD失真校正、非線性伽馬校正、色彩插值、白平衡和傳感器噪聲等對圖像生成的影響,并對這些影響形成的特征進行檢測,從而對圖像的來源和圖像是否拼接進行鑒定。Hany Farid等人利用小波分解和高階統計建模等方法來對圖像素材(包括數碼照片、掃描圖像和計算機生成圖像)進行盲檢測,根據來源不同的圖像具有各異的高階統計的特性,結合機器學習和數據挖掘技術,來進行來源檢測。Hany Farid和A.Popescu還根據DCT系數直方圖中的類采樣效應來進行二次壓縮檢測,并且通過EM算法(Expectation/Maximization)進行數字圖像重采樣檢測。J.Fridrich等人利用數碼相機的模式噪聲來作為檢測標準來判斷相機,進行相機識別。馬里蘭大學的吳旻利用對圖像不同塊之間DCT系數的相關性、信噪比進行統計和雙譜分析的方法,對圖像的空域濾波、壓縮、重采樣、亮度調整等篡改操作進行檢測。
在圖像防偽方面,數字水印技術是當前研究的熱點,并且在國內外的研究中取得了初步的進展。數字圖像篡改取證的研究近年來受到了世界上各國研究機構和研究者的重視,在許多國際重要期刊與國際會議上,圖像盲取證越來越多的成為一個重要專題,IEEE、Springer都為圖像盲取證設置了獨立的期刊,數字圖像取證科學的前沿性和重要性由此凸顯出來,一些圖像相關廠商也在其產品中增加關于圖像篡改取證的模塊,圖像處理工具大亨Adobe正準備在其招牌產品Photoshop中增加圖像防偽外掛程序,來進行圖像真偽和篡改的識別。
數字圖像真偽甄別涉及到圖像處理分析技術、數理統計、模式識別、數據挖掘、成像原理、計算機視覺等方面的知識,是一項比較復雜的系統工程。
成像的過程是將三維景物通過光學系統變換到二維平面上的過程,按照感光媒介不同可分為傳統成像系統和現代成像系統,其代表分別為化學膠片和CCD(或CMOS)。在成像的過程中,拍攝目標所包含的各種相關信息也被悉數記錄,在計算技術發達的今天,國內外研究者寄希望于將包含在圖像中的這些蛛絲馬跡加以綜合運用,以便獲取許多我們以前只有通過物理測量或人工識別才可以獲取的信息,這些應用在現代被歸類為機器視覺。
機器視覺主要通過將觀察對象進行數字化,根據人類的判別規則來對觀察目標進行判別,或者逆用成像原理來獲取觀察目標的物理數據,從而實現對數字化圖像信息進行自動化的識別,這些需要識別的信息主要包括被拍攝目標與相機之間的距離、目標運動速度、圖像中包含的文字乃至人物等等,對圖像中的這些信息進行精確識別一直都是機器視覺領域的研究重點和難點。在現代的生產生活中,機器視覺已經越來越多的被應用到實際,完成一些重復性和機械性的識別工作,以彌補人眼長時間連續進行機械性識別易產生疲勞和不穩定的不足,減輕人類的勞動強度,在一些智能機器人中,也置入了機器視覺模塊,以便判斷周圍環境,為高級人工智能程序提供輸入信息。
1987年,Pentland首先提出了圖像模糊程度與物體距離之間的關系,并將離焦圖像的點擴散函數近似為類高斯函數來進行計算。1988年,Subbarao和Gurumoorthy等人取消了對點擴散函數的限制,利用線擴散函數的擴散參數來代表物體與鏡頭之間的距離,只需點擴散函數具有圓對稱性就可以。1999年,Schechner和Kiryati采用靈敏分析的方法來使用圓柱形點擴散函數估計測距誤差和不同頻率成分的關系,使離焦測距算法在精度上有了更高的提升。
國內外也有許多學者根據圖像中運動模糊位移來測算物體的相對運動速度,Cannon等利用頻域中的零值條紋在理論上證明從勻速直線運動模糊圖像中估計運動方向和相對運動尺度的可行性,但并沒有給出自動鑒別的方法。
在三維重建方面,目前的主要做法是找到圖像的被動線索和主動線索,然后根據同一場景的多個角度的圖像來進行參數化建模。
基于圖像內容的檢索是計算機領域擁有戰略意義的新課題,由于其潛在應用價值極大,所以國內外對于這方面的研究都比較重視,從九十年代至今,已經有許多趨近成熟的系統問世。
國際商用公司(IBM)率先研發出第一個圖像內容檢索系統QBIC,其后麻省理工學院(MIT)也憑借其人才優勢研發出了PhotoBook圖像檢索系統。美國哥倫比亞大學也開發出了VisualSeek,這類系統主要針對如何選擇合適的全局特征來描述圖像中的內容。為了解決圖像內容檢索算法實用性比較差的問題,后來的研究者提出了Image Retrieval算法,各國科學家沿著這一方向又研發出了Netra、BlobWorld、SLMPLIcity等系統。
華裔科學家黃煦濤首先將相關反饋技術應用于圖像檢索,以減少機器低層特征與人類高層語義之間的差異,提高檢索結果的針對性。
在計算機模擬畫像方面,早期公安部組織研發了PZY-110型人像組合儀,不過未能在全國推廣普及。九十年代由公安部和清華大學開發的自動模擬畫像系統通過了專家鑒定。2001年中國刑警學院的趙成文教授的“警星CCK-Ⅲ人像模擬組合系統”開發成功,并達到了國際先進水平。
在顱骨面貌復原方面,我國的吉林大學和意大利都靈大學都采用了首先人工堆顱骨外觀修正,再對顱骨各個面的二維圖像進行采樣并建模。
加拿大哥倫比亞大學的Imager Lab采用參數化人臉模型的辦法來進行建模,Giuseppe等人采用CT切片的疊加來進行三維網格建模,取得了較好的復原效果。
數字圖像取證技術由于起步較晚,尚未形成系統的理論體系和研究模型。本文對圖像取證技術及其研究內容做了綜述,并總結了圖像取證技術五個方面當前的國內外研究方法與現狀。圖像取證技術是在當前硬件環境下發展起來的一個新興領域,它包括到圖像質量優化、圖像真偽鑒別、圖像間接信息提取、圖像內容智能檢索、基于信息構建圖像等方面,涉及到信號與信號處理、成像原理、計算機視覺、數學形態學、統計學乃至密碼學等領域,是人們從繁雜的圖像信息中搜索有價值線索的利器,是與現實生活息息相關的一個研究方向,對于司法取證、圖像信息智能過濾和提取、敏感圖像真偽鑒別等有很大應用價值,極具現實意義。
[1]劉國軍,唐降龍,黃劍華等.基于模糊小波的圖像對比度增強算法[J].電子學報,2005,33(4):643-646.
[2]A.C.Popescu and H.Farid.Exposing Digital Forgeries by Detecting Duplicated Image Regions[M].Technical Report,TR2004-515,Dartmouth College,Computer Science,2004.
[3]郭維新.由最佳散焦圖像序列測距[D].廣州:暨南大學,1990.
王勇亮(1987—),男,山東梁山人,碩士研究生,現供職于山東煙臺生產力促進中心,主要從事虛擬現實系統應用與研究。