董春麗,胡賢芬
(1. 中國民用航空飛行學院,四川 廣漢 618307;2.西南科技大學理學院,四川 綿陽 621010;)
在信息大爆炸時代,信息傳播速度非常快,數字視頻作為信息的載體之一,占據著互聯網總體流量的85%[1]。現實生活中,伴隨著視頻剪輯軟件的不斷更新,視頻剪輯成為一項很簡單的工作,甚至有些不法分子對視頻進行惡意篡改,使篡改后的視頻很難通過肉眼分辨出來,因此如何高效準確的對篡改后的視頻進行分辨已成為亟待解決的問題之一[2]。
視頻篡改主要分為時域和空域兩類篡改。時域上的篡改主要是對視頻整幀進行刪除或添加等操作;空域上的篡改主要是對幀圖像上的目標進行刪除或添加操作。根據數字視頻篡改的類型,需要采用不同的檢測方法[3-5]。由于視頻篡改檢測已成為研究的熱門,吸引了不少研究人員,因此一直有新的方法被提出來。文獻[6]通過時域TCS-LBP算子反映同一空間中當前視頻幀與前后若干視頻幀的像素位置關系,并計算出當前圖像的TCS-LBP特征值,利用特征圖像對視頻的每一幀都進行檢測,判斷該幀是否是復制幀,并定位出視頻篡改的邊界,實驗結果表明,該方法對視頻篡改的檢測性能良好。文獻[7]為了提高視頻匹配的準確率,在圖像提取的特征點引入顏色不變信息量,按照結構相似度將視頻分段處理,并對每段的關鍵幀進行提取,利用目標跟蹤方法計算篡改后視頻幀的位置,實驗結果表明,該方法魯棒性較好。文獻[8]通過對視頻時間與空間信息的計算,對視頻進行分組處理,結合SVM-RPE算法排序視頻幀的VQA特征,采用順序前向算法與Adaboost分類器對排序的特征進行融合,實驗結果表明,該方法大大提高了視頻篡改的檢測精度,但視頻分組策略需要進一步完善。
本文通過改進的三幀差法對圖像幀內篡改進行檢測,對時域上被篡改的可疑幀進行定位,并在空域上確定可疑幀的具體位置。針對幀間視頻篡改檢測采用直方圖相交法,將圖像幀篡改連接處的非連續性轉換為像素帶間的連續性,減小計算量。
幀內篡改是對視頻區域內部進行篡改,主要有目標移入和移除兩種篡改方法。為了提高視頻篡改檢測過程中的計算效率、降低視頻采集的數據量,采用具有靜止背景的視頻幀內篡改檢測方法,不僅能夠準確定位視頻幀內篡改位置,還能夠較好的確定時域上各種壓縮格式的視頻篡改可疑幀。
在視頻的時域定位上,對圖像的能量可疑度定義進行改進,使可疑度算法對圖像能量的識別更加靈敏。在視頻的空域定位上,采用改進的三幀差法對視頻幀內篡改進行定位。視頻幀內目標移除篡改檢測過程如圖1所示。

圖1 視頻幀內目標移除篡改檢測過程
本文主要將視頻篡改檢測分為時域上和空域上篡改定位兩部分。首先通過DCT求出檢測視頻圖像每一幀的能量譜,用頻域熵和低高頻比對能量的可疑度進行描述。然后在空域上利用改進的三幀差法求出圖像可疑幀的運動前景,定位圖像幀具體被篡改的位置。
數字視頻的成像受到設備原本噪聲和外部噪聲的干擾,導致圖像中存在噪聲,因此利用DCT的去噪能力,使圖像能量集中到系數上,實現圖像的降噪處理。DCT變換可以較好的描述圖像信號的相關特性,二維DCT的值用公式可表示為

(1)
且

(2)
其中,a和c的取值范圍為{0,1,…,M-1};b和d的取值范圍為{0,1,…,N-1}。
數字視頻圖像經過DCT處理后,能量主要集中在DCT系數矩陣的低頻部分。DCT系數矩陣中,若低頻系數越集中,那么重構的圖像與原始圖像越相似;若低頻系數越離散,那么重構的圖像與原始圖像越迥異。
數字視頻圖像中的信息較為抽象,采用熵對圖像的信息進行衡量。若圖像信息越集中且有規律,那么熵值越低;若圖像信息越離散且雜亂,那么熵值越高。通過熵值衡量圖像信息的公式可表示為

(3)
其中,Xsig表示信源;pi表示符號i對應的概率。圖像的頻域熵主要是表示圖像低頻聚集情況,那么圖像的頻域熵公式可表示為

(4)
其中,αi表示DTC系數矩陣的i個值。頻域熵越小,表明原始圖像的灰度值分布越平滑;頻域熵越大,表明原始圖像的邊緣與細節越多。為了進一步增大圖像頻域能量的差異,通過低、高頻能量比來描述圖像的能量,公式可表示為

(5)
其中,h表示DCT系數矩陣的低頻系數個數;m×n表示圖像大小。為了更好地表示圖像能量的連續性差異,對圖像頻域能量可疑度進行改進,公式為

(6)
能量可疑度越大,圖像所含的低頻成分越少。如果對圖像中的目標進行移除操作,會增加圖像的低頻成分,減小能量的可疑度,那么就可以及時的發現圖像被篡改了。
在數字視頻時域檢測過程中已經對篡改的可疑幀進行了定位,因此只需要在空域篡改檢測中定位可疑幀的具體位置即可。為了獲得圖像目標的輪廓信息、彌補二幀差法的不足,取圖像相鄰三幀,并將前后兩幀與該幀做差,將得到的差分二值圖像做與運算,求出公共部分,獲得更加精準的圖像目標輪廓信息。但由于圖像運動區域較為特殊,采用普通的三幀差法得到的結果存在噪聲干擾,且運動前景模糊,因此本文對三幀差法進行改進,對得到的差分二值圖先進行數學形態學處理,然后再做或運算。改進的三幀差法流程如圖2所示。

圖2 改進的三幀差法流程
就數字視頻圖像序列而言,對t時刻圖像幀及前后兩幀做三幀差分,公式為

(7)
其中,K(x,y,t)表示t時刻的圖像幀;K(x,y,t-1)和K(x,y,t+1)分別表示t-1時刻和t+1時刻的圖像幀;T表示二值化處理后的閾值大小。為了解決視頻圖像的背景重現問題,使處理后的圖像結果較為集中,同時擴大圖像的目標提取部分,采用或運算

(8)
對圖像進行形態學處理后,不僅保留了圖像的原本信息,還可以在一定程度上抑制噪聲。
視頻的幀間篡改主要是對圖像幀進行刪除、插入等操作,為了降低篡改計算的復雜度,提高篡改識別能力,基于幀間篡改方法的特點,提出直方圖相交法的幀間篡改檢測算法。視頻幀間篡改檢測過程如圖3所示。

圖3 視頻幀間篡改檢測過程
數字視頻的幀間篡改檢測主要是通過橫向/縱向對圖像的截取獲得像素線,并由相鄰的4個像素線組成像素帶;然后通過顏色直方圖計算出臨近像素帶間的關聯性。若視頻發生幀間篡改,那么像素帶間的關聯性也會隨之改變。
假設某段視頻圖像序列的視頻幀長度為Lfra、高度為Hfra、寬度為Wfra,對圖像序列的同一水平(縱向)位置的每幀像素進行提取,建立直角坐標系。以圖像第j幀的位置s處為始發點,沿水平(縱向)位置采集Wfra(Hfra)個像素點,按順時針方向拼接成水平像素線,生成的橫向像素線,公式為

(9)
其中,O[j]xoy表示直角坐標系。將采集的各幀像素線按順序拼接,形成橫向(縱向)像素帶,公式可表示為

(10)
進而將橫向(縱向)形成的像素帶用集合形式表示為

(11)
為了計算視頻圖像像素帶間的相似度,采用顏色直方圖。對于任意像素帶顏色分量的直方圖,公式可表示為

(12)
其中,r表示像素帶灰度值;mr表示像素帶灰度值為r時像素的數目;M表示像素的總個數。為了對橫向(縱向)像素帶的相似度進行衡量,可通過直方圖交互法實現,公式為

(13)
其中,N表示圖像灰度值可取的數量。進而,橫向像素帶相似度集合用公式可表示為

(14)
為了驗證融合幀內與幀間技術的數字視頻篡改檢測方法的有效性,選擇長度為266幀的視頻進行壓縮,圖像幀大小為320*240,在原始視頻的第148幀和第180幀中有運動物體經過,除此之外,其余幀為靜止幀。對原始視頻中的第171幀和第201幀的運動物體通過圖像修改軟件進行移除操作,使篡改后的視頻中只存在靜止背景。篡改后的圖像高低頻比值與頻域熵如圖4所示。

圖4 圖像高低頻比值與頻域熵測試結果
從圖中可以看出,原始視頻中的第171幀和第201幀運動物體移除后,為了對摳出的前景進行掩飾,修圖軟件會主動通過模糊操作將摳出的部分彌補成完整的背景圖片,這樣增加了篡改圖像的低頻成分,因此圖像的低高頻比值增大,頻域熵減小,這也正是圖像第179幀和第189幀出現極值的原因。通過仿真,對圖像幀內運動目標移除頻域可疑度分布進行了驗證,實驗結果如圖5所示。

圖5 圖像可疑度分布
從圖中可以看出,圖像的能量可疑度分布與頻域熵有一致的變化趨勢,這正是因為圖像第179幀和第189幀中運動目標被刪除后,被摳出的目標有大有小,總體上是中間區域摳出的較多,邊緣區域摳出的較少,對圖像進行補全時,中間區域的補全操作較多,模糊圓潤操作面積會更大,所以圖像第179幀和第189幀低頻分量呈現出凸形特征分布,頻域熵呈現出凹形特征分布。
對視頻幀間篡改技術進行檢測時,選擇長度為412幀、GOP為10、壓縮為H.264格式的視頻。在視頻的第158幀和第191幀中有物體A經過,在視頻的第378幀和第400幀中有物體B經過,其余為靜止背景。選擇橫向像素帶,通過仿真求出視頻2~184像素帶的相關度,仿真結果如圖6所示。

圖6 原始視頻像素帶相關度
從圖中可以看出,視頻的像素帶相關度呈現出周期大小為10的周期性分布,這正是因為視頻GOP大小為10所引起的。對原始視頻的第2~184像素帶進行篡改,通過仿真求出相關度,實驗結果如圖7所示。

圖7 篡改視頻像素帶相關度
從圖中可以看出,通過幀間的篡改技術,將原始視頻中的第99幀~128幀替換,連接處為第99幀,由于插入了30幀,原始視頻中第99幀~128幀恰巧是3個周期,但因圖像幀的插入破壞了連接處的像素帶相關度,使數據的周期性發生了改變,因此像素帶相關度的極小值為第95和第124個像素帶的序列上。
為了對被篡改的視頻進行檢測,提出融合幀內與幀間技術的數字視頻篡改檢測方法。該算法的核心是對時域上被篡改的可疑幀進行定位,再通過空域上定位出可疑幀的具體位置。利用幀間篡改方法的特點,利用直方圖相交法對視頻進行檢測。為了驗證本文方法的有效性,分別選擇長度為266幀和412幀的視頻進行壓縮,分別對原始視頻中的第171幀、第201幀的運動物體進行移除操作,對第99幀~128幀進行替換操作,實驗結果表明,本文方法可以準確定位出被篡改的視頻幀,具有顯著的有效性。