劉琚,孫建德
(山東大學(xué)信息科學(xué)與工程學(xué)院,山東濟(jì)南 250100)
獨(dú)立分量分析的圖像/視頻分析與應(yīng)用
劉琚,孫建德
(山東大學(xué)信息科學(xué)與工程學(xué)院,山東濟(jì)南 250100)
隨著通信和計(jì)算機(jī)技術(shù)的發(fā)展,圖像和視頻信息的應(yīng)用越來越多.圖像和視頻信息分析中的一個(gè)重要方法是獲得合適的特征來逼近人類視覺特性.獨(dú)立分量分析是一種新的無監(jiān)督訓(xùn)練方法,它可以在圖像和視頻的理解方面很好地與人類視覺相匹配.給出了不同的ICA圖像/視頻分析模型和基于這些模型的獨(dú)立特征,對(duì)多媒體ICA分析和數(shù)字小波分析方法進(jìn)行了對(duì)比,對(duì)于不同分析方法的計(jì)算機(jī)仿真給出了不同模型的獨(dú)立特征,并且給出了基于這些特征在圖像和視頻水印方案中的應(yīng)用.應(yīng)用實(shí)驗(yàn)的仿真結(jié)果表明,獨(dú)立特征對(duì)于圖像和視頻水印性能具有較好的改善作用.
獨(dú)立分量分析;特征提取;視頻分析;數(shù)字水印
隨著計(jì)算機(jī)和網(wǎng)絡(luò)技術(shù)的發(fā)展,多媒體技術(shù)得到了廣泛的應(yīng)用,近年來又出現(xiàn)了新媒體的概念.多媒體通常是指語音、圖像和視頻信息,新媒體則擴(kuò)展到圖形、文字、動(dòng)畫和虛擬場(chǎng)景等.然而,人們獲取信息的最主要來源仍然是圖像和視頻.人們從圖像/視頻可以得到直觀信息,但是只有對(duì)圖像/視頻進(jìn)行分析、變換后才可以獲得圖像/視頻中隱含的特征并進(jìn)行識(shí)別、分類、檢索和理解等應(yīng)用.
目前常用的圖像特征分析方法大多分為時(shí)/空域和變換域方法.時(shí)/空域中處理技術(shù)通常有時(shí)延、尺度變換、插值、采樣、旋轉(zhuǎn)、濾波等,而變換域方法最主要的就是傅里葉變換和小波變換等.變換域處理方法的中心思想是將信號(hào)分解成基信號(hào)的疊加,這些基信號(hào)可以表現(xiàn)出原始信號(hào)的特性,如頻率特性、時(shí)頻特性等.
傅里葉變換是將一個(gè)信號(hào)的時(shí)域表示形式映射到一個(gè)頻域表示形式,對(duì)一個(gè)信號(hào)做傅里葉變換,可以得到其頻域特性,包括幅度和相位2個(gè)方面.離散余弦變換(discrete cosine transform,DCT)是一種與傅里葉變換緊密相關(guān)的數(shù)學(xué)運(yùn)算.
信號(hào)通過傅里葉變換表現(xiàn)的是頻率特性,但是不同頻率的基信號(hào)出現(xiàn)的時(shí)間無法確定,因此出現(xiàn)了信號(hào)時(shí)頻分析工具——小波變換.對(duì)于數(shù)字信號(hào)的時(shí)頻特性分析主要采用的是離散小波變換(discrete wavelet transform,DWT).
離散小波變換是以相互正交的母小波為基函數(shù),是時(shí)間和頻率局域化的變換,因而能有效地從信號(hào)中提取時(shí)頻分布參數(shù).通過伸縮和平移等運(yùn)算可對(duì)信號(hào)進(jìn)行多尺度的細(xì)化分析,解決了傅里葉變換不能解決的許多問題,被認(rèn)為是時(shí)間-尺度分析和多分辨率分析的一種新技術(shù)[1].它在信號(hào)分析、語音合成、圖像識(shí)別、計(jì)算機(jī)視覺、數(shù)據(jù)壓縮、地震勘探、大氣與海洋波分析等方面都取得了具有科學(xué)意義和應(yīng)用價(jià)值的成果.
獨(dú)立分量分析(independent component analysis,ICA)是近年來在信號(hào)分析與處理中發(fā)展起來的一種新方法,它作為一種盲源分離技術(shù)(blind source separation,BSS),是信號(hào)處理領(lǐng)域的研究熱點(diǎn).ICA的實(shí)質(zhì)就是尋求一種線性變換,將一組隨機(jī)變量表示成一組統(tǒng)計(jì)意義上相互獨(dú)立的變量的線性組合[2],因此通過ICA提取的信號(hào)特征是相互獨(dú)立的.目前ICA已經(jīng)廣泛地應(yīng)用于特征提取、生理學(xué)數(shù)據(jù)分析、語音信號(hào)處理、圖像處理、人臉識(shí)別和數(shù)字水印等方面.
ICA作為一種信號(hào)處理技術(shù),其目的就是以統(tǒng)計(jì)獨(dú)立的變量的線性組合來表示一組隨機(jī)變量[2].ICA最有意義的2個(gè)應(yīng)用就是盲源分離和特征提取,而這2個(gè)方面和數(shù)字水印研究有著相通性和密切的聯(lián)系.
盲源分離是在源信號(hào)和傳輸通道參數(shù)未知的情況下,根據(jù)輸入源信號(hào)的統(tǒng)計(jì)特性,僅通過觀測(cè)信號(hào)就可以實(shí)時(shí)地恢復(fù)或提取源信號(hào).
ICA信號(hào)模型如式(1):

式中:x=[x1x2…xm]T是m維觀察信號(hào)矢量,s=[s1s2…sn]T是n維未知源信號(hào)矢量,A是未知的混疊矩陣,W是未知的分離矩陣.
ICA就是僅根據(jù)觀察信號(hào)x來估計(jì)源信號(hào)s,求解分離矩陣W,通過^s=Wx,得到s的估計(jì).已經(jīng)有許多成熟的ICA算法、如FastICA算法[3]由于其算法簡(jiǎn)單和良好性能而被廣泛應(yīng)用.
FastICA是一種快速的定點(diǎn)獨(dú)立分量分析算法.它首先對(duì)觀察信號(hào)利用主分量分析(principle component analysis,PCA)進(jìn)行預(yù)白化,將觀察信號(hào)x變換成z=Ux,使得z的分量具有單位方差且互不相關(guān),其中z的自相關(guān)矩陣是單位陣,U為白化陣.
FastICA利用峭度目標(biāo)函數(shù)作為分離準(zhǔn)則,分離矩陣的訓(xùn)練公式為

式中:k是迭代次數(shù),最終分離矩陣為W=VTU.
文獻(xiàn)[4]中,A.Hyvarinen將ICA用于圖像特征提取.
假設(shè)一個(gè)信號(hào)在某個(gè)采樣點(diǎn)x的信號(hào)值表示為I(x).信號(hào)處理中的許多基本模型將該信號(hào)I(x)表示為一系列的特征或基函數(shù)ai(x)的線性疊加的結(jié)果:

式中:si為隨機(jī)系數(shù),每一個(gè)信號(hào)I(x)對(duì)應(yīng)的Si是不相同的.由此簡(jiǎn)化為對(duì)于信號(hào)向量 x=[x1x2…xm]T,信號(hào)的表示為x=As.這種簡(jiǎn)潔的表示與基本的ICA模型完全相同.
圖1給出由特征基向量合成圖像的模型[4].

圖1 圖像合成模型Fig.1 Image mixture model
在ICA模型中,至少存在2個(gè)觀測(cè)信號(hào),而實(shí)際中需要處理的往往只有一幅圖像,因而,許多基于ICA的水印方案采用對(duì)原始圖像分塊的方式得到多個(gè)觀測(cè)信號(hào),把每個(gè)塊看作一個(gè)觀測(cè)信號(hào)來建立ICA模型.
對(duì)于圖像,通常是將圖像分成8×8或是16×16的像素塊,如圖2,并把這些塊作為ICA模型中的觀測(cè)信號(hào),再通過ICA得到源信號(hào).這樣得到的所謂源信號(hào)是相互獨(dú)立的,可以視為圖像的特征,因此這一過程稱作特征提取.
圖3是自然圖像采用基于分塊ICA提取出來的基向量[4].為了更好地表現(xiàn)特征,人們往往采用一些標(biāo)準(zhǔn)化手段.具體做法為:首先,將圖像進(jìn)行線性標(biāo)準(zhǔn)化,使得像素具有零均值、單位方差;然后.將圖像分成塊,再利用FastICA方法進(jìn)行處理;最后,得到ICA的向量基.A.Hyvarinen指出[4],這些基向量顯然在空間、頻率、方向這3個(gè)方面都具有局部性,而且這些特征與Gabor函數(shù)十分相似,同時(shí)也指出這些基向量與小波也有相似性.

圖2 分塊法Fig.2 Method of image blocking

圖3 利用分塊ICA提取出來的自然圖像基向量Fig.3 Basis vectors of natural images extracted by the method of blocking ICA
這些特征能被證明含有原始圖像的一些方向邊緣,因此被用作圖像重構(gòu)的基[5].此外,Hateren證明了這些特征與人類視覺獲得的特征是相似的,并且在視頻中的相應(yīng)實(shí)驗(yàn)中也得到了相似的結(jié)論[6].
基于分塊的ICA模型,在圖像分塊之后,各個(gè)塊和原圖像都失去了相似性,提取出來的特征并不能很好地反映圖像的整體特性.
采樣法是一種十分常用的信號(hào)處理方法,可以根據(jù)不同的采樣因子或者采樣間隔將信號(hào)分解成相似的信號(hào).用采樣法抽取則可以使得到的圖像與原始圖像相似.當(dāng)采樣因子為2時(shí),原圖像可以被分解為4個(gè)相似的子圖.
假設(shè)原始圖像大小為n×m,通過采樣因子為2的下采樣(如圖4)后,得到4個(gè)子圖,如式(2)表示為:

式中:I為原始圖像,i=1,2,…,n/2,j=1,2,…m/2.
圖4中由A組成的子圖為原始圖像通過抽取奇行、奇列得到;由B組成的子圖是由原始圖像通過抽取奇行、偶列得到;由C組成的子圖為原始圖像通過抽取偶行、奇列得到;由D組成的子圖是由原始圖像通過抽取偶行、偶列得到.圖5是將原始標(biāo)準(zhǔn)peppers圖像經(jīng)過上述采樣方法得到的分解結(jié)果.

圖4 原始圖像以及經(jīng)下采樣得到的4個(gè)子圖Fig.4 Original image and the four sub-images obtained by downsampling

圖5 原始peppers圖像以及經(jīng)下采樣得到4個(gè)子圖Fig.5 Original standard image“peppers”and the four sub-images obtained by downsampling
將上述采樣方法分解得到的4個(gè)子圖作為觀測(cè)信號(hào)進(jìn)行ICA處理,就可以得到相應(yīng)的特征.
為了后面便于跟小波變換對(duì)比,把下采樣與ICA相結(jié)合處理信號(hào)的整個(gè)過程稱為ICA變換(ICA transform,ICAT)[7].通過 ICAT 得到的4 個(gè)特征圖像(feature image,F(xiàn)I),可以用子帶的方式表示,如圖6.

圖6 ICAT提取的4個(gè)特征分量Fig.6 Four feature images obtained by ICAT
圖6 中,F(xiàn)I1,F(xiàn)I2,F(xiàn)I3,F(xiàn)I4就是原始圖像經(jīng) ICAT獲得的特征.根據(jù)ICA理論,這4個(gè)特征不但不相關(guān),而且相互獨(dú)立.不難發(fā)現(xiàn),這個(gè)分析結(jié)果與圖像經(jīng)小波理論多尺度分析得到的結(jié)果(即圖8(b))很相似.因此,將FI4稱為原始圖像的概貌分量,F(xiàn)I1,F(xiàn)I2,F(xiàn)I3被稱為細(xì)節(jié)分量.
在小波分析理論中,信號(hào)二層、三層乃至高層的分析方法,在實(shí)際應(yīng)用中被廣泛地應(yīng)用.因此,研究二層、高層的ICAT分解方法具有一定意義.
基于采樣和ICA的特征分析方法二層分解模型有2種.第1種是與小波分析方法類似,將一層ICAT分解得到的各個(gè)分量繼續(xù)進(jìn)行一次ICAT處理.另一種方法是將圖像經(jīng)過采樣因子為4的采樣提取出16個(gè)子圖,然后對(duì)這16個(gè)圖像進(jìn)行ICA處理,這個(gè)過程被稱為基于采樣因子為4的ICAT.在這里只以第1種方法為例進(jìn)行說明,分解原理圖如圖7所示.

圖7 第1種2層ICAT分解原理Fig.7 The framework of the first type of 2-order ICAT
第1種方法與常用的小波多尺度分析方法相類似,將它與離散小波變換進(jìn)行分析結(jié)果對(duì)比.標(biāo)準(zhǔn)圖像peppers通過第1種二層ICAT方法處理的結(jié)果如圖8(a),其中16個(gè)分量中存在著概貌分量(最后一個(gè)分量)及細(xì)節(jié)分量(其余15個(gè)分量).圖8(b)是peppers圖像通過二層2D-DWT處理得到的結(jié)果,其中母小波采用的是 Daubechies-4 小波[8-9].


圖8 ICAT與DWT的分析結(jié)果對(duì)比Fig.8 Comparison between ICAT and DWT
小波多尺度分析中,圖像分解得到概貌分量表示的是原始圖像的低頻子帶,是原始圖像能量最集中的部分,體現(xiàn)了原始圖像中的主要信息.因此,本文把概貌部分的能量統(tǒng)計(jì)特性作為概貌分量的一個(gè)準(zhǔn)則來衡量相應(yīng)的變換方法的優(yōu)劣.
本文將概貌分量進(jìn)行二維離散余弦變換(2DDCT),對(duì)得到的離散余弦系數(shù)進(jìn)行zigzag掃描,得到的DCT系數(shù)按從低頻到高頻依次排列.除第1個(gè)DCT系數(shù)(直流系數(shù))外,再按照從低頻到高頻的順序統(tǒng)計(jì)交流系數(shù)能量分別占整個(gè)交流系數(shù)總能量95%、90%的個(gè)數(shù).如果這個(gè)數(shù)目在總的交流系統(tǒng)中所占的比例越小,則表明對(duì)應(yīng)變換的能量集中特性更好.
實(shí)驗(yàn)中采用標(biāo)準(zhǔn)peppers圖像,圖像大小為512×512,離散小波變換采用的母小波為Daubechies-4小波.分別對(duì)一層、二層小波分析和ICAT分解得到的概貌分量進(jìn)行上述的DCT系數(shù)統(tǒng)計(jì)分析.
1)一層分解結(jié)果.在DWT得到的概貌分量(由于采用 Daubechies-4小波,概貌分量像素大小為259×259)的交流(AC)系數(shù)當(dāng)中,按從低頻到高頻的順序,前5 627個(gè)低頻交流系數(shù)的能量占據(jù)了整個(gè)交流系數(shù)總能量的95%,這些系數(shù)占據(jù)整個(gè)交流系數(shù)的8.39%;而ICAT概貌分量(像素大小為256×256)的統(tǒng)計(jì)數(shù)量為3 451個(gè),占據(jù)整個(gè)交流系數(shù)的5.27%,僅僅是DWT結(jié)果的61%.這說明,按從低頻到高頻順序統(tǒng)計(jì),ICAT概貌分量中的前3 451個(gè)交流系數(shù)恢復(fù)的圖像可以得到用小波概貌分量前5 627個(gè)交流系數(shù)恢復(fù)圖像的質(zhì)量.這意味著一層ICAT分解提取的概貌分量能量較DWT更加集中.
2)二層分解統(tǒng)計(jì)結(jié)果.二層DWT得到的概貌分量,其像素大小為69×69,它的交流(AC)系數(shù)當(dāng)中,按從低頻到高頻的順序,前1 673個(gè)交流系數(shù)的能量占據(jù)了整個(gè)交流系數(shù)總能量的95%,這些系數(shù)占據(jù)整個(gè)交流系數(shù)的35.14%.另外,前962個(gè)交流系數(shù)的能量占據(jù)了整個(gè)交流系數(shù)總能量的90%,這些系數(shù)占據(jù)整個(gè)交流系數(shù)的19.61%.采樣因子為2的二重ICA方法得到的概貌分量,其像素大小為64×64,它的交流(AC)系數(shù)當(dāng)中,按從低頻到高頻的順序,前1 296個(gè)低頻交流系數(shù)的能量占據(jù)了整個(gè)交流系數(shù)總能量的95%,這些系數(shù)占據(jù)整個(gè)交流系數(shù)的31.64%;前650個(gè)低頻交流系數(shù)的能量占據(jù)了整個(gè)交流系數(shù)總能量的90%,這些系數(shù)占據(jù)整個(gè)交流系數(shù)的15.87%.這意味著基于下采樣的二層ICAT分解方法提取的概貌分量與二階離散小波變換提取的概貌分量相比,能量更加集中.
ICAT和DWT概貌分量能量統(tǒng)計(jì)的結(jié)果說明ICAT提取的概貌分量能量與DWT提取的概貌分量相比,能量更加集中.也就是說,可以用相對(duì)較少的DCT系數(shù)恢復(fù)出同樣質(zhì)量的圖像.這說明,ICAT方法的稀疏性要強(qiáng)于DWT,即可以用較少的數(shù)據(jù)恢復(fù)相同質(zhì)量的圖像.眾所周知,DWT能去除數(shù)據(jù)的相關(guān)性以達(dá)到減少數(shù)據(jù)的冗余的目的[10]而被應(yīng)用于數(shù)據(jù)壓縮,并已經(jīng)作為JPEG2000壓縮標(biāo)準(zhǔn)的理論基礎(chǔ).ICA獲得的分量不僅不相關(guān)而且是統(tǒng)計(jì)獨(dú)立的,這能在更大程度上減少數(shù)據(jù)冗余.上述實(shí)驗(yàn)也都證明了這一點(diǎn).因此利用ICAT壓縮圖像時(shí),壓縮性能可能會(huì)優(yōu)于DWT.
類似于圖像的ICA分析,視頻的ICA分析也有不同的模型,因此,基于ICA的視頻分析可以產(chǎn)生不同的獨(dú)立視頻特征.
將1.3節(jié)中基于圖像分塊的ICA特征表示[11]向視頻擴(kuò)展,首先將視頻進(jìn)行時(shí)間上的分段,然后將分段視頻在空間上分塊,把視頻分為三維塊,以這些三維塊作為ICA模型中的觀測(cè)分量進(jìn)行ICA分解,所得到的獨(dú)立塊特征就是基于ICA的視頻獨(dú)立塊特征的表示.文獻(xiàn)[10]通過實(shí)驗(yàn)證明這些獨(dú)立塊特征與人類感知視覺中大腦皮層細(xì)胞所呈現(xiàn)的濾波器非常類似.圖9是視頻獨(dú)立塊特征的提取框架.
在進(jìn)行三維塊特征提取時(shí),首先要將視頻進(jìn)行時(shí)間上的分段,即要確定視頻塊在時(shí)間上的跨度,然后才在空間上分塊.視頻在進(jìn)行MPEG壓縮時(shí),通常按照GOP(group of picture,GOP)結(jié)構(gòu)來對(duì)視頻幀分類進(jìn)行不同的壓縮處理,一般GOP中包括3類幀[12]:I幀、P幀和B幀.視頻壓縮中最常用的一種GOP結(jié)構(gòu)如圖10所示.

圖9 視頻獨(dú)立塊特征的提取框架Fig.9 Framework of the independent block-based video feature extraction

圖10 視頻GOP中幀的典型結(jié)構(gòu)Fig.10 The structure of GOP
按照視頻中這種GOP的結(jié)構(gòu)來對(duì)視頻在時(shí)間上進(jìn)行分段.分段后,再按照?qǐng)D9中描述的過程進(jìn)行視頻特征的提取,這樣獲得的特征被稱為視頻獨(dú)立塊特征(video independent block feature,VIBF).這個(gè)過程中的視頻塊特征本身也是視頻的形式,稱其中的視頻幀為切片,以便和原視頻中的幀進(jìn)行區(qū)別.
基于獨(dú)立塊特征的表示方法能夠很好地表示一段視頻,然而這種獨(dú)立塊特征的含義并不非常明確.視頻是時(shí)間軸上有序排列的連續(xù)圖像序列,這些連續(xù)圖像之間存在大量相似的背景信息,幀與幀之間的區(qū)別主要是通過相對(duì)運(yùn)動(dòng)信息來表征的.這些背景信息和相對(duì)運(yùn)動(dòng)信息在統(tǒng)計(jì)上是相互獨(dú)立的,可以通過ICA技術(shù)從相鄰的幀圖像中分別提取出來.由此就產(chǎn)生了基于連續(xù)幀動(dòng)態(tài)分量的第2種視頻的表示方法.
假設(shè)視頻中某連續(xù)的2幀圖像分別為xF(i)和xF(i-1),它們的背景信息 sF(i-1)稱為靜態(tài)分量,它們之間的相對(duì)運(yùn)動(dòng)信息sMF(i)稱為運(yùn)動(dòng)分量.xF(i)和xF(i-1)可以看做是 sF(i-1)和 sF(i)線性疊加的結(jié)果:

式 中:xF(i)、xF(i-1)、sF(i-1)、分 別 是 xF(i)、xF(i-1)、sF(i-1)、的行向量形式.因此,ICA 可以用來分離視頻中相鄰2幀之間的靜態(tài)分量信息和運(yùn)動(dòng)分量信息.圖11是利用FastICA對(duì)一段視頻中相鄰2幀進(jìn)行分解的結(jié)果.

圖11 ICA分解兩相鄰視頻幀得到的結(jié)果Fig.11 ICA analysis on two consecutive frames
文獻(xiàn)[13]證明邊緣是圖像的獨(dú)立成分,而由動(dòng)態(tài)分量圖可以看出,視頻幀中物體的運(yùn)動(dòng)軌跡就是通過邊緣體現(xiàn)出來的.邊緣突出的地方表明發(fā)生了劇烈的運(yùn)動(dòng),邊緣模糊的地方只發(fā)生輕微的運(yùn)動(dòng),沒有邊緣的地方即沒有相對(duì)運(yùn)動(dòng),這一結(jié)果反映了視頻幀的相對(duì)運(yùn)動(dòng)分量,有效地描述了視頻的運(yùn)動(dòng)過程,而提取過程避免了傳統(tǒng)運(yùn)動(dòng)估計(jì)方法中重復(fù)性的塊操作,減少了計(jì)算量.
同時(shí),利用幀差法得到的幀間相對(duì)運(yùn)動(dòng)信息與其使用的參考幀有關(guān),即幀間相對(duì)運(yùn)動(dòng)信息與靜止的背景信息之間存在相關(guān)性.因此,雖然幀差法算法簡(jiǎn)單,可以較快地提取視頻幀間相對(duì)運(yùn)動(dòng)信息,但提取的運(yùn)動(dòng)信息并不是真正意義上的幀間相對(duì)運(yùn)動(dòng)信息,在應(yīng)用中魯棒性較弱.而使用ICA提取的幀間相對(duì)運(yùn)動(dòng)信息是惟一的,與靜止的背景信息是相互獨(dú)立的,可以很好地表示視頻相鄰2幀之間發(fā)生的運(yùn)動(dòng)情況,并且在應(yīng)用中具有較強(qiáng)的魯棒性.
連續(xù)幀動(dòng)態(tài)分量的表示方法能夠很好地體現(xiàn)出視頻中的運(yùn)動(dòng)成分,但是這種成分是由視頻的連續(xù)幀獲得的,表示的只是特定時(shí)間點(diǎn)上的運(yùn)動(dòng)信息,無法反映視頻的整體信息.與此同時(shí),人們發(fā)現(xiàn)視頻中同一個(gè)視頻場(chǎng)景中運(yùn)動(dòng)的對(duì)象、時(shí)序等不發(fā)生變化,由此提出基于獨(dú)立內(nèi)容特征的視頻表示方法.
基于獨(dú)立內(nèi)容特征的視頻表示方法首先要將視頻進(jìn)行鏡頭分割,即根據(jù)場(chǎng)景將視頻按內(nèi)容在時(shí)間上劃分成段,在每段中利用主獨(dú)立分量分析(principal independent component analysis,PICA)提取出基于這段視頻的內(nèi)容特征——視頻獨(dú)立內(nèi)容特征(video independent content feature,VICF).
2.3.1 鏡頭分割
視頻鏡頭分割,又稱為視頻時(shí)間上的分割,是視頻處理中一個(gè)重要的研究方向.視頻分割就是按照?qǐng)鼍皟?nèi)容的變化將視頻在時(shí)間上分成不同的段.鏡頭分割的方法主要有:基于像素的、基于塊的、基于直方圖的方法等[14].
2.3.2 視頻獨(dú)立內(nèi)容特征(VICF)
1)主獨(dú)立分量分析.
一般地,在進(jìn)行ICA分解前,先將觀察信號(hào)利用主分量分析(PCA)進(jìn)行預(yù)白化.若在白化過程中,只選擇觀察信號(hào)的協(xié)方差矩陣中主要特征值所對(duì)應(yīng)的特征向量來構(gòu)造白化陣,就可以實(shí)現(xiàn)降維,并在后面的ICA中達(dá)到對(duì)主要獨(dú)立分量的優(yōu)化估計(jì),這個(gè)過程被稱為主獨(dú)立分量分析.主獨(dú)立分量分析和一般獨(dú)立分量分析的不同就在于白化時(shí)是否進(jìn)行降維.鏡頭中的VICF就是通過主獨(dú)立分量分析提取的.
2)視頻獨(dú)立內(nèi)容特征(VICF).
將同一個(gè)鏡頭內(nèi)視頻幀作為ICA模型中的觀察信號(hào)進(jìn)行PICA分解,就可以得到基于視頻內(nèi)容的獨(dú)立特征VICF.



圖12 手彈鋼琴視頻中的幀F(xiàn)ig.12 Frames in the video of fingers playing piano
圖13是用FastICA對(duì)這段視頻進(jìn)行主獨(dú)立分量分析的結(jié)果,在進(jìn)行PCA預(yù)白化時(shí),維數(shù)降至6,b1-b6是得到的 6 個(gè) VICF;p1-p6為 PCA 白化后得到的6個(gè)主特征分量的幀形式.圖13(a)~(f)是PI-CA提取出來的VICF.其中(a)~(e)中灰度顯著的地方顯示了彈下的鋼琴鍵,b1~b5分量分別對(duì)應(yīng)第4鍵、第2鍵、第1鍵、第3鍵和第5鍵.VICF是從同一內(nèi)容的視頻幀中提取出來的特征幀,是視頻內(nèi)容的本質(zhì)特征,對(duì)視頻中的各種處理有很強(qiáng)的魯棒性.

圖13 PICA分解得到的獨(dú)立分量幀F(xiàn)ig.13 Principal independent content feature frames obtained by PICA
數(shù)字水印技術(shù)是一種將特制的、不可見的標(biāo)記隱藏在數(shù)字圖像、聲音、視頻等數(shù)字內(nèi)容中,由此可以確定版權(quán)擁有者,認(rèn)證數(shù)字內(nèi)容來源的真實(shí)性等.數(shù)字水印系統(tǒng)通常包含2個(gè)部分:水印信息的嵌入和水印信息的提取或檢測(cè),一般要求水印具有不可見性、魯棒性和較大的信息容量[17-21].水印嵌入和檢測(cè)模型如圖14所示.

圖14 水印嵌入和檢測(cè)模型Fig.14 Models of watermark embedding and detection
可以看出,ICA的混疊/分離模型與水印的嵌入/提取在某種程度上是相通的.因此,將ICA與水印技術(shù)結(jié)合,就可以得到基于ICA的圖像/視頻水印方案.下面分別給出基于混疊圖像盲分離的圖像水印檢測(cè)方案.
方案利用ICA的混疊/分離模型,在時(shí)空域中將水印圖像直接疊加到載體圖像上.在水印嵌入時(shí),將水印圖像作為一個(gè)弱信號(hào)嵌入到載體圖像中,得到的嵌入水印的圖像就是載體圖像和水印圖像的混疊;在水印檢測(cè)時(shí),從待檢測(cè)的載體圖像中提取出水印圖像,通過與原始水印圖像的比較來判斷待檢測(cè)的載體圖像中是否嵌入水印.水印嵌入及提取的方案框圖如圖15所示[17].

圖15 空域中嵌入及提取水印的方案Fig.15 Framework of watermarking embedding and extraction in spatial domain
1)水印的嵌入和提取.
選擇2幅尺寸相同的圖像分別作為載體圖像I和水印圖像w,將其看作ICA模型的2個(gè)源信號(hào).水印的嵌入過程用公式表示如下:



為了滿足水印不可見性的要求,Am中|a11|?|a12|,并且可以通過調(diào)節(jié)它們2個(gè)的比例關(guān)系來調(diào)節(jié)水印的不可見程度,其中a21、a22均不為零.
檢測(cè)水印時(shí),可以將混疊矩陣和密鑰矩陣聯(lián)合起來通過水印嵌入過程的逆過程分離出水印信息;然而這種檢測(cè)方法對(duì)于混疊矩陣的保密性不好,并且由于水印檢測(cè)的病態(tài)性,這樣的檢測(cè)方法會(huì)使水印的魯棒性變差.因此,這里采用ICA算法進(jìn)行水印的分離,獲得到分離矩陣Wm后,利用式(1)進(jìn)行分離和提取水印.如果待檢測(cè)的水印圖像為I'w,則提取過程的公式表示如下:

式中:x'Iw為待測(cè)水印圖像I'w的行向量形式,s'w為提取出來的水印圖像w'的行向量形式,行向量s'I為一個(gè)與原始載體圖像類似的圖像I'的向量形式.Wm為提取水印時(shí)的分離矩陣.
2)仿真實(shí)驗(yàn)


圖16 混疊后得到的圖像Fig.16 Two mixture images
對(duì)加水印的圖像進(jìn)行不同的攻擊處理,然后對(duì)加水印的圖像進(jìn)行攻擊,并從攻擊后的圖像中提取水印.圖17(a)、(b)是經(jīng)過JPEG壓縮后的圖像以及從中提取出來的水印.圖18(a)、(b)是中值濾波處理后的圖像以及從中提取出來的水印.

圖17 JPEG壓縮后的圖像及提取出的水印Fig.17 Watermarked image with JPEG compression and the watermark extracted from it
從仿真結(jié)果可以看出,空域中基于ICA疊加/提取的數(shù)字水印方案,其優(yōu)點(diǎn)是嵌入水印信息的量比較大,且對(duì)于一些比較猛烈的攻擊,在密鑰圖像的輔助下,具有良好的魯棒性.
其他文獻(xiàn)中將這種思想在不同變換域或者不同分量上進(jìn)行了應(yīng)用.文獻(xiàn)[28]中將原始圖像和數(shù)字水印進(jìn)行相同的ICA分解后,在原始圖像分解后的系數(shù)上疊加水印分解后的系數(shù),從而完成水印的嵌入;文獻(xiàn)[29-30]中將圖像先進(jìn)行小波變換或者Ridgelet變換,在變換的系數(shù)上通過水印的混疊來完成嵌入,提取時(shí),在變換域上通過ICA分解來提取出混疊的水印;文獻(xiàn)[31]將圖像的RGB 3個(gè)分量作為3個(gè)混疊圖像進(jìn)行ICA分解,在得到的特征上進(jìn)行水印的嵌入和提取.這些方法在一定場(chǎng)合下都得到了很好的結(jié)果.

圖18 中值濾波后的圖像及提取出的水印Fig.18 Watermarked image with median filtering and the watermark extracted from it
“拷貝攻擊”是水印攻擊中容易引起版權(quán)混淆和糾紛的一種攻擊.為了對(duì)抗“拷貝攻擊”,往往需要在嵌入水印的同時(shí),嵌入表征圖像的簽名信息.針對(duì)于這種嵌入水印時(shí)有原始圖像、水印圖像和簽名圖像3個(gè)圖像信息,而提取時(shí)則只有待檢測(cè)圖像和密鑰圖像2個(gè)信息的情況,文獻(xiàn)[19]介紹了一種解決方法.這種方法將原始圖像的簽名連同水印信息一同嵌入到原始圖像中;在接收端,將待檢測(cè)圖像和密鑰圖像作為2個(gè)觀測(cè)信號(hào),通過在提取/檢測(cè)過程中多次采用ICA分解,并結(jié)合源信號(hào)的一定先驗(yàn)知識(shí),實(shí)現(xiàn)從2個(gè)觀測(cè)信號(hào)中分離出原始圖像、原始圖像的簽名以及水印信息.
1)水印的嵌入和提取.
嵌入水印時(shí),首先將原始圖像進(jìn)行多層小波分解,并將其逼近子圖作為源信號(hào)s1,水印和原始圖像的IS分別作為源信號(hào)s2和s3.然后將s1、s2和s3表示成行向量形式,利用ICA混疊模型x=As進(jìn)行混疊實(shí)現(xiàn)水印的嵌入.在這里,為了降低密鑰管理的復(fù)雜度,簡(jiǎn)化水印應(yīng)用過程,隨機(jī)產(chǎn)生一個(gè)2×3維的矩陣A=(aij)2×3作為混疊矩陣,即有如下嵌入模型:

最后選取x1作為嵌入水印和IS的小波逼近子圖,x2為私鑰陣.對(duì)x1進(jìn)行小波反變換,就完成了整個(gè)嵌入過程.為了滿足水印的不可見性要求,混疊矩陣 A 中應(yīng)滿足a12,a13?a11(a12+a13≈0.1a11).如果密鑰陣x2中含有水印信息,則在提取/檢測(cè)階段,對(duì)于不含水印的圖像,仍然能夠?qū)⑺√崛〕鰜恚@是由于不管源信號(hào)如何混疊,ICA方法都可以僅通過觀測(cè)信號(hào)來恢復(fù)或提取源信號(hào),因此為了降低虛警率,a22取值應(yīng)為零.a22=0使得密鑰陣中含有IS信息而不含水印信息,這使得在提取/檢測(cè)時(shí),s3將獲得比s2更高的魯棒性,因此使a12>a13從而進(jìn)一步提高水印的魯棒性.
提取/檢測(cè)水印時(shí),首先將嵌入水印的圖像的小波逼近子圖和私鑰矩陣用行向量表示,并分別看作是2個(gè)觀測(cè)信號(hào)x1和x2,利用ICA分離訓(xùn)練公式得到分離矩陣w1∈R2×2,對(duì)x1和x2進(jìn)行ICA運(yùn)算,得到分離信號(hào)y1和y2,即

從式(3)可以看出,本質(zhì)上y1和y2也是源信號(hào)s1、s2和s3的線性組合.其次,將y2作為一個(gè)觀測(cè)信號(hào)x3,將^s3作為另一個(gè)觀測(cè)信號(hào)x4,對(duì)x3和x4進(jìn)行ICA運(yùn)算,用矩陣W2∈R2×2進(jìn)行分離,得到水印s2和簽名s3:

2)仿真實(shí)驗(yàn)及結(jié)論.

表1給出了在幾種常規(guī)攻擊下提取的水印與原水印之間的NC值,各類攻擊分別為:1)均值為0.1,方差為0.001 5的高斯噪聲攻擊;2)3×3中值濾波;3)剪切掉“Lena”圖像的眼睛部分;4)JEPG壓縮,其中壓縮比率為16.624;5)尺度變換,即采用“Bilinear”方法先將圖像擴(kuò)大為原圖像的2倍,再縮為原圖像大小.從表1中可以看出,此水印算法具有較好的魯棒性,所測(cè)NC值均高于給定的閾值0.85.

表1 常規(guī)攻擊下提取的水印與原水印NC值比較Table 1 NC comparison between the original and extracted watermarks under usual attacks

圖19 水印嵌入前后圖像及水印Fig.19 Images with and without watermark and watermark
視頻水印技術(shù)利用視頻數(shù)據(jù)中存在的時(shí)間冗余和空間冗余,把表征版權(quán)的水印信息嵌入到數(shù)字視頻內(nèi)容中,在不影響視頻質(zhì)量的前提下,達(dá)到版權(quán)保護(hù)和內(nèi)容完整性檢驗(yàn)的目的.
與圖像水印技術(shù)相比,視頻水印具有自身固有的一些特征,視頻水印算法還有一些特殊的要求,如視頻具有更大的信號(hào)空間,因而具有更大的隱藏信息容量;但易受剪切、幀頻改變、幀重組、掉幀等一些特有的攻擊的影響.
不管視頻經(jīng)過什么樣的處理,惟一保持不變的是視頻內(nèi)容,因而視頻內(nèi)容對(duì)各種處理魯棒性最強(qiáng).
利用2.3節(jié)中描述的視頻獨(dú)立內(nèi)容特征分析,提出一種基于ICA和獨(dú)立視頻內(nèi)容特征的視頻水印方案[22].先將視頻通過鏡頭分割在時(shí)間上分段,再對(duì)每個(gè)段進(jìn)行ICA分解,將得到的獨(dú)立分量幀看作圖像,采用現(xiàn)有的圖像水印方法,在每個(gè)段分解得到的主獨(dú)立分量幀上嵌入水印.由于視頻中的主獨(dú)立分量幀對(duì)于各種視頻處理有很好的魯棒性,因此在嵌入水印時(shí)只要采用盲圖像水印方案就可以達(dá)到視頻水印的盲檢測(cè).這里采用了基于量化思想的SWE(single watermark embedding)方案[23].
在水印提取時(shí),先提取待檢測(cè)視頻的主獨(dú)立分量幀,再?gòu)拿總€(gè)主獨(dú)立分量幀中檢測(cè)水印.
仿真實(shí)驗(yàn)中選用一段73幀的廣告作為實(shí)驗(yàn)視頻,視頻中有3個(gè)鏡頭,幀率為25幀/s,幀大小為272×352.水印是有山東大學(xué)字樣的二值圖像,大小為32×32.
在每個(gè)提取出來的VICF上都嵌入相同的水印,并且進(jìn)行下面的10個(gè)攻擊實(shí)驗(yàn),基于幀的攻擊:1)3×3中值濾波,2)幀尺寸縮小2倍,3)幀旋轉(zhuǎn)0.5°,4)密度為0.02 的椒鹽噪聲,5)均值為0,方差為0.001的高斯噪聲;基于視頻的攻擊:6)各視頻段內(nèi)部的幀交換,每5幀中任選2相鄰幀進(jìn)行交換,7)幀丟失,每6幀中任意丟失一幀,8)幀率從25~30幀/s,持續(xù)時(shí)間不變,幀數(shù)從73增為85,9)幀率從25~24幀/s,持續(xù)時(shí)間不變,幀數(shù)從73減為69,10)各視頻段內(nèi)部的共謀攻擊.這些實(shí)驗(yàn)都是在視頻經(jīng)過了MPEG2壓縮后進(jìn)行的.這里沒有選用幀數(shù)不變而持續(xù)時(shí)間變化的幀率變化,是因?yàn)檫@種幀率變化對(duì)于視頻幀沒有任何的影響,和沒有幀率變化的情況下進(jìn)行提取是相同的.圖20(a)~(j)分別對(duì)應(yīng)(a)~(j)攻擊后提取出來的水印.1)~10)每個(gè)子圖中的3個(gè)水印,從左向右分別對(duì)應(yīng)每種攻擊后從第1、2、3段中提取出來的水印.圖20(k)是原始水印.

圖20 各種攻擊下視頻各鏡頭中提取的水印Fig.20 Watermarks extracted from different video shots under various attacks
實(shí)驗(yàn)結(jié)果表明,這種方案對(duì)于常見的基于幀的攻擊,如中值濾波、尺度伸縮、椒鹽噪聲、高斯噪聲等有很好的魯棒性;對(duì)于常見的基于視頻的攻擊,如MPEG2壓縮、幀交換、幀丟失、幀率變化、共謀攻擊等也有很好的魯棒性.對(duì)于空間上不同步的攻擊(如旋轉(zhuǎn)),有一定的魯棒性;而對(duì)于時(shí)間不同步的攻擊(如幀交換、幀丟失、幀率變化),有很好的魯棒性.
2.2節(jié)介紹了利用ICA從視頻相鄰2幀中提取包含相對(duì)運(yùn)動(dòng)信息的運(yùn)動(dòng)分量幀,考慮人眼對(duì)運(yùn)動(dòng)區(qū)域及其鄰近區(qū)域的變化敏感性相對(duì)較低的視覺特性,通過運(yùn)動(dòng)區(qū)域的定位,將水印嵌入原始視頻幀的運(yùn)動(dòng)區(qū)域內(nèi)[24],且采用基于視覺模型的QIM算法,在保證水印不可見的前提下,使水印對(duì)高斯白噪聲、MPEG-2壓縮、幀刪除和幀剪裁等攻擊具有較高的魯棒性.
由于人眼對(duì)紋理細(xì)節(jié)和邊緣分布豐富的運(yùn)動(dòng)區(qū)域及其鄰近區(qū)域的變化敏感性相對(duì)較低,利用ICA提取運(yùn)動(dòng)分量信息,并根據(jù)此定位視頻幀中運(yùn)動(dòng)最為劇烈的部分作為水印嵌入的區(qū)域.首先,通過ICA分析得到2幀共有的靜態(tài)分量和相對(duì)運(yùn)動(dòng)分量.通過定位運(yùn)動(dòng)分量幀中紋理顯著的區(qū)域,可以實(shí)現(xiàn)對(duì)原始視頻幀中運(yùn)動(dòng)區(qū)域的定位.
圖21描述了運(yùn)動(dòng)區(qū)域定位過程.首先,用16×16的宏塊對(duì)運(yùn)動(dòng)信息幀進(jìn)行初步的運(yùn)動(dòng)區(qū)域定位.文獻(xiàn)[24]中用宏塊中各互不重疊的8×8小塊的方差和作為衡量運(yùn)動(dòng)劇烈程度的標(biāo)準(zhǔn),即認(rèn)為方差和大的宏塊運(yùn)動(dòng)更劇烈.其次,以方差和最大的宏塊為中心確定一個(gè)方形區(qū)域(8n×8n,相應(yīng)地嵌入水印的信息量為n×n),此區(qū)域?qū)?yīng)至原視頻幀中,即為定位得到的運(yùn)動(dòng)區(qū)域.

圖21 運(yùn)動(dòng)區(qū)域定位Fig.21 Motion region locating
采用基于Watson’s視覺模型[25]的量化索引調(diào)制算法[26]嵌入水印.檢測(cè)水印時(shí),仍然用ICA提取相對(duì)運(yùn)動(dòng)分量,對(duì)接收到的視頻幀進(jìn)行運(yùn)動(dòng)區(qū)域定位,利用與嵌入相反的過程提取水印.
仿真試驗(yàn)截取了一段北極熊視頻作為載體視頻,共包含50幀圖像,每幀圖像大小為272×352,幀率為25幀/s.使用的水印為由0、1組成的二進(jìn)制偽隨機(jī)序列,長(zhǎng)度為100(相應(yīng)地,確定的運(yùn)動(dòng)區(qū)域的大小為80×80).嵌入水印時(shí),嵌入水印的強(qiáng)度beta設(shè)為18,使視頻在保持良好的視覺質(zhì)量的前提下仍然具有較好的魯棒性.
為證明算法的魯棒性,實(shí)驗(yàn)采用一些常見的信息處理方式對(duì)水印視頻進(jìn)行處理,包括各種均值為0.方差不同的高斯白噪聲攻擊,在保持視頻時(shí)長(zhǎng)或幀數(shù)不變的前提下采用不同幀率的MPEG-2壓縮,以及幀刪除和幀剪裁攻擊.其中,幀刪除中隨機(jī)刪掉視頻中約10%的幀,即視頻丟失5幀圖像.對(duì)于實(shí)際視頻應(yīng)用中經(jīng)常遭受的幀剪裁攻擊,又進(jìn)行了各幀統(tǒng)一順序剪裁和隨機(jī)剪裁,以及各幀隨機(jī)剪裁不同的行列等3種實(shí)驗(yàn)方式.圖22給出了視頻遭受攻擊后的水印檢測(cè)結(jié)果.在試驗(yàn)中,采取用與剪裁處相隔5行/列的行列填充于剪裁處.

圖22 視頻水印檢測(cè)結(jié)果Fig.22 Watermark extraction results
仿真結(jié)果證明了本方案對(duì)高斯白噪聲、MPEG-2壓縮、幀刪除及幀剪裁攻擊有較高的魯棒性.
本文總結(jié)了近年來基于ICA的圖像/視頻分析的方法研究及其在多媒體水印中的應(yīng)用.盲信號(hào)分離方法近年來不斷出現(xiàn)新的成果,欠定盲分離、非線性盲分離分析、張量分析和潛變量分析等,其在圖像和視頻分析領(lǐng)域的應(yīng)用也在不斷拓展.本文只是總結(jié)了自己基于ICA的圖像和視頻特征提取的研究及其在數(shù)字水印領(lǐng)域的應(yīng)用成果,實(shí)際上還更多其他人的類似研究及成果需要在以后的工作中有加以總結(jié).
[1]MALLAT S A.Theory for multiresolution signal decomposition:the wavelet representation[J].IEEE Trans Pattern A-nal Mach Intel,1989,11(7):674-693.
[2]COMON P.Independent component analysis,a new concept[J].Signal Processing,1994,36:287-314.
[3]HYVRINEN A,OJA E.A fast fixed-point algorithm for independent component analysis[J].Neural Computation,1997,9(7):1483-1492.
[4]HYVARINEN A,KARHUNEN J,OJA E.Independent component analysis[M].New York:John Wiley,2001:21-35.
[5]HURRI J,HYVARINEN A,KARHUNEN J,et al.Image feature extraction using independent component analysis[C]//Proc IEEE Nordic Signal Processing Symposium.Espoo,F(xiàn)inland,1996:475-478.
[6]Van HATEREN J H,Van DER SCHAAF A.Independent component filters of natural images compared with simple cells in primary visual cortex[J]//Proceedings Royal Society of London:Biological Sciences,1998,265(1394):359-366.
[7]ZHANG Qiang,SUN Jiande,LIU Ju,et al.A novel ICA-based image video processing method[C]//ICA 2007,LNCS 4666,[S.l.],2007:836-842.
[8]MALLAT S.Wavelets for a vision[J].Proceedings of the IEEE,1996,84(4):604-614.
[9]ANTONINI M,BARLAUD M,MATHIEU P.Daubechies:image coding using wavelet transform[J].IEEE Transactions on Image Processing,1992,1(2):205-220.
[10]SWANSON M D,ZHU B,TEWFIK A H.Multiresolution scene-based video watermarking using perceptual models[J].IEEE Journal on Selected Areas in Communications,1998,16(4):540-550.
[11]Van HATEREN J H,RUDERMAN D L.Independent component snalysis of natural image sequences yields spatio-temporal filters similar to simple cells in primary visual cortex[J]//Proceedings of the Royal Society.London B,1998,265(1412):2315-2320.
[12]TEKALP A M.Digital video processing[M].北京:清華大學(xué)出版社,1998:15-30.
[13]BELL A J,SEJNOWSKI T J.Edges are the independent components of natural scenes[M]//Advances in Neural Information Processing Systems 9.Cambrige:The MIT Press,1996:831-837.
[14]HOYER P O,HYVARINEN A.Independent component analysis applied to feature extraction from color and stereo images[J].Network:Computation in Neural Systems,2000,11(3):191-210.
[15]SMARAGDIS P,CASEY M.Audio/visual independent components[C]//4th International Symposium on Independent Component Analysis and Blind Signal Separation.Nara,Japan,2003:709-714.
[16]孫建德,劉琚.基于獨(dú)立分量分析的盲視頻水印方案[J]. 電子學(xué)報(bào),2004,32(9):1507-1510.
SUN Jiande,LIU Ju.A blind video watermarking scheme based on independent component analysis[J].Acta Electronica Sinica,2004,32(9):1507-1510.
[17]劉琚,孫建德,基于ICA的數(shù)字水印的方法[J].電子學(xué)報(bào),2004,32(4):657-660.
LIU Ju,SUN Jiande.A new scheme of digital watermarking based on independent component analysis[J].Acta Electronic Sinica,2004,32(4):657-660.
[18]KUTTER M,VOLOSHYNOVSKIY S,HERRIGEL A.The watermark copy attack[C]//Proc of SPIE:Security and Watermarking of Multimedia ContentsⅡ.San Jose,USA:SPIE,2000,3971:371-380.
[19]胡慧博,劉琚,孫建德.基于 ICA的抗拷貝攻擊的數(shù)字水印方案[J].電子與信息學(xué)報(bào),2005,27(7):1035-1038
HU Huibo,LIU Ju,SUN Jiande.An ICA-based watermarking scheme resistant to copy attack[J].Journal of E-lectronics& Information Technology,2005,27(7):1035-1038.
[20]LIU Ju,ZHANG Xingang,SUN Jiande.A digital watermarking scheme based on ICA detection[C]//4th International Symposium on Independent Component Analysis and Blind Signal Separation.Nara,Japan,2003:215-220.
[21]凌潔,劉琚,孫建德,等.基于視覺模型的迭代AQIM水印算法[J]. 電子學(xué)報(bào),2010,38(1):151-155.
LING Jie,LIU Ju,SUN Jiande,et al.Visual model based iterative AQIM watermark algorithm[J].Acta Electronica Sinica,2010,38(1):151-155.
[22]SUN Jiande,LIU Ju.A novel blind video watermarking scheme based on independent dynamic component[J].Multidimensional Systems and Signal Processing,2006,17(1):59-74.
[23]YU D,SATTER F,MA K K.Watermark detection and extraction using ICA method[J].EURASIP Journal on Applied Signal Processing,2002,1:92-104.
[24]SUN Zhaowan,LIU Ju,SUN Jiande,et al.A motion location based video watermarking scheme using ICA to extract dynamic frames[J].Neural Computing & Applications,2009,18(5):507-514.
[25]WATSON A B.DCT quantization matrices visually optimized for individual images[C]//Proc SPIE on Human Vision,Visual Processing,and Digital Display Ⅳ.San Jose,USA,1993:202-216.
[26]CHEN B,WORNELL G W.Quantization index modulation:a class of provably good methods for digital watermarking and information embedding[J].IEEE Transactions on Information Theory,2001,47(4):1423-1443.
[27]SUN Jiande,LIU Ju.A blind video watermarking scheme based on ICA and shot segmentation[J].Science in China Series F,2006,49(3):302-312.
[28]GONZáLEZ-SERRANO F J,MURILLO-FUENTES J J.Independent component analysis applied to image watermarking[C]//Proc IEEE ICASSP.Lake City,USA,2001:1997-2000.
[29]MANGAIYARKARASI P,ARULSELVI S.A new digital image watermarking based on finite ridgelet transform and extraction using ICA[C]//Proceedings of ICETECT.Tamil Nadu,India,2011:837-841.
[30]JADHAV S,BHALCHANDRA A.Robust digital image-adaptive watermarking using BSS based extraction technique[J].//International Journal of Image Processing,2010,4(1):77-88.
[31]CHAUDHARI B P,GULVE A K.Approaches of digital image watermarking using IC[C]//Proceedings of ISCET.Punjab,India,2010:32-46.

劉琚,男,1965年生,工學(xué)博士,教授、博士生導(dǎo)師.現(xiàn)為山東大學(xué)信息科學(xué)與工程學(xué)院學(xué)術(shù)委員會(huì)副主任,通信工程系主任;中國(guó)電子學(xué)會(huì)高級(jí)會(huì)員、IEEE高級(jí)會(huì)員(Senior Member);國(guó)內(nèi)外期刊International Journal of Swarm Intelligence Research(IJSIR)、《通信學(xué)報(bào)》和《數(shù)據(jù)采集與處理》等編委.主要研究方為多媒體信息處理、無線通信中空時(shí)信號(hào)處理,盲信號(hào)處理理論與應(yīng)用等.參加了國(guó)家重點(diǎn)基礎(chǔ)研究發(fā)展規(guī)劃(973)項(xiàng)目和歐盟項(xiàng)目等.主持承擔(dān)了國(guó)家自然科學(xué)基金、高等學(xué)校科技創(chuàng)新工程重大項(xiàng)目培育資金項(xiàng)目等課題10余項(xiàng).曾獲江蘇省科技進(jìn)步一等獎(jiǎng)和中國(guó)高校自然科學(xué)二等獎(jiǎng)等,授權(quán)發(fā)明專利8項(xiàng),在國(guó)內(nèi)外核心期刊或重要學(xué)術(shù)會(huì)議上發(fā)表學(xué)術(shù)論文200余篇.

孫建德,男,1978年生.工學(xué)博士,副教授.主要研究方向?yàn)榛趦?nèi)容的多媒體分析、基于視覺關(guān)注模型的圖像/視頻分析、圖像/視頻復(fù)制檢測(cè)、多媒體信息隱藏和數(shù)字水印、2D-3D視頻轉(zhuǎn)換等.主持并參與了國(guó)家自然科學(xué)基金等課題10余項(xiàng).在國(guó)內(nèi)外期刊和重要國(guó)際學(xué)術(shù)會(huì)議上發(fā)表論文30余篇.
Independent component analysis-based image/video analysis and applications
LIU Ju,SUN Jiande
(School of Information Science and Engineering,Shandong University,Ji’nan 250100,China)
The application of image and video is becoming increasingly popular with the development of computer and communication techniques.One of the important methods applied in image and video information analysis is to obtain suitable features which approach the visual characteristics of humans.Independent component analysis(ICA)is an unsupervised training method which effectively matches human vision with image and video understanding.In this paper,different image/video analysis models of ICA were presented and the independent image/video features based on these models were analyzed.A comparison between multimedia ICA and digital wavelet transform(DWT)was performed.Finally,computer simulation results on various analysis methods were given to show the independent features of different models and their applications in image and video watermarking.The results of the application simulations show that the independent features may make improvements for image and video watermarking.
independent component analysis;feature extraction;video analysis;digital watermarking
TP18;TN911.7
A
1673-4785(2011)06-0495-12
10.3969/j.issn.1673-4785.2011.06.004
2011-01-03.
國(guó)家自然科學(xué)基金資助項(xiàng)目(60872024,61001180,60970048);高等學(xué)校科技創(chuàng)新工程重大項(xiàng)目培育資金資助項(xiàng)目 (708059);山東大學(xué)資助創(chuàng)新基金資助項(xiàng)目(2010JC007);教育部博士點(diǎn)專項(xiàng)基金資助項(xiàng)目(新教師項(xiàng)目,200804221023).
劉琚.E-mail:juliu@sdu.edu.cn.