999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

保局投影在對象識別中的應用研究

2022-07-17 15:19:52曾萬里雷翔霄
長沙民政職業技術學院學報 2022年2期
關鍵詞:模型

曾萬里 雷翔霄

(長沙民政職業技術學院,湖南 長沙 410004)

引言

近年來,對象(如人臉、物體等)識別成為模式識別和人工智能領域的研究熱點,研究人員進行了大師探索并取得了突破性的進展,但是大部分的研究還是以單一圖像為識別對象。近年來,基于圖像集的對象匹配取得了一些成果[1],但是在無約束的自然環境中,基于單一查詢圖像集合的識別在技術上仍然具有挑戰性。

隨著網絡攝像機的普及,人們非常容易通過監控設備獲取大量的監控視頻,從而方便地構建大規模的人臉數據庫,這一點促進了近年來基于多圖像集的人臉識別的研究,但是通過這種方式獲取的圖像,清晰度不高,抓取到的人臉信息不全,噪聲較高。研究人員在具體研究應用中,可以利用圖像序列之間的時間信息,也可以把圖像集當成一個松散的集合來處理。一般通過人臉檢測或者跟蹤方法提取的人臉圖像歸一到統一尺寸,然后通過提取圖像的特征向量化單張圖像,也可以直接使用灰度值通過逐行或者列堆疊向量化。

近年來的文獻研究主要集中于參數模型和非參數模型兩個方面。參數模型方法主要通過參數分布來構建圖像集合的模型,如使用Kullback-Leibler散度來度量兩個模型的相似性[2]。但是,在實際應用中,很難對參數進行準確的估計。本文提出的是一種基于非參數模型的方法,這一類方法通過諸如子空間[3]、流形[4]、仿射包和凸包[5]、協方差矩陣[6]等對圖像集合建模,有良好的數學理論支持,其核心在于如何構建這個數學模型以及度量兩個模型之間的相似性。例如子空間以及基于子空間的一類方法將圖像集合投影到低維的線性子空間,再用典型相關來度量兩個子空間的相似性。仿射包和凸包方法,是通過計算圖像集仿射子空間內最近鄰點之間的距離來度量兩個仿射包之間的相似性。

核方法在圖像集合建模方面起著非常重要的作用,主要是通過非線性映射函數將原始空間的圖像投影到可分性更強樣本的高維空間。通常人們通過格拉斯曼流行來描述一個子空間,因為子空間可以解釋成格拉斯曼流形上的點,通過在生成的再生核希爾伯特空間中學習一個分類器實現分類。例如,流形判別分析方法(Manifold discriminant analysis,MDA)[4]通過最大化流形之間的間隔增加不同類樣本之間的可分性。協方差鑒別學習方法(Covariance discriminative learning,CDL)[6]主要基于全部正定對稱矩陣構成黎曼流形的結論,通過計算圖像集合的協方差矩陣得到正定矩陣,從而將圖像集映射到黎曼流形上,并用黎曼流形上的距離(如對數-歐式距離,Log-Euclidean distance,LED)對圖像集合之間的相似性進行度量。

度量學習主要針對構建流形異構的問題,可以找到異構流形存在的共性,解決樣本匹配問題,得到更切實際的距離度量。

1.基于集合的對象匹配框架

最近的研究表明,通過流形上的度量學習可以得到一個更加低維、更加緊致的流形,此流形可以更好地描述圖像集合的特征,在學習得到的流形上進行判別分析能夠獲得更好的識別結果。本文提出是一個非參數模型的方法,討論格拉斯曼流行上的保局投影在對象匹配中的問題。從圖像集合的建模、相似性的定義以及核空間上的流形上的保局投影等幾個方面討論和分析在人臉識別中的應用。

也就是說,函數φ( )S 將圖像集合變換到模型空間Μ 中得到圖像集合的表示,核函數k( )X 將模型空間的特征表示X 變換到新的特征空間F 中,綜合這兩個步驟得到合成變換函數?:

本文的算法框架如圖1 所示,圖像集合通過格拉斯曼流形來建模。通過正交子空間將圖像集合描述為格拉斯曼流行上的點,通過格拉斯曼流形上的度量學習,將原始空間上的樣本投影到一個更加緊致的格拉斯曼流形,然后通過核方法,通過保局投影構建核空間上的圖模型,應用近鄰分類器進行分類。

圖1 基于集合的對象匹配框架示意圖

本文的方法結合了格拉斯曼流形上的度量學習和保局投影的思想。通過度量學習,原始輸入空間的每一個圖像集合度量學習得到模型空間M 得中特征表示,在學習得到的模型空間中的這個特征向量能夠更好地描述圖像集合。在新模型域中定義兩個模型之間的相似性度量函數,然后計算核矩陣,將模型變換到特征空間F,通過核函數將模型空間的度量轉換成歐式空間向量之間距離的度量。

2.基于格拉斯曼流形的度量學習

格拉斯曼流形(Grassmann Manifold)gm,D 是對應于投影矩陣UiUTi∈RD×D的集合,由RD空間的m-維線性子空間RD構成(0 < m≤D)。

格拉斯曼流形上的點,可以用一個非線性映射函數φ 與圖像集S 生成的子空間建立映射關系,表示為X = span( )S ,函數定義為:MF

滿 足 條 件 uTu = vTv = 1,uTul= 0,vTvl= 0,l =1,2,...,k - 1。θk表示第k主角,是兩個子空間中所有單位向量對之間的第k 最小夾角。可以運用下面公式,通過分解UTiUj的奇異值來求出主角:

其中P,Q為正交矩陣,cos θk稱為典型相關。

格拉斯曼流形距離反映的是子空間沿流形表面的幾何結構上的差異,主角反映的是子空間在每一維上的相似性。兩個子空間之間的測地距離定義為格拉斯曼流形上兩個點之間的弧長:

通常情況下可以獲取的圖像數要小于樣本特征維數,以此得到的投影矩陣對原始樣本的真實分布建模帶來不利影響,通過度量學習可以將Gm,D投影到更低維的格拉斯曼流形上,得到更加緊致的樣本分布描述。

設Ui是格拉斯曼流形的一個正交基矩陣,假設存在一個列滿秩矩陣W,P = WWT,P是一個對稱半正定矩陣,秩為 D × D,即PT= P,P≥0。定義Vi= WTUi,

其中Aij= UiUTi- UjUTj,類似于傳統的馬氏度量學習。

設計目標函數:

公式(9)中α 為權重參數,P 是要學習的最優化的對稱半正定矩陣。記NW和Nb分別表示來自同類樣本對

目標函數(9)使得學習得到的流形上同類樣本的線性子空間的投影距離Jw( )P 盡量接近,而異類樣本的線性子空間的投影距離Jb( )P 盡可能拉遠,問題的具體求解可閱讀文獻。

3.基于格拉斯曼流形的核函數學習

由于模型空間和特征空間一般都不是歐式空間,而鑒別分析函數的定義是基于歐式距離度量的,為了能夠在同一空間執行操作,我們利用核函數來定義頂點之間的相似度。

假設對任意的X ∈ Gm,D,函數k:Gm,D× Gm,D→ R+如果 滿 足 條 件 :(1)對 任 意 的 Xi∈ G,bi∈ R,滿 足拉斯曼核。

投影核是格拉斯曼流形上的常用的核函數。

4.堅持激濁揚清。要使黨內政治生活正氣充沛,就必須樹正氣、遏邪氣,形成正向激勵與負向遏制的鮮明導向,對符合黨內政治生活規定要求的人和事給予肯定和褒獎,對違背的給予懲處甚至繩之以法。習近平同志提出:“要激濁揚清,堅持激濁和揚清兩手抓。”[2]

假設兩個集合張成的子空間的正交基記為U1、U2,U1、U2是兩個 D × Ni( )i = 1,2 大小的正交矩陣。投影度量使用全部的主角并通過如下的公式投影到歐氏空間計算距離。

其中 UiUTi(i = 1,2)是一個秩為 q 的 D × D 正交投影矩陣,由Xi的正交基構成。由D × D 投影矩陣張成的歐式空間RD×D中的內積導出一個格拉斯曼核函數:

很容易驗證這個核函數是一個Mercer核。

4.基于格拉斯曼流形的保局投影

在格拉斯曼流形上,使用子空間的正交基來建模圖像集,并對應描述為格拉斯曼流形上的一個點。在格拉斯曼流形上引入圖結構,流形上的點可以抽象為一個帶權無向圖中的頂點,邊的權表示相鄰頂點之間的相似度。

保局投影(Locality Preserving Projection: LPP)關注數據的局部關系,可以把原始樣本點的局部鄰域關系保存下來,能夠較好地反映樣本的流形結構。

利用LPP 找出兩個格拉斯曼流形Gm,D與G'm,D之間的一個映射?:Xi→ Yi。通過計算最小化問題(15)求得Y:

設最終的解的形式為

那么

示為:

其中K=[K1,K2,...,KN]。增加約束條件ATKDKTA=1,最優化求解變成以下形式:

滿足約束條件

最大化準則函數可以轉換為下面的特征值求解問題:

最大的r 個特征值對應的特征向量αi,i=1,…,r,構成投影矩陣

測試階段,給定一個查詢圖像集合Xt∈RD×Nt,通過公式Zt=ATKt將其投影到特征空間,使用最近鄰分類器進行分類。其中

5.實驗分析

5.1.選擇數據集

在圖像數據庫中最常用的是ETH80,它包含8 類物體,每類物體有10 個實例圖集。為了提高實驗效果,盡量選取差異較大、特征明顯的實例進行采集,共選取了3280張圖片。

視頻數據庫選取了基于人臉識別的ChokePoint 和MOBO 數據集,其中ChokePoint 的視頻都是由3 個機位的攝像機同時錄制,且每個動作要反復4 次,以得到不同的序列。該數據集共包含了兩個門口分別錄制的25個人和29個人的視頻。MOBO數據庫由CMU錄制,包含25段視頻。

5.2.選取比較方法

為了提高實驗可信度,本文基于參考文獻慣例做法,選取流形鑒別分析算法(Manifold discriminant analysis,MDA)[4]、協方差鑒別學習(Covariance discriminative learning,CDL)[6]、格拉斯曼流形鑒別分析法(Grassmann discriminant analysis,GDA)、投影度量學習方法(Project metric learning,PML)、互子空間方法(Constrained mutual subspace method,CMSM)進行比較試驗,實驗將灰度圖進行直方圖均衡化處理,得到20×20像素。

5.3.實驗結果分析

從ETH80 數據集的10 個圖像集中,隨機地選取3、5、7 個圖像集作為訓練集,其余的用作測試集,反復實驗10 次,方差和平均識別率如表1 所示。把數據用應用折線圖表示,如圖2,可以看出,保局投影加度量學習的方法比CMSM、MDA、GDA、CDL、PML等方法準確率都高,且訓練集越高,效果越明顯。

表1 數據集分類結果

圖2 數據集分類結果對比折線圖

從ChokePoint 數據庫中選取兩段視頻作為訓練集,余下的作為測試視頻,再從Mobo 數據庫提取圖像的局部二值模式特征。分別得到如下方差和平均識別率,如表2,與CMSM、GDA、CDL、PML 等方法進行比較,優勢明顯,最高超出近20個百分點。

表2 人臉識別結果

綜合以上實驗結果可以看出,本文采用保局投影結合度量學習的方法,比單純使用度量學習的方法效果更優。

結語

基于集合的對象匹配一直是研究的熱點,本文綜合保局投影思想與格拉斯曼流形度量學習思想,基于圖像集合進行建模,運用格拉斯曼流形進行度量學習,構建新的樣本空間,并采用核方法生成保局投影模型,能有效降低圖像預處理時的樣本維度,有效提高模型的準確率。但在其他領域或其他數據庫中應用情況如何,還需要進一步研究。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 亚洲日韩高清无码| 色综合成人| 凹凸国产熟女精品视频| 亚洲av无码专区久久蜜芽| 91精品情国产情侣高潮对白蜜| 久久性妇女精品免费| 亚洲九九视频| 在线观看精品国产入口| 国产精品亚洲片在线va| 日日拍夜夜操| 高清色本在线www| 老熟妇喷水一区二区三区| 日韩免费无码人妻系列| 久久亚洲中文字幕精品一区| 亚洲国产欧美自拍| 久青草网站| 在线视频亚洲色图| 一本二本三本不卡无码| 天堂成人在线视频| 久久久久久久久亚洲精品| 国产成人免费观看在线视频| 91久久偷偷做嫩草影院电| 亚洲一级毛片| 国产一区二区网站| 国产精品白浆无码流出在线看| 69国产精品视频免费| 尤物成AV人片在线观看| 国产91精选在线观看| 国产欧美高清| 欧美国产菊爆免费观看| 在线观看热码亚洲av每日更新| 狠狠亚洲婷婷综合色香| 激情无码字幕综合| 99视频全部免费| 亚洲视频免费播放| 99热这里只有精品国产99| 999国内精品视频免费| 日日拍夜夜操| 国产无吗一区二区三区在线欢| 97综合久久| 91蜜芽尤物福利在线观看| 91成人免费观看| 国产打屁股免费区网站| 欧美色99| 亚洲精品国产精品乱码不卞| 在线欧美国产| 欧美激情一区二区三区成人| 99热国产在线精品99| 中文字幕人妻av一区二区| 亚洲欧美精品日韩欧美| jizz亚洲高清在线观看| 久久这里只精品热免费99| 五月婷婷导航| 久久国产亚洲欧美日韩精品| 99热这里只有精品免费| 免费激情网址| 国产一区二区三区在线精品专区| 黄片一区二区三区| 中文字幕一区二区人妻电影| 免费日韩在线视频| 国产在线自在拍91精品黑人| 国产视频 第一页| 99ri精品视频在线观看播放| 91免费国产在线观看尤物| 欧美午夜在线播放| 精品三级在线| 国产成人精品视频一区视频二区| 国产成人AV综合久久| 92午夜福利影院一区二区三区| 波多野结衣二区| 99激情网| 日本爱爱精品一区二区| 在线国产毛片| 波多野结衣视频网站| 欧美午夜视频| 制服丝袜国产精品| 色综合狠狠操| 午夜啪啪网| 人人爽人人爽人人片| 日韩成人午夜| 黄色网页在线观看| 亚洲人成电影在线播放|