張榮臻


摘要:熱門景區拍攝的旅行照背景中通常會混入無關人物,影響旅行照的效果。本文探索了旅行照背景圖像檢索的方法,以期應用于旅行照的二次處理。方法中引入了行人檢測模型,以提高背景圖像檢索的準確率。
關鍵詞:圖像檢索;旅行照;行人檢測
中圖分類號:TP391.3 文獻標識碼:A 文章編號:1007-9416(2018)12-0058-01
近些年來,旅游成為了日常生活的一項常規活動。但是,大眾旅游一般都集中在節假日時段,這也導致了熱門景區人擠人的情況頻發。在這樣的背景下,拍一張滿意的旅行照成為了一種奢望,通過技術手段對旅行照進行二次處理不失為一種新選擇。旅行照處理涉及到背景圖像和人物圖像兩方面的處理技術,本文集中探討背景圖像的處理方法。本文研究了一種旅行照背景圖像檢索模型,通過該模型檢索出匹配的背景圖像,以期應用于旅行照的合成。
圖像檢索方法分為文本搜圖和以圖搜圖兩種,旅行照缺乏準確的文本標簽匹配,其背景圖像的檢索需要采用以圖搜圖的方法。以圖搜圖的圖像檢索方法,主要依賴于圖像視覺特征的提取,如顏色特征、紋理特征、形狀特征,進而根據查詢圖像和數據庫圖像之間的特征相似性來獲得最終檢索結果[1]。旅行照中不僅包含前景圖像和背景圖像,如果將整張旅行照圖像特征提取出來用于檢索,前景圖像的特征必然會干擾到圖像的檢索效果。本文嘗試通過自動篩除前景圖像特征,保留有效圖像特征,以提高檢索準確率。
1 背景圖像檢索模型
旅行照的前景圖像為人物圖像,這部分圖像除了照片主角的圖像,還有過往行人的圖像。這些人物圖像信息對于背景圖像檢索不僅毫無作用,還可能引入多余特征影響圖像檢索,因此在圖像檢索之前剔除人物圖像非常有必要?;谌宋飯D像的特性,模型引入了自動駕駛領域流行的行人檢測方法來分離出背景圖像,之后再將分離所得的背景圖像用于圖像檢索。詳細的模型結構如圖1所示,旅行照圖像經過行人檢測模塊處理框選出人物圖像,之后從原圖中去除人物圖像區域及其周邊區域得到背景圖,之后提取背景圖特征與數據庫中的圖像進行逐一匹配,檢索出數據庫中相似性較高的圖像。
整個模型中,行人檢測模塊功能相對比較獨立,該模塊選用R-CNN網絡進行行人檢測。其檢測流程為:使用Selective Search得到潛在的目標候選區域,所得的候選區域圖像歸一化處理后傳入到CNN中得到其特征向量,通過SVM對輸入的特征向量進行分類確定其是否為目標。用于圖像檢索的特征提取是否合理也是影響模型效果的關鍵要點,這里主要使用了顏色特征、紋理特征、形狀特征。顏色特征的提取使用空間顏色直方圖來實現,這樣既可以反映顏色信息,又保留了顏色與像素位置特征之間的空間關系。圖像紋理特征的提取通常是基于灰度共生矩陣,涉及的圖像紋理參數包括能量、熵、對比度、相關性,本模型延用此方法。圖像形狀特征提取的方法比較多,如內角向量、梯度向量、Hu矩向量、慣性矩向量、Harris角點向量等,這里選用Harris角點向量[2]。
2 實驗
模型中的行人檢測模塊參數需要進行單獨訓練,由于深度模型需要使用大量數據用于訓練,這里選用了INRIA訓練數據集用于訓練。訓練完成后使用自建旅游景點圖像數據庫進行圖像檢索效果驗證,效果如圖2所示。
3 結語
背景圖像檢索模型能從圖像數據庫中有效檢索出相同背景的圖像,不過排名靠前的圖片通常與去除行人區域后的圖像區域較為接近,后續還需要進行圖像區域匹配方面的優化。
參考文獻
[1]劉麗端.基于聚類的圖像檢索技術研究[D].武漢理工大學,2012.
[2]劉爽.多特征融合圖像檢索方法及其應用研究[D].哈爾濱理工大學,2016.
Background Image Retrieval Model for Travel Photos
ZHANG Rong-zhen
(Zhejiang Institute of Economics and Trade, Hangzhou Zhejiang 310000)
Abstract:Thravel photos taken in popular scenic spots usually involves irrelevant people, This paper explores the method of retrieving background images of travel photographs in order to apply to the secondary processing of travel photographs. A pedestrian detection model is introduced to improve the accuracy of background image retrieval.
Key words:Image retrieval; travel photos; pedestrian detection