李海亭,李艷紅,彭清山,王 閃
(1. 武漢市測繪研究院,湖北 武漢 430022; 2. 精密工程與工業測量國家測繪地理信息局
重點實驗室,湖北 武漢 430022; 3. 武漢大學資源與環境科學學院,湖北 武漢430079)
Research on Privacy Information Hiding in Panoramic Map
LI Haiting,LI Yanhong,PENG Qingshan,WANG Shan
?
全景地圖隱私信息處理的關鍵技術研究
李海亭1,2,李艷紅3,彭清山1,2,王閃1,2
(1. 武漢市測繪研究院,湖北 武漢 430022; 2. 精密工程與工業測量國家測繪地理信息局
重點實驗室,湖北 武漢 430022; 3. 武漢大學資源與環境科學學院,湖北 武漢430079)
Research on Privacy Information Hiding in Panoramic Map
LI Haiting,LI Yanhong,PENG Qingshan,WANG Shan
摘要:全景地圖系統在數據生產中存在一些可能涉及泄漏個人隱私的信息。本文提出了通過采用特征提取和監督學習分類的方法來檢測和處理隱私信息的方法。以人臉和車牌號為例,分別采用支持向量機和投影定位的方法進行了隱私信息定位檢測。試驗證明,該方法具有較好的可行性。
關鍵詞:全景地圖;隱私信息;特征提??;監督分類;目標檢測
一、引言
全景地圖技術是一種由全景技術與電子地圖發布技術相結合的、可定位展示真實場景的虛擬現實技術,是目前在全球范圍內迅速發展并逐步流行的一種視覺新技術[1]。全景地圖主要采用360°全景瀏覽的方式展示空間信息。在全景數據的采集過程中,往往包含了較多可能涉及泄漏個人隱私的信息,如人臉、車牌號等。目前,圍繞空間數據安全開展了大量的數字水印技術研究[2-4],在空間數據的版權保護、使用跟蹤、內容認證等方面發揮了很好的作用,但仍無法滿足全景地圖中某些特定隱私信息的保護。如何將這些隱私信息進行自動識別和保護是全景地圖系統數據處理的一項重要任務。
二、隱私信息特征提取與定位
隱私信息檢測一般包括數據預處理、特征提取、樣本學習和目標檢測4個過程。其中,特征提取是隱私信息定位的關鍵技術,選取的特征直接影響到目標檢測的精度。特征提取的方法較多,包括幾何特征提取法(geometry features extraction,GFE)、主成分分析法(principal component analysis,PCA)及神經網絡特征提取法(neural network features extraction,NNFE)等。本文以人臉和車牌為例,闡述隱私信息的特征提取與定位過程。
1. 人臉檢測
人臉檢測即從不同的全景圖像中檢測出人臉的存在并確定其位置。人臉檢測受光照、噪聲及遮擋影響較大。用于人臉檢測的特征提取在提取之前需對人臉圖像進行歸一化處理,通常包括灰度預處理、角度預處理和尺度預處理3個過程。
(1) 灰度預處理
灰度預處理主要去除不同光照對人臉圖像的影響,比較常用的方法為直方圖法。直方圖表示數字圖像中每一個灰度級與其出現的頻率之間的統計關系。直方圖變換函數包括高斯、瑞利、對數、指數等方式。對數形式的變換函數如下
(1)
式中,f(x,y)為輸入圖像;g(x,y)為輸出圖像;a、b、c為調整曲線的位置、形狀參數。
(2) 角度預處理
在人臉識別過程中,通常假設輸入的人臉圖像的位置是正立的[5]。由于全景采集中人臉的姿態各異,因此需要對圖像進行角度糾正。人臉姿態的糾正主要分為平面旋轉與深度旋轉。角度預處理后的姿態正立度估計方法有兩種:模版匹配法和灰度統計法。
(3) 尺度預處理
由于全景采集過程中成像距離的任意性,人臉圖像的尺寸差異較大,因此必須對圖像進行尺度歸一化處理。主要依賴于特征提取的方法,通常是先對人眼的兩個瞳孔進行定位,然后將兩個瞳孔之間的距離作為比例系數進行圖像的縮放,進而得到人臉歸一化圖像。
在歸一化處理的過程中,首先要對眼睛進行準確定位。眼睛定位可采用混合投影[6]或模板匹配[7]的方法。由于兩眼中心間距受光照或表情變化的影響最小,因此兩眼中心的連線可作為圖像旋轉和尺度處理的依據。由于同一張全景影像可能存在多個人臉的情況,歸一化處理后即生成多個搜索區域,然后通過監督學習的方法對每個搜索區域進行自動識別分類。
(4) 監督分類與信息隱藏
監督分類是機器學習中的一個方法,可以由訓練樣本中學到或建立一個模型,并以此模型推測新的實例。目前常用的監督學習方法主要有支持向量機(support vector machine,SVM)、人工神經網絡(artificial neural network,ANN)、決策樹(decision tree)等。其中,支持向量機分類是一種基于統計學習理論的監督式機器學習方法,即已知訓練點的類別,求訓練點和類別之間的對應關系,以便將訓練集按照類別分開,或是預測新的訓練點所對應的類別[8-9]。它具有泛化能力強、全局最優和計算速度快等突出優點。本文在試驗中采用支持向量機對全景影像中的人臉進行檢測,然后通過高斯模糊算法對人臉區域進行模糊化處理。
2. 車牌定位
車牌號碼是全景地圖中的重要隱私信息。車牌快速定位的技術方法很多,包括彩色分割、形態學分析、區域生長、小波變換等。其中,基于投影圖像分布特征的車牌自動檢測定位技術[10]具有良好的魯棒性。該方法的主要過程如下:
(1) 灰度預處理
全景影像中包含大量顏色信息,對全景影像進行灰度化處理不僅可以減小存儲,還可以加快特征提取的計算速度。
(2) 二值化
二值圖像是指整幅圖像畫面內僅黑、白二值的圖像。在二值化圖像時把大于某個臨界灰度值的像素灰度設為灰度極大值,把小于這個值的像素灰度設為灰度極小值,從而實現二值化。在車牌定位過程中,圖像二值變換的關鍵是確定合適的閾值。二值變換后的圖像須具有原始的特征分布。
(3) 邊緣檢測
邊緣檢測是形狀特征提取和圖像分割的基礎,主要是通過檢測每個像素和其鄰域的狀態,以判定該像素是否位于一個物體的邊界上。邊緣檢測的步驟主要包括濾波、增強、檢測和定位4個過程。常用的邊緣檢測算子主要包括Roberts算子、Sobel算子、Prewitt算子、Krisch算子和高斯-拉普拉斯算子等。
(4) 開運算
對上述運算得到的圖像進行形態學圖像分析,主要包括腐蝕和膨脹運算。腐蝕是一種消除邊界點的過程,可有效消除孤立噪聲點;膨脹是將與目標物體接觸的背景點合并到物體的過程,可填補目標物體中的空洞。開運算即先腐蝕后膨脹的過程,具有消除噪聲、平滑較大邊界的作用。
(5) 車牌定位與信息隱藏
車牌定位包括上下邊界定位和左右邊界定位。經開運算處理后的圖像,車牌區域具有相對集中且規則的紋理特征,并具有連續性。因此,可根據車牌區域黑白跳變次數先確定車牌的上下邊界,然后根據車牌字符在豎直方向的投影值來確定車牌的左右邊界,最后通過高斯模糊算法對車牌區域進行模糊化處理。
三、試驗
本文對武漢市江漢區部分道路的全景影像進行了試驗,包括人臉檢測和車牌定位。整個試驗在Matlab 2011a環境下實現,支持向量機函數庫采用LibSVM,同時采用線性回歸(linear regression)和徑向基函數(radial basis function,RBF)作為核函數進行分類結果比較。試驗過程如下:
1. 人臉檢測
首先對全景影像進行灰度、角度和尺度預處理。圖1為人體部分采用對數變換方式后的效果及圖像直方圖對比圖。由于車載全景影像采集過程中通常采用定焦鏡頭,并且行人與相機之間的距離大于某特定值(如車寬),因此可識別人臉的尺寸保持在一定范圍內。經多次試驗,采用25像素×25像素作為人臉尺寸的大小。試驗采用LibSVM進行監督分類,在監督分類過程中采用PRTools軟件自帶的人臉樣本庫進行訓練。采用交叉驗證對懲罰系數進行尋優,得到最佳C=0.001,精度為94.5%。利用線性回歸、徑向基函數的比較結果及高斯模糊效果如圖2所示。
2. 車牌號定位
在車牌號定位過程中,灰度處理采用的公式為
Gray =R×0.299+G×0.587+B×0.114
(2)
試驗采用Otsu閾值分割算法對圖像進行二值化處理,并采用Robert算子進行邊緣檢測,然后對得到的圖像進行開運算,最后使用投影法實現車牌區域的定位。試驗結果如圖3所示。

圖1 對數變換的效果比較及圖像直方圖對比

圖2 線性回歸和SVM分類結果比較及信息隱藏

圖3 車牌號定位
四、結束語
本文采用支持向量機和投影法實現了全景地圖影像中人臉和車牌區域的檢測,并采用高斯模糊實現了此類敏感信息的隱藏處理,大大提高了數據的處理效率。試驗過程中還存在一些學習不充分、識別精度不足等問題。在以后的研究中,將對目標特征和模型參數進行優化,進一步提高全景地圖隱私數據處理的自動化水平。
參考文獻:
[1]李海亭,彭清山,王閃.數字城市中的全景地圖系統建設方法研究[J]. 測繪通報,2011(4):71-73.
[2]符浩軍,朱長青,趙毅,等. 面向網絡環境的地理空間數據數字水印模型[J].測繪學報,2013,42(6):891-897.
[3]賈培宏,馬勁松,史照良,等. GIS空間數據水印信息隱藏與加密技術方法研究[J].武漢大學學報:信息科學版,2004,29(8):747-751.
[4]朱長青,楊成松,任娜. 論數字水印技術在地理空間數據安全中的應用[J].測繪通報,2010(10):1-3.
[5]HUANG J, SHAO X, WECHSLER H. Face Pose Discrimination Using Support Vector Machines(SVM)[C]∥Proceeding of International Conference Recognition. Brisbane:[s.n.], 1998:154-156.
[6]耿新,周志華,陳世福.基于混合投影函數的眼睛定位[J].軟件學報,2003,14(8):1394-1400.
[7]梁路宏,艾海舟,肖習攀.基于模板匹配與支持矢量機的人臉檢測[J].計算機學報,2002,25(1):22-29.
[8]鄧乃楊,田英杰.數據挖掘中的新方法——支持向量機[M].北京:科學出版社,2004.
[9]楊志民,劉廣利.不確定性支持向量機[M].北京:科學出版社,2007.
[10]楊衛平,李吉成,沈振康.車牌目標的自動定位技術[J].中國圖象圖形學報,2002,7(8):835-839.
[11]張智勇.全景移動測量系統及其應用前景展望[J].測繪通報,2014(3):79-81.
通信作者:李艷紅。E-mail: yanhongli1979@163.com
作者簡介:李海亭(1980—),男,博士,高級工程師,主要從事車載激光掃描數據處理研究。E-mail: 120059908@qq.com
基金項目:國家自然科學基金青年基金(41101449);精密工程與工業測量國家測繪地理信息局重點實驗室開放研究基金(PF2011-26)
收稿日期:2014-11-12
中圖分類號:P283
文獻標識碼:B
文章編號:0494-0911(2015)12-0074-03
引文格式: 李海亭,李艷紅,彭清山,等. 全景地圖隱私信息處理的關鍵技術研究[J].測繪通報,2015(12):74-76.DOI:10.13474/j.cnki.11-2246.2015.383