馬成前 王 利 劉 暢
(武漢理工大學計算機科學與技術系 湖北 武漢 430070)
目前,城市視頻監控已經基本覆蓋整個馬路,視頻監控能夠在緊急情況下提供現場的圖像信息,為相應的處理提供證據。視頻監控實際情況復雜多變,視頻監控場景很多,光線變化、攝像機故障等原因都會導致偏色。為了能夠及時處理偏色異常,需要一直對視頻檢測,為了減輕人力負擔,本文提出一種基于機器學習的圖像偏色檢測方法,來判斷監控是否正常。

鑒于研究背景,目前的模型都不能很好地處理,而且普遍存在一個問題,不能對部分偏色的圖片進行鑒定。本文針對馬路視頻監控的背景,和現有方法目前出現的問題,提出一種基于YUV顏色空間下的智能偏色檢測方法。本文創新點:提出基于機器學習對圖片分而治之的偏色檢測模型。模型創新點包含:對圖片采用分而治之的思想,提出一種圖片分割方法,判斷圖片部分偏色;將灰色理論應用于YUV色彩空間。實驗結果表明,該模型能夠有效檢測馬路視頻偏色異常。
要解決圖片偏色問題,需要分析圖片顏色特征、空間特征、紋理特征等信息。馬路視頻圖片環境較為復雜,場景又比較單一。為此,本文提出基于機器學習對圖片分而治之的偏色檢測模型,模型總體包含五步,采用YUV色彩空間,在此基礎上依次對圖片去灰、分割、特征值提取、機器學習、檢測圖片偏色。圖1為偏色檢測流程圖,圖中描述了根據人工確認的偏色狀態,采用監督性機器學習算法,得到分類器。計算未知圖片的特征值,分類器根據特征值即可得到偏色狀態。

圖1 偏色檢測流程圖
為了能夠更加準確、快速地衡量圖片的偏色,需要選擇合適的色彩空間。YUV色彩空間是歐洲電視使用的色彩空間,而且也是攝影機專用色彩空間。其中Y表示明亮度,U和V表示色度。YUV與RGB轉換公式:
(1)
這種色度空間剛好符合本文論題。因為馬路視頻監控是灰色環境,人眼對R=G=B的圖像,認為是灰色的[7]。也就是Y的值會決定灰度,這會方便對圖像進行去灰處理和有效特征值提取。
對得到的圖片進行去灰處理,判斷像素點的UV值即可判斷出是不是灰度像素點。因為實際總不是那么理想,為了消除誤差,設置閾值:
(2)
式中:PσU、PσV是像素點U和V的閾值。這個值的合理程度會影響能否分割圖片。經過實驗在普通的道路上閾值為10較為合理。那么得到灰度點集:
(3)
式中:P表示所有像素點,pY、pU、pV分別表示p點的YUV像素值,檢測出P0之后將P0的所有點的YUV固定表示為特定值。
對得到的圖片取四個集合:
(4)
建立一個二維坐標,圖片在坐標軸的第一象限,圖片左下角在坐標原點,px表示p點橫向坐標,py表示p點縱向坐標,Pt、Pb、Pl、Pr分別表示圖片上下左右邊界上的像素點,PxMax、PyMax表示圖片橫、縱坐標最大值。本文采用經典算法Floyd算法[8],尋找Pl到Pr集合的最短路徑,Pl到Pr為起點和終點集合,走的路的集合為P0,得到矩陣:
(5)

機器學習的選擇:人工神經網絡是一種模擬人類大腦的數學模型,有大量的神經元鏈接構成,是能夠處理復雜邏輯關系和非線性數據的模型,強大學習能力、較強魯棒性、有聯想能力。BP神經網絡使用較為頻繁,是一種通過對大量樣本的分析糾正,達到對所有實例數據的預測。但是神經網絡結構復雜,需要大量的參數,難以對結果解釋清楚,甚至會出現很不理想的學習結果[10-11,15]。支持向量機是一個監督式的機分類器,基于統計學習理論、尋求結構化風險最小,間隔最大化。主要應用于統計分類和回歸分析,適合處理高維問題,能夠解決非線性的相互作用問題,有很好的泛化能力。但是有效率較低、核函數難以選擇、缺失數據影響較大等問題[9,15]。樸素貝葉斯分類器是統計分類算法,以古典數學理論為基礎,有穩定的分類效率,對缺失數據不敏感,里面的各個類條件是獨立的,只需要少量訓練數據即可。但是不能確定特征值之間的相互作用,對輸入數據的表達形式有要求[12,15]。K-Means聚類就是在多維空間中,計算測試樣本與種子點(一種類別的重心)的距離來進行分類,簇的密集程度和形狀會較大程度影響結果,噪聲的影響巨大[13,15]。決策樹分類算法主要應用于數據挖掘算法,能夠對離散數值型數據提取蘊含的規律,有復雜度低、便于使用、高效等優點。但是數據缺失處理困難,經常出現過度擬合,忽略了特征值之間的關系。經典算法有ID3、C4.5等[14-15]。
判斷圖片是否偏色,是一個二分類問題:偏色、正常。圖片有很多像素點,每一個像素點,單獨來看沒有實際意義,只有所有像素點組合才能近似表現實際物體。所以本文根據數學統計知識,提取圖片全局特征值。
在馬路場景下灰度是個重要因素,提取灰度特征值:
(6)
式中:η為灰度比例。
pU、pV是圖片的色彩分布值,然而色彩的集中趨勢、色彩的偏離程度會直接體現圖片色度分布情況,下面分別提取U和V的數據集中位置和離散程度:
(7)
(8)
(9)
兩種色彩的相關程度對圖片的色彩偏向起決定性作用,實驗中發現,U和V的相關性系數,在偏色圖片與正常圖片中有明顯區別。

(10)
式中:EUV表示所有像素點pV、pU的平均值,DUV表示pV、pU的相關性,會體現多種偏色特征。上面提取的特征值是圖片必須的特征,而非所有的。下面假設,每張圖片得到的特征值為:
(11)
每張圖片有n個特征值,需根據每張圖片的特征數據,對圖片進行監督性的分類。本文擬采用BP神經網絡和SVM支持向量機算法。
為了驗證模型的正確性,本文使用武漢平安城市馬路視頻圖像,攝像機參數不詳。為了具有針對性,在偏色種類方面,測試采用數據已經盡可能包含所有可見光偏色情況;偏色區域方面,包含局部偏色、全局偏色、不偏色等情況;圖片光強部分,默認圖片全是白天的。
首先選定YUV與RGB轉換公式:

(12)
然后選取PσV=10閾值和P0點的固定值:Y=0,U=128,U=128。經過去灰和分割處理,得到如圖2、圖3、圖4的去灰圖和分割圖,圖中的顏色均以灰度表示。在正常圖2和偏色圖片3(圖片偏淡紫色)中顯示,去灰程序會把滿足條件的灰度部分置為黑色,其他部分的色彩保持原狀,因為尋路算法不能找到滿足條件的路徑,所以圖片沒有被分割。圖4是局部偏色圖片,左側偏青綠色,右邊偏淺紅色,去灰后會出現黑色分界線,在尋路算法部分就會找到路徑,然后對圖片進行分割,然后得到圖4(c)、(d)兩張圖片,(c)偏青綠色,(d)偏淺紅色。


圖2 正常圖片預處理前后對比

(a) 部分偏色圖

(b) 去灰圖

(c) 分割圖a

(d) 分割圖b圖4 部分偏色圖片預處理前后對比
如果圖片沒有被分開,就提取去灰后的圖片的特征值;如果圖片被分割,就分別提取每部分的特征值分開處理,這樣被分開后的圖片只要有一張是偏色就認定原始圖像偏色。表1是樣本數據。

表1 特征值提取樣本數據
根據得到的特征值數據進行機器學習,分別隨機選擇偏色、正常的一部分數據進行訓練,剩下的進行檢測。本文分別采用了BP神經網絡和SVM兩種方法,采用MATLAB仿真,根據多次實驗選擇最好的參數,BP方法采用500次訓練次數、目標最小誤差0.01、學習速率0.01、附加動量因子0.95最大確認失敗數5等。SVM采用高斯指定尺度因子2、多項式核3階、核參數[-1,1]、分離方法SMO,得到結果如圖5所示。在BP方法中效果良好,50次的平均正確率為95.846 2%。在SVM中正確率為96.795%。根據實驗結果顯示,用這兩個機器學習算法都能很好地完成圖片偏色檢測,正確率均在95%左右,效果良好。表2為SVM和BP的詳細結果。

圖5 BP和SVM結果對比

方法偏色圖片序號偏色正確率正常圖片序號正常正確率總體正確率SVM124,170,178,22296.491%6997.619%96.795%BP17899.123%62,65,7192.857%97.436%100.000%63,65,69,74,82,8685.714%96.154%116,12098.246%69,8695.238%97.436%126,17898.246%63,64,65,69,74,86,8883.333%94.231%120,19498.246%65,69,8692.857%96.795%170,17898.246%62,65,69,8690.476%96.154%14499.123%69,74,80,84,8688.095%96.154%19499.123%56,57,63,68,70,71,74,86,9178.571%93.590%12099.123%63,65,69,71,80,84,86,8980.952%94.231%120,124,17897.368%69,71,75,86,89,9185.714%94.231%
分析得到的結果,可發現以下問題:得到的分割圖片有可能無法分開偏色部分,是因為灰色過濾并沒有將偏色完全分開,這會影響到對圖片的偏色檢測;對于過度灰色圖片會得到全黑的圖片,這是因為Floyd尋路算法找到了圖片邊界作為分割路徑,后來在程序中控制邊界情況后效果良好。
經過計算,得到結果衡量指標[15],如表3所示。

表3 SVM 和BP結果指標
針對本題背景,漏警概率為偏色的圖片被識別為正常,這個值應該越小越好,虛警概率表示正常圖片被誤判,在判定為偏色圖片中所占的比例,這個值也應該越小越好??傮w來說漏警概率重要程度大于虛警概率,需要保證盡可能不漏掉所有的偏色圖片。根據以上指標顯示,該模型能夠達到良好的效果。
本文從圖片提取、圖片預處理、特征向量提取、機器學習幾個方面闡述了基于機器學習對圖片分而治之的偏色檢測模型。該模型用于馬路視頻圖像偏色檢測,保證監控偏色異常能及時發現,以便下一步處理。重點介紹本模型的圖片預處理、特征值提取方法,并介紹了采用方法的優缺點。雖然實驗結果良好,可是馬路情況難以預測,本文的局部偏色方法有良好的結果,但是不能檢測出所有的局部偏色,比如圖片內部局部偏色。另外機器學習是處理大數據的方法,需要包含足夠的數據量,涵蓋所有的情況。圖片特征值提取直接影響到機器識別的準確度,未來工作旨在尋找更能體現偏色的特征值和足夠的機器訓練樣本。
[1] 方紫娟,謝正祥,呂霞付,等. 一種改進的基于暗通道先驗知識的去霧算法[J]. 微電子學與計算機,2014(5):74-78.
[2] 巢琳, 楊鳴. 基于圖像偏色檢測的自動白平衡算法研究[J]. 移動通信, 2015(8):80-83.
[3] 徐曉昭,蔡軼珩,劉長江,等. 基于圖像分析的偏色檢測及顏色校正方法[J]. 測控技術,2008,27(5):10-12,21.
[4] 夏東. 基于Lab色度空間的視頻圖像偏色檢測方法: 201310336726.8[P]. 2013-11-20.
[5] Cooper T J. Color cast detection and removal in digital images: US6377702[P/OL]. 2002-4-23. http://www.google.com/patents/US6377702.
[6] 姚洪濤, 田青青, 蘇偉,等. 基于彩色直方圖均衡化的自動白平衡算法研究[J]. 長春理工大學學報(自然科學版), 2014(4):104-107.
[7] 鄭秀娥. 淺談圖像偏色的校正[J]. 山東工業技術,2015(12):216.
[8] Gao Y, Yang L, Li S, et al. On distribution function of the diameter in uncertain graph[J]. Information Sciences, 2015, 296(1):61-74.
[9] Zhang C, Wang T, Atkinson P M, et al. A novel multi-parameter support vector machine for image classification[J]. International Journal of Remote Sensing, 2015, 36(7):1890-1906.
[10] Zhang J, Yang Y P, Zhang J M. A MEC-BP-Adaboost neural network-based color correction algorithm for color image acquisition equipments[J]. Optik-International Journal for Light and Electron Optics, 2016, 127(2):776-780.
[11] 薛俊韜, 縱蘊瑞, 楊正瓴. 基于改進的YCbCr空間及多特征融合的手勢識別[J]. 計算機應用與軟件,2016,33(1):151-155.
[12] Friedman N, Geiger D, Goldszmidt M. Bayesian Network Classifiers[J]. Machine Learning, 1997,29(2):131-163.
[13] Kanungo T, Mount D M, Netanyahu N S, et al. An efficient k-means clustering algorithm: analysis and implementation[J].IEEE Transactions on Pattern Analysis & Machine Intelligence, 2002,24(7):881-892.
[14] Arvind V, Bler J, Kuhnert S, et al. On the isomorphism problem for decision trees and decision lists[J].Theoretical Computer Science, 2015,590(C):38-54.
[15] 周志華. 機器學習[M].北京:清華大學出版社,2016:23-169.