吳凱 武昌工學院
圖像處理是指利用計算機技術對圖像進行分析,以便能夠達到人們期望的結果,比如美顏相機需要針對人們的照片進行增強,就可以利用圖像處理技術,識別面部的不和諧之處,將圖像的光照顏色增強,同時還可以處理面部狀態進行美妝。目前,圖像處理通常應用的方法包括六個,分別是圖像變換方法、圖像壓縮與編碼方法、圖像增強與復原方法、圖像分割方法、圖像描述與分類方法。圖像變換可以直接在空間域中進行處理,實現局部特效;圖像編碼壓縮可以改變圖像的大小,節省圖像傳輸時間。圖像增強和復原可以提高圖像的質量,去除圖像中的噪聲數據,比如可以促使圖像中的目標物體輪廓更加清晰。圖像分割可以將人們期望的內容從圖像中提取出來,也是進行圖像深度處理的基礎。圖像描述是圖像識別和理解的前提條件,可以實現圖像的體積描述、表面描述或廣義圓柱體描述。圖像分類也即是圖像識別,利用機器學習方法實現圖像分割和特征提取,應用范圍更加廣泛。
機器學習技術經過多年的研究已經誕生了很多,最為先進和主流的技術包括回歸分析、Apriori算法、卷積神經網絡和K-means算法。
(1)回歸分析
回歸分析能夠有效的反映數據庫中的屬性值在時間特征產生的信息。回歸分析可以將相關的數據項映射到函數上,這個函數是一個關于實值預測變量的,能夠發現變量或屬性之間的相互依賴關系,進一步發現數據的趨勢特征,預測數據的時間序列,發現數據之間的特征關系內容,更好的實現數據分析與操作,保證產品的生命周期穩定。
(2)Apriori算法
Apriori算法可以描述數據集中每一個數據項之間的關系,也即是如果某一個事件發生可能會引起其他事件一同發生,這種關系隱藏在數據中。經過多年的研究,Apriori算法已經得到了極大的改進,引入了許多先進的技術,比如遺傳算法、梯度算子、模擬退火等,提高了關聯規則發現的準確度和高效率,具有重要的作用和意義。
(3)卷積神經網絡
卷積神經網絡是一種多層次的前饋型人工神經網絡,包括兩個關鍵卷積層,分別是特征提取層和特征映射層,這兩個層次的出現使得卷積神經網絡特別適用于圖像處理。特征提取層能夠與輸入神經元進行有效連接,獲取輸入數據信息,從而可以提取一些圖像特征,并且確定圖像特征在圖像中的相對位置。特征映射層可以將提取的特征映射到一個平面上,在這個平面上每一個神經元都可以賦予相同的權值,經過訓練和學習之后,卷積神經網絡就可以得到一個良好的神經網絡結構,可以更好的應用于圖像處理。卷積神經網絡作為分類方法的一個重要算法,其可以描述更高階的抽象復雜函數,該函數可以更加準確的識別語音、提取關鍵特征、理解語音內容等,進一步的準確發現人工智能的相關任務,可以更好地發現深度學習的觀測值。
(4)K-means算法
K-means算法不需要已知數據的類別,他可以采用無監督的學習方式,自動的發現數據集中潛在的類別信息,針對這些信息進行分類操作,確保數據不同類別的相似性盡可能的小,同一類別中的數據相似度保持較高。K-means算法由于具有簡單性、無監督性,已經在很多領域得到廣泛應用,比如搜索引擎、基因序列識別、推薦系統等。
本文為了能夠更加詳細地說明機器學習技術在圖像處理中的應用,以車牌圖像中的字符識別為案例,引入卷積神經網絡技術進行設計,具體的圖像處理步驟如下所述:
(1)生成車牌數據集。本文與公安交通管理部門進行協商和溝通,采集了將近兩萬張車牌,這些車牌數據全部是交通監控視頻拍攝的實際數據,噪聲數據種類繁多且豐富,比如不同角度的光照、不同遮擋程度的照片、不同傾斜角度等,這些車牌數據經過歸一化處理后,統一使用垂直投影法進行有效切割,刪除車牌上的漢字或者字母,僅僅獲取十個阿拉伯數字的個數。
(2)卷積神經網絡輸入層數據。本文利用卷積神經網絡針對0-9阿拉伯數字字符進行標記,生成一個包含了一萬張突破的訓練數據集和包含一萬張圖片的測試數據集,然后使用二值化方法針對圖片進行灰度預處理,將圖片的大小統一設置為28×28像素,然后將像素保存到數據集中,以便能夠輸入訓練和測試。
(3)卷積神經網絡訓練學習和測試。本文的卷積神經網絡訓練測試時使用ReLU激活函數,這個函數可以有效的加快神經網絡收斂速度,還可以有效的減少神經網絡設置參數。該網絡包括三個卷積層、兩個全連接層、一個池化層。卷積層1的20個4×4的卷積核與輸入圖像進行卷積,卷積步長設置為2,可以得到20個13×13的特征圖;卷積層2設置每一個卷積核大小為3×3,卷積步長設置為2,經過卷積訓練后得到50個6×6的特征圖;卷積層3設置每一個卷積核的大小為3×3,卷積步長設置為1,卷積后可以生成60個4×4的特征圖;池化層的步長可以設置為2,這樣訓練完成之后就可以獲取80個2×2的特征圖;全連接層1擁有100個神經元,全連接層2擁有10個神經元,三個卷積層、池化層1和全連接層1的相關激活函數設置為ReLU函數,同時全連接層2的相關激活函數可以設置為sigmoid激活函數。卷積神經網絡設置完畢之后就可以進行訓練學習,精確度穩定和收斂之后就可以進行測試,本文進行測試之后,圖像處理的精確度達到了98.2%,能夠準確的識別車牌字符,具有一定的作用。
圖像處理作為當前人工智能應用的基礎技術之一,其可以有效的提升視頻圖像目標物體處理的精準程度,具有重要的作用。機器學習又是圖像處理的關鍵技術,已經得到了很多人的研究,目前在中科院計算機所、浙江大學CAD&CG實驗室等都提出了很多的新技術,大大的提高了圖像特征提取的速度,還提高了圖像處理的魯棒性。