計算機智能化圖像識別技術探討

2023-09-20 02:19:58薛榮輝劉星星

信息記錄材料 2023年8期

薛榮輝,劉星星,王楠

(西安汽車職業大學汽車工程學院陜西西安 710600)

0 引言

隨著數字化計算快速發展,信息技術與智能化計算機圖像識別技術得到了融合,在此背景下,神經網絡算法在圖像識別領域也發揮了重要作用。當下,計算機圖像識別在智能算法領域得到廣泛應用,從本質上來講,它是一種融合了智能化計算機技術和現代圖像識別、處理技術的新興數字影像技術,該技術經過全面的技術革新,已經被廣泛應用圖像識別與數字化技術處理等領域[1]。例如目前在很多場合都應用到了智能化技術,經過對計算機圖像進行低照度處理,即可提高攝像機、數字化監控設備的傳感器五色彩質量,圖像經智能化識別與處理,清晰度較高,同時采用高感光度技術,有效提高暗光下拍攝出的圖片、圖像識別度,正是因為有了智能化圖像識別技術,才使得圖片的清晰度大大提高,在保證圖片質量的同時,無需使用陣列紅外燈補光也能夠保留住原來的圖像色彩和清晰度。

1 計算機智能化圖像識別技術的基本原理與模式

計算機智能化圖像識別技術的核心是基于機器對圖像進行識別,經過對相關景物進行處理,收集和處理文字、圖像等圖片信息,經過計算機智能化圖像模式識別,能夠由機器取代傳統的人工處理技術,可對某些計算機智能化圖像數據信息進行自動化識別、處理、辨別與分類,在此過程中,系統還能夠對相關圖像中的具體圖形進行快速、準確識別分類[2]。目前,在我國發展的計算機智能化圖像識別模式主要包含三個環節,分別是對計算機智能化圖像進行分類,對計算機智能化圖像特征進行數據提取以及對計算機智能化圖像進行預處理。在前期處理環節,主要目的是采用計算機智能化圖像識別模式對圖像進行增強處理、平滑處理、數據恢復、圖像分割、圖像邊緣檢測等,從而使圖像輸入計算機中即可將上述幾種不同模式轉換為分段處理模式。其中,計算機智能化圖像特征提取主要是借助計算機智能化圖像識別模式有效提取圖像主要特征信息,由此為計算機智能化圖像中的少部分特征進行識別和有效分類。在這幾個環節中,最為關鍵的步驟就是計算機圖像模式分類,對于計算機用戶而言,他能夠通過圖像映射,將計算機智能化圖像類型空間、部分特征向量空間進行圖像歸屬映射,進而使圖像模式分類歸屬為某一類模式,計算機智能化圖像識別技術基本模式[3]如圖1所示。

圖1 計算機智能化圖像識別技術基本模式框圖

1.1 獲取計算機智能化圖像數據

在獲取計算機智能化圖像數據時,首先需要通過掃描儀、傳真機、數碼攝像機、數碼相機等設備,將圖片、景物、照片或圖像等經過數字化傳感器傳入,然后再將這些圖像轉換為相應的物理量,用于計算機測量和處理[4]。

1.2 處理計算機智能化圖像數據

在計算機智能化圖像數據處理過程中,分別需要經過三個不同的步驟,一是選擇計算機智能化圖像的基本特征,二是抽取計算機智能化圖像的基本特征,三是對計算機智能化圖像的基本特征信息進行預處理。經過圖像數據預處理之后,可以有效改善計算機智能化圖像的質量,與此同時,還能夠通過圖像數據處理,徹底消除因傳輸介質所引起的圖像退化現象[5]。在這幾個環節中,抽取計算機智能化圖像基本特征的實質就是有效提取出計算機智能化圖像的圖像性基本元素和圖像特性數字值,而在選擇圖像基本特征時,首先需要抽取特征元素,然后方能選擇特征原圖像進行圖像智能分類識別。

1.3 分類判別計算機智能化圖像

計算機智能化圖像判別分類,核心是通過建立圖像智能分類基本規則,根據規則,對圖像模式進行分類選擇,在此基礎上,借助智能神經網絡模式進行圖像識別,進而實現圖像的智能判別分類[6]。

2 計算機智能化圖像識別技術基本方法

現階段,研究者主要基于神經網絡計算方法,對計算機智能化圖像進行神經網絡識別,通過神經網絡識別圖像,能夠提高圖像識別效能,這種神經網絡技術具有數據大規模處理、計算機智能化圖像分布式存儲以及圖像識別自組織并行等諸多功能。

2.1 神經網絡識別

在采用神經網絡計算方法進行圖像智能識別時,首先需要進行機器學習,而學習特性即是神經網絡學習算法的基本特性,它能夠基于神經網絡計算方法,對神經網絡的具體權值以及網絡閾值進行有效調節,從而可以實現計算機神經網絡學習與訓練。目前,計算機神經網絡學習算法主要分為監督學習算法和無監督學習算法兩種基本模式,其中對于計算機神經網絡監督學習算法而言,在神經網絡學習訓練時,必須要有一定量的輸入矢量和目標矢量作為訓練樣本。而在學習訓練過程中,計算機神經網絡能夠實時輸出目標訓練結果,并進行數值比較,根據比較情況,可有效調節網絡權值與相關閾值,由此經過循環往復的學習和訓練,最終使計算機神經網絡輸出結果更加靠近目標訓練值[7]。當下,最為典型的計算機神經網絡算法為BP算法,它是一種常見的計算機神經網絡監督學習算法?，F如今,也有學者通常采用計算機神經網絡無監督學習算法進行智能圖像識別,這種技術相比于監督學習算法,它在整個學習訓練過程中,均無需學習樣本即可實現自我學習,系統只需要輸入相應的網絡信號,即可反復調節計算機神經網絡的相關權值和閾值,最終形成一種有序的監督學習狀態。圖2所示為基于神經網絡算法的計算機監督學習流程。

圖2 基于神經網絡算法的計算機監督學習流程框圖

2.2 改進的GA-BP算法

在算法領域,BP算法往往具有良好的自學習性,但是其收斂速度較差,尤其在基于BP算法進行梯度下降計算時,機器學習訓練時長較長,且非常容易陷入局部極小的困境之下。對此,本研究為了改進上述BP算法缺陷,將傳統BP算法模式與GA遺傳算法模式相結合,形成了經改進的GA-BP算法,該算法模式能夠有效避免以往算法模式所帶來的未成熟收斂算法缺點,同時還可進行全局最優解搜索與收斂,相比于普通的BP算法而言,經過改進的GA-BP算法基于神經網絡算法思想,可使遺傳算法的魯棒性顯著得到增強,同時還可以充分發揮神經網絡算法的非線性學習能力、收斂速度與映射能力[8]。

2.2.1 基于改進的GA-BP算法思想

改進的GA-BP算法采用遺傳算法思想進行神經網絡權值學習,首先確定GA-BP算法的神經網絡結構,然后列出遺傳算法神經網絡神經元之間的連接關系,在此基礎上,通過連接權編碼,分別形成實數碼串個體與群體,與此同時,進行算法優化計算分析,最后基于遺傳算法對最優個體進行解碼處理,由此有效確定神經網絡具體權值。在本研究中,分別通過三個不同步驟的神經網絡學習,獲得遺傳算法的神經網絡權值。本研究通過一定次數的BP算法學習,有效選取學習結果初值,進而利用遺傳算法模式對收斂速度較慢的算法權值進行網絡學習,由此完成給定精度的算法初始值賦權,這種基于BP優化算法的網絡模型記憶力較強,穩定性良好,且具有較強的算法推廣能力,同時還可以提升算法網絡模型的全局收斂速度。

2.2.2 構建GA-BP算法網絡分類器

在計算機智能化圖像識別過程中,可基于GA-BP算法識別模型,分析雙隱層數字圖像BP網絡分類器樣本構成及其訓練方式。在對數字圖像進行去噪與分割處理之后,可對數字化圖像進行逐行、逐列進行掃描,在此過程中,分別將黑色、白色像素特征記為“1”和“0”,當算法掃描結束之后,即會構建一個具有和圖像相同個數的特征向量矩陣,該矩陣維數為3維,構建起網絡分類器之后,還需進行GA-BP網絡訓練,整個算法學習訓練過程分別包含學習速率選擇,輸入層/輸出層/隱層設計,訓練算法初始化網絡選擇及訓練樣本數選擇。

2.2.3 網絡層數選擇

BP神經網絡設計的首要原則是降低算法誤差,通過增加線性輸出層與S型隱含層網絡的實際隱層數,可以大幅提高全部有理函數的算法精度,并使其進一步逼近BP神經網絡算法精度。在本文中,所選擇的BP神經網絡總共包含4層,分別是網絡層,輸入層,輸出層和運算層,首先在網絡層進行第一層運算,然后將輸出量信號輸入到輸入層首層,在此基礎上,進行第二層算法運算,經過訓練之后,將機器訓練學習結果輸出到第二層和第三層進行算法運算,在整個算法模式中,第一層的主要功能是對輸出量信號進行線性分類,然后通過第二層進行算法邏輯運算,從而使非交凸集合分類的“與”邏輯同“或”邏輯運算得以實現,進而完成整個非交集合分類過程。

2.2.4 輸入層設計

主要根據數據表示方式類和求解問題確定算法輸入層單元數,在對計算機智能化圖像信息進行識別時,首先需要輸入處理后的圖像特征空間維數,在此基礎上,對特征分量維數進行提取并確定神經單元數,此時算法輸入層的圖像像素數和網絡神經元數為“N”。

2.2.5 隱含層單元數選擇

BP神經網絡隱層單元輸入間屬于單調上升的非線性函數,而輸出時間對算法隱藏單元的要求是單元數要合理,如果在基于算法進行計算機智能化圖像識別時,由于隱層單元數較少,此時BP網絡層隱層單元的準確樣本特征和網絡可能提取及訓練不出來,在這種情形下,未訓練樣本容錯性就會大大提升,同時計算機智能化圖像就無法得到有效識別。相反,若BP神經網絡隱層單元數過多,此時其整體的結構復雜度就會上升,在這種狀況下,如若BP網絡層隱層單元的網絡規模過于龐大,則隱層單元數網絡的訓練時間就會顯著增多,同時由于算法訓練特征不收斂,則會導致計算機智能化圖像特征空間劃分過細,如果訓練樣本網絡泛化能力不強,從而會使訓練以外樣本識別率大大降低。

3 實驗仿真及結論

綜上分析,本研究基于GA-BP四層神經網絡進行神經學習算法訓練學習,將隱含層節點數分別設置為6、12、18、24、30,而將輸入/輸出節點依次設置為“251”和“4”,然后分別通過對比分析不同的訓練時間、訓練次數,收集和計算實驗數據,對比結果發現,通過GA-BP神經網絡算法智能化識別的圖像正確率最高為96.7%,而算法識別正確率最低為86.3%,兩者相差10.4%,由此表明,采用改進的GA-BP算法進行計算機智能化圖像識別,當GA-BP四層神經網絡隱含層節點數設置為24,機器學習訓練時間為8.49 s,且學習次數達到81次時,可以最大程度上減少和避免普通算法訓練收斂速度緩慢的問題發生,并取得最佳的算法識別效果。表1所示為神經網絡識別數據。

表1 基于GA-BP算法的計算機智能化圖像識別數據

4 結語

綜上研究,數字影像技術已經伴隨我國信息技術發展逐步滲透、融合和應用到我們日常生活和生活的各個領域,尤其隨著計算機技術和互聯網技術、智能算法等不斷發展,計算機智能化圖像識別技術傳輸與存儲已變得十分先進。但由于傳統圖像識別方法具有很大的技術局限性,因此對現代化新興計算機智能化圖像識別技術的研究一直以來都是國內外學者廣泛關注的研究的重點所在。在此背景之下,針對傳統圖像識別技術和算法搜索過程中存在的訓練時間過長、樣本冗余性大、不便于機器學習從而導致算法識別結果不精準等問題,本研究在分析問題基礎上,提出了一種經改進的GA-BP四層神經網絡學習算法,借助GA-BP神經網絡識別模型進行計算機智能化圖像識別,研究分析表明,該算法模型和圖像識別新方法是高效的。數據顯示,基于GA-BP四層神經網絡算法分析識別下的圖像識別率為96.7%,而傳統方法識別率僅86.3%,因此實驗充分表明該方法有效,且能通過GA-BP算法基于不同類型目標樣本有效解決圖像識別失真率高、檢測率低、穩定性差等問題。