王巖 姬一波


【摘要】? ? 近年來,社會經濟快速發展的同時,計算機信息技術更新的速度不斷加快,逐漸滲透到各個領域當中,為人們帶了極大的便捷。互聯網的普及也使得信息量呈爆炸式增長,卷神經網絡能夠大幅度提升圖像的識別率,從而更加高效的挖掘圖片信息數據,人工智能技術越來越成熟,深度學習也備受人們的高度關注。傳統圖像識別技術相對落后,且識別率低,面對海量的圖像信息數據,傳統識別方式顯然已經無法滿足當前的實際需求。
【關鍵詞】? ? 卷積神經網絡? ? 圖像識別? ? 算法? ? 邏輯回歸
引言:
卷積神經網絡是一種基于人工神經網絡,并將深度學習理論融入其中,從而探索出的一種新型識別算法,這也是目前圖像識別領域發展過程中的重點研究方向。自上世紀九十年代末以來,CNN識別技術便步入了高速發展階段,且逐漸趨于穩定,但是該網絡技術結構存在一定局限性,在對自然圖像進行識別過程中,整體效率與速度依然存在不足之處,無法達到理想化的程度。為了有效改進與優化CNN在自然圖像識別過程中的整體效果,文章通過對當前CNN網絡結構進行了深入分析,并進一步提出了自然圖像識別的卷神經網絡算法,從而逐步實現CNN識別算法可在短期時間之內進行快速收斂,從而達到理想的識別效果。
一、圖像識別與卷神經網絡簡述
1.1圖像識別算法
1.1.1貝葉斯分類法
該方法是統計學中的一種,以統計學為基礎,并采用葉貝斯定理對其進一步分類,這樣的分類方法可以將分類問題逐漸轉化為概率的形式進行表達,并且概率為已知,對圖像特征進行提取分類,通過貝葉斯定理公式計算驗證,之后將圖像進行分類,公式如下:
從以上公式當中我們能夠看到,P(B)能夠表明B條件下的概率,P(AB)指的是相同條件下實現概率,P(A/B)指的是B條件發生后,A件的發生概率。該方法有一定的缺點,并非每個圖像都可有效提取具有一定代表性的特點,當出現該情況時,采用該方法進行圖像分類,會造成圖像分類出現非常大的誤差[1]。
1.1.2模板匹配法
從名字當中便能夠看的出來,其是由根據模板在目標圖像當中對其進行匹配,這樣的方法也被廣泛應用于圖像處理過程中。具體的過程為,先制定模板,之后再針對目標圖像以及對應模式,匹配和模板大致相似的圖像,比較相似的部分還包含圖像的方向與大小,再經過匹配之后,便能夠確定圖像的具體位置。這樣的方法也存在缺點和不足,需要結合圖像設計類似的模板,因此對設計者的研究經驗要求較高[2]。
1.2卷積神經網絡
卷積神經網絡結構屬于人工神經網絡,對映射特征圖和卷積神經網絡當中的卷積核進行計算,并采用函數計算,一般經常使用的是雙曲正切函數。卷積層獲取圖像特征,從不同局域獲取單元節點數據,需要覆蓋整個數據集,如果是相同的圖像,使用卷積核時是不同的,輸入圖像不同,應當采用相同卷積核,這便是權值共享。在池化層當中,為降低平面圖大小,可取映射平面圖中的矩形區域最大值,這樣可有效降低平面圖大小,并且維持空間不發生變形,避免發生過度擬合的情況。如映射層面特征圖大小為8**,在經過池化后,便會得到4*4大小的特征圖[3]。
二、基于卷積神經網絡的圖像識別算法設計
2.1 Mapreduce編程結構模型
Mapreduce是一種并行編程模型,主要應用于大型計算機集群工作中,可對TB、PB數據集進行有效處理,編程模型具有包容性強、操作簡單以及整體擴展能力強等諸多優勢和特征,被廣泛應用于計算機科學領域當中,Mapreduce編程結構是一種樹狀圖結構,采用主節點對大數據集操作模塊進行管理,主節點之后再將任務分發到不同分界點,由分節點對數據進行處理后匯總到主節點。Mapreduce整個處理過程中主要是由Map函數與Reduce函數兩個部分共同組成,兩個函數的具體處理任務也有很大不同,Map函數是對需要進行處理的任務進行分解為多個模塊,Ruduce函數是對完成處理之后的模塊匯總。流程如下圖1所示。
2.2基于Mapreduce的CNN算法設計
該算法是對所訓練數據進行分類,分為大致相同的小部分,和Hadoop平臺中的節點對應,并且通過平均分布的方式進行有效存儲,通過不同節點儲存CNN網絡數據,進行網絡訓練過程,Mapper任務接受數據,可作用在不同節點,并利用正向和方向傳播,計算權值和偏置的變化量,并形成中間鍵數值,完成樣本計算后,對本地文件進行處理,本地文件進行匯總處理之后,各次訓練獲取到的數據再寫進全局文件當中[4]。
2.3 CUDA技術及平臺分析
CUDA編程模型屬于一種能夠支持GPU處理計算的數據開發利用環境,其由NVIDIA公司提出,GPU是一種圖像處理器,GPU的發展及應用大幅度提升了計算機圖形的處理效率與質量,且對計算機圖像仿真、虛擬現實環境以及圖像處理技術等領域的發展具有重要的促進作用。CUDA和GPU之間的有效結合,使得編程人員在CUDA平臺上可采用一般通用化的匯編語言C語言進行匯編,之后再采用GPU完成匯編程序整個運行過程,這樣便不需要單獨的去學習圖像知識,從而有效降低GPU數據計算的難度,使其更加簡化,從而大幅度提升了系統的整體穩定性。CUDA平臺下的數據處理結構由CPU與GPU兩者共同組成,GPU+CPU結構可有效提升計算機性能,同時也能夠節約能源。[5]
2.4多區域邏輯回歸計算的網絡具體改進方法
圖像識別過程中,為了不斷提升實際訓練過程及速度,是需要針對圖像實際情況,對其進行預處理的,這樣也能夠有效去除圖像當中過多的干擾信息數據,之后再對處理之后的圖像進行劃分以及識別,文章將其主要劃分為5個區域,即四個角區域與中心區域,在測試識別過程中,只對中間區域進行測試。
三、圖像識別結果分析
3.1結果
通過系統的篩選以及訓練整個過程,輸入系統當中的數據集主要分為兩類結果:系統預測分類和期望值符合情況下,系統會顯示分類正確,系統預測分類各期望值不相符情況下,系統會顯示分類錯誤的情況,采用通用數據集輸入接口方式,這樣可對數據集進行合理有效分類。
3.2不同區域測試對識別結果產生的影響
這里主要采用的是COFAR10數據集測試,系統會針對每個具體測試結果以及錯誤率進行合理保存,并采用Python腳本查看錯誤率的整個變化狀況,每個epoch為128個樣本。對參數與網絡結構參數進行調整,在未采用邏輯回歸計算時,系統分類錯誤率為18%,采用邏輯回歸后,系統分類錯誤率為13.4%,準確率大幅度提升。原始圖像處理過程中,圖像未經裁剪,但在MR-CNN-G使用過程中,圖像是經過裁剪的,訓練過程中,前者所用時間更少,在測試環節當中,時間明顯增加了。
四、結束語
近年來,隨著互聯網計算機技術的快速發展與普及,已經逐漸滲透進人們生活中的方方面面,為人們帶來了極大的便捷,圖像識別算法作為一項新型的技術,經過長期的發展,CNN算法也取得了顯著的成果,通過對其進行優化改進之后,運用到圖像識別過程中,這樣也極大的提升了圖像識別的實際準確率,并且在整個提升過程當中,數據處理效果明顯增加,但是就目前現狀來看,依然存在諸多問題,如圖像處理過程復雜化,預處理時間也比較長,在對GPU引入過程中,因為數據接口不通用,因此,需要選擇及輸入相關數據集。
參? 考? 文? 獻
[1]張榮磊, 田愛奎, 譚浩,等. 基于卷積神經網絡的圖像識別算法研究[J]. 山東理工大學學報(自然科學版), 2018, 032(001):48-50.
[2]田壯壯, 占榮輝, 胡杰民,等. 基于卷積神經網絡的SAR圖像目標識別研究[J]. 雷達學報, 2016, 5(3)33-34
[3]杜蘭, 劉彬, 王燕,等. 基于卷積神經網絡的SAR圖像目標檢測算法[J]. 電子與信息學報, 2016(12).22-23
[4]許振雷, 楊瑞, 王鑫春,等. 基于卷積神經網絡的樹葉識別的算法的研究[J]. 電腦知識與技術, 2016, 12(010):194-196.
[5]李志明. 基于卷積神經網絡的虹膜活體檢測算法研究[J]. 計算機工程, 2016, 42(005):239-243,248.