曹成志
摘 ?要:隨著人工智能的飛速發展,一系列新興技術不斷興起,而圖像識別技術作為其中最有潛力的方向之一,在醫療、交通、農業等領域都有十分廣泛的應用。本文闡述了圖像識別的基本概念和技術原理,并結合深度學習具體實例,對圖像識別技術的應用進行初步研究,最后指出該技術存在的問題并對發展前景進行展望。
關鍵詞:人工智能;圖像識別;深度學習
引言:
圖像,是人類歷史中最為重要的信息源之一,它通過觀測系統從客觀世界中獲得,可以直觀地表達事物的特征。近年來,隨著大數據時代的到來和計算機技術的蓬勃發展,圖像的數據量呈現指數型增長,圖像識別技術的應用也越來越廣泛,并在衛生醫療、科學研究、故障診斷、交通運輸等領域取得了一定的成績,并改變著人們的日常生活。本文簡要介紹了圖像識別技術的含義、原理和應用領域,并分析該技術的問題和發展前景。
一、圖像識別技術概述
1.圖像識別的含義及發展
圖像識別,是模式識別技術在圖像領域的具體應用,是對輸入的圖像信息建立數學模型,對圖像進行預處理操作,分析并提取圖像特征,然后根據特征建立合適的分類器,進行分類識別的技術[1]。其主要目的是對圖像等可視化信息進行處理和識別,來解決計算機與外部環境的直接通信過程。
圖像識別起源于20世紀40年代,在當時由于計算能力的限制和硬件設施的缺失,并沒有得到很好的發展。主要經歷了三個階段:文字識別、數字圖像處理與識別、物體識別。直到20世紀90年代,伴隨著人工神經網路的興起和計算機技術的發展,圖像識別技術得到廣泛應用,并涌現出很多不同的算法,涉及邊緣檢測、區域提取、閾值分割等多個部分。
2.圖像識別原理
圖像中包含了豐富的數字信息,識別過程主要包括圖像預處理、特征提取和圖像分類三個部分。
1)圖像預處理
對圖像預處理的目的是減少后續過程中的復雜度并提高識別效率。通過各種降低噪聲的手段,將圖像中蘊含的數字信息進行適當簡化,便于對特征進行提取[2]。在該過程中,圖像分割的質量對最終結果具有較大影響。如何高效地將特征目標從源圖像中分割出來,是解決問題的關鍵。由此衍生出了一系列圖像分割法,例如基于方向圖的分割法、三級分割法等等。每一種分割法都有優點和不足,在進行處理時,往往需要將多種方法結合起來并進行適當修改,才能獲得最優的分割效果。
2)特征提取
特征提取是將圖像上的特征點劃分為不同特征子集的過程,這些子集往往是點集、曲線集或連通的的區域集[3]。一般來說,提取的圖像特征主要包括顏色、形狀、紋理和空間四種。顏色特征能夠很好地描述不同顏色在整個圖像的所占比例,適合用于難以自動分割的圖像,但是無法對空間位置進行描述;形狀特征需要對圖像的某個特定目標進行研究,但是如果圖像上的目標發生變形,準確度就會大大下降;紋理特征具有全局性質,對區域性的特征描述具有較好的 穩定性,但是當分辨率變化明顯時,得到的特征偏差也會隨之增加[4];空間特征對靜止圖像的描述效果很好,可是一旦圖像進行縮放、旋轉等操作,特征變化會非常明顯。
3)圖像分類
圖像分類,主要是從一張或者多張圖像總識別出與模板圖像相似的區域,用來預測出對應的類別。在實際應用中,由于拍攝環境等因素的影響,圖像的質量會受到各種因素的干擾,導致失真和扭曲等。如何提高匹配率,加強抗干擾能力并提高匹配速度,成為圖像匹配的主要研究方向。由此出現了很多基于圖像特征的匹配方法,例如幾何圖元法、傅氏形狀描述法等。近年來,深度學習的興起,為圖像匹配提供更多思路和方案。
二.圖像識別技術的應用
目前,識別技術已經廣泛應用于醫療、交通、農業等領域,為人們的日常生活帶來極大便利。
1.醫學圖像識別
醫學圖像種類眾多,清晰度容易受到成像環境的干擾,這些問題在一定程度上會影響醫生對病情的判斷結果。而借助圖像識別技術對患病部位進行檢測和診斷可以顯著提高工作效率,診斷準確率有時甚至可以超過人工診斷準確率?,F階段,該技術的應用主要集中在眼部、胸部、腦部等,可以用于診斷肺癌、乳腺癌、阿爾本次海默癥等,在這些方面取得了一定的研究成果[5]。但是目前為止,由于不具備大量相關的數據集,圖像識別技術對很多病變部位還無法做出判斷。
2.交通識別
在公共交通領域,圖像識別技術主要應用于交通標志識別、車牌識別等,在自動駕駛、智能停車、交通控制等領域發揮著舉足輕重的作用。近年來,一些學者將卷積神經網絡、循環神經網絡等深度學習算法運用到交通標志識別,可以有效提高識別的準確度,并提升訓練速度。另外,圖像識別技術還可以用來檢測路況和行人等物體,為無人駕駛汽車的興起具有顯著推動作用。
3.農業病蟲害識別
農業是我國最重要的基礎產業之一,在現代經濟體系中具有十分重要的地位,農作物的產量和質量直接影響人民的生活水平。而農業病蟲害的爆發往往會造成農作物大幅度減產,對國民經濟造成不可逆轉的損失,因此對病蟲害的防治工作就顯得十分必要。如何對蟲害進行準確有快速的識別和處理,是保證農作物正常生長的有效措施。而依靠人工識別方法比較浪費人力物力,而且出錯率較高,工作繁瑣,越來越不能滿足農業生產的需求。圖像識別技術具有準確、實時和快速的特點,可以很好地輔助農民檢測和發現病蟲害,大大提高工作效率。目前為止,已經實現了對玉米螟、棉鈴蟲等農業害蟲的圖像識別與檢測,準確率較高,同時也降低了農業生產的成本。
三.問題與展望
現階段,圖像識別技術已經具備了一定的應用價值,但在該技術上的理論研究還不夠完善,依然存在一些問題丞待解決。
1.圖像分割算法的性能評估沒有特定的標準,這就為方法的選擇和使用造成一定困難。
2.識別效果主要依賴于大樣本數據集,因此會為數據采集工作提出更高的要求。
3.訓練模型越復雜,計算量越大,訓練時間也會越長。
由此可見,如何在保證準確率的同時,減少模型的計算量并提高計算效率,是圖像識別技術研究的關鍵之一。為了進一步改善該技術,我們應注重算法的原理,不斷優化模型結構,減少訓練參數,提高準確率。
四.結束語
圖像識別技術的出現,為人民的生產和生活帶來極大便利,并推動醫療、交通、農業等領域的建設,但依然還有很大的開發空間,需要更多學者和研究人員的投入。在將來,還會出現更成熟、更方便、更快捷的識別技術,不斷促進人民生活水平的提高。
參考文獻
[1] ?豐曉霞. 基于深度學習的圖像識別算法研究[D].太原理工大學,2015.
[2] ?陳勇濤,郭曉穎,陶慧杰.基于深度學習的圖像識別模型研究綜述[J].電子世界,2018(04):65-66.
[3] ?王志瑞,閆彩良.圖像特征提取方法的綜述[J].吉首大學學報(自然科學版),2011,32(05):43-47.
[4] ?楊德坤. 圖像紋理特征的研究[D].山東師范大學,2012.
[5] ?田凈雯,張雄,胡珺,朱福.圖像識別在醫療領域中的應用[J].上海醫藥,2019,40(03):12-13+54.