鶴壁高中 河南 鶴壁 458000
正文:
花卉,具有觀賞價值的草本植物,是用來欣賞的植物的統稱,喜陽且耐寒,具繁殖功能的短枝,有許多種類。花卉通常由花卉、花冠、花萼、花托、花蕊組成,有各種各樣的顏色,有的長的很艷麗,有香味。而圖像識別技術是人工智能一個重要領域,為識別各種不同模式和對象的技術。近年來,我國科技迅速發展,圖像識別技術也日益成熟,本文以圖像識別技術為基礎,以花卉為識別對象對其進行快速識別并且分類,為人工智能技術提供經驗。
前文中提到,花卉通常由花冠、花萼、花托、花蕊組成,且大多數為被子植物,通常生長在一個有限的短軸上,著其花冠與生殖器。通過使用圖像分割技術將提取圖像中的物體與背景分離,針對其紋理對其進行識別,判斷是否為花卉。
不同的花卉,其葉,枝花冠形狀等都有明顯的區別,可通過使用圖像提取并在數據庫里進行查找的方法來識別花卉。
特征提取是花卉識別的重要環節,在輔以正確的算法對特征進一步分析。由于花卉種類較多,花冠顏色較為繁雜,所以花冠不具備較大參考價值。本論文以其葉莖、形狀、紋理等方面進行分類。
形狀特征有利于分析花冠的瓣的層數,且光照,顏色對形狀特征無太大影響,具較強魯棒性。本論文主要采用最小外接矩形寬高比,凸包面積比,HU不變矩來描述牡丹形狀特征
此算法針對花朵側面圖片,對于花卉來說可辨識花瓣層數。判斷標準為花朵中間突出程度,此方法主要用于辨識側面圖片,而不適用于正面圖片。
凸包是正面圖片中花朵的最小外接多邊形,該特征用于花瓣層數,葉片厚度,葉片疏密程度。花瓣層數少者,相應花瓣間縫隙較大,層數多著相反。兩類在凸包面積與花朵面積的比值上存在一定差異。此算法運用這種特征,用于定量描述花朵的形狀特征,直觀地呈現出不同花朵的不同差異。
幾何矩主要用于圖像描述。不變矩是一種高度濃縮的圖像特征,具平移、旋轉與尺度不變形。一幅灰度圖像可用于二維灰度密度函數表示。因此用矩來描述灰度圖像特征,對其莖葉識別有很大幫助。
紋理是一種反應物體表面紋理脈絡的視覺特征,它體現了物理表面具有緩慢變化的表面結構組織排列屬性,可利用圖像信息,兼顧其宏觀性質,細微結構兩個方面。
在圖像任取一點以及偏離其的一點形成一個點對,并用函數表示初始的灰度值設為(i、j)令此點在整幅圖上移動,得各種(i、j)值,則形成灰度聯合概率矩陣(灰度共生矩陣)。根據不同的數值組合,可以得到不同情況下的聯合概率矩陣。
KNN算法是計算機算法中的一種監督、學習、識別算法。主要內容為給目標樣本周圍找個找個K“鄰居”根據其鄰居多少占比來賦予這個樣本周圍占比最大鄰居的屬性。
比較于其他圖像識別算法、KNN算法的過程十分簡單,而且是一種需要時刻重復“刷新”的計算方式。
KNN算法主要取決以下幾個方式要素:
1.距離
KNN作為以鄰居的占比來決定樣本性質的算法,其距離自然就成了影響模型的重要因素之一。K值(距離)的選擇直接影響其精確度與在圖像識別上的正確率,若K值較小,則意味其復雜度與精確度會再上一層,同時屆于擬合。但K值越大,模型越簡單,K值過大,則結界將總是占比較高的樣本。
根據圖像識別的原理我們可知:圖像識別的算法因為其識別對象的變幻與復雜性、需具備靈活多變性。
2.距離的度量
即測試樣本與訓練樣本的臨近程度,K的大小限制了其選擇
3.分類權重
找好測試樣本周圍的訓練樣本范圍后,我們就需要,根據訓練樣本決定測試樣本屬性,這時就需要制定好的決策規則,常用的有以下兩種:①多數表決;②給予不同距離的測試樣本不同的權值。C比如權值與距離成反比。
KNN的算法固然簡便,但在實際應用正確率卻并不高。并不是理想的圖像識別算法。
機器學習的算法之一,大體內容為將具有相似特征的對象通過線性組合來做出分類決定。有兩部分組成;評分與損失函數、對所處理數據問題進行優化,優化過程中通過更新評分函數的參數來最小損失函數值。在辨別圖像如下應用:
圖像是三維的,可拉伸為一個列向量,對其進行分類,即得出某值,占比最大。若訓練數據中有3000張圖像的數據,即可尋找不同圖像(即所識別的圖)權值比重,放入其分類器識別,占比高的一項即為這張圖的屬性。
總體來看,線性分類器實質上是一個學習模塊,通過深度的數據學習來建立一個個模板,再將目標圖片上的數據代入模塊,進行配比。相較于KNN的設定區域進行對目標數據的定義,這種方法準確性較高,因為線性分類器并未用其所有數據進行一一比對,而是每次識別只用一張圖(減少因數據太多太雜出錯的概率)而且是使用內積計算,不是用L1.L2來覺得其權重。
以神經元為原理,即某一神經元可以影響其他神經元的高效識別方法,因為某方向性與獨特結構而別應用,它可以有效的降低反饋神經網絡復雜性與不穩定性,可以直接輸入原始圖像。卷積在此為內積,就是根據多個一定的權重(卷積核)對一個塊的圖像進行內積運算,重點位于由局部提取出的整體。一般來說,CNN的結構包括兩部分,特征提取層、特征映射層。每層與其下一層緊密相連。并且逐層提取其特征,并對其數據進行記錄,整理。二是特征映射層,每個計算層生多個特征映射層組成,每個特征提取層是一個平面,每個平面權值相同,因為特征提取性算法減小了結構的分辨率。
CNN的局部感知能力很強,多個反射層使其算法簡便了許多。僅需在局部提取,最終在最高層進行整合即可。CNN相較于普通網絡還有一個特點,橫向讀取,幾個神經元橫向對圖片進行提取,相對于普通神經網絡全部神經元都讀取全部圖片這一做法,卷積神經網絡效率更高,讀取更有規律性。圖像處理步驟更加簡便。
另外,池化也是其算法的特點之一,在部分特征提取時(假設劃定某一區域提取)即選擇該區域的最大值或平均值取代該區域,該算法使數據敏感度與算法復雜度降低。比較KNN算法過于死板,不注重變化,在圖像識別中不推薦使用。線性分類器通過深度學習結果模型代入數據的方法雖好,但終究讀取范圍能力有限,需要人為進行大量調整,反復修改。相較之下,卷積神經網絡運用局部特征提取的算法,減小了運算與數據處理的復雜度。兩者在這一點上可以取長補短進行結合。兩者在有光線影響遮擋的情況下,仍舊十分準確的識別出了目標圖片中花卉的種類,識別用時幾乎相同。相較之下,支付寶識花的準確率更大些(微軟喜歡給出幾個不同結果,雖然概率最大的那個是正確的)。
通過使用支付寶與百度的實話技術后,我得出兩者中的共同特點。
百度識花與支付寶識花都是運用類似線性分類器的算法運算——通過從海量圖庫中深度學習,建立起對界門綱目科種屬的具體識知(即成立相對應的線性分類器)鑒于花卉植物的多樣性采用單純的KNN算法出錯幾率太大。花卉識別注重其遞進性而不是整體性。而這時,卷積神經網絡里的局部特征提取法就占了優勢。我在運用支付寶識花軟件與微信識花軟件時的目標為巴粟,其判斷結果都具有類似的紋路,外形且準確率也很高。此外,在辨識出花卉的同時亦能判斷出其他物品所屬種類,說明其算法具有靈活多變的特點。