張涵鈺 趙 平
(天津農學院 計算機與信息工程學院,天津 300384)
在國內這幾年,中國農業大學于新文教授對圖像的研究取得了較為明顯的進步,于新文教授主要采用相似距離分類法、二差分類法以及判別模型分類法三種方法對相關數字圖像的識別進行鉆研,在待識別目標圖像極其規范的情況下有著極高的識別精準度。
在國外,美國新墨西哥州立大學哈比卜·加蘇米和納迪普拉薩德教授等人利用人工神經網絡對棉花生態系統中的昆蟲進行分類識別。他們根據數學形態學中的基本理論對圖像進行膨脹與腐蝕操作,以達到對圖像進行分割的目的,最終成功實現了對生態系統中的植物進行識別[1]。
雖然現如今的圖像識別技術已經有了顯著的發展,但是還沒有一個專門用于菌類識別的應用技術去幫助人們了解想要了解的菌類的對應情況,來區分哪些菌類可食用,而那些菌類不可食用。
通過運用現如今的已經趨近成熟的圖像處理技術,舉一反三實現菌類識別,其中具體方法如圖1 所示。

圖1 圖像識別技術流程示意圖
通過對圖像識別技術的研究,使機器具有視覺能力,然后直接對接收到的視覺信息進行處理,并行反饋處理。圖像識別過程首先需要從外界獲取目標圖像。 這一過程通常稱為圖像采集,它可以通過使用攝像機、攝像機等圖像采集設備實現,然后根據圖像識別模式對采集到的圖像進行處理,在圖像識別過程中稱為圖像預處理,預處理后的圖像去除源圖像中的冗余信息,保存圖像的主要特征,最后選擇圖像的主要特征形成相應的信息映射和信息存儲在信息庫中進行比較,最終實現圖像識別[1]。
在中國,大約有180 種毒蕈,其中至少有30 種可以導致死亡。一般來說,有毒菌的顏色比較鮮艷,菌帽上可能會有突起,紅點,溝渠和裂縫,有的菌子上有菌托、菌環,因此此次項目可以利用這些真菌的特征信息來識別真菌,而圖像特征識別的步驟包括圖像預處理、圖像特征提取、圖像識別分類三個步驟。
2.2.1 圖像預處理
預處理是真菌鑒定過程中的重要環節。 由于圖像采集環境的不同,如光照程度和設備性能等因素,輸入圖像往往存在噪聲和對比度低等缺點。
因此菌類識別的預處理如下:a. 一幅圖像在實際應用過程中可能存在各種各樣的噪聲,這些噪聲可能是在傳輸或量化過程中產生的。菌類圖像也是一樣,在采集過程中會產生各種噪聲,所以必須進行去噪處理。b.去除背景,即將真菌從背景中分離出來,形成二值圖像進行邊緣檢測和形狀特征參數計算。c.真菌圖像經過去噪和背景去除后,可能仍會存在一些孤立的噪聲點,或者由于所選取的菌類本身受到過害蟲侵蝕而導致在其內部有一些孔洞,這些都會影響菌類特征參數的準確計算。因此有必要對去除背景后的圖像進行膨脹運算,然后進行腐蝕運算,經過多次處理,從而消除孤立的噪聲點和內部孔洞,得到完整、準確的真菌二值圖像。
2.2.2 圖像特征提取
由于自然界中的菌類具有不同的形狀與顏色,因此這些特征都可以作為菌類分類的依據。
顏色是菌類的一個重要性狀特征,因為HSI 顏色模型更符合人類的顏色視知覺,因此我們使用HSI 顏色模型的色度(Hue)表示菌類的顏色特征不同的形狀特征為菌類識別提供分了分類依據。考慮到一些菌類菌帽呈扇形、一些菌帽形雨傘形等特征情況,我們選用致密度和三個不變矩等特征建模菌類的形狀特征,其計算方式如下[3]:

2.2.3 基于SVM的圖像識別分類
SVM 是一種基于結構風險最小化原則的可訓練的通用機器學習方法,簡單概括來說的話,它只是一個分類器。支持向量機方法的原理即簡單的線性化和增維過程。在線性可分離情形下,從最優分類超平面發展出支持向量機。如圖2 所示,空心點和實心點表示兩種類型的樣本,H 是H 維分類超平面,H1 和H2 分別為過各類點且離分類超平面舉例最近且平行于H 的超平面。最優分類超平面理論要求分類超平面在正確分開兩類的基礎上最大化分類區間。

圖2 SVM 解釋圖
在得到含有真菌顏色和形狀特征的五維向量后,將這些特征作為真菌分類方法的輸入向量進行真菌鑒定。由于支持向量機(SVM)分類法具有非線性分類及良好的泛化性能,在模式識別領域是最具影響力的方法,所以此次項目選用SVM作為菌類的分類方法,在核函數上選擇徑向基核,因為它具有非線性分類性能和魯棒的性能。
2.2.4 研究效果
選擇5 種不同的真菌,每種真菌隨機選取30 個特征值作為訓練數據,其余的20 個特征值作為測試數據。在訓練模型中,利用五折交叉驗證對訓練模型進行優化(訓練樣本分為5 組,隨機選擇4 組進行訓練,1 組進行模型性能測試),選擇最優SVM懲罰參數c 和徑向基中的g[3]。

表1 基于徑向基SVM 的菌類分類性能
效果測試顯示此次項目所研究的菌類識別技術對于不同菌類的識別準確率較高,此方法具有一定科學效應。
在此僅將菌類識別技術與人臉識別技術與指紋識別技術進行對比,對比情況具體如下:
菌類識別技術沒有人臉識別的技術復雜,由于人臉的差異性不大,甚至有雙胞胎相貌相同等情況,所以人臉識別的預處理和特征提取的算法要比菌類識別的算法更加復雜,而菌類識別技術則是僅僅對真菌的形狀與顏色作為特征提取。
其實菌類識別技術與指紋識別技術根據有相似性,都是通過把一個現場采集到的圖像與一個已經登記錄入系統的圖像進行一對一的比對來確定身份的過程,但是,兩者的區別是指紋識別使用不同的數字化算法在指紋圖像上找到并比對指紋的特征,人們的十個手指產生最少4900 個獨立可測量的特征,指紋識別所提取的特征點更多也因此更加準確。
對比來看,如今項目所研究的菌類識別技術還處于初步階段,與現已成熟的熱門識別技術相比,菌類識別技術還太簡單,在后續的工作中需要對菌類識別技術進行不斷地更新完善。
菌類識別APP 的開發使得人們的生活更加快捷方便,其中主要特點列舉如下:
4.1.1 讓人們可以以快捷的方式學習相關的菌類知識
4.1.2 減少了人們誤食毒蘑菇的風險
4.1.3 擺脫了過往只能輸入名稱查百度詞條的方法
所有的科技發展都是為了使人們的生活更加方便快捷,我們此次對于菌類識別APP 的開發也是以此目的出發,幫助人們擺脫菌類盲區。
2017 年的一篇報道顯示:“目前有一款號稱使用‘革命性的AI’來識別蘑菇的APP,微生物學博士c(Colin Davidson)解釋說,用戶不能通過外觀識別APP來識別蘑菇,比如可致病的亮黃蘑菇在外觀上和可食用的馬菇外觀非常類似,用戶把它拿起來觸摸外觀或者聞它們的味道,需要從多角度觀察和判斷才行”。
這是此次項目開發菌類識別APP的一個顯著問題,畢竟識別菌類不是簡單地通過圖像識別就能識別出所有的菌類,有些菌類可能還需要通過其生長環境和氣味等等各種情況來辨別,而現在所研究的菌類識別卻只是將形狀與顏色作為識別特征,很多菌類仍無法識別,只能將現時期的菌類識別APP當作一個“識別蘑菇的粗略指南”。
在后續的菌類識別開發中可以將菌類的生長環境也納入特征識別當中,使得菌類識別的技術更加完善,成為一個真正能識別所有菌類的APP。