蔣偉+王運祥+張巍


摘要:以7成熟、9成熟和過熟3種不同成熟度的哈密瓜為研究對象,在Matlab 7.6環境下,先利用圖像處理技術對哈密瓜果臍處進行背景圖像分割,計算圖像的最大值、最小值、平均值等7個特征值,然后運用模式識別與回歸工具箱LibSVM建立基于支持向量機(support vector machine,SVM)的哈密瓜成熟度分類模型,并對分類準確率進行預測。結果表明,圖像處理中的LibSVM工具箱可以很好地運用到哈密瓜成熟度的無損檢測研究中,模型分類準確率可達到95.83%。
關鍵詞:哈密瓜;圖像處理;成熟度;無損檢測;LibSVM;模型;準確率
中圖分類號: TS207 文獻標志碼: A
文章編號:1002-1302(2016)11-0396-03
新疆素有“瓜果之鄉”的美稱,目前新疆水果種植總面積已達到991 719 hm2。2012年林果總產量超過650多萬t,年產值近300億元[1],2013年林果總產量達1 326.9萬t[2],發展非常迅猛。林果業已經成為新疆農民脫貧致富的重要途徑。
隨著科學技術的不斷發展與進步,信息技術在農產品加工處理上的運用已經成為當今農業可持續發展的一項重要手段。近年來,國內外眾多專家與學者采用圖像、光譜、氣味等無損性方法對水果品質檢測進行了大量研究。應義斌等用顏色特性對柑橘成熟度進行了無損檢測研究,在波長700 nm光譜處得到了高質量的柑橘圖像,提出了一種利用協方差矩陣和樣本屬于橘黃色和綠色的概率來判斷柑橘成熟度的判別分析法,并以實測固酸比值作為對照,對72個柑橘樣本成熟度的判別準確率達到了91.67%[3]。馬本學等采用漫反射高光譜成像技術對哈密瓜糖度進行了無損檢測研究,對比了多元散射信號修正、標準正則變換校正方法,原始光譜、一階微分、二階微分光譜預處理方法對建模精度的影響;采用偏最小二乘法(partial least squares,PLS)、逐步多元線性回歸(multiple linear stepwise regression,SMLR)和主成分回歸方法對比了帶皮哈密瓜和去皮哈密瓜糖度檢測模型效果。結果表明,應用SMLR法檢測去皮哈密瓜糖度效果最佳,校正集相關系數為0.928,預測均方差為0.458,預測集相關系數為0.818,校正均方差為0.727[4]。宋小青等利用電子鼻技術快速無損檢測低溫貯藏獼猴桃芳香氣味的變化,分別采用偏最小二乘法、多元線性回歸(multivariable linear regression,MLR)和反向傳播算法(back propagation,BP)網絡建立了評價獼猴桃可溶性固形物含量(soluble solid content,SSC)、硬度、pH值的數學模型,研究表明線性判別式分析(linear discriminant analysis,LDA)比主成分分析(principal component analysis,PCA)方法能更好地識別不同貯藏時間的獼猴桃,BP網絡預測能力高于MLR方法,MLR方法的分析精度優于PLS。其中BP網絡的測試集SSC、硬度、pH值的預測值和測試值的R2分別為0.93、0.90、0.90,相應的校正均方差分別為0.48、2.15、0.08[5]。Morrison等指出由于大多數水果成分復雜且不均勻,使超聲波對水果品質檢測很難成功,從而提出了一種新超聲波方法,通過分析水果邊界的反射情況來整體評估水果品質,發現超聲波與臍橙的密度有高度相關性,可以無損預測相對含水率,同時不受水果大小、成熟度等物理特性的影響。通過9 d對1個臍橙的跟蹤研究,發現超聲波與堅實度高度相關[6]。雖然目前國內外學者對哈密瓜成熟度檢測技術缺乏深入地研究,且絕大多數研究仍停留在實驗室研究階段。特別是作為新疆特產的哈密瓜,對它的成熟度檢測尚屬空白,但國內外水果成熟度檢測技術對本研究具有一定的借鑒和移植性。
圖像處理大體上可分為圖像的像質改善、分析、重建三大部分[7],本研究內容屬于圖像分析范疇。首先對哈密瓜特征進行提取說明,然后對特征數據進行歸一化預處理,并以哈密瓜果臍處圖像為研究對象,通過文中處理方法達到識別分類的目的。
1 哈密瓜特征的提取
特征提取前要對圖像進行背景分割[8]處理,剔除影響特征參數的背景因素。圖像的描述性統計量有平均值、標準差、最大值、最小值、極差、中位數、眾數、變異系數、偏度、峰度和熵[9],其中變異系數是衡量資料中各觀測值變異程度的一個統計量,計算公式為變異系數=(標準偏差/平均值)×100%。由于變異系數進行的是2個或多個資料(如價格和轉速等單位不一)變異程度的比較,單位相同時用標準差比較,所以不考慮變異系數。背景分割前、后的圖像如圖1、圖2所示,峰度和熵的分布如圖3、圖4所示。
3 試驗設計與結果分析
3.1 試驗設計
首先,將采購來的哈密瓜分為7成熟、9成熟和過熟3類,然后用奧林巴斯數碼照相機獲取哈密瓜7成熟、9成熟和過熟果臍處圖像各28張,圖片分辨率為3648×2736。從所得圖像中分別選取20張,共計60個作為訓練樣本,其余的24個作為測試樣本。令訓練樣本中與7成熟、9成熟和過熟相對應的標簽分別為1、2、3。通過模式識別與回歸工具箱LibSVM建立基于SVM[11-14]的哈密瓜成熟度分類模型,利用該模型處理分析測試樣本集,得到樣本測試標簽。將實際標簽與測試標簽進行對比,得出分類的準確率。
本試驗采用3種不同的處理方法對訓練集樣本特征數據進行預處理,即對數據進行[-1,1]、[0,1]的歸一化預處理以及不進行歸一化預處理,最后對測試集樣本的預測分類結果的準確率進行對比分析,得出結論。
3.2 結果分析
對哈密瓜訓練集樣本的特征數據進行3種不同的預處理,即進行[-1,1]、[0,1]的歸一化預處理以及不進行歸一化預處理,其中Svmtrain的參數選項都采用“懲罰因子c=2、RBF核函數中的Gamma值g=0.07”,所得的Matlab圖像如圖5至圖7所示。
從圖5至圖7中可以看出,對哈密瓜訓練集樣本的特征數據進行的3種不同預處理方法,都可以將哈密瓜7成熟、9成熟和過熟3類不同成熟度區分,但它們的分類準確率有所不同,具體如表1所示。
從表1可以看出,對訓練集樣本特征數據進行[0,1]的歸一化預處理的分類準確率最高, 不進行歸一化預處理的分類準確率次之,[-1,1]的歸一化預處理的分類準確率最低。
4 結論
本研究分析了在哈密瓜成熟度識別分類中Matlab圖像處理技術的運用,對提取的特征數據進行不同的預處理,得到不同的分類準確率。其中,未進行歸一化預處理的分類準確率并不是最低的,可見并不是任何問題都必須事先把原數據進行歸一化。針對哈密瓜成熟度分類問題,[0,1]的歸一化預處理方法達到了很好的分類效果。可見,基于模式識別與回歸工具箱LibSVM建立的哈密瓜成熟度分類模型對哈密瓜進行分類的無損檢測技術是可行的,并對大型水果上應用無損檢測技術提供借鑒和參考。
參考文獻:
[1]新疆維吾爾自治區統計局. 新疆統計年鑒[M]. 北京:中國統計出版社,2013.
[2]新疆維吾爾自治區統計局. 新疆統計年鑒[M]. 北京:中國統計出版社,2014.
[3]應義斌,饒秀勤,馬俊福. 柑橘成熟度機器視覺無損檢測方法研究[J]. 農業工程學報,2004,20(2):144-147.
[4]馬本學,肖文東,祁想想,等. 基于漫反射高光譜成像技術的哈密瓜糖度無損檢測研究[J]. 光譜學與光譜分析,2012,32(11):3093-3097.
[5]宋小青,任亞梅,張艷宜,等. 電子鼻對低溫貯藏獼猴桃品質的預測[J]. 食品科學,2014,35(20):230-235.
[6]Morrison D S,Abeyratne U R. Ultrasonic technique for non-destructive quality evaluation of oranges[J]. Journal of Food Engineering,2014,141:107-112.
[7]楊 杰. 數字圖像處理及MATLAB實現[M]. 北京:電子工業出版社,2010.
[8]王紅君,陳 偉,趙 輝,等. 復雜背景下植物葉片的彩色圖像分割[J]. 中國農機化學報,2013,34(2):207-211.
[9]謝中華. MATLAB統計分析與應用:40個案例分析[M]. 北京:北京航空航天大學出版社,2010.
[10]史 峰,王小川,郁 磊,等. MATLAB神經網絡30個案例分析[M]. 北京:北京航空航天大學出版社,2010.
[11]Chang C C,Lin C J. LIBSVM:a library for support vector machines[J]. ACM Transactions on Intelligent Systems and Technology,2011,2(3):27.
[12]Hsu C W,Lin C J. A comparison of methods for multi-class support vector machines[J]. IEEE Transactions on Neural Network,2002,13(2):415-425.
[13]Horvath D,Brown J B,Marcou G,et al. An evolutionary optimizer of libsvm models[J]. Challenges,2014,5(2):450-472.
[14]Pouladzadeh P,Shirmohammadi S,Bakirov A,et al. Cloud-based SVM for food categorization[J]. Multimedia Tools and Applications,2015,74(14):5243-5260.