王履程,譚筠梅,王小鵬,雷濤
蘭州交通大學電子與信息工程學院,蘭州 730070
基于機器視覺的枸杞分級方法
王履程,譚筠梅,王小鵬,雷濤
蘭州交通大學電子與信息工程學院,蘭州 730070
WANG Lvcheng,TAN Junmei,WANG Xiaopeng,et al.Wolfberry classification method based on machine vision.Computer Engineering and Applications,2013,49(24):16-18.
枸杞自古以來就是深受歡迎的中藥材,主要產地在我國的西北地區。由于枸杞的采摘時間跨度大,在晾曬過程中易受環境的影響和限制,并且由于枸杞內部條件不同,導致枸杞成品色澤混雜,嚴重影響了枸杞的品質等級。在加工過程中依據枸杞的色澤和大小進行有效的自動分級可以極大地提高枸杞生產企業的經濟效益。傳統的枸杞分級主要采用人工分揀的方法,既花費大量人力,同時分選質量和效率也不能適應日益發展的工廠化加工要求和商品市場需求[1-2]。目前,已開始研制枸杞色選機來代替傳統的人工分揀方法[3],其研發的關鍵是機器視覺部分[4],利用機器視覺技術實現對枸杞準確、快速的自動分類。
基于機器視覺的枸杞分級算法主要包括圖像預處理、圖像分割、色彩分量提取、特征提取與分類標識等步驟[5-6]。圖像分割精確度會直接影響特征提取的可靠性和分類的準確度。目前常用的圖像分割方法有基于閾值的分割方法、基于區域的分割方法、基于邊緣的分割方法以及基于特定理論的分割方法等,其中閾值分割方法對于背景單一,直方圖呈雙峰的圖像能進行快速有效的分割。最小距離分類器是一種簡單而有效的分類方法,在分類前需要各類的中心向量,本文采用聚類分析獲取枸杞各類別的聚類中心作為最小距離分類器的中心向量,從而實現機器視覺部分的高度智能化。圖1為基于機器視覺的枸杞分級方法流程。

圖1 基于機器視覺的枸杞分級流程圖
由于光照、灰塵等因素的影響,在枸杞圖像的采集和傳輸過程中會產生噪聲,因此先要對采集的枸杞圖像進行噪聲移除等預處理[6-7];其后進行圖像分割。
1.1 圖像預處理
為了加快分級的速度,同時便于去除噪聲和分割,對CCD采集的枸杞圖像進行灰度化處理。

其中IR,IG和IB分別為枸杞彩色圖像的RGB分量,Igray為灰度化之后的圖像。
中值濾波方法是一種經典的非線性平滑噪聲的方法,可以有效去除數字圖像中常見的隨機噪聲,并且可以較好地保護圖像的邊緣信息。本文采用3×3窗口的中值濾波法[8]對枸杞圖像進行平滑處理。枸杞圖像、灰度化和中值濾波的結果如圖2(a)~(c)所示。

圖2 枸杞圖像及預處理結果
1.2 圖像分割
枸杞圖像的分割對后續處理至關重要。閾值分割是一種簡單實用的圖像分割方法,它以圖像直方圖信息為主導,具備原理清晰、表述簡單、運算快捷、效果良好等優點[7]。枸杞圖像采集中成像背景穩定,而且圖像具有背景像素灰度級和枸杞像素灰度級對比度大且其直方圖呈雙峰等特點。枸杞灰度圖像的直方圖如圖3所示。因此采用閾值分割方法可以快速有效地分割枸杞灰度圖像。
本文使用分割閾值自動選取的最優方法Otsu閾值法[9]來分割枸杞圖像,通過對圖像的一維直方圖進行統計,把圖像分為背景與目標兩個部分,分別計算兩個類別的方差值,當兩個類別之間的方差最大時,就可以動態確定出背景與目標分割的最優閾值。
假設灰度圖像的像素總數為N,灰度級為L,灰度為i像素個數為ni,則其出現的概率為pi=ni/N(i=0,1,…,L-1)。假定圖像背景與目標的分割閾值是T,此時圖像像素按照灰度可以分為兩類,分別表示背景和目標。L1=[0,1,…,T-1],L2=[T,T+1,…,L-1]分別為背景和目標的灰度級,則背景和目標的類間方差為:

圖3 枸杞灰度圖像的歸一化直方圖

枸杞圖像分割的結果如圖2(d)所示。
1.3 枸杞圖像的特征選擇與提取
色澤、大小和形狀是枸杞品質分級的主要依據[10]。由于枸杞本身的顏色特點,實驗測試表明,使用RGB彩色空間中的紅色分量來進行特征提取效果就非常理想。對于分割后的枸杞圖像,采用分割區域紅色分量的均值和標準差作為枸杞色澤的特征參數。考慮到枸杞本身形狀特點,通過實驗分析和枸杞樣本形狀的計算與描述,將分割區域的面積和偏心率分別作為枸杞的大小和形狀特征參數。
枸杞紅色分量的均值、方差按如下方法計算:

2.1 最小距離分類器
最小距離分類器[7,11]是一種簡單而有效的分類方法,其基本思想是根據訓練集按照算術平均生成一個代表該類的中心向量m1,m2,…,mK,K為類別的數目。對于每一個待分類樣本x,計算其與類中心向量之間的距離,最后判定x屬于與之距離最近的類。距離計算采用歐式距離:

其中x為樣本的特征向量,mi為第i類的中心向量。

表1 部分枸杞樣本特征數據
2.2 K-Means算法
K-Means算法是一種動態聚類的方法,即在歐幾里德空間將N個樣本數據對象劃分為K個聚類,使得每個聚類內的數據相似度高,而不同聚類的數據相似度低。其核心思想是找出K個聚類中心m1,m2,…,mk,使得每一個數據點x和與其最近的聚類中心的平方距離和最小化(該平方距離和被稱為偏差Je)。該算法的基礎是誤差平方和準則[12-13]。
若Ni是第i個聚類ci中的樣本數目,mi是這些樣本的均值向量,即

把ci中的各樣本x與均值向量mi的誤差平方和對所有類相加后為:

Je是誤差準則和聚類準則,Je度量了用K個聚類中心m1,m2,…,mk代表K個樣本子集c1,c2,…,ck時所產生的總的誤差平方。對于不同的聚類結果,Je的值是不同的,使Je極小的聚類是誤差平方和準則下的最優結果。
K-Means聚類算法的步驟可描述如下[6]:
(1)初始分類:依據一定規則指定K個初始聚類中心m1,m2,…,mk。
(2)指派樣本:對每一個樣本x,找到離它最近的聚類中心mi,并將其分配到mi所對應的聚類ci中。
(3)更新mi:重新計算加入新樣本后的聚類的中心。
(4)計算偏差:重新計算Je。
(5)連續迭代計算Je,如果Je值收斂則算法結束,否則轉(2)。
2.3 枸杞分類
枸杞分類通常采用多級分類方式,一般采用兩級分類。本文第一級根據色澤分為2類;第二級根據大小分為3類。第一級采用2維特征向量,分別是枸杞紅色分量的均值和方差,第二級采用一維特征即枸杞分割的面積。兩級分類均采用無監督的K-Means算法訓練得到枸杞分級的基準,在分類階段采用最小距離分類器分類。
本文采用MATLAB 7.0仿真基于聚類分析的枸杞分級方法,部分枸杞樣本的色澤特征向量和大小特征數據見表1。針對170個枸杞樣本進行訓練得到的分級基準見表2。針對680個枸杞樣本進行分類測試,色澤分類準確性達到99.76%,大小分類準確性達到100%。目前色選機處理要求為每天處理2.16噸,每秒處理25 g枸杞(約100粒)。針對170個枸杞樣本進行訓練的耗時為2.923 s,針對680個枸杞樣本進行分類的耗時為0.001 4 s。實驗表明該方法能快速準確地對枸杞進行分級。

表2 170個樣本訓練得到的分級基準
本文研究了采用機器視覺技術對枸杞進行自動分級的方法,根據目前枸杞加工行業的實際情況,采用了色澤和大小兩級分類。考慮到實時性和準確性的要求,在根據色澤分類時選取了枸杞圖像紅色分量的均值和方差作為特征向量,在根據大小分類時使用分割面積作為特征向量。分類方法采用了最小距離分類器,使用K-Means聚類分析獲取聚類中心替換了最小距離分類器中的算術平均中心作為分類的基準,實現了分類的完全自動化。實驗表明該方法能快速準確對枸杞進行自動分級,對其他類似農產品的快速分級提供了理論框架。
[1]崔萍,汪澤鵬.寧夏枸杞產業發展現狀及對策[J].北方果樹,2008(5):36-37.
[2]丁潤鎖,尚立新,寧書臣,等.農產品色選技術的發展分析[J].農業工程,2012(S1):54-56.
[3]王建宏.寧夏枸杞干果告別人工揀選[N].寧夏日報,2006-10-04(001).
[4]張誠彬,陸錫華.色選機及其在糧食工業中的應用[J].糧食與飼料工業,1995(1):1-4.
[5]高瑞,王安福,朱榮.基于機器視覺的光電色選機控制系統的研究[J].鄖陽師范高等專科學校學報,2010,30(6):30-32.
[6]邊肇祺,張學工.模式識別[M].2版.北京:清華大學出版社,2001.
[7]Jain A K,Duin R P W,Jianchang M.Statistical pattern recognition:areview[J].IEEETransactionsonPatternAnalysis and Machine Intelligence,2000,22(1):4-37.
[8]岡薩雷斯,伍茲.數字圖像處理[M].阮秋琦,譯.3版.北京:電子工業出版社,2011.
[9]Otsu N.A threshold selection method from gray-level histograms[J].IEEE Transactions on Systems,Man,and Cybernetics,1979,SMC-9(1):62-66.
[10]張曉煜,劉靜,王連喜.枸杞品質綜合評價體系構建[J].中國農業科學,2004,37(3):416-421.
[11]任靖,李春平.最小距離分類器的改進算法——加權最小距離分類器[J].計算機應用,2005(5):992-994.
[12]Mohd Rijal O,Noor N M.Some remarks on selected image analysis problems using multivariate statistical methods[C]// 2011 IEEE International Conference on Computer Applications and Industrial Electronics(ICCAIE),2011.
[13]Kanungo T.An efficient k-means clustering algorithm:analysisandimplementation[J].IEEETransactionsonPattern Analysis and Machine Intelligence,2002,24(7):881-892.
WANG Lvcheng,TAN Junmei,WANG Xiaopeng,LEI Tao
Traditional wolfberry sorting primarily uses artificial method.It has time-consuming and inefficient shortcomings.An automatic wolfberry classification method based on machine vision is proposed.This paper uses digital image processing technology for wolfberry image pre-processing,segmentation and extraction of characteristic parameters of color,size and shape;it uses theK-means clustering feature to get the baseline of wolfberry appropriate level;it grades wolfberry by minimum distance classifier based on the trained benchmark.The experimental results show that this method can classify different colors and sizes of wolfberry more accurately and quickly.
wolfberry classification;image segmentation;feature extraction;cluster analysis;minimum distance classifier
針對目前傳統的枸杞分級主要采用人工方法,費時費力且效率不高的缺點,提出了一種基于機器視覺技術對枸杞進行自動分類的方法。采用數字圖像處理技術對枸杞圖像進行了預處理、分割,從而提取枸杞的色澤、大小及形狀等特征參數;用K-means算法對特征進行聚類,得到枸杞相應等級的基準;根據聚類分析得到的基準采用最小距離分類器對枸杞進行分級。實驗結果表明,該方法能夠準確快速地對不同色澤和大小的枸杞進行分類。
枸杞分級;圖像分割;特征提取;聚類分析;最小距離分類器
A
TP391.4
10.3778/j.issn.1002-8331.1305-0379
School of Electronic&Information Engineering,Lanzhou Jiaotong University,Lanzhou 730070,China
國家自然科學基金(No.61261029,No.61202314);蘭州交通大學青年科學基金項目(No.2011003)。
王履程(1978—),男,博士研究生,講師,研究領域為模式識別,圖像分析;譚筠梅(1977—),女,博士研究生,講師,研究領域為視頻分析,模式識別;王小鵬(1969—),男,博士,教授,研究領域為數字圖像分析;雷濤(1981—),男,博士,副教授,研究領域為數學形態學,圖像處理。E-mail:wanglc@mail.lzjtu.cn
2013-05-28
2013-07-26
1002-8331(2013)24-0016-03
CNKI出版日期:2013-09-26http://www.cnki.net/kcms/detail/11.2127.TP.20130926.1644.009.html