




摘 要:為了準確鑒別葡萄干等級,提出一種基于人工神經網絡和VPMCD的葡萄干等級檢測新方法。以新疆綠無核三個等級的葡萄干作為研究對象,提取顏色、形狀的特征參數。采用BP神經網絡算法,對比各特征組合對識別率的影響,確定了識別率較高的4個特征參數組合。最后應用VPMCD方法進行樣本訓練并進行葡萄干等級檢測。將提出的方法與SVM、BP神經網絡識別結果進行對比分析,結果表明,VPMCD算法識別率達到100%,分級效果明顯,運算時間少,識別精度高,為農產品等級檢測提供了一個新途徑。
關鍵詞: 葡萄干; 等級檢測; BP神經網絡; VPMCD
中圖分類號: TN926?34 文獻標識碼: A 文章編號: 1004?373X(2016)12?0018?04
Abstract: To precisely identify the raisin grades, a new raisin grade detection method based on artificial neural network and VPMCD is proposed. The Xinjiang Green seedless raisins of three grades are taken as the research object to extract the characteristic parameters of color and size. The BP neural network algorithm is used to compare the influence of each feature combination on identification rate. The four characteristic parameter combinations with high identification rate were determined. The VPMCD method is adopted to train the sample and detect the raisin grade. The identification result of the proposed method was compared with those of SVM method and BP neural network method. The comparison results show that the identification rate of VPMCD algorithm can reach up to 100%, and has superior classification effect, less operation time and high identification precision. It provides a new approach for grade detection of agricultural products.
Keywords: raisin; grade detection; BP neural network; VPMCD
0 引 言
葡萄干營養價值豐富,美味可口,受到全國人民青睞。目前,葡萄干的品質檢測主要分為外部和內部檢測兩類,內部檢測主要是對其味道、糖分、水分的檢測,檢測技術已經比較成熟;外部檢測方法主要是對顏色、形狀、大小及表面缺陷的檢測,檢測技術不夠成熟,仍需進一步研究,如何對大批量葡萄干進行實時檢測,成為研究的關鍵,迅速有效的檢測方法對我國的葡萄干進出口貿易有促進作用。目前農產品識別、分級檢測技術日趨成熟,檢測方法多種多樣,其中神經網絡技術應用較為廣泛[1?3],數據挖掘算法[4]、基于稀疏表示的分類算法[5]也在各類識別中應用,識別精度成為比較各種算法優劣的關鍵。
VPMCD方法是一種基于變量預測模型的模式識別方法,它認為不同類別的系統中,全部或者部分特征之間存在一定的內在關系,根據這種關系建立數學模型,采集研究對象的數據,對模型參數進行訓練可以得到預測模型,利用預測模型可以對各類對象進行預測分類[6]。目前,這種方法在滾動軸承故障診斷、機械故障診斷、齒輪故障診斷及其他的一些故障診斷中應用較為廣泛[7?10],在農產品等級檢測中尚未應用。試驗中嘗試采用VPMCD方法對葡萄干進行等級檢測。
1 研究對象與方法
1.1 研究對象
以新疆綠無核葡萄干作為研究對象,分別選取三個等級(一級、二級、三級)的葡萄干各100粒,其中,每個等級各40粒作為訓練樣本,剩余60粒作為測試樣本。
1.2 研究方法
設計適宜的照明裝置,選擇合適的照明條件,采集三個等級葡萄干圖像后進行圖像預處理,提取出單個葡萄干圖像,圖1為采集的原始一級葡萄干圖像,進行圖像去噪、背景分割、輪廓跟蹤后,提取出單個葡萄干圖像。對所有樣本的單個葡萄干圖像,
提取顏色及形狀特征,編寫人工神經網絡算法進行試驗,選擇識別率較高的特征組合作為識別參數,利用VPMCD方法進行等級測試。研究流程如圖2所示。
2 葡萄干特征提取
2.1 顏色特征
顏色是葡萄干等級識別的最主要特征,一級葡萄干顏色碧綠且著色均勻,試驗前需要選擇合適的顏色模型,提取葡萄干的顏色特征。HSI顏色模型以人眼的視覺特征為基礎,使用色調(H)、飽和度(S)、亮度(I)來表示顏色,與人觀察顏色的感覺最相似,因此,在獲取了葡萄干的24位的真彩色圖像后,利用轉換公式,需將RGB模型轉換為HSI顏色模型,提取H,S,I三個顏色特征。
2.2 形狀特征
形狀特征能夠反映出葡萄干的大小、外形特征,一級葡萄干往往粒大且飽滿,提取合適的形狀特征也是分級的關鍵。試驗中,提取了單個葡萄干圖像的周長(P)、面積(A)、長軸(L)、短軸(M)、長寬比(W)、圓形度(C)六個基本形狀特征。
提取了葡萄干樣本的特征數據后,應初步篩選識別特征,由表1中三個等級各40粒葡萄干樣本的特征均值可以看出,在長寬比、圓形度特征上,三個等級數據差別甚微,原因在于同品種的葡萄晾制的葡萄干外形較為相似,因此,這兩個特征不能作為識別的有效特征,初步選定色調(H)、飽和度(S)、亮度(I)、周長(P)、面積(A)、長度(L)、寬度(M)七個特征參數參與人工神經網絡訓練識別。
表1 各級葡萄干特征均值
葡萄干樣本的各個特征物理意義和取值范圍不同,需進行數值歸一化處理,使其處于同一量綱之中,試驗中采用極值歸一化方法處理。設采集樣本中有N個葡萄干圖像,特征向量的維數為I,第n個圖像的第i個特征值為ln,i,將向量li中每個元素的數值歸一化到[0,1]范圍。極值歸一化公式為:[ ln,i=ln,i-minlimaxli-minli, n=0,1,2,…,N-1, i=0,1,2,…,I-1] (1)
式中: min(li)為采集樣本中圖像的第i個特征向量li的最小值;max(li)為采集樣本中圖像的第i個特征向量li的最大值。
3 采用人工神經網絡進行特征優選
人工神經網絡是模擬生物神經網絡進行信息處理的一種數學模型。試驗中,采用BP神經網絡模型,利用Matlab編寫程序,構建了具有一個隱含層的三層網絡模型,輸入層節點數采用特征參數個數,初步選定為7個,輸出節點為3個,對應3個等級的葡萄干,初始學習速率為0.01,目標誤差采用0.001。采用雙曲正切函數tansig作為隱含層激活函數、對數S型激活函數logsig作為輸出層激活函數,網絡輸出值在0和1之間。
(1) 確定識別率較高的網絡結構。根據對測試樣本的識別準確率,選取識別率較高的網絡結構,如表2所示為各種網絡結構下樣本的識別率。由表2可以看出,輸入層為7、隱含層為17、輸出層為3時識別率較高,且訓練速度也相對較快。
表2 不同網絡結構下的識別率比較
(2) 選取最優特征組合。各個特征在識別中所起作用不同,特征少、識別效率高是算法追求的目標。試驗中,在確定了網絡結構后,通過對不同特征參數組合下識別率的比較,選取最佳特征組合。不同參數組合識別率的比較如表3所示。可以看出,使用色度(H)、面積(A)、長度(L)、寬度(M)4個特征組合識別率最高,訓練速度快,因此選擇這4個特征作為最終識別特征。
4 基于VPMCD的等級檢測算法
在農產品的等級檢測中,神經網絡、支持向量機(SVM)等檢測識別方法沒有考慮到對象特征間的相互內在關系。VPMCD方法根據這種關系,對不同類別對象建立不同的數學模型,利用這些數學模型對測試樣本特征值進行預測,根據預測結果對農產品進行分級。因此,在處理非線性分類問題時,VPMCD方法避免了神經網絡的迭代過程,大大減少了計算量和訓練時間。
試驗中,對每個訓練樣本提取色度、面積、長度、寬度4個特征值,根據特征值之間的非線性特性,選用二次交互模型QI[11],建立預測模型;提取每個測試樣本特征向量作為測試數據。利用VPMCD方法進行等級檢測分為模型訓練和模型分級兩個過程,具體如下:
(1) 模型訓練過程:
① 在三個等級的葡萄干中,共收集n個訓練樣本(n=120),每一等級分別有nk(k=1,2,3)個樣本。
② 提取訓練樣本4個特征向量X=[X1,X2,X3,X4]。
③ 對任意被預測變量Xi(i=1,2,…,4),選擇二次交互模型(QI)。
④ 令k=1,對于k等級的nk個訓練樣本中的任意一個,對其每個特征值Xi建立數學模型,得到nk個方程,用最小二乘法對這nk個方程的模型參數進行估計,得到各特征值Xi的預測模型VPMik。
⑤ 令k=k+1,循環步驟④,直至k=3結束。此時對各等級葡萄干的所有特征值都分別建立了預測模型VPMik,模型訓練過程結束。
(2) 模型分級過程:
① 提取測試樣本葡萄干特征值X=[X1,X2,…,X4];
② 對于測試樣本所有特征值Xi(i=1,2,…,4),分別采用VPMik(k=1,2,3)進行預測,得到測試值ik;
③ 在同一等級下,計算所有特征值的預測誤差平方和值δk(k=1,2,3),分級時,當預測樣本中所有δk第k個最小時,將測試樣本識別為第k等級。
[δk=i=14Xi-ik2] (2)
5 試驗及分析
利用Matlab編程實現了BP神經網絡方法、支持向量機(SVM)和VPMCD識別算法。對40個訓練樣本進行訓練,并對60個測試樣本進行了識別。識別精度與SVM,BP神經網絡識別比較如表4所示,在一級葡萄干識別中,識別精度及識別時間如表5所示。
試驗中,BP神經網絡與SVM 中的多個參數需要經過若干次優化確定,而在VPMCD方法中,訓練樣本的特征值預測誤差平方和最小即為最佳預測模型,分級時就以測試樣本預測誤差平方和最小來判定屬于哪個等級。結果表明,該方法不但識別精度高于其他兩種方法,且由于避免了神經網絡中結構和類型的選擇、迭代學習的過程,SVM中參數尋優過程,運算時間也大大減小,因此,VPMCD方法在葡萄干的等級檢測中是一種可行且有效的模式識別方法。
表5 BP神經網絡,SVM,VPMCD識別一級葡萄干結果
6 結 論
采用BP神經網絡進行特征優選,對葡萄干提取的9個特征參數進行訓練,通過對比識別精度,確定了最佳網絡結構及最佳特征組合,選用色度、面積、長度、寬度作為最終識別特征。該文提出一種基于VPMCD對葡萄干進行等級檢測的新方法,試驗結果顯示,提出方法識別率達到100%,將識別結果與使用BP神經網絡和SVM識別做了比較,結果表明,VPMCD方法不論在識別率還是訓練時間上,均優于其他兩種方法。試驗證明,VPMCD方法運算時間少、識別精度高,在農產品等級檢測中可行且有效,為等級檢測提供了一個新途徑。
參考文獻
[1] 詹映,羅華平,彭云發,等.BP人工神經網絡南疆紅棗顏色分級方法的研究[J].食品工業,2015,36(1):165?167.
[2] 李國進,董第永,陳雙.基于計算機視覺的芒果檢測與分級研究[J].農機化研究,2015(10):13?18.
[3] 楊眉,魏鴻磊,華順剛.一種基于神經網絡的扇貝圖像識別方法[J].大連海洋大學學報,2014,29(1):70?74.
[4] 張昭,羅文亮,喬永亮,等.基于數據挖掘算法的竹塊顏色分級研究[J].中國農機化學報,2013,34(2):217?220.
[5] 向金海,楊申,樊恒,等.基于稀疏表示的烤煙煙葉品質分級研究[J].農業機械學報,2013,44(11):287?292.
[6] 楊宇,王歡歡,曾鳴,等.基于變量預測模型的模式識別方法在滾動軸承故障診斷中的應用[J].湖南大學學報(自然科學版),2013,40(3):36?40.
[7] 程軍圣,馬興偉,楊宇.基于ICA相關系數和VPMCD的滾動軸承故障診斷[J].振動、測試與診斷,2015,35(4):645?648.
[8] 賈民平,韓冰.改進VPMCD法及其在機械故障診斷中的應用[J].中國機械工程,2015,26(14):1861?1865.
[9] 許有才,萬舟.基于條件局部均值分解與變量預測模型的軸承故障診斷方法[J].計算機應用,2015,35(9):2606?2610.
[10] 李葵,范玉剛,吳建德.基于 MRSVD 和 VPMCD 的軸承故障智能診斷方法研究[J].計算機工程與應用,2016,52(8):153?157.
[11] YANG Yu, WANG Huanhuan, CHENG Junsheng, et a1. A fault diagnosis approach for roller bearing based on VPMCD under variable speed condition [J]. Measurement, 2013, 46(8): 2306?2312.