馬彧廷,郭敏
(陜西師范大學(xué) 計(jì)算機(jī)科學(xué)學(xué)院,陜西 西安 710062)
基于極限學(xué)習(xí)與蜻蜓算法的小麥碰撞聲信號(hào)檢測(cè)與識(shí)別
馬彧廷,郭敏
(陜西師范大學(xué) 計(jì)算機(jī)科學(xué)學(xué)院,陜西 西安710062)
蟲(chóng)害損害大量?jī)?chǔ)糧,長(zhǎng)期食用蟲(chóng)蛀粒小麥會(huì)造成營(yíng)養(yǎng)不良,甚至誘發(fā)疾病,因此對(duì)受損粒小麥的檢測(cè)工作刻不容緩。本文提出一種新的基于碰撞聲的方法結(jié)合極限學(xué)習(xí)機(jī)與蜻蜓優(yōu)化算法檢測(cè)小麥蟲(chóng)蛀粒與發(fā)芽粒。從時(shí)域頻域兩方面提取信號(hào)特征,包括:時(shí)域短時(shí)窗口最大幅值與方差、峭度、3階Rényi熵、功率譜均方根。隨后采用極限學(xué)習(xí)機(jī)進(jìn)行分類,并用蜻蜓算法優(yōu)化相應(yīng)參數(shù)。實(shí)驗(yàn)結(jié)果顯示,93%的完好粒、95%的蟲(chóng)蛀粒及87%的發(fā)芽粒被正確識(shí)別,表明了本文所提出算法對(duì)受損粒小麥檢測(cè)的有效性。
碰撞聲學(xué);極限學(xué)習(xí)機(jī);蜻蜓優(yōu)化算法;受損麥粒;識(shí)別檢測(cè)
小麥中存在一定數(shù)量的受損麥粒,其中主要包括蟲(chóng)蛀粒與發(fā)芽粒,這些受損麥粒將影響面粉質(zhì)量。在麥粒收獲季節(jié),當(dāng)含水量較高時(shí),麥粒容易發(fā)芽,形成發(fā)芽粒。對(duì)于蟲(chóng)蛀麥粒,害蟲(chóng)會(huì)損害大量?jī)?chǔ)存小麥[1]。長(zhǎng)期食用受損粒小麥會(huì)造成營(yíng)養(yǎng)不良,甚至誘發(fā)疾病。因此,對(duì)受損粒小麥的檢測(cè)工作刻不容緩。先前研究者采用X射線成像、幼蟲(chóng)蠕動(dòng)與咀嚼聲檢測(cè)、二氧化碳檢測(cè)等方法來(lái)檢測(cè)蟲(chóng)蛀粒小麥。然而,由于這些方法具有操作緩慢、設(shè)備昂貴、勞動(dòng)密集等缺點(diǎn),使之不能定量檢測(cè)蟲(chóng)蛀粒小麥。2005年,Pearson等人率先采用基于碰撞聲的方法檢測(cè)蟲(chóng)蛀粒小麥,提取碰撞聲信號(hào)的時(shí)域及頻域特征,檢測(cè)完好粒與蟲(chóng)蛀粒小麥的識(shí)別率分別為87.4%、85%[2]。為提高識(shí)別率,2007年,Pearson等人將之前的方法加以改進(jìn),采用四種不同方法提取碰撞聲信號(hào)特征,獲得完好粒與蟲(chóng)蛀粒小麥的識(shí)別率分別為98%、87%[3]。2008年,Ince等人采用一種新的時(shí)頻分析方法處理小麥碰撞聲信號(hào),從蟲(chóng)蛀粒、蛹粒、結(jié)疤粒中分揀完好粒的識(shí)別率分別為96%、82%、94%[4]。基于碰撞聲的方法除了用于小麥檢測(cè)工作,也被用于檢測(cè)開(kāi)心果[5-7]、榛子[8]等農(nóng)作物。
文中提取碰撞聲信號(hào)的時(shí)域及頻域特征,結(jié)合極限學(xué)習(xí)機(jī)與蜻蜓算法對(duì)完好粒、蟲(chóng)蛀粒與發(fā)芽粒小麥進(jìn)行分類,較好地識(shí)別了受損粒小麥,為小麥及其他農(nóng)作物分揀提供依據(jù)。
圖1為小麥碰撞聲信號(hào)采集裝置,該裝置由振動(dòng)給料機(jī)、碰撞鋼板、麥克風(fēng)和裝有聲卡的計(jì)算機(jī)組成。通過(guò)對(duì)比多次實(shí)驗(yàn)效果,最終確定麥粒的掉落高度為50 cm,碰撞鋼板的規(guī)格為24×11×0.06 cm,為避免麥粒掉落碰撞鋼板后發(fā)生反彈,設(shè)定碰撞鋼板的傾角為60度。實(shí)驗(yàn)所用麥克風(fēng)是SHUREBG 4.1,用于采集麥粒碰撞鋼板后產(chǎn)生的碰撞聲。900粒麥粒被用于實(shí)驗(yàn),包含完好粒、蟲(chóng)蛀粒、發(fā)芽粒各300粒。通過(guò)振動(dòng)給料機(jī),一堆麥粒被轉(zhuǎn)化為一縱行麥流,自由落下并撞擊碰撞鋼板,隨后麥克風(fēng)采集碰撞聲信號(hào)并將其傳輸給帶有聲卡的計(jì)算機(jī),聲卡對(duì)采集的碰撞聲信號(hào)進(jìn)行模數(shù)轉(zhuǎn)換,信號(hào)采樣頻率為48 kHz,模數(shù)轉(zhuǎn)換為18 bits。經(jīng)模數(shù)轉(zhuǎn)換后的信號(hào)被保存在計(jì)算機(jī)內(nèi),用于后續(xù)處理。

圖1 實(shí)驗(yàn)裝置圖解Fig.1 The schematic of experimental apparatus
2.1數(shù)據(jù)處理與特征提取
本文對(duì)每類小麥原始碰撞聲信號(hào),從最大幅值前20個(gè)采樣點(diǎn)起,取連續(xù)的5 120個(gè)采樣點(diǎn)作為預(yù)處理后信號(hào)。完好粒、蟲(chóng)蛀粒及發(fā)芽粒小麥碰撞聲信號(hào)時(shí)域圖及其Welch功率譜密度圖如圖2所示,從圖中可以看出,完好粒小麥碰撞聲信號(hào)的最大幅值相對(duì)較大,且與蟲(chóng)蛀粒和發(fā)芽粒相比,完好粒小麥碰撞聲信號(hào)在衰減過(guò)程中具有更大波動(dòng),表現(xiàn)出更不平穩(wěn)的衰減趨勢(shì),這與不同類小麥內(nèi)部結(jié)構(gòu)特性的差異及它們與碰撞鋼板的共振效果不同有關(guān)。為更好描述上述特性,本文提取以下特征作為判別特征:1)時(shí)域短時(shí)窗口方差與最大幅值。選取短時(shí)窗口大小為512個(gè)采樣點(diǎn),相鄰窗口間256個(gè)采樣點(diǎn)重疊。因此,對(duì)每個(gè)信號(hào)提取19個(gè)短時(shí)幅值特征及19個(gè)短時(shí)方差特征。2)峭度。由于三類小麥碰撞聲信號(hào)在衰減過(guò)程中表現(xiàn)出不同的波動(dòng)特性,而峭度能很好表征信號(hào)的分布特性,故選取峭度作為判別特征之一。3)3階Rényi熵。Williams等指出,3階Rényi熵能夠衡量信號(hào)的復(fù)雜度。相對(duì)于完好粒小麥而言,蟲(chóng)蛀粒小麥與發(fā)芽粒小麥的碰撞聲信號(hào)表現(xiàn)出更平穩(wěn)的衰減趨勢(shì),因此它們的信號(hào)復(fù)雜度較大,Rényi熵也較大。4)功率譜均方根,能夠反映信號(hào)頻域的能量特性。

圖2 完好粒、蟲(chóng)蛀粒、發(fā)芽粒小麥碰撞聲信號(hào)及其對(duì)應(yīng)Welch功率譜密度展示Fig.2 Impact acoustical signals as well as the corresponding Welch power spectral density representations from an undamaged wheat kernel,an insect-damaged wheat kernel(IDK),and a sprouted-damaged wheat kernel
2.2極限學(xué)習(xí)機(jī)與蜻蜓算法理論
2.2.1極限學(xué)習(xí)機(jī)
2004年,黃等人證明了前向神經(jīng)網(wǎng)絡(luò)收斂緩慢,他們提出了一種新的算法稱為極限學(xué)習(xí)機(jī)(ELM),它是一種基于單隱層的前向神經(jīng)網(wǎng)絡(luò),通過(guò)隨機(jī)選擇單隱層前向神經(jīng)網(wǎng)絡(luò)的權(quán)值決定輸出權(quán)值[9]。與傳統(tǒng)學(xué)習(xí)算法如BP神經(jīng)網(wǎng)絡(luò)相比,極限學(xué)習(xí)機(jī)具有非常快的學(xué)習(xí)速率,與此同時(shí)擁有較好的泛化性能。ELM算法概括如下:
1)給定一個(gè)訓(xùn)練樣本S={(x1,t1),…,(xN,tN)},激活函數(shù)G(x)以及隱層結(jié)點(diǎn)數(shù)L。
2)隨機(jī)選取隱層結(jié)點(diǎn)參數(shù)ωi,bi(i=1,2,…,L)。
3)計(jì)算輸出權(quán)值β。

這里,H是隱層輸出矩陣,N為訓(xùn)練樣本數(shù),I是單位矩陣,T是目標(biāo)向量。正值C加入對(duì)角陣HHT或HTH能夠使之獲得更好的泛化性能[10]。

表1 所提取判別特征及相應(yīng)公式展示Tab.1 The extracted discriminant features with the corresponding equation representations
2.2.2蜻蜓算法
2015年,Mirjalili提出一種新的群智能優(yōu)化算法,稱為蜻蜓算法(DA)[11]。該算法來(lái)源于蜻蜓的靜態(tài)和動(dòng)態(tài)群智能行為,對(duì)蜻蜓的航行、尋找食物、逃避敵人等行為進(jìn)行數(shù)學(xué)建模。Mirjalili證明了對(duì)于一個(gè)給定問(wèn)題,蜻蜓算法能有效改善初始隨機(jī)種群,能夠收斂至全局最優(yōu)解,與其他已知優(yōu)化算法相比具有競(jìng)爭(zhēng)優(yōu)勢(shì)。蜻蜓算法思想如下:
1)更新蜻蜓位置向量Si,Ai,Ci,F(xiàn)i,Ei。這里Si,Ai,Ci,F(xiàn)i,Ei分別表示分離、排隊(duì)、結(jié)盟、接近食物及逃避敵人行為的位置向量。
2)計(jì)算步長(zhǎng)向量

這里s,a,c,f,e,ω分別為對(duì)應(yīng)權(quán)值。
3)更新位置向量
有鄰居時(shí),

無(wú)鄰居時(shí),

這里,t是當(dāng)前迭代,d是位置向量維數(shù)。Le′vy函數(shù)為:

r1,r2分別是[0,1]內(nèi)的隨機(jī)數(shù),β為常數(shù)。
文中對(duì)每類小麥碰撞聲信號(hào)提取41個(gè)特征作為判別特征,包括:19個(gè)時(shí)域短時(shí)窗口方差、19個(gè)時(shí)域短時(shí)窗口最大幅值、峭度、3階Rényi熵及功率譜均方根。隨后,采用極限學(xué)習(xí)機(jī)(ELM)進(jìn)行分類識(shí)別。對(duì)于極限學(xué)習(xí)機(jī),由于正值能夠使之獲得更好的泛化性能,故本文采用一種新的優(yōu)化算法——蜻蜓算法對(duì)ELM中的參數(shù)C進(jìn)行優(yōu)化及對(duì)隱層結(jié)點(diǎn)數(shù)進(jìn)行選擇,蜻蜓算法參數(shù)設(shè)置如下:蜻蜓數(shù)為5,C值與隱層結(jié)點(diǎn)數(shù)下限為1,上限為400。本文采用5折交叉驗(yàn)證的整體識(shí)別率作為蜻蜓算法的適應(yīng)度函數(shù)。圖3分別展示了在50、100 和400次迭代次數(shù)下的適應(yīng)度曲線及蜻蜓軌跡,可以看出,當(dāng)?shù)螖?shù)超過(guò)100時(shí),算法基本收斂。根據(jù)最優(yōu)交叉驗(yàn)證率下的C值與隱層結(jié)點(diǎn)數(shù),本文選取C值及隱層結(jié)點(diǎn)數(shù)分別為324、296,選取sigmoid函數(shù)作為ELM激活函數(shù)。采用完好粒、蟲(chóng)蛀粒及發(fā)芽粒小麥各200粒訓(xùn)練、各100粒測(cè)試,實(shí)驗(yàn)結(jié)果如表2所示,從中可以看出,93%的完好粒、95%的蟲(chóng)蛀粒及87%的發(fā)芽粒被正確識(shí)別,表明文中所提出的方法可有效識(shí)別受損粒小麥。
為進(jìn)一步探究本文所提出方法的有效性,實(shí)驗(yàn)對(duì)比了未經(jīng)參數(shù)優(yōu)化的ELM、經(jīng)典的BP神經(jīng)網(wǎng)絡(luò)與支持向量機(jī)(SVM),實(shí)驗(yàn)結(jié)果表明,文中所提出方法能夠獲得更高平均識(shí)別率,這主要?dú)w因于所提取特征的有效性、ELM良好的泛化性能及蜻蜓算法在解目標(biāo)優(yōu)化問(wèn)題方面的優(yōu)勢(shì)。

圖3 不同迭代次數(shù)下適應(yīng)度曲線及蜻蜓軌跡Fig.3 The fitness curve and the track of dragonflies in various iterations
文中提出一種新的基于碰撞聲的方法結(jié)合極限學(xué)習(xí)機(jī)與蜻蜓優(yōu)化算法檢測(cè)受損粒小麥。從時(shí)域頻域兩方面提取信號(hào)判別特征,采用極限學(xué)習(xí)機(jī)進(jìn)行分類,并用蜻蜓算法優(yōu)化極限學(xué)習(xí)機(jī)參數(shù)。實(shí)驗(yàn)結(jié)果表明,本文所提出算法能有效檢測(cè)受損粒小麥,為小麥或其他農(nóng)作物分揀提供依據(jù)。

表2 本文所提出方法對(duì)三類小麥的分類結(jié)果Tab.2 Classification results for three types of wheat kernels by using the proposed method

表3 不同分類方法的實(shí)驗(yàn)結(jié)果Tab.3 Experimental results for various classification methods
[1]GUO Min,SHANG Zhi-yuan,SHI Huan-wen.Sound absorption measurements of various types of grain[J].Acta Acustica united with Acustica,2005,91(5):915-919.
[2]Pearson T C,Cetin A E,Tewfik A H.Detection of insect damaged wheat kernels by impact acoustics[C]//Proceedings of IEEE International Conference on Acoustics,Speech,and Signal Processing.Philadelphia:[s.n.],2005:649-652.
[3]Pearson T C,Cetin A E,Tewfik A H,et al.Feasibility of impact-acoustic emissions for detection of damaged wheat kernels[J].Digital Signal Processing,2007,17(3):617-633.
[4]Ince N F,Onaran I,Pearson T C,et al.Identification of damaged wheat kernels and cracked-shell hazelnuts with impact acoustics time-frequency patterns[J].Transactions of the ASABE,2008,51(4):1461-1469.
[5]Omid M.Design of an expert system for sorting pistachio nuts through decision tree and fuzzy logic classifier[J].Expert Systems with Applications,2011,38(4):4339-4347.
[6]臧富瑤,馮濤,王晶,等.基于碰撞聲的開(kāi)心果分揀技術(shù)研究[J].農(nóng)產(chǎn)品加工,2014,1(11):65-67.
[7]臧富瑤,馮濤,王晶,等.基于撞擊聲的開(kāi)心果分揀模型研究[J].食品與機(jī)械,2015,31(2):157-160.
[8]Cetin A E,Pearson T C,Sevimli R A.System for removing shell pieces from hazelnut kernels using impact vibration analysis[J].Computers and Electronics in Agriculture,2014 (101):11-16.
[9]HUANG Guang-bin,ZHU Qin-Yu,Siew C K.Extreme learning machine:Theory and applications[J].Neurocomputing,2006,70(1):489-501.
[10]Hoerl A E,Kennard R W.Ridge regression:Biased estimation for nonorthogonal problems[J].Technometrics,1970,12 (1):55-67.
[11]Mirjalili S.Dragonfly algorithm:a new meta-heuristic optimization technique for solving single-objective,discrete,and multi-objective problems[J].Neural Computing and Applications,2015:1-21.
Detection and classification of damaged wheat kernels based on extreme learning and dragonfly algorithm using impact acoustical signals
MA Yu-ting,GUO Min
(College of computer science in Shaanxi Normal University,Xi′an 710062,China)
Insects will destroy significant amounts of stored grain,and long-term feeding on damaged wheat kernels will result in malnutrition,even induce diseases,therefore,the work of detection of damaged wheat kernels is of great urgency.In this paper,a novel method based on impact acoustics combining extreme learning machine(ELM)with dragonfly algorithm was proposed for detection of insect-damaged wheat kernels(IDK)and sprout-damaged ones.Discriminant features,including the maximum amplitudes and variances in time-domain short-time windows,kurtosis,the third-order Rényi entropies and the mean square roots of power spectrum,were extracted both from the time-domain and frequency-domain.Subsequently,ELM was used for classification with dragonfly algorithm for parameter optimization.The experiment results demonstrated that 93.0% of undamaged wheat kernels,95.0%of insect-damaged wheat kernels and 87.0%of sprout-damaged ones were correctly detected,which indicated the effectiveness of the proposed algorithm for detection of damaged wheat kernels.
impact acoustics;extreme learning machine;damaged wheat kernels;detection
TN0
A
1674-6236(2016)05-0008-04
2015-11-01稿件編號(hào):201511002
國(guó)家自然科學(xué)基金資助項(xiàng)目(10974130)
馬彧廷(1990—),男,新疆北屯人,碩士研究生。研究方向:信號(hào)處理與模式識(shí)別。