張麗娜 馬巧梅
(寶雞文理學院計算機學院 寶雞 721016)
據國家糧食局統計,全國糧食庫存居于歷史最高點,且1/6的糧食儲存在簡易倉囤,并且隨著我國糧食產量的持續增加,糧食存儲存在設施能力嚴重不足、物流通道不暢、質量安全隱患較大、糧情監測預警滯后、糧食產后損失浪費嚴重等問題。我國基層農戶存糧約占全國糧食年總產量的一半左右,但由于儲存條件差、設施簡陋等原因,農戶儲糧損失比例約為8%左右,安全儲糧面臨前所未有的困難與挑戰,保障糧食儲存安全迫在眉睫。
隨著檢測技術的發展以及各項新技術的應用,在傳統的儲糧害蟲檢測方法之外,近紅外光譜法、X射線法、微波雷達法、圖像識別法、電子鼻法和聲檢測法也正被廣泛應用,這些方法各有利弊,其中國內外對于儲糧害蟲聲音檢測方法也已具備一定成果,將糧食顆粒經過碰撞裝置產生超聲或者可聽聲,使用各種多種模式識別方法再對聲音信號進行進一步分類識別。
廣義回歸神經網是基于徑向基函數網絡一種改進,相對傳統神經網絡不需反復訓練且對樣本數量要求不高,并具備訓練速度快等優點,使其具有很大優勢[1]。因此,本文以小麥碰撞聲檢測裝置為基礎,提出一種基于廣義回歸神經網絡的小麥碰撞聲信號分類方法,實現對小麥完好粒和蟲害粒的識別與分類。
郭敏團隊研究設計了一個基于聲特征的糧食顆粒碰撞信號分類裝置[2],研究在此基礎上,創新性地使用廣義回歸神經網絡用于聲音信號的識別,系統結構如圖1所示,將糧食顆粒經過碰撞聲裝置產生可聽聲,使用專業錄音設備采集聲音數據,計算機對原始數據進行去噪、截取有用信號等預處理操作,隨后提取糧食聲音信號的特征參數,使用廣義回歸神經網絡分類得到識別結果。

圖1 碰撞聲信號識別系統結構
廣義回歸神經網絡由美國學者Specht D.F.[3]在1991年提出,其原理是基于人腦的神經元細胞對外界反應的局部性,并具備全局逼近和最佳逼近的優點。與BP神經網絡類似,它是由輸入層、隱層和輸出層構成的3層前向網絡。網絡的第1層為輸入層,將輸入信號傳輸至隱層,其數目等于樣本輸入向量的維數[4~6],隱層節點函數為輻射狀的高斯函數,輸出節點由特定的線性函數構成。其基本原理如下描述。
設j維向量,x=[x1,x2,…xj]T為過程的輸入向量,對應輸出向量為y,隨機變量x和y的聯合概率密度函數為f(x,y)。由于GRNN的理論基礎是非線性回歸分析,通過給定x的值,計算相應y的條件數學期望進行回歸。GRNN估計和的聯合概率密度函數,來建立一個估計的概率模型。通過訓練輸入輸出集,利用非參數密度估計法構建PDF估計器。對于給定的輸入向量x,假設被估計函數連續且光滑,則估計y的期望值為[7~9]

連續概率密度函數函數f(x,y)可定義為[10~11]


其中,xi,yi分別為隨機變量x和y的第i個樣本值,σ為平滑參數,p為隨機變量x的維數,k為樣本數量[12]。
GRNN的拓撲結構如圖2所示,具有輸入層、模式層、求和層和輸出層4層網絡結構。算法描述如下。
1)將樣本輸入至輸入層,如圖1所示,輸入層的節點數目等于輸入向量的維數p,隨后將輸入向量的各元素傳送至模式層。
2)模式層的節點數等于訓練樣本數目,其傳遞函數為

3)求和層有兩種類型的節點,第一種類型僅包含一個神經元,對所有模式層神經元的輸出進行算術求和,模式層各神經元與該神經元的連接權值為1,其傳遞函數為;第二種類型包含剩余節點對所有模式層神經元的輸出進行加權求和,求和神經元j的傳遞函數其中,yij為模式層中第i個神經元與求和層中第j個求和神經元之間的連接權值為第i個輸出樣本Yi中的第j個元素[13]。
4)輸出層中的節點數目等于學習樣本中輸出向量的維數m[14]。

圖2 GRNN的拓撲結構
1)網絡結構相對簡單,除了輸入和輸出層外,一般只有兩個隱藏層,模式層和求和層。而模式中隱藏單元的個數,與訓練樣本的個數是相同的。
2)網絡訓練非常簡單。當訓練樣本通過隱藏層的同時,網絡訓練隨即完成。而不像前饋神經網絡一樣,需要非常長的訓練時間和高的計算成本。
3)由于簡單的網絡結構,我們不需要對網絡的隱藏層數和隱藏單元的個數進行估算和猜測。由于它是從徑向基函數引申而來,因此只有一個自由參數,即徑向基函數的平滑參數。而它的優化值可以通過交叉驗證的方法非常容易得到。
4)網絡計算結果的全局收斂性。標準的前饋神經網絡的計算結果則會經常不能達到全局收斂,而停止在局部收斂。
實驗中采用小麥作為糧食樣本,所有樣本均來自陜西省某農戶糧倉,實驗共隨機選擇霉變小麥、無損小麥、發芽小麥和蟲害小麥各500顆,分別使2000顆小麥顆粒經過碰撞聲信號識別系統,并錄制碰撞聲音,使用希爾伯特黃變換方法提取聲音特征,最后利用廣義回歸神經網絡對小麥顆粒進行分類識別。實驗將每類聲信號隨機分為兩部分,作為訓練樣本和測試樣本。
實驗中,分別對四類聲音信號的時域和頻域特征進行分析,組建特征庫,使用高頻帶能量、最強IMF中心頻率、時頻熵、殘差平方和、方差等五種頻域、時域特征作為識別受損小麥與完好小麥的有效特征,特征含義如表1所示。

表1 有效特征含義
神經網絡訓練指的是向網絡輸入足夠多的樣本,通過一定算法調整網絡結構,使網絡的輸出與預期值相符。一個神經網絡的搭建,需要滿足三個條件:輸入和輸出;權重(w)和閾值(b);多層感知器的結構。神經網絡的運作過程如下:確定輸入和輸出;找到一種或多種算法,可以從輸入得到輸出;找到一組已知答案的數據集,用來訓練模型,估算w和b;一旦新的數據產生,輸入模型,就可以得到結果,同時對w和b進行校正。
根據學習環境中教師信號的差異,GRNN的訓練屬于有監督式訓練,共分兩個步驟:第一步為無教師式訓練,確定訓練輸入層和隱層間的權值;第二步為有教師訓練,根據提供的目標向量集來訓練生成隱層和輸出層之間的權值矩陣。
根據GRNN神經網絡的結構特征,確定網絡的輸入層和輸出層神經元的數目分別為輸入的特征向量維數和小麥類型數,由于實驗中包含小麥完好粒和蟲害粒,因此待分類的樣本種類為4,對應的輸出層的節點數也相應確定為4。本文采用二進制形式表示四類小麥碰撞聲信號的仿真結果,令小麥完好粒的對應輸出為0001,蟲害粒的對應輸出為0010,霉變粒的對應輸出為0100,發芽粒的對應輸出為1000。并通過Matlab編程實現。具體程序如下:
net=newgrnn(p1n,t1n,SPRAD);其中p1n為聲音數據p經過歸一化處理后的數據,t1n為發病率數據t經過歸一化處理后的數據,SPRAD為光滑因子。y=sim(net,p1n);網絡模擬。t2n=sim(net,p2n);網絡仿真與預測,最終確定光滑因子進行PRRS發病預測,檢驗t2值與PRRS實際發病率值擬合程度是否令人滿意。
實驗一中,將小麥完好粒、蟲害粒、發芽粒和霉變粒4類小麥顆粒作為實驗對象,使用廣義回歸神經網絡的分類結果如表2所示,訓練樣本和采樣樣本數量均為250粒,測試函數建模實驗結果表明,識別率分別為76%、44%、50%、68%,無法得到較為滿意的識別率[15]。

表2 分類結果

表3 分類結果
重新選擇實驗對象,將外部特征比較明顯的發芽顆粒借助肉眼識別,使用系統提取小麥完好粒、蟲害粒和霉變粒碰撞聲特征,并使用廣義回歸神經網絡得到的識別結果如表3所示,訓練樣本和采樣樣本數量均為250粒,可以看出,此時可以較好地識別同種類小麥的三種不同類型,并且識別率可達到80%以上。說明了通過對小麥碰撞聲信號使用恰當數字信號處理方法進行特征提取,并借助廣義回歸神經網絡可以得到較好的識別率[2]。
本文在團隊前期研究成果基礎上,將四類小麥顆粒通過碰撞聲裝置提取到聲音特征,并采用廣義回歸神經網絡對其進行分類識別,并沒有得到比較好的識別效果。實驗將外部特征比較明顯的發芽顆粒人工挑選出,再使用同樣的方法對剩余三類信號進行分類識別,取得了高于80%的識別率,測試函數建模實驗結果表明,該方法能有效提高建模精度和模型泛化能力,為進一步實現小麥病蟲害顆粒自動化檢測提供了有效的方法。
未來可以對系統進行進一步改進,比如:進一步提高硬件設備的實驗精度;研究特征提取方法,采用特征融合進一步提高識別率;采用多種模式識別方法進行分類識別;針對識別率較低的四類麥粒類型,考慮結合圖像識別方法提高對小麥發芽粒的識別效果。