姜洪遠, 楊光友,2, 劉 浪, 劉威宏
(1.湖北工業大學 農機工程研究設計院, 湖北 武漢 430068; 2.湖北省農機裝備智能化工程技術研究中心, 湖北 武漢 430068)
目前,國內外的各種類型聯合收割機已廣泛應用液壓控制技術。液壓系統的應用使收割機機械結構整體布置更緊湊、質量更輕,操作更方便,更易于實現自動控制[1]。由于聯合收割機作業環境惡劣且粉塵較多,為保障聯合收割機的正常運行,對聯合收割機液壓系統的監測顯得尤為重要[2-3]。國內外學者進行了廣泛的研究;何麗平[4]將模糊系統和神經網絡相結合,建立模糊神經網絡的數學模型,構造了基于模糊神經網絡的聯合收割機液壓故障診斷系統;陳章位[5]研究了信號時域-頻域分析處理的小波分析,提出了機械系統狀態特征提取的新途徑,并將其應用于電液伺服系統狀態監測中,實現了系統狀態特征的定量描述;周汝勝等[6]團隊提出了基于模糊化規則的FARX模型,并將此模型應用于挖掘機液壓系統之中;張若青等[7]采用多步預測神經網絡對多級液壓伺服系統進行故障診斷,并通過仿真和實驗驗證了多步預測神經網絡對多級液壓伺服系統進行故障診斷的有效性;SEPASI M,SASSANI F[8]設計了應用無跡卡爾曼濾波器對液壓系統進行在線故障診斷系統;MOZAFFARI A等[9]提出了一種用于具有分組方法、數據處理和基于語法仿生監督的可進化自組織神經模糊多層分類器的液壓系統故障診斷方法。
基于液壓系統非線性特點,本研究提出了一種將SAE和DBN融合的聯合收割機液壓系統運行狀態監測系統,該系統先使用SAE直接對由傳感器輸入的原始信號進行特征提取,然后通過DBN進行二次特征提取,建立聯合收割機液壓系統狀態參數和狀態類型之間的非線性映射,擺脫了對人工經驗診斷的依賴,提高了對聯合收割液壓系統工作狀態監測的準確率和實時性,為液壓系統故障診斷打下基礎。
由Rumelhart等提出的自動編碼器與其他前饋神經網絡類似,都是由輸入層、隱藏層和輸出層組成,如圖1所示。自動編碼器的輸出層和輸入層具有相同的神經元個數,且隱藏層的神經元個數小于輸入層和輸出層。通過最小化輸入層和輸出層之間的重構誤差,使得自動編碼器學習到原始數據的特征表示。

圖1 自動編碼器網絡結構Fig.1 Autoencoder network structure
編碼器是將原始數據映射到數據的隱含表示,如式(1)所示;解碼器盡可能的將隱含表示重構為原始輸入數據,如式(2)所示。將編碼器的輸出h作為原始數據的特征表示,而解碼器的輸出主要用于訓練過程中的重構誤差的計算,通過重構誤差反向傳播以調整神經網絡的權值和偏置值。
編碼器f通過式(1)將輸入層的數據X=[x1,x2,…,xn]映射到隱藏層,得到原始數據的特征表示h:
(1)
其中,sf為編碼器非線性激活sigmoid函數,Wij為輸入層第i個神經元與隱藏層第j個神經元之間的連接權值,bj為編碼器偏置值,hj為隱藏層第j個神經元的輸出值,n為輸入層的神經元個數。解碼器g通過式(2)將原始數據的特征表示h映射到輸出層,得到原始數據的重構數據Y:
(2)

輸入層的值X和輸出層的值Y之間的誤差為重構誤差,其計算公式如式(3)所示:
(3)


BENGIO Y等[10]在Rumelhart等提出的自動編碼器(AE)的基礎上提出的堆疊自動編碼器(SAE),能夠逐層的學習原始數據更加抽象和更加復雜的特征表示。SAE是在貪婪逐層非監督預訓練之后經過有監督的微調得到的,其由多個自動編碼器堆疊而成,如圖2所示。堆疊自動編碼器的每個自動編碼器以上一層自動編碼器的隱藏層輸出h作為輸入層的輸入,從而使得SAE能夠獲得原始輸入數據更深層次的特征表示。經過無監督預訓練得到的自動編碼器的編碼器f都將被保存,并在有監督的微調過程中作為編碼器的初始權重和偏置值[11-12]。

圖2 堆疊自編碼器預訓練原理圖Fig.2 Stack Autoencoder pretraining schematic
使用自動編碼器的方法訓練AE1層,使用AE1層的隱藏層的值H訓練AE2層,得到H的特征表示G。同理訓練AE3層,直到所有AE層訓練完成。將所有訓練好的自動編碼器的編碼器依次連接,得到預訓練好的SAE模型[13]。預訓練好的SAE頂層加入Softmax分類器,用于對SAE的有監督微調,其網絡結構如圖3所示。

圖3 堆疊自動編碼器網絡結構Fig.3 Stack autoencoder network structure
將預訓練過程中所得到的所有編碼器的權值和偏置值作為有監督微調的初始值。Softmax函數用于分類,其輸出神經元個數和分類數相同。Softmax分類層的各個神經元的輸出由式(4)和式(5)計算得出:
li=WiZ+bi
(4)
(5)
式中,σi(l)為第i個Softmax神經元的輸出,表示該樣本屬于第i個類別的概率;r為類別數;Z為SAE求得的樣本深層特征表示;zb為Z的第b個元素;Wi為SAE的最后一個隱藏層所有神經元到第i個Softmax神經元的權值矢量;bi為偏置值。Softmax分類函數的損失函數使用式(6)所示的交叉熵函數進行度量:
(6)
式中,yi為該樣本經過one-hot編碼后的標簽;L為Softmax分類函數的損失函數。
深度信念神經網絡(Deep Belief Network,DBN)由Geoffrey Hinton[14]教授在2006年提出,是一種由多層非線性變量連接組成的概率生成模型[15]。DBN通過建立觀察數據和標簽之間的聯合概率分布,對P(Observation|Label)和P(Label|Observation)均作了評估,其學習能力非常強大,可以在原始樣本數據中提取有效的低維特征,以便于進行準確分類。DBN的網絡結構如圖7所示,由圖7可知DBN是由多個受限玻爾茲曼機(Restricted Boltzmann Machine, RBM)疊加構成的。通過貪婪逐層算法[7]訓練DBN網絡,從最底層的RBM開始訓練,從下往上邊訓練邊保存模型參數,直到DBN網絡完成訓練。與其他神經網絡相比較,大大提高了訓練效率[16-18]。不僅解決了局部最優問題,而且此方法是無監督的。本研究使用BP神經網絡對DBN進行微調優化[19],以提高網絡的分類能力,DBN的網絡結構如圖4所示。
(7)

圖4 DBN的網絡結構Fig.4 DBN network structure
DBN網絡的訓練包括無監督的學習和反向調優兩個過程[20]。
1) 無監督的學習
利用CD-K算法(Contrastive Divergence,對比散度算法)進行權值初始化。
(1) 隨機初始化權值{W,a,b},其中W為權重向量,a是可見層的偏置向量,b為隱藏層的偏置向量,隨機初始化為較小的數值。

(2) 將X賦給顯層v(0),計算使隱層神經元被開啟的概率:
(8)
其中,式中的上標用于區別不同的向量,下標用于區別同一向量中的不同維。
(3) 根據計算的概率分布進行一步Gibbs抽樣,對隱藏層中的每個單元從{0,1}中抽取得到相應的值,即h(0)~p(h(0)|v(0))。詳細過程如下:
首先,產生一個[0,1]上的隨機數rj,然后由式(9)確定hj的值如下:
(9)
(4) 用h(0)重構顯層,需先計算概率密度,再進行Gibbs抽樣:
對于貝葉斯可見層神經元[21]

(10)
對于高斯可見層神經元
(11)
其中,N表示為正態分布函數。
(5) 根據計算到的概率分布,再一次進行一步Gibbs采樣,對顯層中的神經元從{0,1}中抽取相應的值來進行采樣重構,詳細過程如下:
首先,產生[0,1]上的隨機數,然后確定vj的值:
(12)
(6) 再次用顯元(重構后的),計算出隱層神經元被開啟的概率:
對于高斯或者伯努利可見層神經元

(13)
(7) 按照式(14)~式(16)更新得到新的權重和偏置。
W←W+λ[p(h(0)=1|v(0))v(0)T-
p(h(1)=1|v(1))v(1)T]
(14)
b←b+λ[p(h(0)=1|v(0))-p(h(1)=1|v(1))
(15)
a←a+λ[v(0)-v(1)]
(16)
其中,λ為學習率。
2) 反向調優
進行有監督的調優訓練時,需要先利用前向傳播算法,從輸入得到相應的輸出值,然后再利用后向傳播算法來更新網絡的權重值和偏置值。
(1) 前向傳播
利用CD算法預訓練好的W,b來確定相應隱元的開啟和關閉。逐層向上傳播,一層層地將隱藏層中每個隱元的激勵值計算出來并用sigmoid函數完成標準化,如下所示:
(17)
最后由式(18)和式(19)計算出輸出層的激勵值和輸出:
h(l)=W(l)·h(l-1)+b(l)
(18)
(19)
(2) 反向傳播
采用最小均方誤差準則的反向誤差傳播算法來更新整個網絡的參數,則代價函數如式(20):
(20)
其中,E為DNN學習的平均平方誤差,Xi表示理想的輸出,i為樣本索引。(Wl,bl)表示有待學習的權重和偏置的參數。
采用梯度下降法,來更新網絡的權重和偏置參數,如(21)所示:
(21)
其中,λ為學習效率。
SAE作為特征提取的一類模型,能夠提取出良好的數據特征。如果將SAE提取出的特征進行二次特征提取,會產生更好的分類效果。因此本研究將SAE和DBN結合得到SAE-DBN模型。其模型結構圖如圖5所示。底層為SAE層,提取輸入數據的深層次特征;DBN層對輸入數據的深層次特征進行降維操作,得到的數據作為Softmax層的輸入,Softmax層對輸入樣本進行分類處理,得到當前樣本的種類。

圖5 SAE-DBN結構Fig.5 SAE-DBN structure
為驗證SAE-DBN在聯合收割機液壓系統運行狀態監測上的有效性,于2019年5月在山東濰坊進行了聯合收割機收割作業實驗。采集的數據為GM80型聯合收割機液壓系統的壓力以及相關部位的轉速,而所需作物以及實驗環境等信息通過人員現場測試獲得。
該型號聯合收割機液壓系統原理示意圖如圖6所示,聯合收割機的主要動作包括撥禾輪升降、割臺升降、主離合控制、滾筒位置調節、喂入攪龍轉動以及撥禾輪轉動等,這些動作由撥禾輪升降油缸、割臺油缸、主離合油缸、滾筒油缸、喂入攪龍液壓馬達和撥禾輪液壓馬達等執行元件來完成。該液壓系統還包括換向閥、溢流閥液壓鎖、單向節流閥等控制元件以及液位計、冷卻器、過濾器等輔助元件。

1.過濾器 2.冷卻器 3.液壓泵 4.電機 5.單向閥6.三位八通換向閥 7.二位二通換向閥 8.順序閥9.三位四通換向閥 10.液壓鎖 11.單向節流閥12.卸荷閥 13.溢流閥 14.二位八通換向閥15.溫度計 16.液位計 17.加熱器 18.油箱圖6 聯合收割機液壓系統原理示意圖Fig.6 Hydraulic system schematic diagram of combine harvester
聯合收割機作業時,首先接通割臺油缸(a2通電),調節割臺高度, 使得割臺處于合適的位置; 同時接通喂入攪龍液壓馬達和撥禾輪液壓馬達(i2和g2受力),驅使喂入攪龍和撥禾輪旋轉;然后接通撥禾輪升降油缸(b2通電),油缸有桿腔進油時,油缸回縮,撥禾輪下降接觸小麥。此時可驅動聯合收割機進行小麥收獲作業。在作業時,可接通滾筒油缸調節滾筒位置(e2通電),以獲得更優異的脫粒性能。作業結束,依次斷開喂入攪龍液壓馬達(i2失力)、撥禾液壓馬達(g2失力),接通滾筒油缸調節滾筒位置(e1通電),回復脫離滾筒初始位置,接通割臺油缸(a1通電),調節割臺高度,接通撥禾輪升降油缸(b1通電),調節撥禾輪位置,完成聯合收割機的停車作業。
實驗依據國家標準GB/T 8097—2008《收獲機械聯合收割機試驗方法》的要求,選取適當大小的試驗田。由于數據采集系統存在干擾,采集到的原始數據中存在異常值和缺失值等,因此對原始數據進行預處理。若1個樣本中所有屬性都為0,則刪除該樣本;對于異常值,通過前后樣本的均值取代該異常值;對于缺失值,通過樣條插值法進行填補,表1為經過預處理之后的實驗數據。駕駛員操作使聯合收割機處于不同工作狀態,采集該狀態下的液壓參數,如圖7所示為聯合收割機進行實驗的實驗現場圖和傳感器安裝圖。

圖7 實驗現場及所用傳感器Fig.7 Field diagram and sensors

表1 主要實驗數據Tab.1 Main experimental datas
實驗數據經過預處理之后得到65677個樣本數據,包括了聯合收割機待機狀態、割臺低位收割短時穩定運行、割臺低位收割長時穩定運行、聯合收割機原地撥禾輪轉動、收割時僅喂入攪龍轉動、割臺高位收割短時穩定運行、割臺高位收割長時穩定運行、原地撥禾輪和喂入攪龍轉動、喂入攪龍為高轉速等九種作業狀態時相應部件的液壓數據。其中聯合收割機處于割臺低位收割短時穩定運行和割臺高位收割短時穩定運行時,液壓系統參數變化曲線如圖8所示,作業時對應的液壓系統狀態One-hot編碼[22]標簽如表2所示。

圖8 液壓系統部分參數Fig.8 Partial parameters of hydraulic system

表2 液壓系統工作狀態對應標簽Tab.2 Corresponding label of hydraulic system working state
1) 實驗數據集構建和實驗環境
在每個類取1000個樣本數據組成測試集(9000個樣本),其余樣本數據作為訓練數據集(56677個樣本)。實驗軟件環境為Windows10 64位操作系統,采用Tensorflow深度學習框架,選用Python3.5作為編程語言,硬件環境:計算機內存8GB,搭載Intel(R)Core(TM) i5-7500 CPU@3.40GHz處理器。
2) SAE-DBN模型訓練
對數據進行歸一化能夠提升模型的收斂速度、運行速度以及模型的精度[23],因此在模型訓練之前首先用Min-Max標準化方法對數據集進行歸一化處理, 使得結果落在[0,1]區間內,轉換函數如下:
(22)
其中,x為樣本數據,xmax為數據集中的最大值,xmin為數據集中的最小值,x*為歸一化后的數據。
本研究使用的SAE-DBN模型中,SAE層擁有3個自動編碼層在模型的無監督深層次特征學習訓練階段,對于每個自編碼網絡均使用sigmoid作為激活函數[24]。DBN層擁有3個RBM網絡,通過貪婪逐層算法進行訓練。最后通過Softmax分類層[25]對整個網絡進行有監督的微調。
3) SAE-DBN實現過程
(1) 對樣本數據集進行標準化處理后,按要求將數據集分為訓練集和測試集;
(2) 建立基于SAE-DBN的聯合收割機液壓系統運行狀態監測模型;
(3) 隨機初始化SAE中的所有參數,同時使用訓練集中的無標簽樣本對SAE進行逐層預訓練;
(4) 采用訓練集中的標簽樣本通過Softmax函數對SAE進行有監督的網絡調優;
(5) 隨機初始化DBN網絡的參數值{W,a,b},同時使用SAE提取的無標簽特征數據通過CD算法對RBM進行逐層預訓練[26];
(6) 采用SAE提取的標簽特征數據通過Softmax函數對SAE進行有監督的網絡調優;
(7) 將SAE和DBN疊加,使用訓練數據集中的標簽樣本對SAE-DBN進行整個模型的參數調優[27],直至誤差小于規定值。
4) 模型訓練結果
在模型訓練過程中,發現聯合收割機液壓系統運行狀態監測的準確率與AE層數和RBM層數均有一定的關系。有訓練數據集經過大量的實驗,繪制出三者之間的關系,如圖9所示。

圖9 SAE-DBN模型準確率與RBM層和AE層數之間的關系Fig.9 Relationship among accuracy of SAE-DBN model and numbers of RBM layer and AE layer
由圖9可知,隨著SAE中AE層數的增加,模型的準確率呈現上升趨勢,且趨勢逐漸變緩;準確率隨著RBM層數的增加出現上升趨勢。但是當RBM層數大于5層時,SAE-DBN模型的準確開始出現下降趨勢。因此確定本研究使用的SAE-DBN模型由3個AE層疊加形成的SAE和5層RBM構成的DBN組成,SAE-DBN模型的每層神經元個數如表3所示,SAE-DBN網絡模型訓練過程中的訓練準確率如圖10所示,不同層的損失變化σ曲線如圖11所示。

表3 SAE-DBN深度網絡模型的參數設置Tab.3 Parameter setting of SAE-DBN depth network model
從圖10的準確率ζ變化曲線可以看出模型的準確率隨著訓練次數n的增加而趨于穩定,SAE-DBN的準確率為92.47%。

圖10 SAE-DBN訓練過程準確率變化曲線Fig.10 Training accuracy curve of SAE-DBN

圖11 不同層的損失變化曲線Fig.11 Loss variation curves at different layers
此SAE-DBN模型在測試集上的結果如表4所示, 由表4可知當操作聯合收割機割臺低位收割短時穩定運行、割臺低位收割長時穩定運行、割臺高位收割短時穩定運行、割臺高位收割長時穩定運行,模型的準確率較低。本研究使用的SAE-DBN模型在聯合收割機待機狀態下、收割時僅喂入攪龍轉動、聯合收割機原地撥禾輪轉動、原地撥禾輪和喂入攪龍轉速同時轉動等狀態下有優異的性能。對基于SAE、DBN和BPNN的聯合收割機液壓系統運行狀態監測方法,采用與SAE-DBN同樣的訓練集進行訓練,4種模型在不同收割機狀態下的性能如圖12所示。

表4 SAE-DBN對聯合收割機工作狀態辨別結果Tab.4 Result of combine harvester's working state identification based on SAE-DBN

圖12 SAE-DBN和SAE、DBN以及BPNN之間的比較圖Fig.12 Comparison diagram between SAE-DBN and SAE, DBN and BPNN
由圖12可知SAE-DBN模型準確率為91.88%,與SAE、DBN以及BPNN等相比,分別提高了3.82%,4.81%和8.09%;但是在割臺低位收割短時穩定運行、割臺低位收割長時穩定運行、割臺高位收割短時穩定運行以及割臺高位收割長時穩定運行狀態下性能與其他模型相比,準確率提升不顯著;在聯合收割機原地撥禾輪轉動、 原地撥禾輪和喂入攪龍轉速同時轉動、收割時僅喂入攪龍轉動狀態下,SAE-DBN模型準確率有顯著提高。
由實驗結果可知SAE-DBN模型在聯合收割機液壓系統狀態分類有優異的表現,為聯合收割機液壓系統故障診斷與預警提供了一種比較先進的技術手段。
提出了一種SAE-DBN的聯合收割機液壓系統運行狀態監測方法,并通過聯合收割機不同工況實驗,驗證了模型的有效性。主要結論如下:
(1) 基于SAE-DBN模型的液壓系統運行狀態監測方法,較大程度上提高了模型學習特征的能力,實驗數據表明,與SAE、DBN和BPNN相比,SAE-DBN具有更高的分類準確率;
(2) 構建的基于SAE-DBN模型的液壓系統運行狀態監測系統,可以采用無標簽數據進行預訓練,克服了BPNN等模型無法利用無標簽樣本訓練的缺點,提高了對無標簽數據的利用率;
(3) SAE-DBN模型能夠有效學習到數據的深層特征表示,避免了人工設計數據特征的步驟,為液壓系統故障診斷提供了新的方法。
下一步研究可通過遺傳算法、粒子群算法等對該模型進行優化,避免人工確定網絡結構,進一步提升模型性能。