盛俊杰, 王九龍, 李樹勇, 文 勇
(中國工程物理研究院 總體工程研究所,四川 綿陽 621900)
楔形環連接結構是一種特殊的過盈連接形式,由于其連接簡單且可靠、同時兼具節省空間及減重的優勢,主要應用于魚雷、航天飛行器以及水下航行器的殼體連接。相比于傳統的螺栓連接結構,采用楔形環連接結構可保持產品表面連續光順,有效減小阻力、降低噪聲,具有優良的氣動和液動性能[1-2]。由于楔形環連接結構的特殊形式,不具備如傳統螺栓螺釘連接結構通過擰緊力矩來定量實現預緊狀態的表征能力。對于裝配而言,存在過松不滿足預緊要求、過緊分解困難的問題;對于使用而言,在長時振動、沖擊等環境剖面下存在松動的風險。因此,發展楔形環連接結構預緊狀態辨識技術具有重要的工程意義。
目前,按照檢測原理區分,常見機械連接結構診斷方法主要包括振動、聲音、壓電阻抗、超聲波等。由于振動噪聲信號易于采集,同時其響應信號中信息豐富且與結構特征緊密關聯,使得基于振動噪聲的結構狀態辨識技術得以廣泛應用[3-6]。但是對于采用楔形環結構這類重大武器裝備而言,受結構空間和裝備使用要求,相比振動傳感,噪聲這類非接觸式傳感手段使用面更廣。按照狀態辨識方法劃分,主流的結構狀態診斷方法可分為基于模型驅動和基于數據驅動兩類[7-8]。基于模型驅動的方法需掌握連接結構松動機理等先驗知識,基于此建立針對性的信號處理方法以提取敏感特征,但是對于復雜非線性結構來說敏感特征提取難度大,同時模型泛化能力差[9]。鑒于模型驅動方法局限性,基于傳統機器學習和深度學習的這類數據驅動的方法受到了廣泛關注[10-11]。相較于傳統的淺層機器學習方法,深度學習技術簡化了神經網絡前的特征工程處理環節,克服了傳統機器學習方法過于依賴人工經驗提取特征的缺陷,直接基于原始數據便可實現特征深度挖掘和提取,輸出特征敏感性更強,其診斷性能更優[12-15]。
主流的基礎深度學習模型包括卷積神經網絡(convolutional neural networks, CNN)[16]、深度自編碼(deep auto encoder,DAE)[17]、深度信念網絡(deep belief network,DBN)[18]、遞歸神經網絡(recursive neural network, RNN)[19]等。Deng[20]利用連續小波變換提取滾動軸承振動時頻特征,并利用CNN網絡實現故障分類;李松柏等[21]提出基于信息融合和堆棧降噪自編碼(stacked denoising auto encoder,SDAE)的齒輪故障診斷方法;雷亞國等[22]將深度神經網絡應用于大樣本數據下的齒輪故障診斷及分類。主流的深度學習網絡在大數據樣本分類任務中表現突出,尤其對于機械裝備工業大數據環境下的健康狀態監測,大大提高了特征提取敏感性和自動化診斷效率。但是對于楔形環連接這類武器裝備結構而言,其樣本量較小,傳統的深度學習算法難以在有限數據中提取到足夠的深層敏感信息。為了解決此類問題,孿生神經網絡受到了學者的廣泛關注,孿生神經網絡包括兩個子網絡,彼此之間共享權重,其優點主要在于處理小樣本及類別不平衡問題,更易做集成學習[23-24]。孿生神經網絡目前主要應用于人臉識別、目標追蹤等,對于小樣本連接結構故障診斷及模式識別還少有關注[25]。
針對楔形環連接結構狀態辨識問題,本文基于孿生神經網絡模型,實現了小樣本預緊結構宏觀分類,同時通過特征可視化技術,深入分析了孿生神經網絡訓練過程特征聚類效果,并基于二維特征建立了預緊狀態定量表征模型,實現了楔形環連接結構定量預緊辨識,避免了預緊狀態過緊拆卸困難的傳統裝配問題。
孿生神經網絡是基于兩個神經網絡建立的耦合架構,兩個網絡結構相同,權重共享。兩個神經網絡可由任意的神經網絡模塊拼接而成,例如卷積神經網絡、遞歸神經網絡等。對于每個類別中樣本數量較少,且不同類別中樣本數量不平衡的分類問題,傳統的深度學習方法很難得到較好的訓練結果,這類小樣本分類問題的關鍵在于有限樣本中充分挖掘不同類別中的敏感特征,而孿生神經網絡的優勢就在于小樣本學習,且不容易被錯誤樣本干擾,對于容錯要求嚴格的分類問題,具有優良的分類效果。
孿生神經網絡是基于兩個神經網絡建立的耦合架構,兩個網絡結構相同,權重共享,如圖1所示。兩個神經網絡可由任意的神經網絡模塊拼接而成,例如卷積神經網絡、遞歸神經網絡等。對于每個類別中樣本數量較少,且不同類別中樣本數量不平衡的分類問題,傳統的深度學習方法很難得到較好的訓練結果,這類小樣本分類問題的關鍵在于有限樣本中充分挖掘不同類別中的敏感特征,而孿生神經網絡的優勢就在于小樣本學習,且不容易被錯誤樣本干擾,對于容錯要求嚴格的分類問題,具有優良的分類效果。

圖1 孿生神經網絡結構Fig.1 Siamese neural network structure
孿生神經網絡在同一特征結構下利用相似性度量進行樣本分類,其訓練過程需最大化不同標簽的表征,同時最小化相同標簽的表征?;诖?孿生神經網絡采用對比損失函數,具體如式(1)所示
(1)
式中:y為樣本對標簽,當樣本類別相同,y=1,當樣本類別不同,y=0;d為樣本對輸入特征向量之間的距離;m為不相似樣本之間設定特征距離閾值。
從式(1)可以看出,當樣本對標簽為1時,即樣本為同類時,損失函數只保留式(1)前部分,如式(2)所示
(2)
對于同類樣本而言,若輸出特征向量損失函數較大,則表示當前網絡結構欠佳,需進一步迭代更新,直至損失函數降低至可接受范圍。
當樣本對標簽為0時,即樣本非同類時,損失函數式(1)變形為式(3)
(3)
對于非同類樣本,兩者輸出特征向量距離越大,損失函數越小。同時損失函數只考慮0~m之間的不相似特征距離,當距離超過m,我們認為兩者之間距離已足夠大,滿足不同類的分類要求,視為此時損失函數為0。m通常取值在(0~1)之間,可根據計算效率和分類效果進行擇優選擇。
孿生神經網絡利用樣本對的方式進行訓練,通過隨機匹配的方式變相地增加了訓練樣本數量,同一個樣本在多個樣本對中被多次使用,彌補了小樣本深度學習中的過擬合缺陷。同時,相比于其他深度學習算法,孿生神經網絡將多分類問題轉變為多個二分類問題,利用對比損失函數促使同類樣本彼此接近,非同類樣本遠離,無需直接在樣本中學習類別特征,在學習目標上由挖掘樣本本質特征轉變為挖掘不同樣本的相似性特征,這種學習模式淡化了深度學習對大樣本數量的要求。
經預處理的楔形環連接結構模態敲擊信號時域波形如圖2所示,累計記錄了10組敲擊響應時域波形,其結構預緊狀態從松到緊逐漸提高。由圖2可知,受敲擊激勵大小影響,其不同預緊狀態響應信號在幅值上存在差異,難以直接通過響應信號直接提取到敏感信息。

圖2 楔形環連接結構響應信號時域波形Fig.2 Time domain waveform of wedge-ring connection structure
根據楔形環連接結構響應信號特征,為降低孿生神經網絡訓練負擔,提高訓練效率和特征挖掘深度,通過時頻分析方法對孿生神經網絡輸入信號進行二次特征增強,將一維輸入特征轉變到二維時頻空間。孿生神經網絡整體結構見圖3所示。

圖3 孿生神經網絡結構Fig.3 Siamese neural network structure
(1)預設不同預緊狀態楔形環連接結構,根據其預緊狀態劃分為松動、弱預緊和強預緊3種狀態。圖4為不同預緊狀態楔形環連續敲擊聲音響應時域波形,對其時域波形進行預處理,均分提取瞬態沖擊響應信號,其起點取響應極值點,終點根據衰減波形確定,需滿足有效覆蓋波形衰減段。

圖4 瞬態沖擊響應時域波形預處理Fig.4 Time domain waveform preprocessing of transient impulse response
(2)為充分挖掘不同預緊狀態響應信號的敏感特征,基于短時傅里葉變換將瞬態沖擊響應信號轉換為時頻圖,其表達式為

(4)
式中:t和f為時間和頻率;x(τ)為待分析的信號;h*(τ-1)為滑移窗函數的共軛函數。
(3)為減小數據運算量,凸顯敏感特征,同時消除由于輸入激勵引起的額外差異,利用大津法計算不同時頻圖的最佳二值化分割閾值,并對不同預緊狀態時頻圖進行二值化處理,獲得二值化圖像[26]。
(1)基于不同預緊狀態的二值化圖像及其標簽,建議系列孿生對,預緊狀態相同的樣本對標記其為1,預緊狀態不同時,標記其為0,其標記規則如圖5所示。

圖5 孿生對標記規則Fig.5 Marking rule of twin pair
(2)建立如圖2所示的3層全連接層Dense網絡,兩個樣本共享網絡參數,通過全連接網絡結構深度挖掘樣本對的敏感特征,并利用歐式距離判別函數和損失函數反饋訓練網絡。
(3)基于孿生神經網絡訓練結果輸出三種預緊狀態二維特征,完成楔形環連接預緊狀態孿生網絡分類模型構建,將待測樣本輸入網絡,獲得其二維特征。
(4)計算孿生神經網絡分類模型中強預緊狀態二維特征聚類中心C,以此為基準,計算待測樣本二維特征與中心C的歐式距離。
(5)劃定強預緊狀態二維特征相似性可接受閾值,根據式(5),將歐式距離轉化為相似性特征指標,當相似性特征指標大于,即認為預緊狀態已滿足要求
m=e-|d|/ε2
(5)
式中,ε為相似性指標置信因子,取值為0~1。
為驗證所提孿生神經網絡辨識楔形環連接結構預緊狀態有效性,建立了如圖6所示的試驗臺。試驗系統主體結構由兩個帶楔形環槽的圓筒結構和一對環狀楔形環帶組成。通過敲擊楔形環帶大端實現楔形環帶的預緊功能,并記錄不同預緊狀態下楔形環帶大端間距。此外,通過噪聲傳感器記錄不同預緊狀態下的聲音響應信號,噪聲信號采樣頻率為2 000 Hz。

圖6 楔形環連接結構Fig.6 wedge-ring connection structure
試驗共包括50組數據,根據每種狀態下楔形環結構大端間距可將預緊狀態劃分為3類,分類規則如表1所示。

表1 楔形環連接結構預緊狀態分類規則
基于表1預緊狀態分類規則,對所有聲音響應信號預緊狀態進行標記,在預處理、時頻變化等過程中保持響應信號同標簽一一對應。首先將聲音信號進行分段預處理,并利用短時傅里葉變換將其轉化為時頻圖,不同預緊狀態下的聲響應信號典型時頻圖如圖7所示。由圖7可知,隨預緊狀態升高,高頻信號表現得更為豐富,但是弱預緊與強預緊狀態時頻圖差異較小,難以直接通過時頻分析技術辨識其類別。

圖7 不同預緊狀態的聲信號時頻圖Fig.7 Time-frequency graphs of acoustic signals with different pretension states
為減小數據運算量,凸顯敏感特征,將時頻圖進行二值化處理,不同預緊狀態聲響應信號二值化時頻圖如圖8所示。由圖8可知,弱預緊狀態與強預緊狀態二值化時頻圖表現出與圖7時頻圖類似的特點,兩者時頻特征分布較類似,表明當楔形環連接結構達到弱預緊后,其整體結構已初步達到一個相對穩定狀態。針對此種類間距較小的分類問題,需充分發揮孿生神經網絡核心思想,弱化樣本的本質特征挖掘,重點圍繞樣本間的相似/非相似特征。

圖8 不同預緊狀態的聲信號二值化時頻圖Fig.8 Binarized time-frequency graphs of acoustic signals with different pretension states
基于圖5孿生對標記規則,根據不同樣本的預緊狀態標簽對樣本進行二次標記,建立二值化時頻圖孿生對,典型的樣本孿生對結構如圖9所示。

圖9 二值化時頻圖孿生對Fig.9 twin pair of binarized time-frequency graph
選取40組試驗數據作為訓練樣本,將其兩兩組合成樣本對,剩余10組樣本作為測試樣本。訓練參數中,不相似樣本特征距離閾值為0.3,迭代次數1 000次,學習率0.000 1,梯度衰減因子0.9,最小數據組batch_size為10。訓練過程中的損失函數趨勢變化如圖10所示。

圖10 損失函數變化趨勢Fig.10 Variation trend of loss function
孿生神經網絡深度學習訓練過程是一個黑盒,通常通過損失函數趨勢值評價訓練模型的成熟度,但是單一的損失函數值難以直接表征模型的聚類程度,此外,其原始輸出為0/1/2三種分類結果(分別表示松動、弱預緊、強預緊),分析過程固然簡化但同時也帶來類內樣本差異性無法體現,分類結果缺乏直觀證據表征?;诖?為在一定程度破解“黑盒”問題,增強訓練模型使用信心,對訓練及分析過程進行可視化運算,將簡單0/1/2分類結果轉化為二維特征,通過評價二維特征聚類效果間接反映訓練效果。其中,第1次、第500次和第1 000次的二維特征輸出效果如圖11所示,由圖11可知,當迭代次數達到500次時,雖然其損失函數已趨于較低水平,但其不同樣本之間分類效果并不明顯,當訓練次數達到1 000次時,三類不同樣本表征出明顯的二維區域特征,達到預期訓練效果。

圖11 二維特征輸出可視化Fig.11 Two-dimensional feature visualization
基于訓練樣本建立了二維特征提取模型,為檢驗該模型對于不同預緊狀態樣本辨識精度,利用10組樣本進行預緊狀態分類測試驗證,同樣將其測試結果輸出至二維特征平面,結果如圖12所示。由圖12可知,測試樣本與對應訓練模型達到了較好聚類效果,據此可有效實現不同預緊狀態樣本的宏觀分類表征。

圖12 測試樣本聚類結果Fig.12 Clustering results of test samples
在楔形環實體裝配過程中,為保持長時動態環境條件下的結構穩定性,不僅要求能實現其預緊狀態宏觀辨識,還需滿足預緊性能精細化定量表征,以指導精密裝配?;诖?在孿生神經網絡分類模型基礎上,進一步開展預緊性能二維特征指標量化表征。以圖11中迭代1 000次后的分類模型為基準,計算其強預緊狀態二維特征聚類中心C(-6.095,-1.763)。以圖2中連續敲擊的一組樣本(累計10次)作為待測樣本,計算待測樣本同聚類中心C的歐氏距離,并據式(5)將其轉化為相似性特征指標,其趨勢如圖13(a)所示,由圖可知,從松動到預緊其相似性指標呈現出明顯上升趨勢,第7次敲擊時,m達到強預緊閾值,滿足預緊要求。同時可發現,從第8次裝配敲擊后,其相似性指標再次呈現下降趨勢,并在第10次低于強預緊閾值。針對該現象,結合強預緊聚類模型進行分析,根據其0.95閾值,劃定強預緊二維特征接收域(接收半徑R=0.462),如圖13(b)可知,第7/8/9次預緊狀態二維特征均處于可接收域,當達到10次敲擊后,其二維輸出特征P10遠離聚類中心C,并超出可接收域范圍。上述特征分析結果表明,一旦楔形環預緊狀態達到閾值,繼續敲擊可能存在環帶過緊從而超出設計范圍,從裝備實際使用過程中的裝拆可行性考慮,應避免此類情況。

圖13 測試樣本定量評估結果Fig.13 Quantitative evaluation results of test samples
針對武器裝備中的楔形環連接結構預緊狀態辨識問題,本文建立了面向小樣本的孿生網絡分類模型,并基于特征可視化技術實現了預緊狀態精密表征。該方法首先利用時頻處理技術實現了孿生網絡模型輸入特征增強,在此基礎上建立了3層孿生神經網絡分類模型,實現了三類預緊狀態的訓練樣本二維特征聚類和待測樣本宏觀分類?;诙S特征建立了相似性指標定量表征模型,引入目標狀態聚類中心與接收域參量,有效實現了楔形環預緊狀態定量評估。對于武器裝備楔形環連接結構這類預緊機理復雜、樣本小且不平衡的辨識問題,本文所提方法提供了一種新的技術途徑,具有一定工程應用價值。