劉志懷, 秦 芳, 劉 娜, 黃祖坤, 劉學斌
(1. 河南理工大學 現代教育技術中心, 河南 焦作 454000; 2. 哈密豫新能源產業研究院有限責任公司, 新疆 哈密 839000;3.華北科技學院 環境工程學院, 北京 101601; 4. 哈密職業技術學院 信息網絡中心, 新疆 哈密 839000;5. 哈密職業技術學院 機電系, 新疆 哈密 839000)
鋼絲繩是工業中常用的柔性承載構件,已廣泛應用于電梯、起重機械、客運索道、礦山等諸多行業[1]。在使用過程中鋼絲繩的損傷程度和承載能力時刻關系到設備及人身安全,因而,準確可靠地檢測鋼絲繩損傷狀況具有重要的經濟和社會效益[2-4]。目前代表性的鋼絲繩無損檢測方法主要有電磁檢測法、超聲波檢測法、聲發射檢測法、射線檢測法及光學檢測法等。在諸種檢測方法中,人們公認電磁檢測法相對較好。
電磁檢測法中最重要的內容之一就是建立斷絲損傷與檢測信號的某些特征屬性之間的映射關系[5]。國內外學者提出了很多鋼絲繩斷絲損傷信號的特征屬性。例如,斷絲信號與股波信號在特定時延點的相關特征屬性[6]、信號的絕對峰值、峰峰值、差分超限數目、波寬、峰-峰值波寬比、波形下面積、波動面積、短時能量、短時波動能量、理想波峰角等時域特征屬性[7-9],頻域中譜分布特征屬性[10],時頻域中小波變換的模極大值、小波能量特征以及小波包分解的熵特征屬性[11-12],基于漏磁場強度分析模型提取的特征屬性等[13]。只有找到上述特征屬性與鋼絲繩斷絲損傷之間的關系,才能利用斷絲信號的特征屬性來推斷鋼絲繩斷絲的損傷情況。
人工神經網絡作為一種自適應模式識別技術在鋼絲繩損傷定量識別中得到了大量的研究[14-17],其本質是通過人工神經網絡建立斷絲信號的特征屬性與鋼絲繩斷絲損傷之間的關系,進而利用該關系和特征屬性來識別斷絲損傷情況。由于鋼絲繩損傷類型、損傷形態、損傷位置等具有多樣性,在神經網絡模型的構建過程中人們往往希望利用盡可能多的特征屬性來表征鋼絲繩斷絲損傷情況,然而,多個特征屬性之間經常會存在較強的相關性,這容易導致分析問題的復雜性和建模效率的降低[18-19],達不到鋼絲繩斷絲精確檢測的目的。
主成分分析法能夠將多個相關變量簡化為少數幾個不相關的綜合變量,而且這些不相關的綜合變量包含了原變量提供的絕大部分信息。針對上述難題,采用主成分分析方法對鋼絲繩斷絲信號的多個特征屬性進行降維處理,得到主成分特征屬性,然后依據神經網絡構建主成分特征屬性與鋼絲繩斷絲數目之間的關系,進而預測鋼絲繩斷絲數目。試驗結果表明,該方法能夠較為可靠地提高鋼絲繩斷絲檢測的準確率。
傳統的BP算法一般以誤差函數最小為逼近目標,利用梯度下降法進行網絡參數的迭代而完成整個自學習過程。雖然該算法能夠有效解決諸多問題,但由于輸入輸出關系的復雜性導致當訓練樣本的特征屬性數目較多時其收斂速度和精度明顯下降;另一方面,訓練樣本特征屬性數目的增加又是提高網絡工作性能的重要前提。
鑒于此,本文提出主成分分析的BP神經網絡,其基本思想是利用主成分分析方法降低斷絲信號原始特征屬性數據間的相關性,在有效保留數據信息的前提下降低數據的維數,獲得斷絲信號的主成分特征屬性。然后,利用主成分特征屬性作為BP神經網絡的輸入,減少網絡輸入層的節點數,從而簡化BP神經網絡結構,達到提高鋼絲繩斷絲檢測精度的目的,如圖1所示。
基于主成分分析與BP神經網絡的鋼絲繩定量檢測方法技術流程如下:
步驟1求取斷絲信號原始特征屬性訓練樣本集的協方差矩陣,并求出樣本集協方差矩陣的特征值和對應的特征向量,特征值按降序排列;
步驟2計算方差貢獻率和累計方差貢獻率;
步驟3根據累計方差貢獻率及特征值之間的差異性等判別標準,篩選出斷絲信號訓練樣本集的主成分特征屬性R_PCA(Principal Component Analysis);
步驟4將步驟3得到的R_PCA作為BP 神經網絡的訓練樣本,對BP 神經網絡進行訓練;
步驟5求取測試樣本集的主成分特征屬性T_PCA;
步驟6將測試樣本集的主成分特征屬性T_PCA 輸入在步驟4中訓練完成的BP神經網絡中進行鋼絲繩斷絲的定量檢測,從而得出鋼絲繩的斷絲個數。

圖1 基于主成分分析和BP神經網絡的鋼絲繩斷絲定量檢測模型Fig.1 Quantative testing method for broken wire in steel rope based on principal component analysis and BP artificial neural network model
該應用實例中的斷絲信號是對兩種規格的鋼絲繩(鋼絲繩1和鋼絲繩2)進行試驗而采集得到的,所使用的鋼絲繩規格分別為鋼絲繩1:ф28(6x19) mm,鋼絲繩直徑28 mm,鋼絲直徑1.4 mm,麻纖維芯;鋼絲繩2:ф15(6x37) mm,鋼絲繩直徑15 mm,鋼絲直徑0.7 mm,麻纖維芯。
鋼絲繩斷絲定量檢測方法中最重要的內容之一就是建立斷絲損傷與檢測信號的某些特征屬性之間的映射關系,也就是說所選用的特征屬性要能最大程度地表征鋼絲繩的斷絲損傷。
前人的研究結果表明影響鋼絲繩斷絲漏磁場分布的因素有鋼絲繩直徑、鋼絲直徑、斷口距離、斷絲錯位、斷絲翹度以及斷絲在鋼絲繩截面的位置等[20];鋼絲繩斷絲漏磁信號的峰峰值、峰寬和波峰形態等共同反映集中斷絲的信息。鋼絲繩缺陷寬度在一定范圍內與檢測信號的峰值幅度成反比,即缺陷寬度越大,峰值幅度越小。在材料厚度一定時,缺陷的深度信號的峰峰值成正比[21]。
因此,參照各位學者的研究成果,選擇鋼絲繩斷絲信號的7種特征屬性來表征鋼絲繩的斷絲情況,這7種特征屬性分別為鋼絲繩直徑(用x1代表,下同)、鋼絲直徑(x2)、峰值(x3)、峰峰值(x4)、波形下面積(x5)、波寬(x6)、波峰角(x7),它們的具體描述如下:
鋼絲繩直徑——為鋼絲繩外接圓的直徑,鋼絲繩的大小用“公稱直徑”描述。
鋼絲直徑——指組成鋼絲繩的單根鋼絲的直徑。
峰值——為異常信號的振幅峰值與閾值(圖2中為Vy)之間差值的絕對值。正常情況下,鋼絲繩斷絲損傷檢測信號的電平會在一定范圍內波動,當存在斷絲時,信號的峰值會突然增大,超出正常范圍。由仿真分析及試驗可知,斷絲數越多或者斷口寬度(某范圍內)越大,產生的總漏磁越強,由霍爾元件采集到的信號峰值就越大。因此,可根據峰值的大小粗略判斷鋼絲繩斷絲損傷的有無和多少。
峰峰值——定義為局部異常信號的峰與谷間幅值之差的絕對值,計算峰峰值時首先尋找信號中的極大值和極小值,然后求得相鄰的一對極值之差的絕對值(極差),最后對差值作二值化處理即可。
波寬——前面兩種特征量都是基于信號的幅度和波動量提出的,為了更好地描述信號的狀態以及鋼絲繩缺陷的程度,除考慮幅度方面的因素外,還應考慮沿空間分布的情況。最簡單的空間參數是波寬。經實驗證明,波寬是衡量斷絲口寬度的主要性能指標。另外,同一位置處不同的斷絲根數,也會引起波寬的不一致。波寬的定義為B=|a1-a2|,其中a1,a2為損傷與閾值Vy的交點,如圖2所示。

圖2 典型斷絲信號波形Fig.2 Typical broken wire signal waveform
波形下面積——指一個波動或一個捻距信號下的面積,它綜合反映了信號波形的峰值及時間或空間上的跨度兩方面的信息。如圖2陰影部分表示的即為波形下面積。
波峰角——是指一個波峰與左右相鄰兩個波谷所形成的角度。鋼絲繩斷絲位置常處于與卷筒或滑輪纏繞的部分,而且斷絲口經過纏繞后很容易形成翹曲,經實驗表明,波峰角度的大小與斷絲的翹曲程度有密切關系。
在鋼絲繩斷絲定量檢測中,希望所使用的測試數據是準確可靠的。文獻[22]中給出了兩種類型的鋼絲繩斷絲測試試驗數據,這些數據是通過嚴格的試驗獲得的,其可靠性是比較高的;另外,該套測試數據已被其它專家所采用,從此角度也可以說明該套測試數據是比較準確可靠的。故此,本文也采用文獻[22]中的測試數據來驗證所給出的斷絲定量檢測方法,即本文中表1和表2中的數據均來源于文獻[22],其中表1給出了這7種特征屬性的訓練樣本集,訓練樣本共計21個。表2給出了這7種特征屬性的測試樣本集,樣本共計19個,此外表1和表2中x0為數據編號,x8為鋼絲繩實際斷絲數目。
由于鋼絲繩斷絲信號特征屬性的數據量綱和數據級別不同,使得數據之間的差異比較大,需要將7個鋼絲繩斷絲信號特征屬性的原始樣本數據集進行歸一化處理,然后再計算其相關系數矩陣并進行相關性分析。數據歸一化公式為
yij=(xij-xavgj)/sj,i=1,2,…,n;j=1,2,…,p
(1)
式中:xij為斷絲信號的原始特征屬性;xavgj為第j個特征屬性的平均值;sj為其標準差;n為樣本的總個數;p為特征屬性的總數;yij為第i個樣本第j個特征屬性歸一化后的數據值。

表1 訓練樣本數據集
表3為訓練樣本數據集(歸一化后)的鋼絲繩斷絲特征屬性相關系數矩陣。從表3可知,某些鋼絲繩斷絲信號特征屬性彼此之間存在明顯的相關性,這會對利用BP 神經網絡進行鋼絲繩斷絲檢測的精度造成影響,因此,有必要對輸入數據進行主成分分析。

表2 測試樣本數據集

表3 鋼絲繩斷絲信號特征屬性相關系數矩陣
利用表3給出的鋼絲繩斷絲信號特征屬性相關系數矩陣進行主成分分析,并計算方差貢獻率和累計方差貢獻率。表4為鋼絲繩斷絲信號訓練樣本數據集的各成分方差貢獻率及累計貢獻率。從表4中的各成分因子特征值來看,因子1與2的特征值相比,二者差異較大,而其它因子之間的差異相對較小,初步可以得知提取前2個因子即可以概括絕大部分信息。從表4的各成分的方差貢獻率及累計貢獻率來看,前2項成分的累計方差占總方差的85.86%。按照主成分的選取標準,結合各成分因子特征值的差異,同時參考后續預測斷絲的準確率,可知前2項主成分就可以代替原始的7個鋼絲繩斷絲信號的特征屬性。綜合以上分析,選取前2個因子作為鋼絲繩斷絲信號的主成分特征屬性。

表4 各成分方差貢獻率及累計貢獻率
主成分因子載荷矩陣見表5(在表5中Z1和Z2分別為第一主成分因子列向量和第二主成分因子列向量)。根據表5中的主成分分析矩陣模型,可以得到原始特征屬性的主成分數據集表達式為
PCA1=0.441 5N1+0.441 5N2+0.443 9N3+0.370 6N4+
0.336 1N5+0.401 4N6+0.040 9N7
(2)
PCA2=-0.221 5N1-0.221 5N2-0.212 8N3+0.092 6N4+
0.449 2N5+0.181N6+0.783 2N7
(3)
式中:Ni(i=1,2,…,7)為鋼絲繩斷絲信號特征屬性xi(i=1,2,…,7)進行標準化后的訓練樣本數據集。PCAj(j=1,2)為第j個主成分的線性組合。

表5 主成分因子載荷矩陣(Z1和Z2分別為第一和第二主成分)
根據主成分分析結果,將前2個斷絲信號主成分特征屬性作為輸入,因此可以確定網絡模型輸入層神經元個數為2個。隱含層節點數的確定采用試算法,選取訓練與測試結果誤差最小時所對應的隱含層神經元數作為最后確定的隱含層節點數。經試算,在隱含層神經元數為11時,訓練效果最佳,因此,隱含層神經單元個數為11個。
大量的實驗結果表明,一處損傷斷絲不會超過4根,斷絲向量僅取前4項就可以滿足要求,分別表示一處損傷內的1根,2根,3根,4根斷絲。將鋼絲繩在一處損傷內的斷絲數作為網絡的輸出,這樣網絡的輸出有4個節點。每個節點的輸出采用(0,1)二值函數編碼,因此可以確定網絡的拓撲結構為2-11-4型。
此外,為了對比鋼絲繩斷絲檢測的效果,以鋼絲繩斷絲信號的全部7個特征屬性作為輸入,輸入神經元的個數為7個,建立拓撲結構為7-11-4型的傳統BP神經網絡模型。
利用Matlab編寫程序并調用神經網絡工作箱里的newff函數來初始化網絡,傳遞函數在隱含層采用log-sigmoid函數,輸出層采用purelin函數。所訓練的網絡模型參數設定為:最小訓練速率為0.01,允許誤差為0.001,最大迭代次數為2 000次。在訓練過程中,當滿足目標精度要求或者達到最大迭代次數時,自動停止訓練。
訓練樣本為表1中給出的鋼絲繩斷絲信號特征屬性數據集,訓練樣本總數共計21個;測試樣本選用表2給出的鋼絲繩斷絲信號特征屬性測試樣本集數據,測試樣本總數共計19個。
分別利用訓練樣本的主成分特征屬性和原始特征屬性對BP神經網絡進行訓練,經過數輪迭代,得到訓練好的神經網絡權值矩陣和閾值矩陣,這兩個矩陣就是鋼絲繩斷絲信號特征屬性與斷絲數目之間的關系。利用上述訓練好的兩個BP神經網絡模型和表2給出的鋼絲繩斷絲信號特征屬性測試樣本集對鋼絲繩斷絲進行定量檢測。
表6給出了這兩種方法預測的測試樣本集斷絲數目的檢測結果。表7統計了傳統BP神經網絡和基于主成分分析的BP神經網絡斷絲數目檢測精度對比結果。
從表6和表7可以看出,傳統的BP神經網絡在19個測試樣本中檢測正確的樣本個數是12個,檢測正確率為63.15%;而基于主成分分析的神經網絡檢測正確的樣本個數為15個,檢測正確率為78.95%,說明基于主成分分析的BP神經網絡鋼絲繩定量檢測方法的精度更高。網絡結點數的減少使得程序運行的速度明顯加快,平均檢測時間從24.2 ms減少到8.4 ms。
值得說明的是,本文的斷絲檢測結果是將兩種不同規格(鋼絲繩1:ф28(6x19) mm,鋼絲繩直徑28 mm,鋼絲直徑1.4 mm,麻纖維芯;鋼絲繩2:ф15(6x37) mm,鋼絲繩直徑15 mm,鋼絲直徑0.7 mm,麻纖維芯)的鋼絲繩放在一起進行的檢測。我們也測試了將兩種不同規格的鋼絲繩分別進行單獨檢測,檢測結果為:傳統的BP神經網絡方法鋼絲繩1的斷絲識別率為88.9%,鋼絲繩2的斷絲識別率為90%,二者的平均斷絲識別率89.4%;基于主成分分析的BP神經網絡方法鋼絲繩1和鋼絲繩2的斷絲識別率均為100%。

表6 兩種方法得到的鋼絲繩斷絲檢測結果(其中,方法1傳統BP神經網絡,方法2基于主成分分析的BP神經網絡)

表7 兩種方法得到的鋼絲繩斷絲檢測結果對比(方法1為傳統BP神經網絡,方法2為基于主成分分析的BP神經網絡)
應用實例檢測結果表明利用主成分分析消除了鋼絲繩斷絲信號原始特征屬性之間的相關性,獲得了主成分特征屬性,并以此作為BP神經網絡的輸入,可以提高鋼絲繩斷絲檢測的精度,并能減少計算量。
在本文的應用實例中選取了7種鋼絲繩斷絲信號的特征屬性,今后的研究中,可進一步挖掘斷絲信號的其它特征屬性,并利用主成分分析找到更多彼此不相關的特征屬性,進一步提高鋼絲繩斷絲檢測的準確率。
致謝:衷心感謝各位審稿專家對本文的指導和建議。