韓 松, 徐林森
(1.中國科學(xué)院合肥物質(zhì)科學(xué)研究院, 合肥 230031; 2.中國科學(xué)技術(shù)大學(xué), 合肥 230026; 3.安徽省仿生感知與先進(jìn)機(jī)器人技術(shù)重實(shí)驗(yàn)室, 合肥 230031)
長期以來由于機(jī)器設(shè)備的故障難以預(yù)知,人們常常采取以下措施:①等發(fā)現(xiàn)設(shè)備已經(jīng)損壞再進(jìn)行維護(hù)修理;②定期檢查維修。前者,是在發(fā)現(xiàn)設(shè)備已損壞的情況下再進(jìn)行彌補(bǔ)修理,顯然,這種辦法會造成很大的經(jīng)濟(jì)損失,甚至給機(jī)器設(shè)備帶來災(zāi)難性破壞,更為嚴(yán)重的則有可能造成人員傷亡;后者雖然在一定程度上優(yōu)于前者,但是其帶有一定計(jì)劃性和預(yù)防性,易造成時間和經(jīng)濟(jì)上的浪費(fèi),另外何時進(jìn)行定期檢修也是未知的。所以,只有預(yù)知性的檢查維修才是最合理的、最經(jīng)濟(jì)的,要是能在設(shè)備剛剛發(fā)生故障,或者有出現(xiàn)故障的趨勢的時候就檢測到了隱患以提前預(yù)告,那么,工作人員就能在合適的時間采取合理的應(yīng)對措施,這時,故障診斷技術(shù)就漸漸顯出其重要性。
相比于機(jī)器學(xué)習(xí)中的其他算法,基于結(jié)構(gòu)化最小風(fēng)險(xiǎn)原則的支持向量機(jī)在解決有限樣本、非線性等問題時,具有結(jié)構(gòu)簡單、泛化能力強(qiáng)、學(xué)習(xí)速度快等優(yōu)點(diǎn)[1-2]。中外諸多學(xué)者進(jìn)行了相關(guān)研究,文獻(xiàn)[3]中用二值支持向量機(jī)(support vector machine,SVM)訓(xùn)練數(shù)據(jù)特征矩陣,用已知信號訓(xùn)練模型,去檢測實(shí)際供水管道以判別泄漏。王念秦等[4]建立4種SVM模型來研究滑坡災(zāi)害危險(xiǎn)性,其中徑向基核函數(shù)SVM模型的預(yù)測結(jié)果正確率最高(82.3%)。謝樺等[5]用建立的二分類SVM模型驗(yàn)證實(shí)際配電系統(tǒng)的工況,得到合成少數(shù)類過采樣技術(shù)處理前模型的分類準(zhǔn)確率為93.1%。單劍鋒等[6]采用SVM方法對電路的12種故障類型進(jìn)行診斷,得到的診斷率范圍為70%~100%。Giorgio等[7]學(xué)者基于SVM建立的模型對心臟信號的預(yù)測正確率達(dá)98.35%。主成分分析(principal component analysis, PCA)的主要目的就是降低數(shù)據(jù)的維度,用較少的幾個綜合變量來盡可能多地反映原始變量的信息。Liu等[8]介紹了一種基于PCA的自動變量選擇方法,該方法的目標(biāo)是從一組變量中識別出一個地球地形圖分類的候選輸入。Nzayisenga等[9]研究考察了影響進(jìn)口貿(mào)易的各種因素的影響,并運(yùn)用主成分分析法確定了一個實(shí)證模型,利用1980~2017年的二手?jǐn)?shù)據(jù)對盧旺達(dá)進(jìn)口貿(mào)易的影響因素進(jìn)行了綜合分析。劉翠翠等[10]建立的PCA-SVM模型對麥冬葉部病害識別的準(zhǔn)確率為94.4%;劉承照等[11]建立PCA-SVM模型對礦床類型進(jìn)行勘探,模型的訓(xùn)練準(zhǔn)確率為92.3%,測試準(zhǔn)確率為88.7%。段凌風(fēng)等[12]通過PCA-SVM模型對人工合成要素進(jìn)行預(yù)測分類,預(yù)測準(zhǔn)確率達(dá)98%。Hu等[13]結(jié)合PCA和SVM對高度自相似的數(shù)字醫(yī)學(xué)圖像進(jìn)行處理,平均準(zhǔn)確率為99.242 5%。Cho等[14]提出了一種對疑似阿爾茨海默病進(jìn)行早期的診斷的實(shí)現(xiàn)方法,得到全腦區(qū)的PCA-SVM模型的準(zhǔn)確率最高為92.38%。
與上述研究相比,提出的PCA-SVM模型故障診斷準(zhǔn)確率更高,為滾動軸承的故障診斷研究提供了一種新的手段。
數(shù)據(jù)來源于美國凱斯西儲大學(xué)提供的軸承故障數(shù)據(jù),4組數(shù)據(jù)分別為正常基準(zhǔn)數(shù)據(jù)、內(nèi)圈故障數(shù)據(jù)、外圈故障數(shù)據(jù)和滾動體故障數(shù)據(jù)。實(shí)驗(yàn)裝置如圖1所示。

圖1 實(shí)驗(yàn)裝置Fig.1 The experimental device
圖1中的實(shí)驗(yàn)平臺包括一個2馬力(1馬力≈735 W)的電機(jī)、一個轉(zhuǎn)矩傳感器、一個功率計(jì)和電子控制設(shè)備。被測軸承支撐電機(jī)軸,使用電火花加工技術(shù)在軸承上布置了單點(diǎn)故障,故障直徑分別為0.007、0.014、0.021、0.028、0.040 in(1 in=25.4 mm),選擇電機(jī)轉(zhuǎn)速為1 797 r/min、故障直徑0.021 in下測得的數(shù)據(jù)作為研究對象。
1.1.1 系統(tǒng)誤差
選擇貝塞爾公式計(jì)算的標(biāo)準(zhǔn)差和別捷爾斯公式計(jì)算的標(biāo)準(zhǔn)差相比較的方法來判別4列數(shù)據(jù)是否存在列內(nèi)系統(tǒng)誤差[15],該方法的理論說明如下,按貝塞爾公式計(jì)算的標(biāo)準(zhǔn)差為

(1)
按別捷爾斯公式計(jì)算的標(biāo)準(zhǔn)差為

(2)
令,

(3)
式中:m、n表示數(shù)據(jù)的數(shù)目;vi表示殘差即測量值與數(shù)列平均值之差。

1.1.2 粗大誤差
選擇3σ準(zhǔn)則(拉依達(dá)準(zhǔn)則)來判別樣本數(shù)據(jù)的粗大誤差。3σ準(zhǔn)則就是在測量列中發(fā)現(xiàn)有大于3倍標(biāo)準(zhǔn)差的殘差的測量值即|vi|>3σ,則認(rèn)為它含有粗大誤差,應(yīng)給予剔除[15]。
這兩種方法通過MATLAB編程來實(shí)現(xiàn),在程序中,每種數(shù)據(jù)隨機(jī)選取120 000個共選取120 000×4個數(shù)據(jù),其結(jié)果顯示如圖2所示。

圖2 誤差分析結(jié)果Fig.2 Error analysis results
由于時域特征在分析機(jī)器設(shè)備振動信息中的簡單便捷性,常常通過振動信號的時域特征來對機(jī)器設(shè)備的狀態(tài)和故障進(jìn)行診斷,下面為一些常用的指標(biāo)。
1.2.1 有量綱參數(shù)
均方根值(xrms):用來表示信號的能量大小的值,又叫作有效值[16],計(jì)算公式為

(4)
式(4)中:n為數(shù)據(jù)的數(shù)目。


(5)
方根幅值(xr):指對幅值的根值求平均所得的值,計(jì)算公式為

(6)
1.2.2 無量參數(shù)
波形指標(biāo)(K):通常把用來表示波形的指標(biāo)叫作波形指標(biāo),其數(shù)學(xué)表達(dá)式為

(7)
峰值指標(biāo)(Cf):通常,把峰值xp與式(4)的比值稱為峰值指標(biāo),即

(8)
脈沖指標(biāo)(I):峰值和平均幅值的比值作為衡量波形是否有沖擊的脈沖指標(biāo),即

(9)
裕度指標(biāo)(Lf):峰值與式(6)的比值作為反映外界對測量值的干擾情況的裕度指標(biāo)[16],即

(10)
峭度指標(biāo)(Kv)的數(shù)學(xué)表達(dá)式[16]為

(11)
通常情況下,振動信號變大的時候,脈沖指標(biāo)、峭度指標(biāo)、裕度指標(biāo)、峰值指標(biāo)都有較大幅度的增加。但是,隨著故障的繼續(xù)發(fā)展,均值、均方根值、方根幅值以及峭度均會逐漸地增大。
選取xrms、σ2、xr、K、Cf、I、Lf、Kv這8個幅域指標(biāo)進(jìn)行滾動軸承的故障診斷分析。為了不失一般性,從正常數(shù)據(jù)中隨機(jī)選取120 000個數(shù)據(jù)作為0類數(shù)據(jù),從3種故障數(shù)據(jù)中各隨機(jī)選取120 000個數(shù)據(jù)分別作為1類、2類、3類數(shù)據(jù)。
PCA的基本思想是降維,就是用幾個綜合變量替代原始的多個變量以實(shí)現(xiàn)降低維度的目的[17]。用來替代原始變量的這幾個綜合變量包含了原始變量的絕大多數(shù)信息,能夠較好地反映原變量的情況[18]。一般情況下,用來替代的新綜合變量是由原始變量用線性組合的方法加以限制綜合而來。
2.1.1 主成分分析的數(shù)學(xué)模型
對于p個變量的n個樣本的原始數(shù)據(jù)矩陣為

(12)
式(12)中:
主成分分析就是將p個觀測變量綜合成另外p個變量:

(13)
記為
Fj=aj1x1+aj2x2+…+ajpxp,其中j=1,2,…,p。
式中:主成分系數(shù)矩陣為

(14)

上述的數(shù)學(xué)模型,用矩陣的形式表示為
F=[aij]X
(15)
式(15)中:
F=(F1F2…Fp),X=(x1x2…xp)
2.1.2 MATLAB結(jié)果分析
用MATLAB軟件進(jìn)行主成分分析,主要使用該軟件自帶的PCA函數(shù)進(jìn)行有關(guān)方面的計(jì)算分析,得主成分系數(shù)如表1所示。
各主成分的貢獻(xiàn)率及累計(jì)貢獻(xiàn)率如表2所示。
從表2可以看出,前3個主成分的累計(jì)貢獻(xiàn)率已經(jīng)達(dá)到97.639 8%,其他主成分分量所占的比重不到3%,可視其為噪聲成分而忽略不計(jì)以節(jié)省計(jì)算時間提高效率,因此,前3個主成分可以作為檢測參數(shù)。這樣,將原始的8個輸入向量轉(zhuǎn)換成了3個輸入向量,用3個主成分向量代替了原始的8個輸入變量,有效地降低了輸入矩陣的維度,并且這3個主成分變量幾乎包含了原始的8個變量的所有信息。
2.2.1 線性支持向量機(jī)
在圖3中,兩種符號表示兩類樣本,H為分類面,而把作為分類邊界的且相互平行的H1、H2之間的距離,叫作分類間隔;H1、H2上的樣本點(diǎn)稱為支持向量。
如果樣本集線性可分,樣本點(diǎn)(xi,yi),(i=1,2,…,n),xi∈Rd,yi∈{+1,-1}為類別標(biāo)簽;那么,分類平面滿足下列關(guān)系:
yi[(wx)-b]≥0
(16)

如果存在錯誤分類的情況,則引入正松弛因子ζi,得:
yi[(wx)-b]-1+ζi≥0
(17)
如果把懲罰項(xiàng)加到目標(biāo)函數(shù)中,其中C為一個控制著懲罰程度的常數(shù),那么目標(biāo)函數(shù)就成為

(18)
采用拉格朗日乘子法,其中αi、αj為拉格朗日乘子,則上述問題將變?yōu)槿缦滦问降膶ε紗栴}:

(19)

(20)

f(x)=sgn[(w*x)+b*]
(21)
2.2.2 非線性支持向量機(jī)
如果給定的原始數(shù)據(jù)不適合用線性SVM來解決,通常情況下可以通過數(shù)學(xué)方法將數(shù)據(jù)所在的維數(shù)較小的空間變換成維數(shù)較大的空間,然后在變換的高維空間中將小維數(shù)空間中的非線性問題進(jìn)行線性化處理,從而把最優(yōu)分類面放在該高維空間中尋求。從2.2.1節(jié)中可以發(fā)現(xiàn),核函數(shù)能夠滿足達(dá)到原數(shù)據(jù)的這種內(nèi)積運(yùn)算的目的。所以,將訓(xùn)練數(shù)據(jù)根據(jù)核函數(shù)轉(zhuǎn)化成內(nèi)積的形式,之后再使用2.2.1節(jié)中講述的線性可分SVM方法對原始數(shù)據(jù)訓(xùn)練,就可以將非線性問題進(jìn)行變換以實(shí)現(xiàn)線性分類。
對原始數(shù)據(jù)集建立SVM模型進(jìn)行滾動軸承的故障診斷,調(diào)用libsvm軟件包中函數(shù)svmtrain和函數(shù)svmpredict來產(chǎn)生訓(xùn)練集和測試集。為了不失一般性,從輸入屬性數(shù)據(jù)中隨機(jī)選取70%的數(shù)據(jù)作為訓(xùn)練集,而剩余的30%則作為測試集。訓(xùn)練集和測試集的預(yù)測結(jié)果如圖4所示。

表1 主成分系數(shù)

表2 主成分貢獻(xiàn)率及累計(jì)貢獻(xiàn)率

圖3 線性可分支持向量機(jī)Fig.3 Linear separable support vector machine

圖4 SVM模型預(yù)測結(jié)果對比Fig.4 Comparision of SVM model prediction results
圖4中,訓(xùn)練集的預(yù)測正確率為87.202 4%,測試集的預(yù)測正確率為84.722 2%。
對原始數(shù)據(jù)集進(jìn)行主成分分析后,建立PCA-SVM模型進(jìn)行滾動軸承的故障診斷。同樣地調(diào)用libsvm軟件包中函數(shù)svmtrain和函數(shù)svmpredict來產(chǎn)生訓(xùn)練集和測試集,從輸入屬性數(shù)據(jù)中隨機(jī)選取70%的數(shù)據(jù)作為訓(xùn)練集,而剩余的30%則作為測試集。訓(xùn)練集和測試集的預(yù)測結(jié)果如圖5所示。

圖5 PCA-SVM模型預(yù)測結(jié)果對比Fig.5 Comparision of PCA-SVM model prediction results
圖5中,訓(xùn)練集的預(yù)測正確率為99.702 4%,測試集的預(yù)測正確率為98.611 1%。與SVM模型的分類結(jié)果相比,該模型的訓(xùn)練集和測試集的預(yù)測正確率均顯著提高。
通過上述研究和分析,可以得到以下結(jié)論:
(1)由原始的8個輸入向量降維得到的3個主成分向量幾乎包含了原始的8個變量的所有信息。
(2)對比PCA-SVM模型分類結(jié)果和SVM模型分類結(jié)果發(fā)現(xiàn),數(shù)據(jù)進(jìn)行PCA后,訓(xùn)練集和測試集的預(yù)測正確率均顯著提高。
(3)與SVM模型相比,PCA-SVM模型的分類效果更好,其訓(xùn)練集的預(yù)測正確率為99.702 4%,測試集的預(yù)測正確率為98.611 1%。這一結(jié)果對于絕大多數(shù)故障診斷來說是可以接受的,是可以作為一種故障診斷的評價(jià)標(biāo)準(zhǔn)的。