馬 帥, 王曉東*,2, 吳建德,2, 范玉剛,2, 黃國勇,2
(1.昆明理工大學(xué)信息工程與自動(dòng)化學(xué)院,云南昆明650500;2.云南省礦物管道輸送工程技術(shù)研究中心,云南昆明650500)
近年來,長距離輸?shù)V管道在我國得到了快速的發(fā)展,作為五大運(yùn)輸方式之一的管道輸送相比較于鐵路、公路具有不占或少占土地、不污染環(huán)境,投資費(fèi)用低、自動(dòng)化程度高等一系列明顯的優(yōu)點(diǎn),成為冶金礦山企業(yè)建設(shè)設(shè)計(jì)鐵精礦外運(yùn)的主要方式之一。由于礦物管道設(shè)計(jì)一般多在地形復(fù)雜的高山、高原地區(qū),給管道的正常輸送帶來不利的影響;特別是在管道的轉(zhuǎn)彎和有較大落差的連接處容易造成礦漿管內(nèi)漿體的流速不穩(wěn)定,導(dǎo)致管道堵塞,嚴(yán)重影響了冶金礦山企業(yè)的正常生產(chǎn),造成巨大的經(jīng)濟(jì)損失。目前,常用的管道檢測裝置主要通過管道的輸送壓力、流量等參數(shù)的變化來判斷[1]。此類方法受輸送物質(zhì)特性及輸送工況等諸多因素影響,且報(bào)警發(fā)生在泄漏之后[2]。因此,針對目前管道檢測出現(xiàn)的問題,特別是礦漿管道堵塞檢測難問題,基于模式識(shí)別的方法能夠較好地識(shí)別出壓力信號的異常,并及時(shí)識(shí)別故障信號。
目前,基于傳統(tǒng)統(tǒng)計(jì)學(xué)理論的神經(jīng)網(wǎng)絡(luò)的模式識(shí)別方法在實(shí)際工程中應(yīng)用較多,但是,其結(jié)構(gòu)參數(shù)往往依賴于多次的實(shí)驗(yàn)才能確定,而且需要大量的故障樣本對其進(jìn)行訓(xùn)練。而在實(shí)際的工業(yè)生產(chǎn)中,大量存在的是正常操作條件下的數(shù)據(jù),只有少量故障數(shù)據(jù)。神經(jīng)網(wǎng)絡(luò)分析可以做到經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化,但與實(shí)際風(fēng)險(xiǎn)仍有較大差異,泛化性差,其診斷的準(zhǔn)確性一直不能達(dá)到工程的要求[3]。支持向量機(jī)(Support Vector Machine,SVM)是在統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)上發(fā)展起來的一種新的通用機(jī)器學(xué)習(xí)方法。SVM較好地解決了以往許多學(xué)習(xí)方法中小樣本、非線性和高維數(shù)等實(shí)際難題,可以使在小樣本情況下建立的分類器具有很強(qiáng)的推廣能力[4]。
針對礦漿管道堵塞檢測的特殊性,管道堵塞技術(shù)面臨的一個(gè)難題就是管道堵塞樣本數(shù)據(jù)不易獲取,此外也很難對獲取的非平穩(wěn)隨機(jī)信號進(jìn)行特征提取,這些問題嚴(yán)重地制約著管道堵塞檢測技術(shù)的發(fā)展。鑒于支持向量機(jī)與其他機(jī)器學(xué)習(xí)方法的本質(zhì)區(qū)別在于它是針對小樣本、非線性問題提出的,它能在訓(xùn)練樣本很小且非線性的情況下達(dá)到很好的分類推廣效果,而且它不需要預(yù)先知道故障分類的先驗(yàn)知識(shí)[5]。因此,支持向量機(jī)可以被應(yīng)用于管道堵塞技術(shù)的檢測領(lǐng)域。
有效識(shí)別在礦漿管道完全堵塞前將小堵塞即不完全堵塞的壓力信號、流量信號識(shí)別出來顯得至關(guān)重要。文中對傳統(tǒng)統(tǒng)計(jì)學(xué)與統(tǒng)計(jì)學(xué)習(xí)理論進(jìn)行比較,分析了傳統(tǒng)學(xué)習(xí)方法的局限性,然后將基于支持向量機(jī)分類方法用于管道堵塞信號的識(shí)別,并將實(shí)驗(yàn)結(jié)論與神經(jīng)網(wǎng)絡(luò)方法對比,證明該方法是可行的,有效的。
傳統(tǒng)統(tǒng)計(jì)學(xué)理論與統(tǒng)計(jì)學(xué)習(xí)理論相比,局限性主要表現(xiàn)在以下兩方面[6]。
傳統(tǒng)統(tǒng)計(jì)學(xué)理論對樣本的要求比較高,如神經(jīng)網(wǎng)絡(luò)方法,包括兩個(gè)方面:樣本的數(shù)量和樣本的質(zhì)量。在管道堵塞檢測中,要求樣本數(shù)據(jù)的分布能覆蓋所有管道堵塞模式,這決定了樣本的數(shù)量會(huì)很多,并且類似的工況樣本不能有矛盾或沖突。然而,在實(shí)際的工業(yè)生產(chǎn)中只有少量的故障樣本,大量存在的是正常工況下的數(shù)據(jù),并且管道堵塞的故障模式是有限的。因此神經(jīng)網(wǎng)絡(luò)等方法不能滿足檢測堵塞信號的樣本數(shù)目,及其有限的管道堵塞應(yīng)用。
傳統(tǒng)學(xué)習(xí)方法中采用的經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化(ERM)準(zhǔn)則常常定義為

其中,Remp(w)是利用已知的經(jīng)驗(yàn)數(shù)據(jù)(訓(xùn)練樣本)來計(jì)算,因此被稱為經(jīng)驗(yàn)風(fēng)險(xiǎn)。利用對參數(shù)w求經(jīng)驗(yàn)風(fēng)險(xiǎn)來逐漸逼近理想的期望風(fēng)險(xiǎn)的最小值。而神經(jīng)網(wǎng)絡(luò)故障診斷模型基于經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化的原則,這樣很容易導(dǎo)致神經(jīng)網(wǎng)絡(luò)的過學(xué)習(xí),即訓(xùn)練誤差過小而導(dǎo)致泛化能力下降。根據(jù)統(tǒng)計(jì)學(xué)習(xí)理論,對指示函數(shù)集中的所有函數(shù)(包括使經(jīng)驗(yàn)風(fēng)險(xiǎn)最小的函數(shù))、經(jīng)驗(yàn)風(fēng)險(xiǎn)Remp(w)和實(shí)際風(fēng)險(xiǎn)R(w)之間以至少1-η的概率滿足以下關(guān)系[7]:

式中:R(w)為實(shí)際風(fēng)險(xiǎn);Remp(w)為經(jīng)驗(yàn)風(fēng)險(xiǎn);h為函數(shù)集的VC維;n為樣本數(shù)。
在訓(xùn)練樣本數(shù)目有限的條件下,模型的VC維越高則置信范圍越大,真實(shí)風(fēng)險(xiǎn)與經(jīng)驗(yàn)風(fēng)險(xiǎn)之間可能的差別就越大。這就是出現(xiàn)過學(xué)習(xí)的原因,從而導(dǎo)致識(shí)別模型的泛化性能差。而機(jī)構(gòu)風(fēng)險(xiǎn)最小化原則(SNM)將預(yù)測函數(shù)集構(gòu)造為函數(shù)子集序列,使各個(gè)子集按照VC維的大小排列,在各個(gè)子集間折中考慮經(jīng)驗(yàn)風(fēng)險(xiǎn)Remp(w)和置信范圍φ(h/n),取實(shí)際風(fēng)險(xiǎn)最小[8]。
基于以上分析,針對傳統(tǒng)的統(tǒng)計(jì)學(xué)理論局限性,支持向量機(jī)方法建立在統(tǒng)計(jì)學(xué)習(xí)理論的結(jié)構(gòu)風(fēng)險(xiǎn)最小原理和采用結(jié)構(gòu)風(fēng)險(xiǎn)最小原理及VC維的基礎(chǔ)上,根據(jù)有限樣本信息在模型中的復(fù)雜性和學(xué)習(xí)能力之間尋求最佳折中,能夠兼顧訓(xùn)練誤差和泛化能力,從而獲得更高的推廣能力。
支持向量機(jī)是在統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)上發(fā)展起來的一種新的學(xué)習(xí)方法,具有很多優(yōu)于已有方法的性能[9]。支持向量機(jī)作為一種小樣本學(xué)習(xí)理論,建立在結(jié)構(gòu)風(fēng)險(xiǎn)最小化的基礎(chǔ)上,對有限的訓(xùn)練樣本集,能夠獲得最優(yōu)的推廣能力,較好地解決了過學(xué)習(xí)和欠學(xué)習(xí)以及局部極小點(diǎn)等問題,已被成功地應(yīng)用于人臉識(shí)別、語言識(shí)別等領(lǐng)域[10]。支持向量機(jī)的核心思想是把輸入空間的樣本通過非線性變換映射到高維核空間,在高維核空間求取具較低VC維的最優(yōu)分類超平面。分類方法如下:
設(shè)有一個(gè)訓(xùn)練樣本集:{(x1,y1),(x2,y2),…,(xn,yn)},其中 xn∈ Rn,yn∈ R,xn為支持向量機(jī)的輸入數(shù)據(jù),yn為對應(yīng)的輸出數(shù)據(jù)。要實(shí)現(xiàn)最優(yōu)超平面需要對訓(xùn)練樣本數(shù)據(jù)進(jìn)行正確分類,則要滿足

根據(jù)結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,將最優(yōu)分類面問題表示成求解二次凸優(yōu)化問題:

其中:w為超平面系數(shù)向量;b為偏置;ξi為松弛變量;C為懲罰參數(shù)。
將約束化問題轉(zhuǎn)化為構(gòu)造Lagrange函數(shù)求解,利用對偶原理可得到上述優(yōu)化問題的對偶描述:

其中,αi為朗格朗日乘子。若為最優(yōu)解,則

即最優(yōu)分類面的權(quán)系數(shù)向量w*是訓(xùn)練樣本量yi和xi的線性組合。相應(yīng)的最優(yōu)分類判別函數(shù):

對于線性不可分問題,可以在其分類方程中引入一個(gè)松弛變量ξi≥0來解決。
而當(dāng)訓(xùn)練樣本集非線性問題時(shí),通常可以將輸入樣本映射到某個(gè)高維特征空間,進(jìn)而在該空間中構(gòu)造最優(yōu)分類面并在這一空間中求最優(yōu)分類面。此時(shí)對應(yīng)的最優(yōu)分類判別函數(shù)為

上式即為支持向量機(jī)。
支持向量機(jī)的分類函數(shù)形式上類似于一個(gè)神經(jīng)網(wǎng)絡(luò),輸出量是輸入向量與中間核函(Kernel function)節(jié)點(diǎn)乘積的線性組合。支持向量機(jī)在訓(xùn)練中包括選擇合適的核函數(shù),它的訓(xùn)練能力跟所選擇的核函數(shù)以及所選擇的相關(guān)參數(shù)有很大的關(guān)系,尤其是核參數(shù)以及模型參數(shù)中的懲罰參數(shù)C有很大的關(guān)系。分類計(jì)算中可以選擇不同的核函數(shù),通常有多項(xiàng)式核函數(shù)、徑向基核函數(shù)、高斯核函數(shù)以及線性核函數(shù)。文中支持向量機(jī)采用徑向基核函數(shù)(RBF)。
實(shí)驗(yàn)數(shù)據(jù)采用M寬(M表示某一泵站壓力、流量的采樣值)的數(shù)據(jù)樣本作為支持向量機(jī)的輸入值,每組輸入為泵站進(jìn)口壓力值和流量值組成。本實(shí)例中M=130,使用其中100組作為訓(xùn)練樣本,對另外30組進(jìn)行預(yù)測分類,樣本采樣間隔為2 min。
1)隨機(jī)從M寬的數(shù)據(jù)樣本抽取訓(xùn)練樣本。
2)選擇合適的核函數(shù),文中選用RBF核函數(shù)。
3)支持向量機(jī)的訓(xùn)練方法很多,網(wǎng)格搜索法是將C和γ分別取M個(gè)值和N個(gè)值,對M×N個(gè)(C,γ)的組合,分別訓(xùn)練不同的支持向量機(jī),再估計(jì)其學(xué)習(xí)精度,從而在M×N個(gè)(C,γ)的組合中得到學(xué)習(xí)精度最高的一個(gè)組合作為最優(yōu)參數(shù)[11]。基于支持向量機(jī)礦漿管道堵塞信號識(shí)別方法就是采用該思想。
4)訓(xùn)練模型的參數(shù)尋優(yōu)(懲罰因子C和參數(shù) γ)。
5)向訓(xùn)練好的樣本模型中輸入測試樣本,檢測分類效果。
由于輸?shù)V管道的特殊性,在管道完全堵塞的前期會(huì)形成一些小的堵塞即不完全堵塞,對這些不完全堵塞的壓力信號以及流量信號用支持向量機(jī)進(jìn)行辨識(shí),對于管道堵塞起到一個(gè)很好的預(yù)警作用。文中采用云南某公司2010年某一泵站輸?shù)V管道壓力、流量數(shù)據(jù)進(jìn)行檢測,在識(shí)別模型問題上將SVM,RBF人工神經(jīng)網(wǎng)絡(luò)測試結(jié)果進(jìn)行性能比較分析,評估SVM的分類辨識(shí)效果。
為了消除樣本在數(shù)值上相差較大的影響,提高模型的學(xué)習(xí)速度和預(yù)測精度,對輸入樣本進(jìn)行歸一化處理。歸一化公式為

利用Libsvm工具箱中自帶的網(wǎng)格參數(shù)尋優(yōu)方法(Cross search method),自動(dòng)尋找RBF核中的C參數(shù)、Gammam參數(shù),獲得最佳參數(shù)值C=0.062 5,g=5.78,交叉檢驗(yàn)準(zhǔn)確率(Cross validation accuracy)為99%。SVC參數(shù)選擇結(jié)果如圖2所示。

圖1 樣本歸一化數(shù)據(jù)Fig.1 Figure of sample data for normalization
采用100組樣本數(shù)據(jù)作為訓(xùn)練集,建立堵塞識(shí)別模型,對30組數(shù)據(jù)進(jìn)行分類預(yù)測,準(zhǔn)確率達(dá)93.33%。效果如圖3所示。
利用同樣的訓(xùn)練集和測試集,RBF人工神經(jīng)網(wǎng)絡(luò)分類預(yù)測效果如圖4所示。
從圖3和圖4的測試結(jié)果可以看出,相比較于RBF人工神經(jīng)網(wǎng)絡(luò),支持向量機(jī)在小樣本中顯示出

圖2 SVC參數(shù)選擇結(jié)果Fig.2 Figure of SVC Parameter selection result

圖3 測試集SVM預(yù)測結(jié)果Fig.3 FigureoftestsetsSVM neuralnetwork prediction result
針對礦漿管道沿線堵塞事件檢測這一典型的分類問題,較好地將支持向量機(jī)用于管道堵塞信號的識(shí)別。測試結(jié)果表明,基于支持向量機(jī)的管道識(shí)別方法比人工神經(jīng)網(wǎng)絡(luò)方法學(xué)習(xí)訓(xùn)練速度快,分類良好的處理能力,避免了RBF人工神經(jīng)網(wǎng)絡(luò)過學(xué)習(xí)現(xiàn)象,這是因?yàn)樯窠?jīng)網(wǎng)絡(luò)等傳統(tǒng)的學(xué)習(xí)方法是基于經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原則,但是經(jīng)驗(yàn)風(fēng)險(xiǎn)最小不能確保實(shí)際風(fēng)險(xiǎn)最小,因此出現(xiàn)了過學(xué)習(xí)的現(xiàn)象。而基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則的支持向量機(jī)比RBF人工神經(jīng)網(wǎng)絡(luò)顯示出更好的分類能力,識(shí)別效果優(yōu)于RBF人工神經(jīng)網(wǎng)絡(luò)。處理效果性能好。基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則的支持向量機(jī)比基于經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原則的RBF人工神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法有更好的泛化能力和更高的分類準(zhǔn)確率,因此更適合小樣本條件下的機(jī)器學(xué)習(xí)。該方法可以有效地用于識(shí)別礦漿管道堵塞事件,提高管道堵塞檢測的準(zhǔn)確率,從而達(dá)到安全生產(chǎn)的目的。因此基于支持向量機(jī)的礦漿管道堵塞信號識(shí)別方法可推廣到油氣管道堵塞信號的檢測中,應(yīng)用前景廣闊。但是,目前基于支持向量機(jī)的管道堵塞信號識(shí)別方法仍需在其核函數(shù)和參數(shù)選擇中進(jìn)一步改進(jìn)。

圖4 測試集RBF神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果Fig.4 Figure of test sets RBF neural network prediction result
在下一步工作中,將對支持向量機(jī)識(shí)別堵塞信號方法進(jìn)行改進(jìn),通過實(shí)驗(yàn)進(jìn)一步完善識(shí)別效果。
[1]楊杰,王桂增.輸氣管道泄漏診斷技術(shù)綜述[J].化工自動(dòng)化及儀表,2004,31(3):1-5.YANG Jie,WANG Gui-zeng.Leak detection and location methods for gas transport pipelines[J].Control and Instruments in Chemical Industry,2004,31(3):1-5.(in Chinese)
[2]曲志剛,封皓,靳世久,等.基于支持向量機(jī)的油氣管道安全監(jiān)測信號的識(shí)別方法[J].天津大學(xué)學(xué)報(bào):自然科學(xué)版,2009,42(5):465-470.QU Zhi-gang,F(xiàn)ENG Hao,JIN Shi-jiu,et al.An SVM-based recogntion method for safety monitoring signals of oil and gas pipeline[J].Journal of Tianjin University:Natural Science Edition,2009,42(5):465-470.(in Chinese)
[3]康維新,彭喜元.基于二層SVM多分類器的樁基缺陷診斷[J].電子學(xué)報(bào),2008,12(12A):66-70.KANG Wei-xin,PENG Xi-yuan.The defects diagnose of pile foundation based on two-layermultiple-classifier of SVM[J].Acta Electronica Sinica,2008,12(12A):66-70.(in Chinese)
[4]姜萬錄,吳勝強(qiáng).基于SVM和證據(jù)理論的多數(shù)據(jù)融合故障診斷方法[J].儀器儀表學(xué)報(bào),2010,31(8):1738-1743.JIANG Wan-lu,WU Sheng-qiang.Multi-data fusion fault diagnosis method based on SVM and evidence theory[J].Chinese Journal of Scientific Instrument,2010,31(8):1738-1743.(in Chinese)
[5]趙艷燕.基于支持向量機(jī)的管道泄漏聲發(fā)射研究[D].北京:北京化工大學(xué),2010.
[6]梅建新,段汕,潘繼斌.支持向量機(jī)在小樣本識(shí)別中的應(yīng)用[J].武漢大學(xué)學(xué)報(bào):自然科學(xué)版,2002,48(6):732-736.MEI Jian-xin,DUAN Can,PAN Ji-bin.The application of support vector machines in recognition of small sample[J].Journal of Wuhan University:Natural Science Edition,2002,48(6):732-736.(in Chinese)
[7]Burges C J C.Atutorial on support vector machines for pattern recognition[J].Data Mining and Knowledge Discovery,1998,2(2):121-167.
[8]范曉靜,張來斌,梁偉,等.基于支持向量機(jī)的管道泄漏檢測方法研究[J].儀器儀表學(xué)報(bào),2008,28(4):236-239.FAN Xiao-jing,ZHANG Lai-bin,LIANG Wei,et al.Research of leakage detection for pipelines based on support vector machine[J].Chinese Journal of Scientific Instrument,2008,28(4):236-239.(in Chinese)
[9]張學(xué)工.關(guān)于統(tǒng)計(jì)學(xué)習(xí)理論與支持向量機(jī)[J].自動(dòng)化學(xué)報(bào),2000,26(1):32-42.ZHANG Xue-gong.Introduction to statistical learning theory and support vector machines[J].Acta Automatica Sinica,2000,26(1):32-42.(in Chinese)
[10]邊肇祺,張學(xué)工.模式識(shí)別[M].北京:清華大學(xué)出版社,2000.
[11]李琳,張曉龍.基于RBF核的SVM學(xué)習(xí)算法的優(yōu)化計(jì)算[J].計(jì)算機(jī)工程與應(yīng)用,2006(29):190-204.LI Lin,ZHANG Xiao-long.Optimization of SVM with RBF kernel[J].Computer Engineering and Applications,2006(29):190-204.(in Chinese)