基于半監督域適應模糊推理的球磨機負荷參數軟測量

2019-05-30 06:11:06李思思杜永貴閻高偉

太原理工大學學報 2019年3期

李思思，杜永貴，閆飛，閻高偉

(太原理工大學電氣與動力工程學院，太原 030024)

球磨機是廣泛應用于電力、化工等流程工業領域的典型高能耗設備，其負荷參數的準確檢測對磨礦作業環節的優化控制、節能降耗、安全運行具有重要的意義。

目前，球磨機的負荷參數檢測通常采用軟測量策略，即選擇與主導變量相關的輔助變量(振動或振聲信號)建立模型，得到負荷參數預測值。文獻[1]針對球磨機振動信號特征值具有散度大、隨機性強的特點提出基于云模型的建模策略。文獻[2]根據多源信號存在相關性、互補性以及冗余性的特性提出多源數據特征融合的球磨機負荷軟測量方法。然而，上述建模策略僅適用于解決單工況問題。

在實際的運行中，運行任務與設定值的變化、外界環境的改變、設備重組等，會導致運行工況、數據分布發生改變[3]。對于多工況過程，現有研究通常采用多模型策略。該策略主要針對全局模型抽取共同特征以達到概率同分布的技術要求。文獻[4]依據先驗知識劃分工況，然后對多個工況分別建立子模型。文獻[5]引入均值聚類的方法對工況進行劃分與識別。但是，多模型在集成過程中，由于樣本劃分不精確、部分模型數據缺失等因素導致輸出精度低，預測效果不理想。

遷移學習[6-7]是一種放寬了數據同分布要求的機器學習方法。該方法通過抽取領域間“隱含語義”或挖掘領域間“共享知識結構”，遷移源域已有的知識來解決未知但與源域相關的學習問題。目前，遷移學習應用于計算機視覺[8]、多工況故障診斷[9]等方面，并且取得了諸多成果。

綜上所述，本文引入遷移學習策略，同時考慮到球磨機振動信號不確定性的特點，研究了一種基于半監督域適應模糊推理的軟測量方法。該方法首先通過半監督域適應解決數據分布差異導致的模型失配問題；然后，通過模糊C均值聚類對不確定非線性系統的源域數據劃分規則并建立回歸模型，從而提高模型預測性能。

1 理論與算法

1.1 希爾伯特-施密特獨立標準

希爾伯特-施密特獨立標準[10]計算兩組數據集間再生核希爾伯特空間的協方差來衡量數據之間的獨立性。當且僅當兩數據集間相互獨立時，其值為零；當數據集間的依賴性越強時，其值越大。最大化數據X及標簽Y的依賴性，得到目標函數為：

max Tr(VTXHYHXTV) .

(1)

1.2 流形正則化域適應

文獻[11]研究了基于流形正則化域適應濕式球磨機負荷參數軟測量方法。目標函數為：

(2)

式中：上標s、t表示為源域和目標域；L為Laplacian矩陣；Mc為擴展非參數最大均值差異矩陣。流形正則化域適應方法首先采用集成流形約束、最大方差及擴展非參數最大均值差異方法得到特征變換矩陣；然后將目標域和源域數據通過投影變換矩陣投影到公共子空間；最后應用統計方法建立預測模型。

1.3 模糊推理模型

球磨機是包含多種不確定性擾動的多變量對象。其運行過程中，由于環境的復雜性，即使在同一負荷參數的情況下振動信號也會存在很強的不確定性，并且隨著鋼球和襯板的磨損，振動信號存在時變性。為此，可以采用非線性的模糊推理方法建立回歸預測模型，從而利用IF-THEN模糊規則把不確定非線性系統的狀態空間分成不同的區域，構建容忍參數不確定性的模糊推理模型[12]。

設模糊規則把不確定非線性系統的狀態空間劃分為K個區域，第i∈[1,K]個規則為Ri，則模糊推理如下：

Ri:IfxisAi(x,ci), theny=L(x,pi) .

(3)

式中：Ai為模糊系統的模糊集；pi為模糊參數；ci為隸屬中心。

2 基于半監督域適應模糊推理

工況改變時，待測數據與歷史數據分布失配，導致原模型失準。若根據少量有標簽的待測樣本建模，則難以滿足傳統機器學習方法需要足夠多樣本才能建立模型的前提條件。若根據歷史數據建立軟測量回歸模型，則會違背機器學習及統計方法建立在同分布條件的前提。

針對振動信號的不確定性及工況改變后數據分布的差異造成模型失配的問題，本文根據工況變化前后數據分布特征，建立基于半監督域適應模糊推理模型，從而得到待測工況負荷參數預測值。

2.1 半監督域適應

文獻[11]屬于無監督特征映射方法，無法將標簽信息融入特征映射的過程來提高公共子空間數據的可辨識屬性。為此，將公式(1)引入公式(2)得到得到半監督域適應方法。該方法目標函數為：

(4)

為求得特征變換矩陣V，將公式(4)最大化問題轉化為：

(5)

引入拉格朗日乘子：

(6)

式(6)對V求導得：

(7)

半監督域適應方法具體過程：首先，根據公式(7)求得特征變換矩陣V；其次，分別將源域、目標域數據投影公共子空間。

2.2 模糊推理建模

建立前件辨識模型。設樣本個數為n，利用模糊C均值聚類方法將輸入數據X=[x1,x2,…,xn]分成若干類。模糊C均值聚類的目標函數為：

(8)

式中，m為模糊指數。聚類中心ci及其隸屬度μ可以利用拉格朗日條件極值得到：

(9)

(10)

建立后件辨識模型。對于輸入數據，輸出可以表示為：

(11)

因此，給定輸入數據X=[x1,x2,…,xn]，模糊推理的輸出數據為：

(12)

系數矩陣p可以通過最小化目標函數(13)求得：

J2=(Fp-Y)T(Fp-Y) .

(13)

式中，Y為真實輸出標簽。目標函數為關于p的二次函數，則輸出的系數矩陣最優解為：

p=(FTF)-1FTY.

(14)

基于半監督域適應模糊推理方法如圖1所示。首先利用半監督域適應方法將源域和目標域的高維數據映射到公共子空間，降低因數據分布差異造成的模型失配的影響；然后利用特征映射后源域數據進行模糊C均值聚類；最后根據聚類結果建立相應的模糊推理預測模型，并將特征映射后的目標域數據帶入模型，得到負荷參數預測值。

圖1 半監督域適應模糊推理方法 Fig.1 Semi-supervised domain adaptive fuzzy inference

3 實驗結果與分析

為了驗證本文所提出的半監督域適應模糊推理方法的有效性，進行了兩組仿真實驗：第一組仿真實驗證明工況改變時，傳統的軟測量方法不能取得可靠結果；第二組實驗引入遷移學習策略，分別將本文所提算法與流形正則化域適應、半監督-偏最小二乘進行對比，LX驗證算法的有效性。本文所選用的評價指標為均方根誤差(RMSE).

3.1 數據采集與預處理

通過改變介質充填率(ball charge volume ratio，BCVR)的方式模擬工況突變。數據采集裝置為D602 mm×715 mm小型實驗室球磨機。利用多通道數據采集裝置，獲取5組固定BCVR的小型實驗室球磨機振動信號。為保證負荷參數的高分辨率，每組都做了充分的實驗，并對實驗進行振動信號現場同步采集。每組實驗通過添加物料量改變料球比、濃度、充填率。濕式球磨機實驗實施方案如表1所示。

表1 工況突變實驗情況Table 1 Experimental condition of sudden change

將每組源域數據和目標域數據的振動信號平均分為20個樣本，每個樣本覆蓋長度大于濕式球磨機旋轉一周所用時間，然后將難以建模的時域信號通過快速傅里葉變換轉換為頻域信號。

以介質充填率變化的5種工況為例，每個工況下隨機選取500個振動信號的樣本，通過鄰域保持嵌入(neighborhood preserving embedding，NPE)方法將高維頻譜特征降維至三維空間進行可視化。圖2給出了5種工況下三維空間的數據分布情況。

圖2 不同工況數據降維后的分布情況 Fig.2 Distribution of different working conditions data after dimensionality reduction

從圖2中可以看出不同工況下，數據分布存在差異性。

3.2 實驗設置

實驗一：傳統軟測量方法通常分為兩步，即特征提取與回歸模型建立。常見的特征提取有主成分分析(principal component analysis，PCA)、深度信念網絡(deep belief network，DBN)等。常見的建模方法有偏最小二乘回歸(partial least squares，PLS)、核模糊回歸以及極限學習機(extreme learning machine，ELM)等算法。

本文采用傳統方法PCA提取特征，其原因為PCA是一種多變量的統計學方法且對過程噪音和數據缺失具有一定的魯棒性。回歸模型采用模糊推理方法，其規則數為5。不同工況負荷參數預測的RMSE如表2所示。表中“1→2”表示工況1為訓練數據，工況2的數據為測試數據，其他記號同理。

表2 模糊推理方法負荷參數預測結果Table 2 Fuzzy inference method for load parameters prediction

根據表2可知，工況發生改變后，模型負荷參數預測的精度就會逐漸降低，泛化性能差。其原因為工況改變后，不同工況數據分布的差異造成模型的失配。

實驗二：當工況發生改變后，傳統軟測量方法不再適應，為此引入遷移學習策略中的特征映射方法。對比實驗中，流形正則化域適應采用文獻[11]中的方案。半監督-偏最小二乘表示采用半監督域適應將源域和目標域數據映射到公共子空間，利用偏最小二乘法建立回歸模型。半監督域適應模糊推理建模方法如2節所述，其規則數為5.表中“1→2”表示工況1遷移到工況2，即工況1為源域數據，工況2的數據為目標域數據，其他記號同理。不同遷移學習方法的RMSE如表3所示。

表3 不同遷移學習方法預測結果Table 3 Prediction results of different transfer learning methods

對比表2與表3可知，通過采用遷移學習策略，負荷參數預測精度明顯提高。相對于傳統方法，遷移學習方法在建模的過程中，挖掘更多與球磨機負荷參數相關的特定領域信息，使預測結果與真實值更加接近，誤差減小，模型的泛化性能及預測精度有所提高。根據表3中的結果，可以看出：

1) 將希爾伯特-施密特獨立標準引入特征映射過程中對于模型預測精度的提高有一定的作用。

2) 對比半監督-偏最小二乘建模結果與半監督域適應模糊推理方法，后者預測精度相對較高。其原因為模糊推理是一種能容忍參數不確定性的非線性建模方法。

圖3 負荷參數預測結果 Fig.3 Prediction results of load parameters

為直觀了解參數預測情況，以工況1的數據作為源域數據，工況2的數據作為目標域數據，繪制了圖3。圖中模糊推理為實驗一中傳統方法的預測結果。

由圖3可知，半監督域適應模糊推理方法較好地跟蹤了真實值的變化，這充分說明該方法對于預測球磨機負荷參數的有效性。

4 結論

本文研究了一種基于半監督域適應模糊推理的球磨機負荷參數軟測量方法。與其他軟測量方法相比，該方法的優點在于：

1) 當工況發生改變后，可以充分利用歷史工況數據，降低數據采集成本。

2) 可以有效避免傳統建模方法因數據分布差異而造成的模型失配問題。

3) 采用模糊推理建模過程簡單，具有良好的預測性能,易于在實際應用中實現。實驗結果表明，引入半監督域適應模糊推理方法可以實現磨機負荷參數的較高精度預測。這種建模方法及思想對其他領域的參數預測有一定的參考價值。