999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于核極限學習機的快速主動學習方法及其軟測量應用

2020-11-18 01:55:18代學志熊偉麗
化工學報 2020年11期
關鍵詞:方法模型

代學志,熊偉麗

(江南大學輕工過程先進控制教育部重點實驗室,江蘇無錫214122)

引 言

在復雜工業過程中,需要對一些決定產品質量的關鍵變量進行監測和控制,但由于現場環境以及技術條件的制約,使得這些變量難以在線測量。軟測量[1-3]是工業過程中用于解決難測變量檢測的常用技術,通過訓練集構建數學模型,實現對新樣本質量變量的實時估計。常見的軟測量模型包括支持向量回歸(support vector regression,SVR)[4]、人工神經網絡(artificial neural network,ANN)[5]、高斯過程回歸(Gaussian process regression,GPR)[6]和極限學習機(extreme learning machine,ELM)[7-8]等。

軟測量技術通常需要大量標記數據才能完成模型訓練,而在實際工業過程中常常是無標記樣本數量多,有標記樣本數量較少,而且獲取成本高。在這種情況下,如何利用大量無標記數據和少量標記數據來提升模型性能成為軟測量建模的關鍵問題。因此半監督學習[9]和主動學習[10]被提出并得到快速發展,并被廣泛應用于圖像檢測[11]、故障診斷[12]、網絡安全[13]和工業過程建模[14-15]等領域。

主動學習通過引入“人在回路”的環節提升模型性能,具體實施過程是利用樣本選擇策略挑選有價值的無標記樣本進行標記,并將這些標記數據添加到訓練集優化模型參數,當達到預設的終止條件時,迭代學習過程終止,從而實現以最小的標記代價實現模型性能的提升。在這種學習框架下,許多學者圍繞樣本選擇策略[16-22]進行了大量研究。Norkus 等[20]將主動學習與高斯過程回歸結合,通過減小方差有效解決了主動學習中的樣本選擇問題。Demir 等[21]提出一種支持向量回歸的多準則主動學習方法,利用支持向量回歸和核k 均值聚類進行信息評估,有效擴充了建??臻g。Tang 等[22]通過分析核主成分分析和高斯過程回歸的關系,引入不確定度和代表性指標對無標記樣本進行信息評估。然而上述三種評估算法的訓練時間較長,運行效率較低。

相比于支持向量回歸等建模方法,ELM 的運算成本低,泛化能力強。Huang 等[23]將核函數引入ELM,提出核極限學習機(kernel extreme learning machine,KELM)算法,進一步提升了ELM的魯棒性,并被廣泛應用于軟測量建模過程。楊錫運等[24]提出了一種基于粒子群優化的KELM 模型,并在風電功率區間預測中取得較好的效果。張雷等[25]將KELM與Gath-Geva 聚類算法相結合,有效解決了多階段間歇過程的軟測量建模問題。在主動學習方面,Qian 等[26]將KELM 引入主動學習,并根據softmax 模型構建無標記樣本的評價機制,有效提升了信息評估的精度。然而上述方法在每次迭代過程中需要重新評估無標記樣本信息,降低了迭代過程的運行效率,導致運算成本的增加。

綜上所述,本文提出一種基于核極限學習機的快速主動學習方法,利用KELM 的預測輸出與目標輸出的誤差進行無標記樣本置信度的定義,同時考慮算法迭代過程的快速性,引入矩陣反演公式對樣本選擇策略進行優化,提升了迭代過程樣本評估的運算效率;應用矩陣相似度理論對迭代過程的標記數據進行分析,并根據相似度指標度量已標記樣本信息設計算法的終止條件。將所提方法應用于硫回收過程的SO2和H2S濃度的軟測量,驗證了所提方法的有效性和優越性。

1 核極限學習機

極限學習機是一種單隱層前饋神經網絡模型[23],可以通過KKT 理論計算網絡輸出權值。給定n 個訓練樣本{X ∈Rn×m,t ∈Rn},m 為輸入變量維數,ELM 的優化目標是最小化訓練誤差和輸出權重的范數,ELM的優化函數可以表示為:

其中,β 是隱含層到輸出層的輸出權重向量,h(xi)為xi的隱層映射。

ELM的優化函數可以等價為:

式中,ξi為訓練誤差,C 為懲罰系數,用來權衡模型的訓練誤差和輸出權重。根據KKT 最優化條件解得:

其中,H 為隱層映射矩陣,T =[t1,…,tn]T為目標值矩陣,I為單位矩陣。

應用Mercer’s條件定義KELM的核矩陣為:

其中,K(xi,xj)為核矩陣Ω 的第i 行、第j 列的元素。

通常選擇徑向基核函數作為KELM 模型的核函數:

其中,δ為核函數參數。

則KELM的預測輸出表達式為:

2 基于KELM的快速主動學習方法

所提的主動學習方法主要從樣本選擇、迭代更新和終止條件三個方面進行了改進。首先,為了更加準確地評估無標記樣本,利用KELM 算法計算無標記樣本的置信度,并以此作為樣本選擇依據。其次,充分考慮上一輪迭代信息,引入矩陣反演公式對評估算法進行優化,以加快主動學習的迭代更新過程。最后,為了使主動學習迭代過程及時終止,利用矩陣相似度理論對迭代過程的已標記樣本數據進行信息度量,并將其作為終止依據,從而實現了以最小的標記代價獲得模型性能的提升。

2.1 基于KELM的樣本選擇

主動學習主要是利用無標記樣本信息改善模型性能,其核心思想是選取置信度較低的樣本進行標記。所提主動學習方法是根據KELM 的預測輸出與目標輸出之間的誤差來構建無標記樣本的置信度指標,若樣本的置信度較高,表明該樣本對于已標記樣本集是信息冗余的;反之則表明該樣本包含了額外信息,若對該樣本進行標記,則能有效擴充模型信息,提升KELM模型的預測性能。

其中,HL為標記樣本的隱層核映射矩陣。將式(7)進行標準化,可以得到:

其 中,eN=[1,…,1]T∈Rnl。 根 據 誤 差 指 標dN-KELM定義無標記樣本的置信度:

其中,η ∈(0,1),當η 趨近于1 時,說明該樣本數據與現有的已標記樣本集在本質上是相同的;反之,若η 趨于0 時,則說明對應的樣本數據極有可能漂移出KELM 模型空間,標記該樣本后能夠為KELM模型提供更多額外信息。

2.2 快速迭代更新

主動學習過程中,每次標記新樣本后都必須重新計算評估模型參數,隨著迭代的進行,評估算法的運行效率將越來越低。為了進一步降低KELM 評估算法的運算成本,本文將樣本評估過程分為初始化階段和快速迭代學習階段,根據給定訓練集構建初始KELM 評估算法,同時保存本次評估過程的運算信息,在迭代學習階段,充分利用已有的運算信息,減少不必要的迭代計算過程,同時引入矩陣反演公式對評估算法進行優化,以此提升評估算法的運行效率。

在無標記樣本集中刪除所選的樣本:

Pk可以表示為:

2.3 終止條件設計

主動學習的終止條件通常是標記代價達到一定指標,該指標根據實際情況預先設定,但無法表征標記樣本集的信息量。本文為了使主動學習及時終止,進一步提升學習效率,引入矩陣相似度理論[28]對標記樣本集建立信息評價機制,通過對迭代過程的標記數據進行分析,得到樣本數據間的相似度,并根據相似度指標度量標記樣本的信息量變化,其基本原理如下。

對Rmix進行特征值分解,得到一個正交矩陣P0:

則Yi的協方差矩陣Si為:

由式(22)可得:

根據式(23)可以得到:

根據式(26)可知,相似度指標D 的取值范圍為(0,1),D 較小時,已標記樣本集信息量較少,隨著迭代過程的進行,已標記樣本集的信息量逐漸增加,相似度D 逐漸趨近于1,當D 連續兩次大于設定的終止閾值時,則認為已標記樣本集的信息量已經達到要求,迭代過程終止。

2.4 基于KELM的快速主動學習算法流程

以上從樣本選擇策略、迭代更新過程和終止條件設計等方面描述了所提快速主動學習方法,建模流程如圖1所示,具體建模步驟如下:

(1)將原始訓練集分為有標記訓練集和無標記訓練集;

(2)在初始化階段,利用KELM 算法進行樣本選擇,選取部分樣本數據進行標記,建立KELM 模型,并保存初始過程的運算信息;

(3)在迭代學習階段,利用迭代信息和矩陣反演公式優化KELM 評估算法,選擇樣本數據進行標記,建立KELM 模型,并保存迭代過程的運行信息;

(4)迭代終止檢驗,若標記樣本集的相似度指標符合終止條件,輸出KELM 軟測量模型,主動學習終止,否則返回步驟(3)進入新一輪的迭代。

3 仿真實驗

3.1 數值仿真實驗

為了驗證所提方法的有效性,以二維空間為例,生成60 個服從高斯分布的樣本數據,高斯分布的均值向量分別為[0,0]T,[8,0]T,[0,0]T和[8,8]T,協方差矩陣為單位陣,利用KELM 對無標記樣本進行信息評估,有標記樣本與無標記樣本的置信度關系如圖2(a)所示,其中紅色實心點為已標記樣本,綠色實心點為無標記樣本,色標值表示KELM 進行樣本評估后所得到的置信度。從圖2(a)可以看出,已標記樣本的附近區域置信度較高,經過KELM 樣本選擇和人工標記后,有標記樣本和無標記樣本的置信度關系如圖2(b)所示,可以看出,新標記的樣本能夠為KELM 模型空間提供更多信息,有效擴充了模型空間,說明了本文采用KELM 的置信度指標作為樣本選擇評價準則的合理性。

3.2 硫回收仿真實驗

為了進一步驗證本文方法的性能,選用硫回收過程作為仿真對象,其簡化的工藝流程如圖3所示。硫回收裝置(sulfur revoery unit, SRU)主要對含硫氣體進行硫的回收,以防止對大氣造成污染。SRU 過程的輸入為兩種酸性氣體,一種是含有硫化氫的氣體,稱為MEA,另一種是含有硫化氫和二氧化硫的氣體,稱為SWS。MEA 和SWS 首先被送入B106、B103中進行焚燒從而除去殘留的氨氣,然后依次送入冷凝器和催化轉化器中,催化轉化器通過H2S 和SO2的反應生成硫和水,從而達到清除硫化物的目的。詳細的SRU 描述可以參考文獻[29]。硫回收過程含有2 個主導變量,分別為H2S 和SO2濃度,SRU的過程變量描述如表1所示。

SRU 共收集2000 組數據,從中選擇1000 組數據作為訓練集,1000 組數據作為測試集,訓練集中初始標記樣本有10 個,未標記樣本有990 個,標簽率為1%,迭代過程中采用KELM 方法訓練模型。實驗環境為64 位Windows7 操作系統,Intel(R) Core(TM)i5-6500 CPU 3.2GHz處理器,8GB內存,編程語言使用python。

圖1 基于KELM的快速主動學習算法流程Fig.1 The flow of quick active learning algorithm based on KELM

圖2 已標記樣本和無標記樣本的置信度關系圖(數值仿真實驗)Fig.2 Confidence relationship between labeled samples and unlabeled samples(Numerical simulation experiment)

圖3 SRU的簡化工藝流程Fig.3 Simplified process flow of SRU

表1 SRU的過程變量描述Table 1 Process variable description of SRU

首先對所提方法的樣本選擇策略進行實驗分析,有標記樣本和無標記樣本如圖4(a)所示,橫坐標為SRU 的u2變量,縱坐標為SRU 的u3變量,紅色實心點為10 個已標記樣本,藍色實心點為無標記樣本,且樣本顏色隨置信度的變化而變化,采用KELM算法對無標記樣本進行信息評估,有標記樣本與無標記樣本的置信度關系如圖4(b)所示,可以看出,新標記的樣本與原始標記樣本差異較大,能夠為KELM 提供更多額外信息,有效擴充了KELM 建模空間,進一步驗證了所提方法的合理性。

其次對迭代更新過程的學習步長(每次迭代標記樣本個數)進行實驗分析,圖5 為所提方法學習步長對模型性能的影響??梢钥闯?,隨著學習步長num 的增加,更多的標記樣本添加到訓練集中優化KELM 模型,模型性能提升得越快,然而人工標記成本也隨之增多。進一步在相同標記樣本數量的情況下,重新進行仿真實驗,從圖6 可以看出,在迭代初期越小的學習步長對模型性能提升得越快,相應地迭代次數和運算成本也隨之增多。

圖4 已標記樣本和無標記樣本的置信度關系圖(硫回收仿真實驗)Fig.4 Confidence relationship between labeled samples and unlabeled samples(sulfur recovery simulation experiment)

圖7 為無標記樣本分別在第20 次、第40 次、第60 次和第80 次迭代后無標記樣本置信度的變化情況,其中虛線為無標記樣本置信度的平均值。可以看出,隨著主動學習迭代過程的進行,無標記樣本的置信度越來越大,并逐漸趨近于1。主要是因為軟測量模型在迭代更新后,更多的標記樣本參與到KELM 模型優化中,使得對無標記樣本的信息評估更加精確。并且隨著迭代過程的運行,無標記樣本信息逐漸減少,KELM 模型性能不再有顯著提升。

圖5 在不同學習步長下模型性能隨迭代次數的變化Fig.5 Change of model performance with the number of iterations under different learning steps

圖6 在不同學習步長下模型性能隨標記樣本個數的變化Fig.6 Change of model performance with number of labeled samples under different learning steps

圖7 無標記樣本的置信度隨迭代次數的變化Fig.7 Change of confidence of unlabeled samples with the number of iterations

圖8 不同終止閾值對模型性能的影響Fig.8 Effect of different termination thresholds on model performance

圖8為終止條件中不同終止閾值對模型性能的影響,可以看出,隨著終止閾值逐漸增大,模型性能逐漸提升。這是因為越大的閾值對終止條件要求越高,從而需要標記更多無標記樣本來提升模型性能,同時人工標記成本和運算成本也隨之增加,因此應在不影響KELM 模型性能的條件下設置盡可能高的終止閾值,本實驗在預測H2S和SO2的濃度時將終止閾值設為0.999。

最后為了進一步驗證所提方法的有效性,縱向比較了四種主動學習方法,對比方法包括Random、DAL[30]和RSAL[31]。

(1)Random 方法。利用隨機選擇的方式選取無標記樣本進行標記。

(2)DAL 方法。通過計算無標記樣本與有標記樣本之間的歐式距離來度量無標記樣本信息,從而挑選信息量較大的樣本進行標記。

(3) RSAL 方法。利用已標記樣本構建殘差模型,并對無標記樣本進行殘差估計,以此挑選殘差較大的樣本進行標記。

將本文所提方法記為Proposed,迭代過程中的學習步長設置為10,分別進行5次仿真實驗,四種主動學習方法的平均均方根誤差(RMSE)隨迭代次數的變化情況如圖9 所示,四種主動學習方法在迭代過程中的性能指標如表2和表3所示。

圖9 平均RMSE隨迭代次數的變化Fig.9 The change of mean RMSE with the number of iterations

從圖9可以看出,隨著標記數據的增加,四種主動學習的軟測量模型性能均有所提升。其中,RSAL、DAL和本文方法均比Random方法的效果好,相比于RSAL 和DAL 方法,本文方法的收斂速度更快,這表明在相同的標記代價下,本文方法能夠對軟測量模型性能提升得更高,第30 次迭代后,軟測量模型性能基本保持不變,為了達到相同的效果,隨機選擇需要標記接近3倍的無標記樣本。

從表2和表3可以看出,RSAL、DAL和本文方法的RMSE的標準差均低于Random 方法,主動學習方法比Random 更加穩定,相比于RSAL 和DAL 方法,本文方法在大多情況下標準差最小,若以穩定性作為評價指標,所提方法的模型性能最好。最后,對主動學習迭代過程的運行時間進行分析,可以看出,與RSAL和DAL方法相比,所提方法的迭代更新時間最短,降低了迭代過程的運行成本,比較全面地提升了主動學習的性能。

表2 四種主動學習方法在迭代過程中對H2S濃度預測的性能指標Table 2 Performance index of four active learning methods for H2S concentration prediction in iterative process

表3 四種主動學習方法在迭代過程中對SO2濃度預測的性能指標Table 3 Performance index of four active learning methods for SO2 concentration prediction in iterative process

4 結 論

針對工業過程中有標記樣本少無標記樣本多的情況,提出了一種基于核極限學習機的快速主動學習方法,該方法利用KELM 對無標記樣本進行信息評估,根據每次迭代的運算信息優化樣本選擇策略,并引入矩陣相似度理論完成終止條件的設計。通過對硫回收過程H2S 和SO2濃度的測試,結果表明,所提方法不僅具有較強的樣本選擇能力,而且迭代更新速度較快,穩定性較高,應用于復雜化工過程建模,能夠大大降低主動學習的運算成本,并減少人工標記代價,更加有效地實現過程質量變量的軟測量。

猜你喜歡
方法模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
學習方法
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 久久久久亚洲AV成人人电影软件| 国产区91| www.狠狠| 亚洲天堂免费在线视频| 欧美三級片黃色三級片黃色1| 亚洲一级无毛片无码在线免费视频| 99成人在线观看| 欧美成人免费午夜全| 精品偷拍一区二区| 一本色道久久88| 亚洲IV视频免费在线光看| 日韩av在线直播| 久久人人爽人人爽人人片aV东京热 | 在线观看亚洲国产| 久久成人国产精品免费软件| 91麻豆精品国产高清在线| 欧美日韩在线亚洲国产人| 毛片免费观看视频| 国产精品成| 青草视频久久| 成人国产精品一级毛片天堂| 超碰精品无码一区二区| 国产一区二区丝袜高跟鞋| 日韩免费中文字幕| 无码国产伊人| 一区二区理伦视频| 免费高清a毛片| 2048国产精品原创综合在线| 国产亚洲精久久久久久久91| 色成人亚洲| 在线亚洲小视频| 国产精品成人一区二区| jijzzizz老师出水喷水喷出| 91蝌蚪视频在线观看| 亚洲欧美一区二区三区蜜芽| 欧美成人在线免费| 久久一本日韩精品中文字幕屁孩| 久久婷婷六月| 欧美成在线视频| 亚洲无码视频图片| 国产欧美日韩18| aⅴ免费在线观看| 无码精品国产VA在线观看DVD| 欧美一区二区福利视频| 蜜桃视频一区二区| 国产无码在线调教| 国产精品网曝门免费视频| 国产精品lululu在线观看| 国产AV无码专区亚洲精品网站| 午夜影院a级片| 精品国产免费观看| 国产日韩欧美视频| 国内精品久久久久鸭| 99在线视频免费| 欧美日韩高清| 少妇精品网站| 高清免费毛片| 日本欧美中文字幕精品亚洲| 亚洲日韩精品伊甸| 亚洲视频影院| 91极品美女高潮叫床在线观看| 亚洲国产中文精品va在线播放 | 国内精品久久人妻无码大片高| 日本91在线| 国产swag在线观看| 亚洲成年网站在线观看| 久久综合亚洲色一区二区三区| 尤物视频一区| 日韩午夜伦| 性欧美在线| www.youjizz.com久久| 亚洲日韩高清无码| 国产精品页| 欧美激情伊人| 天堂岛国av无码免费无禁网站| 欧美色视频日本| 国产第八页| 四虎AV麻豆| 思思热精品在线8| 国产精品va| 国产91蝌蚪窝| 五月天综合网亚洲综合天堂网|