999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于寬度混合森林回歸的城市固廢焚燒過程二噁英排放軟測量

2023-03-06 13:31:36崔璨麟喬俊飛
自動化學報 2023年2期
關鍵詞:特征模型

夏 恒 湯 健 崔璨麟 喬俊飛

本文縮寫詞的詳細解釋見表1.

表1 符號說明Table 1 Symbol description

城市固廢焚燒是目前世界范圍內解決 “垃圾圍城”困境的主要方式之一,具有無害化、減量化和資源化等顯著優勢[1-2].目前中國MSWI 的處理能力占比已超過50%,污染排放監管力度也逐漸加強[3].二噁英作為MSWI 過程排放的有組織廢氣中具有持久性和劇毒性的有機污染物[4],是造成焚燒建廠存在 “鄰避現象”的主要原因[5],也是MSWI 過程必須最小化控制的重要環保指標之一[6-7].基于高分辨氣相色譜/高分辨質譜的離線化驗分析方法是目前DXN 排放濃度檢測的主要手段[8],存在技術難度大、時間滯后性大、人力與經濟成本高等缺點,已成為阻礙MSWI 過程實現實時優化控制的關鍵因素之一.因此,DXN 排放濃度的在線檢測是MSWI 過程的首要挑戰問題[3].

針對上述問題,利用可在線檢測的DXN 關聯物構建映射模型進而獲得DXN 濃度的在線間接檢測方法成為熱點[9-10];然而,其存在設備復雜、成本高、干擾因素多、預測精度無法保證等問題[11],同時其在本質上也是一種結合數據建模的檢測手段.相較于離線分析和在線間接檢測方法而言,基于工業集散控制系統采集的易檢測過程數據驅動的軟測量技術是解決DXN 無法在線檢測問題的有效途徑,具有穩定、精準和快速響應等特點[3].軟測量技術已在石油、化工和煉鋼等復雜工業過程的難測參數檢測中廣泛應用[12-15].

目前,面向DXN 排放濃度的軟測量研究可分為基于單學習器和基于集成多學習器兩個方向.針對前者: Chang 等[16]采用遺傳規劃結合神經網絡對歐美等多個國家焚燒廠的Polychlorinated dibenzop-dioxins/Polychlorinated dibenzofurans 排放進行建模,其數據涉及多種不同類型的焚燒爐,導致模型不具有良好的應用性;Bunsan 等[17]通過多次重復實驗確定反向傳播神經網絡結構后構建軟測量模型,但其不具有良好的移植性且BPNN 面對小樣本時存在過擬合、穩定性差等問題;針對上述基于NN的軟測量方法存的問題,肖曉東等[18]利用支持向量回歸[19]構建基于國內MSWI 過程實際數據的軟測量模型,但存在核函數、懲罰系數等超參數難以確定的問題;進一步,喬俊飛等[20]針對北京某MSWI 電廠的高維過程數據,設計了基于多層特征選擇策略的軟測量模型,但約簡特征模型的泛化性能有待提高.

從機理視角,DXN 排放濃度與MSWI 過程的多個工藝階段的眾多過程變量均具有相關性,并且在不同工況下也存在差異性;此外,獲取DXN 濃度檢測真值存在難度大、成本高的缺點,使得建模數據的小樣本、高維度特性成為DXN 軟測量面臨的主要問題.上述因素導致基于單學習器的軟測量模型難以獲得較佳檢測精度.因此,基于集成多學習器的軟測量模型成為當前的研究熱點,其包括: 湯健等[21]基于選擇性集成思想設計了一種自適應確定SVR 超參數的軟測量方法,采用文獻[22]的數據進行驗證,但測量精度有待提高;在此基礎上,湯健等[23]采用變量投影重要性評價和設定特征約簡比率的策略對北京某MSWI 過程的DXN 建模數據進行維數約簡后,構建能夠自適應確定核參數的SEN 軟測量模型,進一步提高了檢測精度;針對上述方法存在的放棄部分特征可能導致的信息丟失問題,Xia 等[24]通過隨機森林和梯度提升樹的混合集成策略進行DXN 軟測量模型構建,但模型結構過于復雜且運行時間較長,不適用于實際應用;進一步,借鑒NN 模式和非NN 模式深度學習在提取深層次表征特征方面的突出性能[25-26],Tang 等[27-28]提出了面向小樣本高維數據的深度森林回歸算法并用于構建DXN 軟測量模型,但檢測精度仍有待進一步提高;在此基礎上,Xu 等[29]采用主成分分析對高維過程數據進行特征提取后再基于DFR 構建軟測量模型,雖然提升了模型的泛化性能但約簡后的潛在特征已不具備物理意義.顯然,上述集成學習策略均存在訓練難度大、模型復雜度高以及收斂速度慢等問題.

近年來,寬度學習通過先擴展模型網絡 “寬度”再采用Moore-Penrose 逆矩陣[30]獲取權重的方式構建模型,具有收斂速度快、超參數少和精度高等優勢[31-32].現有的BLS 研究主要基于NN 模式,已在圖像識別[33-35]、故障診斷[36-38]和工業過程控制[39-41]等多個領域廣泛應用.但是,上述研究均是在低特征維數、大樣本數據集的研究背景下進行的應用與探索[39,42].面向高特征維數、小樣本數據集[43]的BLS研究還未見報道.

針對上述問題,以MSWI 過程DXN 排放濃度檢測為目標,提出了基于寬度混合森林回歸的建模算法.主要創新工作為:

1)基于BLS 框架的優勢,提出了具有特征映射層、潛在特征提取層、特征增強層和增量學習層結構的BHFR 建模算法.

2)利用RF 和完全隨機森林組成的混合森林組替代BLS-NN 神經元組,實現對高維特征向量的映射.

3)基于PCA 的潛在特征提取和互信息度量準則,以保證全聯接混合矩陣中潛在有價值信息的最大化傳遞和最小化冗余.

4)通過增量式學習策略構建以混合森林組作為最小單位的增量學習層,采用Moore-Penrose 偽逆獲得權重矩陣.

在高維基準數據集和MSWI 過程DXN 數據集上的實驗結果表明了本文方法的有效性和優越性.

1 面向DXN 排放的MSWI 過程描述

MSWI 過程包含固廢儲運、固廢燃燒、余熱交換、蒸汽發電、煙氣凈化和煙氣排放等工藝階段,以日處理量800 噸的北京某爐排式MSWI 過程為例,其工藝如圖1 所示.

圖1 城市固廢焚燒工藝流程圖Fig.1 Process flow chart of municipal solid waste incineration process

結合DXN 分解、生成、吸附和排放的全流程對各階段的主要功能描述如下:

1)固廢儲運階段.環衛車輛從城市各收集站點將城市固廢運輸至MSWI 電廠,經稱重記錄后從卸料平臺傾倒至固廢儲存池中未發酵區,然后由固廢抓斗對其進行混合攪拌,再抓取至發酵區,經3~ 7天發酵和脫水以保證MSW 焚燒的低位熱值[44].研究表明,原生MSW 中存在微量DXN (約0.8 ng TEQ/kg),并含有DXN 生成反應所需的多種含氯化合物[5].

2)固廢燃燒階段.固廢抓斗將發酵后的MSW投放至進料斗,經進料器將MSW 推送到焚燒爐內,依次經過干燥、燃燒1、燃燒2 和燃燼爐排后,MSW 中的可燃成分隨之完全燃燒;所需助燃空氣由一次風機和二次風機從爐排下方和爐膛中部注入,最終燃燒產生的灰渣從燃燼爐排末端落至撈渣機,經水冷后送入爐渣池.研究表明,啟爐和停爐期間因工況波動頻繁導致所產生的DXN 量級遠遠高于正常運行期間[45].為保證原生MSW 中含有的以及焚燒時產生的DXN 在爐內能夠被完全分解,爐膛燃燒過程需滿足: 嚴格控制煙氣溫度在850 ℃以上、高溫煙氣在爐內停留時間超過2 秒、確保足夠大的煙氣湍流度等工藝要求[46].

3)余熱交換階段.爐膛產生的高溫煙氣(高于850 ℃)經引風機抽吸進入余熱鍋爐系統,先后經過過熱器、蒸發器和省煤器設備,與鍋爐汽包液態水進行熱交換后產生高溫蒸汽,進而實現降溫處理,使余熱鍋爐出口的煙氣溫度低于200 ℃ (即煙氣G 1).從DXN 生成機理的角度,高溫煙氣經余熱鍋爐降溫時,導致DXN 生成的化學過程包括高溫氣相合成(800 ℃~ 500 ℃)[47]、前驅物合成(450 ℃~ 200 ℃)[48]和從頭合成(350 ℃~ 250 ℃)[49]等反應,但目前還暫無統一的定論[50].

4)蒸汽發電階段.利用余熱鍋爐產生的高溫蒸汽推動汽輪發電機,機械能轉變為電能,實現廠級用電的自給自足和剩余電量的上網供應,實現資源化和獲取經濟效益.

5)煙氣凈化階段.MSWI 過程的煙氣凈化主要包含脫硝、脫硫、脫重金屬、吸附DXN 和除塵(顆粒物)等一系列過程,進而實現焚燒煙氣污染物排放達標的目的.采用活性炭噴射系統吸附煙氣中的DXN 是目前應用最為廣泛的技術手段[51],其吸附后的DXN 富集于飛灰中.

6)煙氣排放階段.經降溫和凈化處理后的含有微量DXN 的焚燒煙氣(即煙氣G 2)由引風機抽吸后經煙囪排放至大氣中.MSWI 過程的不間斷、長時間的運行特性導致煙囪內壁顆粒物中附著大量DXN (即記憶效應[52]),但在何種工況下存在釋放的可能性還是目前業界未解決的研究難題.

目前,面向MSWI 過程的DXN 軟測量檢測研究主要集中針對排放階段(即煙氣G 3)的DXN 濃度檢測,其對應的過程變量信息如表A1 所示.本文研究重點是構建G 3 煙氣處的軟測量模型.

表A1 DXN 數據集的過程變量信息Table A1 The process variable information for DXN datasets

表A1 DXN 數據集的過程變量信息 (續表)Table A1 The process variable information for DXN datasets (continued table)

表A1 DXN 數據集的過程變量信息 (續表)Table A1 The process variable information for DXN datasets (continued table)

表A1 DXN 數據集的過程變量信息 (續表)Table A1 The process variable information for DXN datasets (continued table)

2 基于寬度混合森林回歸的建模策略

本文BHFR 建模策略包含特征映射層、潛在特征提取層、特征增強層和增量學習層4 個主要部分,如圖2 所示.

圖2 寬度混合森林回歸建模策略圖Fig.2 Modeling strategy of broad hybrid forest regression

各部分的主要功能如下:

2)潛在特征提取層.利用PCA 對由X與特征映射層輸出ZN組成的全聯接混合矩陣[X|ZN] 進行潛在特征提取,去除特征空間的冗余信息,進一步通過所提取的潛在特征與真值y的互信息確定潛在特征維數并得到新的輸入數據

3)特征增強層.以X′作為輸入,通過特征增強層的K個混合森林組進行特征映射,得到增強層輸出矩陣HK;

4)增量學習層.以X′作為輸入,以混合森林組為最小單位逐步增加并更新權重WK+P,直到訓練誤差收斂.

2.1 特征映射層

從本質上講,BHFR 是以RF 和CRF 為基元構成的混合森林組作為基礎映射單元取代原始BLS中的神經元.

以特征映射層的第n個混合森林組為例描述特征映射層的建模過程.對{X,y}進行Bootstrap和RSM 采樣,獲得混合森林組模型的J個訓練子集,表示如下:

式中,L表示決策樹葉節點數量,I(·) 表示指示函數,當預測樣本屬于當前葉節點的樣本集時Rl),即將cl作為該樣本的?預測值.cl采用遞歸分裂方式計算,其物理意義是: 第l個葉節點的預測值,由第l個葉節點中所有樣本的加權均值所得.

進一步,RF 和CRF 的建模過程如圖3 所示.

圖3 RF 和CRF 的建模過程Fig.3 Modeling process of RF and CRF

RF 的基本思想為通過Bootstrap 和RSM 構建多個以平方誤差為損失函數分裂生長的決策樹模型后并行集成,建模步驟如RF 建模過程所示.RF中決策樹的分裂損失函數 Ωi(·) 可表示為:

CRF 的基本思想為通過Bootstrap 和RSM 構建多個完全隨機分裂生長的決策樹模型后并行集成,建模步驟見CRF 建模過程所示.CRF 中決策樹的分裂采用完全隨機選擇方式,可表示為:

被隨機分裂的左右樹節點輸出值為樣本真值的期望,如下:

通過上述過程,第n個混合森林組可表示為:

進而,第n個映射特征可表示為:

最終,特征映射層的輸出ZN表示為:

式中,ZN包含NRaw個樣本和 2N維特征.

算法1.RF 建模步驟

2.2 潛在特征提取層

為了避免信息傳遞過程中的信息丟失導致的過擬合現象,本文BHFR 采用全聯接策略實現特征映射層與特征增強層、增量學習層之間的信息傳遞.同時,為了保證模型訓練過程中信息冗余的最小化,此處采用PCA 提取全聯接混合矩陣的潛在特征,再利用互信息進一步篩選與真值信息最大化相關的潛在特征,進而實現對高維數據的降維處理.

首先,原始輸入數據X與特征映射矩陣ZN組合得到全聯接混合矩陣A,可表示為:

式中,A含NRaw個樣本和 (M+2N) 維特征.

接著,考慮到A的維數遠高于原始數據,此處利用PCA 最小化A中的冗余信息,計算A的相關矩陣R,如下:

進一步,對R進行奇異值分解,得到(M+2N)個特征值和相應特征向量,如下:

式中,U(M+2N)表示 (M+2N) 階正交矩陣,Σ(M+2N)表示 (M+2N) 階對角矩陣,V(M+2N)表示(M+2N)階正交矩陣.

式中,σ1>σ2>···>σ(M+2N)表示由大到小排列的特征值.

然后,根據設定潛在特征貢獻閾值η,確定最終的潛在特征數量QPCA,如下:

式中,QPCA?(M+2N).

基于上述確定的QPCA個潛在特征,獲得特征值集合對應的特征向量矩陣VQPCA,即A的投影矩陣.然后,對A進行特征投影以實現冗余信息的最小化處理,將獲得潛在特征記為XPCA,即:

接著,通過信息最大化選擇機制以保證所選擇潛在特征與真值間的相關性,如下:

2.3 特征增強層

首先對新數據集{X′,y}進行采樣,獲取混合森林算法的訓練子集,如下:

接著,以第k個混合森林組中第j個RF 的構建為例,如下:

進而,可得到特征增強層中第k個混合森林組中的RF 模型為:

然后,類似地以第k個混合森林組中的第j個CRF 的構建為例,如下:

進而,可得到特征增強層中第k個混合森林組的CRF 模型,其表示為:

通過上述過程,得到第k個混合森林組第k個增強特征表示如下:

最后,特征增強層的輸出HK表示如下:

當不考慮增量學習策略時,BHFR 模型的表示如下:

式中,GK表示特征映射層與特征增強層輸出的組合,即其包含NRaw個樣本和(2N+2K) 維特征;WK表示特征映射層和特征增強層與輸出層間的權重,其計算如下:

式中,I表示單位矩陣,λ表示正則項系數.相應地,GK的偽逆計算可表示為:

2.4 增量學習層

針對BLS 模型達不到預期建模精度的問題,文獻[31]提出了增加特征映射節點和增加特征增強層節點兩種策略.本文的BHFR 以混合森林組為基本單元,依據訓練誤差的收斂程度實現增量學習,具體如下.

首先,對新數據集{X′,y}進行基于Bootstrap和RSM 的采樣,獲取混合森林算法訓練子集,過程如下:

接著,構建第p個混合森林組中的決策樹其過程與特征映射層和特征增量層相同,此處不再贅述.

進一步,當增加1 個混合森林組后,特征映射層、特征增量層和增量學習層的輸出可表示如下:

式中,GK=[ZN|HK] 包含NRaw個樣本和(2N+2K)維特征,GK+1包含NRaw個樣本和(2N+2K+2J)維特征.

然后,進行GK+1的Moore-Penrose 逆矩陣的遞推更新,如下:

式中,矩陣C和矩陣D的計算如下:

進而,GK+1的Moore-Penrose 逆矩陣的遞推公式如下:

進一步,特征映射層、特征增量層和增量學習層與輸出層間權重的更新矩陣為:

式中,WK=(λI+[GK]TGK)-1[GK]TY.

由于采用上述偽逆更新策略只需要計算增量學習層混合森林組的偽逆矩陣,因此能夠實現快速的增量式學習.

進一步,根據訓練誤差的收斂程度實現自適應增量學習.此外,定義誤差的收斂閾值θCon用以確定增量學習中混合森林組的數量p.相應地,BHFR模型的增量學習訓練誤差表示如下:

式中,?表示增量學習第p+1 個與第p個混合森林組訓練差值WK+p+1-y)2)1/2表示包含p個和p+1 個混合森林組的BHFR 模型訓練誤差.

最終,本文BHFR 模型的預測輸出為:

2.5 算法偽代碼

BHFR 方法的偽代碼如下:

算法3.算法偽代碼

由上述偽代碼可知,特征映射層、特征增強層和增量學習層是在相同方向進行擴展,算法程序在實現上按照與建模策略相對應的描述進行編寫,進而在軟測量的工業應用中只需要通過更新增量學習層即可實現模型的在線更新.

3 實驗研究與應用

3.1 實驗數據和評價指標描述

本文先采用高維基準數據集驗證,再采用北京某MSWI 電廠的實際DXN 數據進行工業驗證,詳細信息如表2 所示.

表2 實驗數據統計結果Table 2 Statistical results of experimental datasets

表2 中,CT 切片數據集和住宅建筑數據集源自UCI 平臺數據庫[55];橙汁近紅外光譜數據集源于http://www.ucl.ac.be;DXN 數據源自于北京某MSWI 電廠.本文數據在文獻[23]的基礎上進行了樣本擴充和特征刪減,共涵蓋了2009~ 2020 年的DXN 排放濃度建模數據141 組.其中DXN 真值為2 小時采樣化驗后的折算濃度,每組建模數據的過程變量均為同一時刻下的過程數據,采樣頻率為小時,對缺失數據和異常變量進行剔除后的輸入變量為116 維,其相應取值為當前DXN 真值采樣時間段內的均值.

本文選取均方根誤差、平均絕對誤差和決定系數共三個評價指標比較不同方法的性能,計算如下:

3.2 基準驗證

本文BHFR 方法的參數設置為: 決策樹葉節點最小樣本數Nsamples為7、RSM特征選擇數量為決策樹的數量Ntree為10、特征映射層和特征增強層中混合森林組的數量NForest均為10、正則化參數λ為 1-10.

首先,根據特征映射層的輸出ZN和原始輸入數據的全聯接混合矩陣A確定用于特征增強層和增量學習層潛在特征數量.在NIR、CT 和RB 數據集中A的特征維數分別為900、491 和303 維,其前60 個潛在特征的累計貢獻率如圖4 所示.

根據圖4 所示,當潛在特征貢獻率閾值η為0.9 時,NIR、CT 和RB 數據集中選擇的潛在特征數量分別為3、19 和12 個.上述所選潛在特征與真值間的互信息值如圖5 所示.

圖4 基準數據集中潛在特征的貢獻率曲線Fig.4 Contribution rate curves of latent features of benchmark datasets

如圖5 所示,互信息閾值ζ分別為0.70、0.85和0.80 時,NIR、CT 和RB 數據集中被選的潛在特征數量分別為2、11 和1 個.

圖5 基準數據集潛在特征與真值的互信息值Fig.5 Mutual information values of latent features and true values of benchmark datasets

接著,預設增量學習層的混合森林組單元數量為100,BHFR 模型的訓練誤差與混合森林組數量間的關系如圖6 所示.

由圖6 所示的訓練誤差曲線可知,BHFR 在NIR、CT 和RB 數據集上的訓練過程均可收斂至某一確定下限值.

圖6 基準數據集訓練誤差收斂曲線Fig.6 Training error convergence curve of benchmark datasets

采用RF、DFR、DFR-clfc、BLS-NN 與本文方法進行對比,相應模型參數設置為:

1) RF,決策樹葉節點最小樣本數Nsamples為3,RSM 特征選擇數量為,決策樹數量Ntree為500;2) DFR,決策樹葉節點最小樣本數Nsamples為3,RSM 特征選擇數量為,決策樹數量Ntree為500,每層中RF 和CRF 模型的數量NRF和NCRF均為2,總層數設置為50;3) DFR-clfc,決策樹葉節點最小樣本數Nsamples為3,RSM 特征選擇數量為,決策樹數量Ntree為500,每層中R F 和CRF模型的數量NRF和NCRF均為2,總層數設置為50;4) BLS-NN,特征節點數Nm為5,增強節點數Ne為41,神經元數量Nn為9 和正則化參數λ為 2-30.

將上述方法在相同條件下重復20 次實驗,其統計結果和預測曲線如表3~ 表5 和圖7~ 圖9 所示.

由表3~ 表5 和圖7~ 圖9 可知:

表3 NIR 數據集實驗結果Table 3 Experimental results of NIR dataset

表4 CT 數據集實驗結果Table 4 Experimental results of CT dataset

表5 RB 數據集實驗結果Table 5 Experimental results of RB dataset

圖7 NIR 數據集的擬合曲線Fig.7 Fitting curves of NIR dataset

圖8 CT 數據集的擬合曲線Fig.8 Fitting curves of CT dataset

圖9 RB 數據集的擬合曲線Fig.9 Fitting curves of RB dataset

1) NIR 數據集.在訓練集中,RMSE、MAE 和R2指標的均值統計結果均以BLS-NN 最佳(7.4226×10-1、4.6530×1 0-1和9.9476×1 0-1),但方差統計結果弱于RF、DFR 和DFR-clfc,本文BHFR 在各項指標的均值和方差統計結果上的表現與BLSNN 接近;在驗證集中,RF 的RMSE 和R2指標均值效果最佳(1.348×1 01和2.7181×1 0-1),DFRclfc 在3 個指標的方差統計結果最優,本文BHFR的性能整體不如RF、DFR 和DFR-clfc,BLS-NN在各項指標中表現最差;在測試集中,BHFR 在RMSE、MAE 和R2的均值統計結果優于其他方法,但其方差統計結果依舊低于RF、DFR 和DFRclfc;上述結果表明,BHFR 針對高維譜數據的泛化性能最強,但穩定性有待進一步增強.

2) CT 數據集.在訓練集中,BLS-NN 的三個指標的均值和方差均表現最佳,BHFR 僅次于BLSNN,BHFR 的訓練穩定性好于RF 和DFR-clfc;在驗證集中,三個指標的均值統計結果均是本文BHFR 最佳(1.2459×1 00、8.5055×1 0-1和9.8148×10-1),其方差僅弱于DFR;在測試集中,BHFR 的表現與驗證集一樣,均值性能表現最佳,穩定性優于RF 和DFR-clfc,DFR 性能最穩定.上述結果表明: 相較于基于樹的方法,BLS-NN 在訓練時存在明顯的過擬合現象;本文BHFR 的均值性能最佳,但其穩定性有待加強.

3) RB 數據集.訓練集中,BLS-NN 的三個指標的均值和方差結果均為最佳;本文BHFR 的均值統計結果在驗證和測試數據集中均優于其他方法,但BHFR 在模型穩定性方面依然弱于DFR 方法.上述結果表明,BLS-NN 存在過擬合,本文BHFR穩定性有待增強.

綜上可知,上述小樣本高維數據的實驗結果表明了本文BHFR 具有比RF、DFR 及其改進版DFRclfc、BLS-NN 更佳的泛化性能.

3.3 工業驗證

在DXN 數據集中,本文BHFR 的參數設置為:決策樹葉節點最小樣本數Nsamples為7,RSM特征選擇數量為決策樹的數量Ntree為10,特征映射層和特征增強層中混合森林組的數量NForest均為10,潛在特征貢獻率閾值η為0.9,正則化參數λ為 2-10.

類似基準數據集,基于全聯接混合矩陣A確定用于特征增強層和增量學習層的潛在特征數量,其維數為316 維,前80 個潛在特征的累計貢獻率如圖10 所示.

根據圖10 所示,當潛在特征貢獻率閾值η為0.9 時,DXN 數據集中選擇的潛在特征數量為35 個.接著,計算35 個潛在特征與DXN 真值間的互信息值,結果如圖11 所示.

圖10 DXN 數據潛在特征的貢獻率曲線Fig.10 Contribution rate curve of latent feature of DXN dataset

根據圖11 所示,將互信息閾值ζ設置為0.75,DXN 數據集中被選的潛在特征數量為6 個.進一步,預設增量學習層的混合森林組單元數量為1 000,相應地BHFR 模型的訓練誤差與混合森林組數量間的關系如圖12 所示.

圖11 DXN 數據潛在特征與真值的互信息值Fig.11 Mutual information value of latent feature and true value of DXN dataset

由圖12 所示的訓練誤差曲線可知,BHFR 在DXN 數據集上的訓練過程可收斂至某一確定下限值.

圖12 DXN 訓練誤差收斂曲線Fig.12 Convergence curves of DXN training error

然后,采用RF、DFR、DFR-clfc 和BLS-NN與本文BHFR 進行對比.參數設置為: 1) RF,決策樹葉節點最小樣本數Nsamples為3,RSM特征選擇數量為,決策樹的數量Ntree為500;2)DFR,決策樹葉節點最小樣本數Nsamples為3,RSM特征選擇數量為,決策樹的數量Ntree為500,每層中RF 和CRF 模型的數量NRF和NCRF均為2,總層數設置為50;3) DFR-clfc,決策樹葉節點最小樣本數Nsamples為3,RSM 特征選擇數量為,決策樹的數量Ntree為500,每層中RF 和CRF 模型的數量NRF和NCRF均為2,總層數設置為50;4) BLSNN,特征節點數Nm為5,增強節點數Ne為41,神經元數量Nn為9 和正則化參數λ為 2-30.上述方法在相同條件下重復20 次實驗,其統計結果和預測曲線如表6 和圖13 所示.

由表6 和圖13 可知,1) RF 在訓練、驗證和測試中的RMSE、MAE 和R2指標均值統計結果均優于DFR,但在穩定性指標上弱于DFR;2) DFR 和DFR-clfc 在建模精度上與RF 接近,同時建模穩定性要好于RF,其中DFR-clfc 在訓練、驗證和測試集的精度略高于DFR,但DFR 的穩定性更好;3)BLS-NN 對訓練數據出現了明顯的過擬合,其在驗證和測試集中的泛化性能和穩定性上均表現最差,表明BLS-NN 難以適用于本文中的真實工業過程的小樣本高維數據;4) BHFR 在測試集中的RMSE、MAE 和R2指標的均值統計結果均為最佳,穩定性僅弱于DFR,表明BHFR 具有良好的泛化性能和穩定性.

圖13 DXN 數據集中的擬合曲線Fig.13 Fit curves of DXN dataset

表6 DXN 數據集實驗結果Table 6 Experimental results of DXN dataset

綜上可知,DXN 軟測量建模實驗表明本文BHFR具有比經典RF、DFR 及其改進版DFR-clfc 更好的學習能力,同時在測試集上的建模精度和對數據的擬合程度也強于RF、DFR、DFR-clfc 和BLS-NN,體現了其在構建DXN 軟測量模型中的明顯優勢.

3.4 算法時間復雜度分析

在RF、DFR、DFR-clfc 和BHFR 模型中采用的決策樹算法均為二叉樹,該類型決策樹算法的時間復雜度可表示為 OTree(M ×N ×logN) (一個決策樹模型的時間復雜度記為 OTree(#Tree)),其中M表示數據的維度,N表示數據的樣本數量.下面僅考慮模型的主要結構部分,并給出了各模型的算法時間復雜度.

1) RF 的時間復雜度為:

式中,#Tree*=MRSM×N ×logN,Ntree表示RF的決策樹數量(一個森林模型的時間復雜度記為ORF(#Forest)).

2) DFR 的時間復雜度為:

式中,NRF和NCRF表示每層中RF 模型和CRF 模型的數量,Layers表示DFR 模型的深度.

3) DFR-clfc 的時間復雜度為:

式中,#Forest*=#Forest×β,β為森林模型復雜度的系數,該系數由每層逐漸增加的特征數量決定.

4) BLS-NN 的時間復雜度可表示為:

式中,Nm表示特征節點數量,Ne表示增強節點數量,Nn表示每個節點中的神經元數量.

5)本文BHFR 的時間復雜度為:

式中,#Forest*=#Forest×α,α表示森林模型復雜度的系數且α<1 (潛在特征提取層的降維作用使得特征增強層和增量學習層的輸入特征維數顯著減小).

由式(41)~ 式(45)可知,BHFR 的時間復雜度TBHFR要遠小于傳統深度集成方法DFR 和DFRclfc 的TDFR和TDFR-clfc,即相對于深度集成算法BHFR 在時間成本上具有明顯優勢.相較于BLS-NN方法的TBLS-NN,BHFR 的時間復雜度偏高,其主要原因在于混合森林組的時間復雜度 O (#Forest) 要高于單一神經元.因此,進一步的研究是考慮在不損失模型精度的情況下降低BHFR 的時間復雜度.

3.5 超參數敏感性分析

為進一步對本文BHFR 進行性能評估,本節對決策樹葉節點最小樣本數Nsamples、RSM 特征選擇數量MRSM、決策樹的數量Ntree、混合森林組的數量NForest、潛在特征貢獻率閾值η、互信息閾值ζ和正則化參數λ等超參數進行敏感性分析,其設置區間如表7 所示.

表7 BHFR 超參數及其區間設置Table 7 Super parameters and interval setting of BHFR

實驗中采用單因素分析策略,即每次僅將單一參數作為可變項,測試集的R2實驗結果如圖14 所示.

由圖14 可知:

1)決策樹葉節點最小樣本數Nsamples.如圖14(a)所示,其橫坐標表示設置的葉節點最小樣本數Nsamples(每個數據集的橫坐標長度不同,設置區間詳見表5),縱坐標表示模型的性能評價指標R2.隨著Nsamples的逐漸增大,NIR、RB 和DXN 數據集中的R2逐漸變小,表明取相對小的Nsamples時模型的泛化性能更佳,反之則較差;在CT 數據集中,模型性能不受Nsamples變化的影響,即當決策樹僅包含一個根節點時(即Nsamples等于訓練樣本數量),測試集具有非常好的泛化性能.可知,不同數據集對BHFR 模型中Nsamples的敏感程度具有差異性.因此,將Nsamples設置在[3,10]最為合適.

2) RSM 特征選擇數量MRSM.如圖14(b)所示,其橫坐標表示設置的RSM 特征選擇數量MRSM(每個數據集的橫坐標長度不同,設置區間詳見表5),縱坐標表示模型的性能評價指標R2.當MRSM增加時,CT 和RB 數據集中的R2逐漸變大后保持平穩,NIR 和DXN 數據集中的R2曲線卻具有明顯的震蕩趨勢.可知,NIR 和DXN 數據集對MRSM的數量更為敏感,CT 和RB 數據集只需選取較少特征即可建立較高精度的模型,即數據間存在差異性.因此,將MRSM設置為原始特征數量的1/10,可兼顧模型的時間成本和泛化性能.

3)決策樹的數量Ntree.如圖14(c)所示,其橫坐標表示設置的決策樹的數量Ntree(每個數據集的橫坐標長度均為5~ 100),縱坐標表示模型的性能評價指標R2.隨著Ntree的逐步增加,CT、RB 和DXN 數據集中的R2趨勢總體平穩,NIR 數據集中的R2的變化卻較為明顯.可知,針對CT、RB 和DXN數據集,決策樹數量對模型的影響較小,選取較少的決策樹建模即可保證模型性能.因此,將Ntree設置為40,可使模型適用于不同數據集的建模需求.

4)混合森林組的數量NForest.如圖14(d)所示,其橫坐標表示設置的混合森林組的數量NForest(每個數據集的橫坐標長度均為5~ 100),縱坐標表示模型的性能評價指標R2.隨著NForest的增加,各數據集的性能表現與超參數Ntree相一致.可知,NForest的設置不宜過大,其值適當時模型的泛化性能最佳.因此,將NForest設置在[25,35]區間,模型建模精度較高.

5)潛在特征貢獻率閾值η.如圖14(e)所示,其橫坐標表示設置的潛在特征貢獻率閾值η(每個數據集的橫坐標長度不同,設置區間詳見表5),縱坐標表示模型的性能評價指標R2.其決定著從全聯接混合矩陣特征空間A中提取的潛在特征數量,η越大表示潛在特征維數越高.實驗表明,隨著η增大,CT 數據集中的R2表現最穩定,NIR、RB 和DXN數據集中的R2在接近η=1 時,出現局部最小值(即模型性能最差).可知,本文方法對超參數η的敏感程度相對較低.因此,將η設置為0.9,可確保選擇合適數量的潛在特征,進而保證建模精度.

6)互信息閾值ζ.如圖14(f)所示,其橫坐標表示設置的互信息閾值ζ(每個數據集的橫坐標長度不同,設置區間詳見表5),縱坐標表示模型的性能評價指標R2.理論上其決定特征增強層和增量學習層的輸入特征維數,ζ越大表示輸入特征維數越低.實驗中,隨著η增大,CT 數據集的性能不變,RB數據集的R2存在極小值,DXN 數據集的R2先變大后平穩,NIR 數據集的R2逐漸變小后接近穩定.可知,CT 和DXN 數據集,超參數ζ對模型性能的影響較小;但RB 和NIR 數據集,超參數ζ設置較小時模型性能更佳.因此,綜合不同數據集的結果可知,將ζ設置為0.7 較為合適.

圖14 超參數敏感性分析曲線Fig.14 Sensitivity analysis curves of super parameter

7)正則化參數λ.如圖14(g)所示,其橫坐標表示設置的正則化參數λ(每個數據集的橫坐標長度不同,設置區間詳見表5),縱坐標表示模型的性能評價指標R2.隨著λ逐漸變小,NIR、CT、RB 和DXN 數據集的總體表現為先逐漸增大再達到穩定,其中RB 數據集在模型達到平穩后表現出明顯的震蕩現象.可知,正則化參數λ對不同數據集的影響是一致的,其中以RB 數據集最為敏感.因此,將λ設置為 1-10可使模型效果達到最佳.

綜上可知,不同超參數針對不同數據集具有差異性,有必要進行全局優化.

4 結論

針對MSWI 過程關鍵指標參數DXN 排放濃度難以實時準確檢測的問題,本文提出了一種基于BHFR 的軟測量方法,其結合了寬度學習、集成學習和潛在特征提取等算法,主要貢獻: 1)基于寬度學習系統框架,采用非微分學習器構建了包含特征映射層、潛在特征提取層、特征增強層和增量學習層的軟測量模型;2)利用信息全聯接、潛在特征提取和互信息度量對BHFR 模型內部信息進行處理,有效保證了BHFR 模型內部特征信息的傳遞最大化和冗余度最小化;3)采用混合森林組為映射單元實現建模過程的增量學習,通過偽逆策略快速計算輸出層權重矩陣,再利用訓練誤差的收斂程度自適應調整增量學習,實現了高精度的軟測量建模.基于北京某MSWI 電廠的真實數據驗證了DXN 濃度軟測量模型的有效性.

今后的研究工作是進行基于數值仿真的機理分析,實現面向生成、吸附和排放等多階段的DXN 排放濃度軟測量建模,為MSWI 過程污染排放運行優化控制提供有效支撐.

猜你喜歡
特征模型
一半模型
抓住特征巧觀察
重要模型『一線三等角』
新型冠狀病毒及其流行病學特征認識
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 国内精品91| 亚洲欧美日韩精品专区| 日韩精品无码免费一区二区三区| 天堂亚洲网| 蜜臀av性久久久久蜜臀aⅴ麻豆 | 国产欧美精品一区aⅴ影院| 国产香蕉在线视频| 日日拍夜夜操| 国产综合网站| 美女国产在线| 久久久久夜色精品波多野结衣| 国产99精品久久| 高清欧美性猛交XXXX黑人猛交| 天天躁夜夜躁狠狠躁躁88| 国产激情在线视频| av在线人妻熟妇| 亚洲精品波多野结衣| 超清无码熟妇人妻AV在线绿巨人| 99精品欧美一区| 久久免费看片| 激情爆乳一区二区| 夜精品a一区二区三区| 97视频免费在线观看| 国产黄色免费看| 久久综合色视频| 久久久四虎成人永久免费网站| 天天综合网亚洲网站| 欧美a在线| 国产伦精品一区二区三区视频优播 | 波多野结衣爽到高潮漏水大喷| 久久性妇女精品免费| 欧美日韩精品在线播放| 特级毛片免费视频| 999国产精品永久免费视频精品久久| 91久久国产成人免费观看| 久久黄色毛片| 久草热视频在线| 亚洲日韩每日更新| 午夜日本永久乱码免费播放片| 人妻丰满熟妇AV无码区| 日韩精品成人在线| 日韩毛片在线播放| 人妻丰满熟妇αv无码| 欧美色视频网站| 麻豆AV网站免费进入| a天堂视频| 亚洲bt欧美bt精品| 国产一区成人| 国产精品性| 日本精品视频一区二区| 成AV人片一区二区三区久久| 国产高清免费午夜在线视频| 在线免费看片a| www亚洲天堂| 亚洲婷婷六月| 操美女免费网站| 午夜成人在线视频| 精品第一国产综合精品Aⅴ| 中文无码日韩精品| 国产视频久久久久| 欧美黄网在线| 91九色最新地址| 国产日韩精品欧美一区灰| 97国产在线视频| 无码免费视频| 美女视频黄又黄又免费高清| vvvv98国产成人综合青青| 国产91成人| 一区二区日韩国产精久久| 91麻豆精品国产高清在线| 国产小视频在线高清播放| 伊伊人成亚洲综合人网7777 | 67194亚洲无码| 日韩中文字幕亚洲无线码| 国产青榴视频在线观看网站| 91国内外精品自在线播放| 性色生活片在线观看| 夜夜操国产| 亚洲日本韩在线观看| 福利视频一区| 国产男女免费完整版视频| 波多野结衣久久高清免费|