蔣 欽,葉 濤,張 舒,楊瑞
(武漢理工大學 機電工程學院,武漢 430070)
自從我國完成新型干法水泥技術替代后,我國水泥產量持續居于世界首位,占據世界水泥產量的60%左右[1],水泥產量自2019 年持續走高[2]。
在全球“碳中和”的背景下,國內外學者致力于提高水泥行業能源利用率的研究,主要包含燒成設備改造、原燃材料代替及水泥能耗預測研究。文獻[3]通過擴大分解爐體積、優化撒料裝置及改用第四代篦冷機等一系列技術措施對5000 t/d 水泥熟料生產線進行了技術改造,改造后噸熟料煤耗降低5.56 kg;文獻[4]在水泥生料中分別外摻ZnO、TiO2、MnO2、CuO 及CaF2,在不同摻量及不同溫度下比較各外摻物對生料易燒性的影響,結果表明含鋅、含鈦及含氟廢渣對生料易燒性改善最佳。
現有研究一般是利用歷史生產數據,通過機器學習算法建立水泥能耗模型,最后分析各參數與煤耗的關系從而達到煤耗優化的目的。文獻[5]將偏最小二乘投影應用于潛在結構回歸,表明降低窯爐燒結溫度,可以在降低能耗和CO2排放的同時,保證水泥熟料的質量水平;文獻[6]使用聚合神經網絡來提高單個人工神經網絡非線性模型的魯棒性,為Ewekoro 水泥廠確定最佳操作參數,達到了61.5%能源效率的最佳條件。
鑒于此,本文提出了一種CatBoost 結合粒子群算法(particle swarm optimization,PSO)的方式,對四川省某水泥廠的生產工藝參數進行預測與優化,最終確定最低噸煤耗和其對應的工藝參數,此外分析了不同工藝參數對煤耗調優的影響程度。
本文主要針對水泥燒成系統做煤耗優化,四川省某水泥廠的新型干法水泥煅燒工藝采用目前廣泛使用的“五級旋風窯外預分解”技術,工藝流程主要包括預熱分解、熟料燒成及熟料冷卻[7]。
預熱器出口氣體溫度及氣體成分對于煤耗支出有一定的影響,比如預熱器出口廢氣溫度偏高,說明廢熱高溫氣體沒有與生料充分地進行熱交換;預熱器C1 出口廢氣中CO 含量偏高,說明窯爐內通風狀態不佳,燃料燃燒不充分,影響熱耗;從C5 預熱器至C1 預熱器的溫度應該是逐級遞增的關系,如果出現溫度倒掛現象,也會影響熱耗[8]。如果分解爐出口氣體溫度低于C5 預熱器出口氣體溫度,也是煤粉不完全燃燒的現象。調整篦冷機推速可以控制熟料層的厚度,從而保證熟料驟冷;冷卻風機用風量的調整,可以直接影響二三次風溫,間接地影響煤耗。喂料量過少不利于產量提升,過多會導致窯爐內部供氧量不足;三次風溫反映熟料冷卻效果,同時向分解爐提供熱源及空氣。
因此結合水泥生產線實際情況及廠內專業人員的建議,選取46 項工藝參數用于煤耗優化研究。
對于異常工藝參數直接剔除,而對于數據樣本的缺失值,為更好地進行后續的研究,就需要對其進行補充,常見的缺失值處理方法有刪除缺失值、回歸預測缺失值和線性插補等[9]。本文采集的數據樣本較少,基于計算成本及模型擬合性考慮,本文使用線性插補及均值替換的方法對缺失值進行填充。
在水泥燒成系統中采集的工藝參數之間具有不同的量綱及單位,并且某些參數范圍變化很大。如果直接使用這些數據樣本訓練模型,會造成部分數據的特征提取困難,因此需要對采集的樣本數據進行歸一化,用于提升訓練時模型的收斂速度[10]。
本文分析的是噸煤耗與選取的工藝參數之間的關系,結合采集的數據及單位,噸煤耗計算公式為
式中:噸煤耗的單位為kg/t。
在構建噸煤耗回歸預測模型之前,需要對所有工藝參數進行相關性分析。本文中需要剔除Pearson相關系數絕對值低于0.2 的工藝參數,預熱器三次風壓、窯尾O2含量、C1 出口O2含量等22 項工藝參數與噸煤耗的相關系數絕對值均小于0.2,故刪去這22 項工藝參數。
對于噸煤耗預測來說,如果某個工藝參數方差很低,該工藝參數在煤耗預測中作用很小,就需要進行刪除。在模型訓練過程中,某些特征會出現相關性過高的現象,稱為共線性。如果同時使用就會導致分析結果不穩定,故需要消除共線性,即剔除其中某個工藝參數。找出Perason 相關系數絕對值大于0.85 的所有工藝參數,只保留方差值較大的一項,剔除掉其它工藝參數。最終剔除ID 風機轉速、ID 風機功率、預熱器出口CO、窯尾煙囪粉塵含量、窯尾煙囪O2含量這5 項參數,剩余19 項工藝參數用作噸煤耗預測模型的輸入。
梯度提升決策樹(gradient boosting decision tree,GBDT)算法融合Boosting 算法和決策樹算法,由文獻[11]提出。XGBoost、LightGBM、CatBoost 都是在GBDT 算法的基礎上進行了改進。
隨機森林回歸是一種集成算法,由多棵回歸樹組成,模型的最終預測結果取所有回歸樹的均值[12]。XGBoost 繼承了CART 的優點,使用GBDT 算法訓練新的決策樹將其加入到模型中[13]。LightGBM 由微軟開發,是基于決策樹的梯度提升框架[14]。CatBoost是Yandex 開源的GBDT 改進算法,以梯度提升對稱樹為基學習器[15]。此外,CatBoost 把梯度增強算法改為有序增強算法,避免了迭代過程中的梯度偏移,增強了泛化能力。使用隨機森林、XGBoost、LightGBM 和CatBoost 的回歸預測效果如圖1 所示。

圖1 四種回歸器預測效果Fig.1 Four types of regressors predict performance
結合上述不同算法下的噸煤耗模型預測結果,對比結果如表1 所示。可以看出MAE、RMSE 越小,R2決定系數越高??傮w來看,CatBoost 在MAE、RMSE、R2決定系數優于其它3 種算法。

表1 四種算法在默認參數下的性能對比Tab.1 Performance comparison of four algorithms under default parameters
樹結構Parzen 評估器(tree-structured parzen estimator,TPE)是使用高斯混合模型的一種非常規貝葉斯優化算法[16]。TPE 算法優化流程如圖2 所示。

圖2 TPE 算法優化流程Fig.2 TPE algorithm optimization flow chart
經過TPE 優化后,隨機森林算法、XGBoost 算法、LightGBM 算法、CatBoost 算法的性能對比如表2所示。CatBoost 在MAE、RMSE、R2方面接近于XGBoost,并且單次迭代時間更短,所以本文選用基于CatBoost 算法建立的噸煤耗預測模型。
CatBoost 模型輸入端共有19 項工藝參數,這些工藝參數耦合性很強,傳統的經驗法很難通過調整這19 項工藝參數,達到噸煤耗全局最優的目的。粒子群算法收斂速度快、求解精度高,特別適用于單目標優化問題,因此本文使用粒子群算法用于研究煤耗優化問題。
多參數優化是使用PSO 算法篩選出的19 項工藝參數進行優化求解,找到一組最佳的工藝參數組合使噸煤耗最低?;赑SO 的參數優化流程如圖3所示。
基于PSO 的迭代曲線如圖4 所示??梢钥闯鲈谇?00 次迭代中,適應值收斂極快;在第100 次迭代后,有陷入局部最優的情況及跳出局部的情況,但是優化程度并不明顯;在第325 次迭代后找到噸煤耗最低的工藝參數組合,此時噸煤耗為77.91 kg。優化后的工藝參數取值組合如表3 所示。

表3 優化后的19 項參數取值Tab.3 Optimized 19 parameter values

圖4 PSO 優化曲線Fig.4 PSO optimization curve
煤耗優化參數眾多,如果對所有參數同時現場調優,勢必是一大難點。但是,如圖5 所示,在圖5的幫助下,就可以知道每個參數在煤耗調優中的比重,根據比重大小進行現場參數調優。比如分解爐用煤率、預熱器三次風溫、C1 出口壓力及主傳窯轉速的優化權值均在10%以上,可以先對這幾項參數調優,達到快速降低煤耗的目的。

圖5 各參數優化權值占比Fig.5 Optimization weight ratio of each parameter
本文通過Pearson 相關系數和方差法篩選出水泥生產過程中對煤耗影響較大的特征參數。比較了隨機森林、XGBoost、LightGBM 和CatBoost 四種回歸器對噸煤耗的預測效果,通過TPE 優化后4 個回歸器的R2分別為0.9646、0.9789、0.9718 和0.9779,考慮到迭代時間的影響,使用CatBoost 結合粒子群算法對煤耗進行優化,確定最低噸煤耗為77.91 kg 以及各工藝參數最優值以及各參數對煤耗調優的影響程度。