史成云 崔文波 崔汝念 鄒欣延
(紅塔煙草(集團)有限責任公司昭通卷煙廠,云南 昭通 657000)
本研究從煙草制造企業生產過程執行管理系統中提取大量的歷史實際生產與檢測數據,結合機器學習相關算法、控制算法和參數設置經驗,分析入口水分、出口水分和車間溫濕度等可控影響因素與天氣情況等不可控影響因素對煙草生絲水分造成的影響。利用相似度計算法篩選出合格的歷史生產數據結果作為煙草生絲水分控制的參考標準,采用數據驅動的預測控制算法降低煙草生絲水分的誤差控制范圍,最終得到煙草生絲水分控制后的結果。
本框架采用多元非線性回歸的機器學習算法[1],從歷史數據中學習加水量控制模型和出口水分預測模型,實際生產過程中由控制模型計算加水量,根據計算得到的加水量用預測模型預測出口水分,如果預測值滿足工藝要求則采用計算值,否則使用優化函數尋找優化方向,再次計算加水量直到預測出口水分滿足工藝要求。并根據一段時滯后監測到的實際出口水分數據作為反饋輸入調整優化函數。模型框架如圖1 所示。

圖1
加水量和出口水分之間的數據趨勢關系如圖2所示。

圖2
從圖2 可以看出,除部分離群點外,數據聚集為一個巨大的簇,特征之間沒有明顯的線性關系。考慮到實際生產過程中,煙葉生絲的含水率除了受到可控因素影響外,還受到不可控的諸如環境溫濕度等的影響,是一個復雜的多正交系統[2],針對這一數據特點我們采用多元非線性回歸的方法構建水分預測模型和加水量計算模型,針對不同配方分別進行訓練。
將歷史數據按照配方號進行分割,采用2022 年8月1 日之后的數據進行訓練(和現場工控工程師及數據采集人員交流,此時間后采集的數據較為穩定)。
輸入特征:’實際加水流量’,’加水瞬時量’,’加水累計量’,’實際熱風溫度’,’實際循環風溫度’,’蒸汽累計量’,’蒸汽實際流量’,’蒸汽瞬時量’,’實際入口水分’,’環境溫度’,’環境濕度’,’電子秤實際流量’,’電子秤累計量’,’電子秤瞬時量’。
輸出:’實際出口水分’。
隨機選取70%的數據作為訓練數據,剩余30%的數據作為測試數據。經過多次迭代擬合階次為5 時模型決定系數超過0.99,擬合效果可以接受。(如圖3)

圖3
輸入特征:’實際出口水分’,’加水瞬時量’,’加水累計量’,’實際熱風溫度’,’實際循環風溫度’,’蒸汽累計量’,’蒸汽實際流量’,’蒸汽瞬時量’,’實際入口水分’,’環境溫度’,’環境濕度’,’電子秤實際流量’,’電子秤累計量’,’電子秤瞬時量’。
輸出:’實際加水流量’。
隨機選取70%的數據作為訓練數據,剩余30%的數據作為測試數據。經過多次迭代擬合階次為5 時模型決定系數超過0.99,擬合效果可以接受。(如圖4)

圖4

煙葉從經過電子秤到出口有時滯,PID 設備和傳感器的采集頻率為每2 秒1 次,PID 設備讀數和傳感器檢測值不可避免地存在誤差[4],從數據看誤差表現出不穩定性,這和煙葉生絲生產過程中受到多種因素綜合影響的認識是一致的,為了更好地對加水量進行優化,我們采取一段時滯后的出口水分平均值作為優化依據。
目標優化函數:

Cx+i表示時滯內的加水總量,yi表示時滯內的出口水分平均值,φi≥0 表示天氣等不可控因素,λ表示不可控因素在模型中的權重[5]。h=ACx+i+B令代入上式可得:

對函數L 求導,當導數為0 時取得最小值:

利用最小二乘法對目標優化函數J中的∑(ACx+i+Byi)2求解。
使用設備改造完成后30%的數據量作為測試數據,分別對加水量計算模型和出口水分預測模型進行測試,依據平均絕對誤差(MAE)、平均絕對百分比誤差(MAPE)和均方根誤差(RMSE)三個指標進行評 估。MSE 值≤0.045,MSAE 值≤0.029,RMSE 值≤0.062,滿足工藝要求。出口水分預測和真實值對比圖如圖5 所示。

圖5
從圖5 中可以看出,模型從現有數據中很好地習得了歷史數據中的加水經驗,并可以較為準確地預測給定加水參數條件下的出口水分。