張冬啟 洪蒙納 李繼庚 滿 奕,2,*
(1.華南理工大學(xué)制漿造紙工程國家重點實驗室,廣東廣州,510640;2.深圳新益昌科技股份有限公司,廣東深圳,518000)
我國生活用紙產(chǎn)量近10 年的增長率達5.9%,是全國紙張總產(chǎn)量增長率的2倍以上。在所有的紙產(chǎn)品生產(chǎn)過程中,生活用紙具有最高的單位產(chǎn)品水耗和能耗[1-2],如何提髙生活用紙能效水平和紙張質(zhì)量是近年來造紙工作者面臨的共同挑戰(zhàn)。起皺是生活用紙生產(chǎn)中重要的環(huán)節(jié),不僅影響紙機的能耗水平和后加工環(huán)節(jié),還直接影響紙張的品質(zhì)。研究表明,生活用紙經(jīng)過起皺后,縱向伸長率可提高800%,紙張厚度增加300%,挺度下降38%,紙張強度下降70%。因此對起皺過程進行實時監(jiān)測[3]、定量化測量和表征皺紋質(zhì)量、監(jiān)測紙病[4],在提高生活用紙質(zhì)量和降低能耗方面有著重要作用。
為了對生活用紙皺紋質(zhì)量進行科學(xué)表征,前人已經(jīng)做了一些研究。在皺紋質(zhì)量表征方面,Pan 等人[5]測量了生活用紙皺紋深度、頻率等指標,分析了這些指標對紙張伸長率和拉力的影響。在生活用紙皺紋質(zhì)量影響因素方面,屈云海等人[6]通過監(jiān)測紙機的振動,及時發(fā)現(xiàn)故障,從而提高紙張皺紋質(zhì)量。李廣森[7]通過實驗,發(fā)現(xiàn)影響生活用紙皺紋質(zhì)量的因素主要有紙張定量、漿料質(zhì)量、起皺刮刀、起皺率等,進而提出了改善紙張皺紋質(zhì)量的建議。管敏等人[8]探究了皺紋質(zhì)量與紙張柔軟度之間的關(guān)系,研究了起皺刮刀的安裝和使用對皺紋質(zhì)量的影響。在制漿造紙建模方面,李遠華等人[9]利用機器學(xué)習(xí)等知識,建立了基于數(shù)據(jù)挖掘的抗張強度軟測量模型。孟子薇等人[10]建立了基于梯度提升回歸樹算法的打漿度軟測量模型,并取得良好效果。Man 等人[11]通過機理建模,模擬造紙廢水處理過程,結(jié)果表明,模型效果良好,能夠準確得到出水COD 含量。這些成果在一定程度上量化了影響生活用紙皺紋質(zhì)量的影響因素,為起皺過程的優(yōu)化提供了依據(jù)和參考。然而,影響皺紋等級的關(guān)鍵指標依然存在難以實時測量,存在大滯后或者測量儀器成本較高等缺陷。因此,在工業(yè)實踐中,對皺紋等級的評定,往往依賴人工經(jīng)驗,這就導(dǎo)致了主觀化判斷和分類不準確的問題。
為解決生活用紙生產(chǎn)過程中皺紋等級的科學(xué)、快速、實時表征問題,本研究基于梯度提升回歸樹(GBRT)算法,在大量測量數(shù)據(jù)的基礎(chǔ)上,建立皺紋等級軟測量模型。為工業(yè)在線實時測量皺紋等級,提高紙張質(zhì)量提供了科學(xué)依據(jù)。
為建立生活用紙皺紋等級軟測量模型,本研究首先測量了生活用紙皺紋質(zhì)量指標。之后通過相關(guān)性分析方法,選取了對皺紋等級影響大的幾個指標作為輸出結(jié)果。通過探究紙張生產(chǎn)中的各個環(huán)節(jié)對皺紋質(zhì)量的影響,選擇合適的輸入變量;最后根據(jù)選擇的變量,建立基于GBRT 算法的生活用紙皺紋質(zhì)量軟測量模型。本研究的技術(shù)路線如圖1所示,具體如下。
(1)數(shù)據(jù)獲取及預(yù)處理。通過企業(yè)數(shù)據(jù)庫獲取相應(yīng)的制漿數(shù)據(jù)、造紙數(shù)據(jù)并測量皺紋質(zhì)量數(shù)據(jù)。選擇合適的皺紋質(zhì)量指標作為皺紋質(zhì)量軟測量模型的輸出,并對原始數(shù)據(jù)進行預(yù)處理,提高數(shù)據(jù)質(zhì)量。
(2)特征選擇。數(shù)據(jù)預(yù)處理后,通過單因素探究和相關(guān)性分析,選擇對皺紋質(zhì)量影響最大的因素,作為生活用紙皺紋質(zhì)量軟測量模型的輸入。
(3)皺紋質(zhì)量軟測量模型的建立。由于GBRT 具有精度高、收斂速度快等特點,故本研究以支持向量機(SVM)和AdaBoost 為比對,建立基于GBRT 算法生活用紙表面粗糙度、皺紋深度、皺紋頻率軟測量模型。3 個軟測量模型建立過程類似,后面將以表面粗糙度軟測量模型建立為例,進行詳細說明。
(4)模型評估及驗證。計算誤差,模型驗證。

圖1 生活用紙皺紋質(zhì)量軟測量技術(shù)路線圖
生活用紙皺紋質(zhì)量分析儀是對生活用紙皺紋質(zhì)量進行定量化的測量與分析的儀器,其基本測量項目包括表面粗糙度、皺紋深度、皺紋頻率、皺紋寬度、細小皺紋、角度、獨立峰脊數(shù)、針孔等15 個指標。本研究采用的生活用紙皺紋質(zhì)量分析儀由北京奧普樂科技開發(fā)有限公司生產(chǎn)。皺紋等級和質(zhì)量指標及其物理含義如表1所示。
本研究采用生活用紙皺紋質(zhì)量分析儀結(jié)合現(xiàn)代光學(xué)與計算機圖像處理,采用多光源光度學(xué)立體重構(gòu)技術(shù)進行分析。在獲取紙面的不同角度光源圖像后,通過分析反光與陰影的變化規(guī)律來計算出紙面各部分對應(yīng)的高度,從而得到紙張的三維信息。其中,皺紋頻率、深度等參數(shù),可以從三維高度圖中通過傅里葉變換紅外光譜儀得到,在溫度和濕度相對穩(wěn)定的條件下,連接好相關(guān)軟件和儀器,取少量單層待測樣品置于試樣臺上,即可進行測量。圖2所示為生活用紙皺紋質(zhì)量原圖和3D合成圖。

表1 皺紋等級和質(zhì)量指標及其物理含義

圖2 生活用紙皺紋質(zhì)量原圖和3D合成圖
皺紋等級可以通過皺紋指標得到。以某生活用紙企業(yè)定量為15.5 g/m2的紙種為例,使用生活用紙皺紋質(zhì)量分析儀測量其標準紙樣的皺紋指標,通過相關(guān)性分析得到。圖3為標準紙樣皺紋指標與皺紋等級的相關(guān)性。由圖3可知,與皺紋等級相關(guān)性最大的指標分別是皺紋深度、表面粗糙度、皺紋頻率。選取這3個指標對生活用紙皺紋等級進行定量化表征。圖4為標準紙樣皺紋深度、皺紋頻率、表面粗糙度與皺紋等級的關(guān)系。
由圖4 可知,對于同一紙種而言,不同皺紋等級的皺紋指標存在一個明顯的分層,皺紋等級越高,其表面粗糙度越低,皺紋深度越小,皺紋頻率越大,皺紋越細膩。即可以使用粗糙度、皺紋深度和皺紋頻率來定量化表征生活用紙的皺紋等級,進一步表明,通過這3個皺紋質(zhì)量指標就可以得到皺紋等級。
在皺紋質(zhì)量軟測量模型建立之前,首先需要選擇合適的變量作為軟測量模型的輸入。本研究使用Pearson相關(guān)系數(shù)進行分析,如式(1)所示。

式中,xi、yi分別代表2 個變量的值;分別為2 個變量的平均值;相關(guān)系數(shù)能夠反映x 與y2 個變量之間的相關(guān)性,通常在-1~1 之間;r 的絕對值越大,x與y的相關(guān)程度越密切。

圖3 標準紙樣皺紋指標與皺紋等級的相關(guān)性

圖4 皺紋深度、皺紋頻率、表面粗糙度與皺紋等級的關(guān)系
梯度提升回歸樹(Gradient Boost Regression Tree,GBRT)模型是Boosting 算法的一種,也是Boosting 算法的一種改進[12]。
GBRT模型的具體過程如下。
輸出:回歸樹fM(x)。
步驟1:模型的初始化,如式(2)所示。

式中,f0(x)是只有1 個根節(jié)點的初始決策樹,ρ為損失函數(shù)最小化常數(shù),L(yi,ρ)為損失函數(shù)[13]。
步驟2:迭代生成M棵樹。
(1)對于所有的樣本N,計算損失函數(shù)的負梯度值,并將它作為殘差的估計值rim,如式(3)所示。

(2)針對上一步產(chǎn)生的殘差生成一棵回歸樹gm(x),將第m 棵樹的輸入空間分割成J個不相交區(qū)域R1m,R2m,…,Rjm,并計算梯度下降的步長,如式(4)所示。

利用線性搜索估計葉節(jié)點區(qū)域的值,使損失函數(shù)極小化。
步驟3:更新模型,其中Ir表示學(xué)習(xí)率,如式(5)所示。

步驟4:達到最大迭代次數(shù),或者迭代停止條件時,輸出回歸樹模型f(x)=fM(x)[14],其中M表示樹的數(shù)量。
支持向量回歸(SVR):SVR 是支持向量機(SVM)的一個重要分支、其原理主要為尋找一個回歸平面,使得所有樣本數(shù)據(jù)到該平面的距離最近。SVR的性能和核函數(shù)的選擇有很大關(guān)系,常用的核函數(shù)是高斯核(RBF)[15]。SVR 能較好地解決有限樣本學(xué)習(xí)問題,可避免局部最優(yōu)解,但其精度受核函數(shù)的影響較大,這是由于采用不同的核函數(shù),SVR將形成不同的方法所致。
AdaBoost:該算法的基本思想是將大量擬合能力一般的弱學(xué)習(xí)器通過一定方法疊加起來,構(gòu)成一個具有很強擬合能力的學(xué)習(xí)器。理論證明,只要每個弱學(xué)習(xí)器的擬合能力比隨機猜測的好,那么當(dāng)弱學(xué)習(xí)器的個數(shù)趨向于無窮時,強學(xué)習(xí)器的錯誤率趨于零[16]。可對損失函數(shù)進行極小化優(yōu)化。與其他算法相比,Ada-Boost 算法具有精度高、魯棒性好等特點,但是其收斂速度較慢,有噪聲時,容易過擬合。
本研究的數(shù)據(jù)來源于國內(nèi)某大型生活用紙廠某生產(chǎn)線2019 年4-5 月的工藝數(shù)據(jù)和皺紋質(zhì)量數(shù)據(jù),共計380 組。該生產(chǎn)線定量為11 g/m2、13.8 g/m2和15.5 g/m2等8 個紙種,不同的紙種在漿料配比、磨漿工藝和造紙工藝等方面有所不同。因而,獲取原始數(shù)據(jù)時,在保證生活用紙皺紋質(zhì)量的情況下,每個紙種在起皺率、化學(xué)試劑用量、刮刀使用時間等工況方面,都設(shè)置了一定的梯度,確保涵蓋95%以上的工況。其中,制漿工藝數(shù)據(jù)和造紙工藝數(shù)據(jù)從該企業(yè)的歷史數(shù)據(jù)庫中獲取[17],皺紋質(zhì)量數(shù)據(jù)由生活用紙皺紋質(zhì)量分析儀測量得到。
數(shù)據(jù)預(yù)處理主要包括磨前纖維形態(tài)的計算和制漿、造紙、皺紋數(shù)據(jù)的匹配。根據(jù)漿料配比和不同漿板的原始纖維形態(tài),計算混合后漿料的纖維形態(tài)[10]。然后通過測量生活用紙的皺紋質(zhì)量,得到生活用紙的表面粗糙度、皺紋深度、皺紋頻率等皺紋指標,并且通過數(shù)據(jù)庫系統(tǒng)采集造紙過程中的車速、卷速、烘缸壓力、烘缸溫度等造紙過程數(shù)據(jù),在此過程中,數(shù)據(jù)庫通過記錄該批次紙張的軸號,按照軸號將皺紋質(zhì)量數(shù)據(jù)和造紙過程工藝數(shù)據(jù)進行匹配。
為選取合適的變量作為生活用紙皺紋質(zhì)量軟測量模型的輸入,本研究采取相關(guān)性分析和單因素探究。得到皺紋數(shù)據(jù)和工藝數(shù)據(jù)之后,使用相關(guān)性分析,探究工藝條件對皺紋質(zhì)量的影響。以粗糙度為例,造紙過程工藝數(shù)據(jù)與紙張表面粗糙度的相關(guān)性如圖5所示。
由圖5 可知,對生活用紙表面粗糙度影響較大的幾個因素分別為:刮刀使用時間、加熱后溫度、卷曲率、烘缸壓力等,其中,刮刀使用時間與表面粗糙度的相關(guān)性最高,對表面粗糙度的影響最大。
為了確保輸入特征的準確性,根據(jù)相關(guān)性分析的結(jié)果和相關(guān)文獻研究[5],本研究分別選取了與皺紋質(zhì)量相關(guān)性大且容易控制的刮刀使用時間、起皺率等6個變量來做單因素探究。在其他情況不變的情況下,分別探究這6個因素對皺紋質(zhì)量的影響。以刮刀使用時間和起皺率為例,圖6 和圖7 分別為刮刀使用時間和起皺率對紙張表面粗糙度的影響。
由圖6 可知,刮刀使用時間對紙張表面粗糙度影響很大,隨著刮刀使用時間的增加,紙張表面粗糙度增加,且刮刀使用時間對紙張表面粗糙度的影響是分階段的。前20 h 紙張表面粗糙度顯著增大,20~60 h紙張表面粗糙度變化不大,60 h后紙張表面粗糙度進一步增加,皺紋質(zhì)量下降。當(dāng)超過接受范圍時,需要更換刮刀以保證皺紋質(zhì)量。
由圖7 可知,在其他條件相同時,隨著起皺率的增加,紙張表面粗糙度上升且接近線性變化,即隨著起皺率的增加,紙張皺紋質(zhì)量變差。因此,想要得到高質(zhì)量的皺紋,起皺率需控制在一定的范圍之內(nèi)。
綜上可知,起皺率、刮刀使用時間等因素對生活用紙皺紋質(zhì)量的影響很大,這與相關(guān)性分析的結(jié)果是一致的。為了防止過擬合,選取刮刀使用時間、加熱后溫度、起皺率、車速、卷速、纖維寬度、細小纖維百分比、長纖比等10 個變量作為模型的輸入,構(gòu)建生活用紙皺紋質(zhì)量軟測量模型。
本研究選取GBRT 算法,以支持向量機(SVM)和AdaBoost作為對比。每種算法都需要調(diào)節(jié)相應(yīng)的參數(shù),本研究選擇網(wǎng)格搜索的方法進行參數(shù)調(diào)節(jié),即對各個參數(shù)可能的取值進行排列組合,遍歷各個參數(shù)的排列組合進行模型優(yōu)化。為了減小樣本分配帶來的誤差,防止過擬合,通過5折交叉驗證的方式對模型進行評分,平均評分最高的參數(shù)組合為模型的最優(yōu)參數(shù)。
選擇均方誤差(Mean Squared Error,MSE)、平均絕對誤差(Mean Absolute Error,MAE)、平均相對誤差(Mean Relative Error,MRE)以及均方根誤差(Root Mean Squared Error,RMSE)[18]作為模型的評價指標,在這4個指標中,數(shù)值越小表示誤差模型的誤差越小,模型效果越好。計算公式見式(6)~式(9)。

圖5 造紙過程工藝與紙張表面粗糙度的相關(guān)性

圖6 刮刀使用時間對紙張表面粗糙度的影響

圖7 起皺率對紙張表面粗糙度的影響

式中,yi是實際值,是預(yù)測值,N 是驗證樣本數(shù)量。

圖8 3種模型軟測量表面粗糙度結(jié)果與實際值對比
以紙張表面粗糙度為例,調(diào)節(jié)好參數(shù)之后,隨機選取80%數(shù)據(jù)作為訓(xùn)練集,20%數(shù)據(jù)作為測試集,3個模型的擬合情況如圖8所示。由圖8可見,在3個模型中,GBRT和AdaBoost效果良好,預(yù)測結(jié)果的變化趨勢與實際值基本相同。其中,基于GBRT的表面粗糙度軟測量模型的誤差分布如圖9所示,由圖9可知,模型效果良好,其絕對誤差均在1.6以內(nèi),其誤差主要來自于某些工況突變。3個模型的評價結(jié)果如表2所示。

表2 基于3個算法的表面粗糙度軟測量模型結(jié)果
由表2可知,在這3個模型中,GBRT和AdaBoost的RMSE分別為0.800、0.868,其MRE分別為3.44%、3.88%,模型擬合效果良好,平均相對誤差小,能夠準確地軟測量得到生活用紙的表面粗糙度。在保證模型沒有過擬合的情況下,模型精度越高越好,在誤差允許的范圍內(nèi),也可以考慮使用其他模型。

圖9 基于GBRT的表面粗糙度軟測量模型誤差分布
由于皺紋深度和皺紋頻率的軟測量模型建立過程與表面粗糙度軟測量模型建立過程類似,在此不詳細介紹。表3 為基于GBRT 算法的皺紋深度和皺紋頻率軟測量模型評估結(jié)果。由表3 可知,基于GBRT 算法的皺紋深度和皺紋頻率軟測量模型的MRE 分別為3.64%和4.16%,模型效果良好,能夠準確軟測量得到生活用紙的皺紋質(zhì)量。因此該模型可廣泛應(yīng)用于生活用紙企業(yè)。

表3 基于GBRT算法皺紋深度和皺紋頻率軟測量模型結(jié)果
本研究建立了基于梯度提升回歸樹(GBRT)算法的生活用紙皺紋等級軟測量模型,解決了生活用紙皺紋質(zhì)量等級在線軟測量的問題。分別建立生活用紙的表面粗糙度、皺紋深度、皺紋頻率軟測量模型,基于GBRT算法3個模型的平均相對誤差分別為3.44%、3.64%、4.16%,模型效果良好。該模型能夠準確軟測量生活用紙的皺紋質(zhì)量,對實時監(jiān)測生活用紙皺紋質(zhì)量、精細控制起皺過程具有重要意義。