黃國樑 張蓀毅 樊盛炯 譚衍冬 葉 盛
(上海煙草集團有限責(zé)任公司,上海 200082)
風(fēng)選后煙絲的填充值水平一直是影響后續(xù)卷接包質(zhì)量的重要關(guān)聯(lián)指標(biāo),與煙絲的填充、煙支空頭、吸阻等物測指標(biāo)存在顯著的相關(guān)性。對此筆者針對上海卷煙廠中華專線81#的風(fēng)選后煙絲填充值進(jìn)行了專題研究。
該文主要介紹了煙絲填充值穩(wěn)定性控制模式中的特征降維、層級關(guān)聯(lián)性數(shù)據(jù)的分析手法。數(shù)據(jù)降維是將原來較多的特征重新計算組合,從而形成少量新特征的過程。將特征降維和聚類挖掘技術(shù)應(yīng)用于“煙絲填充值穩(wěn)定性控制模式”的關(guān)鍵指標(biāo)特征甄選上,其目的是以盡可能用可視化的呈現(xiàn)方式,快速發(fā)現(xiàn)特征參數(shù)間的內(nèi)部關(guān)聯(lián)性與因果關(guān)系,方便用戶后期對各層級指標(biāo)組織樹的快速鉆取;關(guān)聯(lián)性分析是在大規(guī)模數(shù)據(jù)中集中尋找數(shù)據(jù)間的關(guān)聯(lián)性。數(shù)據(jù)間的這些聯(lián)系可以看作為兩種抽象主體之間的遞進(jìn)關(guān)系,其中前者是后者的抽象基礎(chǔ),代表了共現(xiàn)關(guān)系的頻繁項集。頻繁項集是經(jīng)常出現(xiàn)在一處的物品的集合,它暗示了某些事物之間總是結(jié)伴或成對出現(xiàn)的現(xiàn)象。
該文選取上海卷煙廠中華專線81#內(nèi)從制葉預(yù)處理段至煙絲風(fēng)選段內(nèi)2021年3月—10月為期半年的制絲批次參數(shù)數(shù)據(jù)。收集81#廠內(nèi)工序段對應(yīng)的該時間段內(nèi)的環(huán)境溫濕度檢測點原始數(shù)據(jù)。獲取81#風(fēng)選出口煙絲批次檢測填充值質(zhì)檢數(shù)據(jù)。
該文根據(jù)每個批次的相應(yīng)工序的生產(chǎn)時間,統(tǒng)計對應(yīng)時間段內(nèi)的多位點的環(huán)境溫、濕度原始數(shù)據(jù),利用加權(quán)平均的方法進(jìn)行統(tǒng)計整理,得出對應(yīng)批次的松散段溫度、松散段濕度、加料段溫度、加料段濕度、烘絲前溫度、烘絲前濕度的數(shù)據(jù);針對數(shù)據(jù)樣本中存在的缺失值,應(yīng)用參數(shù)數(shù)據(jù)均值填補的方法進(jìn)行數(shù)據(jù)填補;選取研究對象填充值進(jìn)行偏度分析,結(jié)果顯示呈現(xiàn)偏右分布;于是采用BOX-COX變換轉(zhuǎn)化為正態(tài)分布。采用Z-score標(biāo)準(zhǔn)化方法對整體數(shù)據(jù)樣本進(jìn)行參數(shù)標(biāo)準(zhǔn)化,并剔除相對異常范圍以外的數(shù)據(jù)點。
該文將81#預(yù)處理段至風(fēng)選段的所有質(zhì)量參數(shù)進(jìn)行工序歸位和性質(zhì)分類,分類規(guī)則為各類別內(nèi)參數(shù)可以交叉出現(xiàn),共分為蒸汽、溫度、水分、風(fēng)度、氣壓、流量六個特征大類(即六大簇),以便為后續(xù)因子分析和降維分析做準(zhǔn)備。
通過分析計算蒸汽簇、溫度簇等六大簇內(nèi)所有參數(shù)之間的相關(guān)系數(shù),并對相關(guān)系數(shù)進(jìn)行排序、篩選后發(fā)現(xiàn),其中21個蒸汽系列參數(shù)之間的相關(guān)性較強,于是便將此21個參數(shù)作為后續(xù)因子特征降維的參數(shù)研究范圍。然后對參數(shù)簇進(jìn)行KMO檢驗和巴特利球形檢驗(Bartlett's test),以驗證數(shù)據(jù)用于因子分析的有效性。該文以溫度簇作為示例,見表1。

表1 KMO檢驗和巴特利球形檢驗數(shù)值表
其中KMO檢驗和巴特利球形檢驗值達(dá)到79.4%線性相關(guān),即大于50%,說明了變量間的相關(guān)程度無太大差異,驗證了數(shù)據(jù)用于因子分析是有效的。
對于2.1節(jié)經(jīng)類別參數(shù)相關(guān)性分析后篩選出的相關(guān)性較強的21個具體參數(shù)名目,該文僅認(rèn)為這21個參數(shù)具有較高的代表性質(zhì),但是它們之間的交互作用、具體工段位置和參數(shù)效應(yīng)是混亂且不一致的。為了便于后續(xù)分析,參數(shù)需要進(jìn)一步精簡。
因此筆者采用數(shù)據(jù)壓縮方法,利用因子分析計算出了21個參數(shù)的公因子貢獻(xiàn)率以及相應(yīng)公因子數(shù)對應(yīng)的累計貢獻(xiàn)率等數(shù)值。該21個參數(shù)的因子貢獻(xiàn)率與累計貢獻(xiàn)率分別為31.63%、31.63%;13.75%、45.37%;10.73%、56.10%;7.16%、63.27%;6.85%、70.12%;5.28%、75.40%;5.00%、80.39%;3.86%、84.25%;3.58%、87.83%;2.72%、90.55%;2.55%、93.10%;2.48%、95.58%;1.46%、97.04%;0.81%、97.85%;0.61%、98.46%;0.47%、98.93%;0.40%、99.33%;0.28%、99.62%;0.16%、99.78%;0.14%、99.91%;0.09%、100.00%。
根據(jù)該計算數(shù)據(jù),可提取前6個公因子代表該21個參數(shù)75%的信息。但是由于因子間相關(guān)性較低,在數(shù)據(jù)壓縮時對其提取度有可能達(dá)不到60%,因此該文需要進(jìn)一步計算因子載荷矩陣數(shù)值,為接下來的參數(shù)降維提供依據(jù)。
通過對因子載荷矩陣數(shù)據(jù)進(jìn)行偏維度分類,并按照計算出來的因子載荷矩陣數(shù)值的絕對值大小,該文最終將蒸汽簇內(nèi)21個參數(shù)壓縮至四個維度的四小參數(shù)簇,依次命名為葉絲增溫增濕(HT)蒸汽(HT蒸汽壓力A、B,HT蒸汽閥門開度A、B,蒸汽溫度A、B和蒸汽流量A、B)、加料HT蒸汽(二次加料機HT蒸汽壓力、蒸汽溫度和蒸汽流量)、加料筒蒸汽(二次加料機筒壁蒸汽溫度、加蒸汽流量體積和進(jìn)滾筒散熱器薄膜閥閥門開度)和加料助噴蒸汽(二次加料機加料助噴蒸汽壓力)。其他五大參數(shù)簇均按照類似該數(shù)據(jù)壓縮方式進(jìn)行壓縮,最終形成煙絲填充性能-六大參數(shù)簇(一級性能指標(biāo))-二級壓縮指標(biāo)簇-三級底層參數(shù)指標(biāo)。壓縮成果如下所示:
一級性能指標(biāo)為六大類:水分、風(fēng)度、氣壓、流量、蒸汽、溫度;二級壓縮指標(biāo)為根據(jù)六大類進(jìn)行的詳細(xì)劃分,詳情見表2。

表2 二級壓縮指標(biāo)
三級底層參數(shù)指標(biāo)分別對應(yīng)二級壓縮指標(biāo),一個二級指標(biāo)下對應(yīng)多個三級參數(shù)指標(biāo),詳細(xì)對應(yīng)關(guān)系與因子相關(guān)系數(shù)見表3。
在利用特征降維和因子分析方法將81#整體參數(shù)數(shù)據(jù)進(jìn)行維度降維,將蒸汽、溫度、風(fēng)度、氣壓、流量和水分作為第一維度。其次,利用因子分析方法,將各個一級維度進(jìn)一步劃分為二級維度自定義參數(shù)。最后,利用相關(guān)性分析建立起實際制絲工序中具體參數(shù)與二級自定義參數(shù)對應(yīng)的邏輯關(guān)系,進(jìn)而形成了可用于決策樹模型預(yù)測的數(shù)據(jù)樣本。
該文運用決策樹的基尼指數(shù) CART算法對81#整體參數(shù)與填充值進(jìn)行決策樹決策劃分。其中CART決策樹使用“基尼指數(shù)”來選擇劃分屬性。數(shù)據(jù)集D的純度可用基尼值來度量,如公式(1)所示。

式中:D代表為數(shù)據(jù)分析樣本;k代表為序號;y為數(shù)據(jù)樣

表3 三級底層參數(shù)指標(biāo)與二級壓縮指標(biāo)的對應(yīng)關(guān)系與因子相關(guān)系數(shù)

然后利用CART算法來進(jìn)行81#的填充值決策,切分質(zhì)量的評價準(zhǔn)則使用均方誤差(MSE),切分原則splitter使用最優(yōu)切分原則(best),最大樹深度選擇3層。進(jìn)行決策后,模型預(yù)測性能在85%以上。
在81#填充值的影響模式下,因子水平優(yōu)化順序見表4。

表4 81#填充值影響模式下的因子水平優(yōu)化順序
在輸出填充值影響控制模式下的決策樹決策后,依據(jù)模型推薦算法得出因子重要性排序,從低到高依次為:F61工序水分、F53功能風(fēng)、F水汽壓力、F21工序溫度、F63加水量、F振動溫度。詳細(xì)排序如下所示: F61工序水分占11.31%、F53功能風(fēng)占10.5%、F41水汽壓力占10.4%、F21工序溫度占9.06%、F63加水量占7.82%、F22振動溫度占6.17%、F52風(fēng)速占4.43%、F32總路流量規(guī)模占4.1%、F33加水量占3.95%、F25風(fēng)溫占3.83%、F31分路流量規(guī)模占3.58%、F24排潮溫度占3.37%、F12綜合蒸汽占3.34%、F42拔風(fēng)罩壓力占3.2%、F43筒氣壓占3.06%、F34加蒸汽量占2.85%、F62烘后水分占2.77%、F23主動溫度占2.73%、F51風(fēng)壓占2.42%、F11分后蒸汽占1.1%。
在進(jìn)行填充值決策以及因子重要性排序之后,結(jié)合表3,進(jìn)行底部溯源分析,從填充值的最佳水平設(shè)置數(shù)值區(qū)間出發(fā),根據(jù)決策樹推薦決策,將一級參數(shù)、二級自定義參數(shù)全部化歸到第三級工序指標(biāo),利用置信區(qū)間算法,得出在95%置信度下,因子參數(shù)對應(yīng)不同填充值上、下界數(shù)值的各自應(yīng)該控制的上、下界范圍如表5所示。
表5 中羅列了制絲流程中可控或者間接可控參數(shù)的最佳控制區(qū)間范圍,而“-”代表在對應(yīng)填充性能下不做參數(shù)范圍的明確要求。
后續(xù)可結(jié)合車間對風(fēng)選后葉絲填充值控制標(biāo)準(zhǔn),利用平行坐標(biāo)原理將相關(guān)參數(shù)進(jìn)行區(qū)間監(jiān)控,做到及時預(yù)判與調(diào)整葉絲質(zhì)量的趨勢性偏移。
該文通過制絲流程全參數(shù)的決策模型運算,得出按照層級關(guān)系與填充性能相對應(yīng)的參數(shù)控制范圍。為了后續(xù)運用模型的有效性、準(zhǔn)確性,該文采用分割測試(AB test)驗證方法,選取相鄰兩天完全一樣的生產(chǎn)工況與計劃作為一組AB test試驗,驗證在中、高填充性能下,并根據(jù)模型預(yù)測的參數(shù)設(shè)置水平范圍進(jìn)行設(shè)置,分析最終葉絲填充性能是否有顯著性差異。
由于筒壁溫度是被動控制的設(shè)備參數(shù),無法直接調(diào)節(jié),最終的驗證參數(shù)為松散回潮加水比例、松散回潮工藝氣體溫度、松散回潮拔風(fēng)壓力、松散回潮加蒸汽比例。驗證試驗方案見表6。
根據(jù)表6的試驗方案進(jìn)行AB test驗證試驗時,第一天正常生產(chǎn),第二天調(diào)整試驗參數(shù)水平設(shè)置,并保持其他參數(shù)不變,該2組試驗的試驗結(jié)果見表7。
對表7的2組試驗結(jié)果分別進(jìn)行成對雙樣本t檢驗,P≤0.05、泊松相關(guān)系數(shù)≥0.8,結(jié)果顯示:1組根據(jù)模型預(yù)測的高填充性能對應(yīng)的參數(shù)調(diào)整后,得到的試驗填充值結(jié)果相比正常生產(chǎn)的對照組填充值均值有顯著性地提升;2組根據(jù)中水平填充性能對應(yīng)的參數(shù)調(diào)整后,得到的填充值結(jié)果相對正常生產(chǎn)對照組并無明顯差異。
該文通過AB test驗證試驗,驗證了利用決策預(yù)測模型得到的填充值關(guān)鍵參數(shù)的控制體系,可以有效、及時地調(diào)整與控制風(fēng)選后煙絲填充性能的變化。

表5 因子參數(shù)對應(yīng)填充值水平的填充性能

表6 驗證試驗方案

表7 AB test 驗證結(jié)果
該文利用特征降維和決策樹預(yù)測等分析方法,找尋出了影響風(fēng)選后填充值穩(wěn)定性的全工序參數(shù)控制體系,并且通過因子置信區(qū)間分析得出了各參數(shù)對應(yīng)的控制范圍,通過ABtest驗證試驗,驗證了參數(shù)控制體系可以有效地調(diào)整、控制填充值的變化趨勢,并且證明了相關(guān)的重點參數(shù)對風(fēng)選后制絲質(zhì)量的影響,便于生產(chǎn)管理人員重點監(jiān)控,為保持制絲質(zhì)量穩(wěn)定性提供了明確的方向。