楊 辰,郭 宇,黃少華,崔世婷
(南京航空航天大學機電學院,江蘇 南京 210016)
面向多品種、變批量生產的離散制造系統具有典型的動態性和不確定性特點,設備故障、物料短缺、緊急任務插入等生產異常往往不可預測[1]。傳統生產中,當異常發生時,由于缺乏及時、準確的生產制造信息,生產異常會逐漸蔓延,對生產進度造成重大影響。隨著物聯網技術在生產制造中的應用發展,生產要素的實時信息得以被感知采集[2],使得管理者能夠及時、準確地掌握車間生產狀態信息。由此,如何通過分析車間生產狀態數據,使管理者能夠及時發現和分析異常信息,成為了提高車間生產效率不可避免的研究問題之一。
文獻[3]通過建立基于在制品加工工序的事件監控模型,實現了對離散制造車間全周期的生產狀態監控。文獻[4]為挖掘生產過程中的生產異常對離散制造過程中的復雜事件進行了提煉和推理。異常事件的發現可以使管理人員直觀地觀測到生產過程中發生的異常,但無法從整個生產系統層面了解到由異常事件引起的生產異常持續時間和嚴重程度,而如果頻繁處理異常事件易導致生產系統震蕩而影響生產順利進行。針對生產系統層面上的異常發現問題,當前采用的研究方法大都是依據某一屬性的影響因素取值預測該屬性未來的狀態或取值。文獻[5]對微車后橋關鍵生產工序的生產異常事件進行了系統分類,并通過徑向基函數神經網絡對生產過程中關鍵工序生產異常損失進行了預測。文獻[6]為預測離散制造車間在加工準備階段以及執行階段存在的異常對訂單質量和交付期的影響,并建立了基于多決策樹預測模型。文獻[7]提出基于時間加權的深度神經網絡模型,通過影響訂單完成時間的特征因素與其計劃的偏離程度來預測訂單完成時間。上述學者采用不同的機器學習方法來構建預測模型,以挖掘不同生產異常衡量指標與其所有影響因素之間的映射規律,但大都未關注引發生產異常衡量指標異常的具體影響因素及其自身造成的生產異常程度。
基于以上分析,對上述兩類方法進行有效結合,提出一種物聯網環境下的車間生產異常發現與分析方法。以物聯網技術為支撐,通過構建在制品信息采集模型,定義在制品異常事件類型,實時監測在制品異常事件,實現生產過程中的異常發現。在此基礎上,通過構建生產異常衡量指標并對其影響因素進行分析,建立基于改進卷積神經網絡(Convolutional Neural Networks,CNN)的剩余完工時間預測模型,實現異常事件對生產影響程度的定量分析。
生產異常發現與分析的具體運作模式,如圖1所示。

圖1 生產異常發現與分析運作模式Fig.1 Operational Mode of the Production Abnormality Discovery and Analysis
在基于物聯網的制造環境中,可實時感知車間生產狀態數據,并基于企業上層系統(MES∕ERP)針對當前生產任務所制定的產品加工計劃和異常事件判斷規則,對在制品實時狀態信息進行分析,判斷是否存在在制品異常事件。若不存在,則繼續進行判斷。若存在,則從上層系統中提取影響生產任務剩余完成時間的因素的實時狀態信息作為預測模型輸入,動態觸發以歷史數據集訓練的生產任務剩余完成時間預測模型的執行,通過預測結果與計劃剩余完成時間的偏差,即生產任務延遲完成時間,來量化當前存在的異常事件對車間生產的影響程度。最后,由車間管理人員根據發現的異常事件和影響程度進行實時調度管控。
離散制造車間中所有資源發生的異常最終都能映射到生產過程中與在制品相關的事件上,通過對在制品的異常事件的監測可以達到生產異常發現的目的。在離散制造過程中,可以將在制品的異常事件概括為在制品在不同加工工序上與加工計劃不匹配的狀態改變。在物聯網環境下,在制品可實現整個加工過程的狀態監測,以在制品j在設備m上進行某道工序加工的狀態信息采集為例,如圖2所示。

圖2 在制品的實時狀態信息采集模型Fig.2 The Real-time State Acquisition Model of WIP
根據采集模型描述,將在制品的異常事件概括分為:(1)與生產業務邏輯相關的異常事件,例如某個在制品的加工順序不符合工藝流程等;(2)與生產過程時間相關的異常事件,例如某個在制品在某個位置停留時間過長(或過短)等異常事件;基于以上分析,對所監測的異常事件及判斷條件進行定義,如表1所示。

表1 在制品異常事件Tab.1 Abnormal Events of WIP
當在制品在生產過程中發生異常事件時,隨著生產加工的連續進行,其產生的干擾會在一段時間內持續影響當前車間生產任務剩余部分的正常執行,即可認為異常事件對生產過程造成的異常影響會反映在生產任務的實際剩余完成時間上。由此,可通過生產任務的實際剩余完成時間與計劃剩余完成時間的偏差,即生產任務延遲完成時間D,來衡量異常事件對于后續生產任務執行的影響程度,表達如下:

式中:D P E—生產任務的計劃剩余完成時間,為確定值;DPA—實際剩余完成時間,將D P A作為預測模型輸出,以獲得生產任務延遲完成時間。
假設當前時刻為T n,DP A取值的影響因素[8]主要包括T n時刻的車間生產狀態(車間所有在制品的加工狀態)以及當前生產任務的組成。由上節描述所知,T n時刻的車間生產狀態可由T n時刻車間每臺設備的入緩存區狀態I S、設備加工區狀態M S、出緩存區狀態O S以及從此出緩存區出去的在制品的轉運狀態RS構成。因此,D P A可表達為:

式中:h(·)—DPA與其影響因素的映射函數;Q k—第k種類型在制品的數量;IS T n、M S T n、O S T n、RS T n—T n時刻車間所有設備的入緩存區狀態、設備加工區狀態、出緩存區狀態和轉運狀態;在基于車間物聯感知環境下,以設備m為例,對上述四類狀態的組成和量化方式進行描述,如表2所示。

表2 車間生產狀態描述Tab.2 Workshop Production Status Description
為了對異常事件的影響程度進行分析,需將上節描述的D P A影響因素作為數據輸入,并對D P A進行預測。離散制造過程中產生的生產狀態數據特征繁多且復雜,而CNN所具有的權值共享技術降低了神經網絡所需的參數數量,能使其在處理多特征數據方面具有較強優勢。結合離散制造數特征,采用的網絡模型結構,如圖3所示。

圖3 CNN網絡模型Fig.3 Convolutional Neural Networks Model
由于生產狀態數據常以列表形式存儲且長度較長,為了便于CNN對其進行處理分析,在數據輸入到網絡進行訓練前,將原始數據轉化為二維特征圖。轉化步驟為:(1)假定輸入數據的長度為L;(2)根據L決定二維特征圖的尺寸大小:q×p。其中,L≤q×p;(3)將輸入數據的前q個數據作為二維特征圖的第一行,接下來的q個數據作為第二行,以此類推。最后缺少的數據以0填充。
CNN[9]的特征提取部分由卷積層和下采樣層兩層交替組成。卷積層通過在輸入特征圖上滑動權值矩陣并與被覆蓋局部子矩陣進行卷積操作以提取局部特征,公式如下:

式中:—第l層中的第j個卷積輸出特征子圖—第l-1層的第i個輸入特征子圖—在第l層用來連接第i個輸入特征子圖與第j個輸出特征子圖的權值矩陣;—第l層第j個輸出特征子圖的偏置;f(?)—激活函數,采用ReLU函數,可有效解決梯度彌散問題,使梯度得以有效傳播。
在學習過程中,為了減小網絡每一層特征值的分布波動帶來的影響,引入批量歸一化[10],將卷積神經網絡每一層卷積操作后的特征值進行歸一化操作后再進行激活操作,以保證特征值的方差為1,均值為0,大大減少了特征值的差異性,提升了卷積神經網絡的魯棒性和訓練速度。計算過程如下:

式中:n—批量化尺寸;x i—輸入(卷積操作后的輸出);y i—輸出;μb—均值和方差;γ、β—重構參數,用來保持特征分布不變,須通過學習確定;ε—微常量。
為解決卷積操作后造成的特征維數增加問題,對特征圖進行最大下采樣操作,可在減少數據處理量的同時,仍較好地保留有用信息。
原始特征圖經由特征提取部分后,提取出若干有效特征,最終由全連接層進行回歸預測。假設第l+2層為全連接層,和分別表第l+2層的特征j與上層的特征i的連接權值和偏置,則其計算如下:

由于這種全連接關系易造成過擬合現象,引入隨dropout技術,對特征以相同的概率值進行丟棄,一方面可以簡化連接關系,加快網絡訓練。另一方面,每次訓練出現的特征不完全相同,使參數更新不再受限于固定的特征連接關系,減小了過擬合的發生。
在回歸預測過程中,采用Adam優化器[11]反向傳播,以更新網絡參數,使代價函數達到極小化。傳統反向傳播算法采用固定的學習率更新參數,學習率對網絡模型的性能有顯著的影響,往往難以設置,而Adam可以使學習率根據參數自適應地更新,從而避免網絡陷入局部最優值。以第t次迭代更新過程為例:

式中:E—代價函數,這里采用均方誤差;θ—網絡中的所有權值和偏置;ρ1、ρ2—在區間[0,1)內的固定參數;m(t)和v(t)—梯度的一階矩估計和二階矩估計,由于v(0)=0,m(0)=0,為避免其接近零向量,對上式進行偏差修正。

修正后,m?(t)和v?(t)對學習率α進行動態調整。最終,權值和偏置的更新公式如下:

式中:ε—用于數值穩定的常數,取值為10-8。
以某航天企業的精密機加車間為例,該車間由13臺設備組成,主要加工8種類型的零件,每臺設備出緩存區與入緩存區容量大小固定且同一時刻只能加工一個在制品,并遵循先到先加工原則。隨機選取特征維數為629的8745組車間樣本數據作為網絡訓練和測試數據集,比例為8:2。經過反復對比試驗后,對網絡參數進行設置,其中訓練過程學習率為0.0005,迭代次數為200,批量化尺寸為256,dropout保留率為0.93,詳細參數,如表3所示。

表3 網絡模型參數Tab.3 Parameters of Network Model
為驗證所訓練的CNN網絡模型的預測精度,從測試集中隨機抽取200組樣本數據進行測試,測試結果,如圖4所示。圖中紅色點表示實際的DP A值,藍色點表示預測的D P A值。可以看出,大部分對應的藍色點與紅色點呈重合狀態,存在較小部分呈偏離狀態但偏離程度較小,能較為精確地通過車間實時生產狀態數據對生產任務的剩余加工時間進行預測。

圖4 CNN預測結果對比圖Fig.4 Comparison of Actual and Predicted DPA Values Using CNN
同時,將其與本領域使用過的稀疏自編碼器[7](SAE,Sparse Autoencoder)、BP神經網絡[12]進行實驗比較,兩者的預測效果,如圖5、圖6所示。對比可見,CNN的預測精度明顯優于BP(500-313-20)和SAE,后兩者的藍色預測值與紅色真實值呈重合狀態的部分較少且其中絕大部分的偏離程度較大。

圖5 SAE預測結果對比圖Fig.5 Comparison of Actual and Predicted DPA Values Using SAE

圖6 BP(500-313-20)預測結果對比圖Fig.6 Comparison of Actual and Predicted DPA Values Using BP(500-313-20)
在實驗中,選取根均方差(RMSE,root mean square error)來度量上述三種模型預測值同真實值之間的偏差以作為測量過程精度的標準,如圖7所示。CNN模型的RMSE測試訓練曲線收斂下降速度較快,最后呈現的RMSE值較低,可達到15.67。同時,測試與訓練曲線收斂速度與方向一致,表明模型可有效地避免過擬合現象的發生。對三個模型進行200次迭代的RMSE測試對比,如圖8所示。圖中,BP(200-313-20)神經網絡的收斂下降速度較慢且RMSE值最小只有36.2。SAE的收斂下降速度較快,過程也較為平穩,但達到最小RMSE值為27.33,偏差遠遠大于CNN模型。

圖7 CNN訓練測試收斂曲線Fig.7 Convergence Curves on Train Set and Test Set Using CNN

圖8 三種模型收斂曲線Fig.8 Convergence Curves of Three Models
為驗證整個異常發現與分析方法的可行性,以車間某一時刻的異常狀態為例進行具體實驗分析。某一時刻的部分在制品異常事件,如表4所示。由表可知在制品k170648在設備3的加工異常和k170386、k170396在設備3出緩存區排隊超時,引發了其設備后續生產的停滯和在制品本身后續工序的正常執行。將異常事件發生時刻10:58時的車間生產狀態數據從數據庫中進行提取,設備3在10:58時刻的生產狀態數據,如表5所示。將10:58時刻的生產狀態數據以及生產任務的組成輸入到上述CNN預測模型中,預測可得車間在當前時刻異常事件發生的生產狀態下,當前生產任務的剩余完成時間為227h,而計劃剩余219h,當前異常事件的發生會導致生產任務存在9h的延遲。車間調度員則需根據延遲時間來衡量車間此時的異常程度,并重點關注導致設備3發生加工異常事件的原因,根據異常程度對其采取相應的調整措施。

表4 在制品異常事件Tab.4 Abnormal Events of WIP

表5 10:58時刻設備3的生產狀態數據Tab.5 Production Status Data of Equipment 3 at 10:58
(1)當在制品異常事件發生時,通過改進CNN實時預測生產任務的剩余完成時間,以生產任務延遲完成時間來量化當前異常事件對車間生產的影響程度,最后將在制品異常事件以及其影響程度共同作為車間調度依據。相比傳統生產異常預測方法,可在準確評估生產異常程度的同時,對具體異常原因進行定位。
(2)結合制造數據特征,將離散制造過程中的一維數據轉化為二維特征圖,降低了CNN應用場景的特殊性。同時在CNN的特征提取階段引入批量歸一化和ReLU、回歸預測階段引入drop‐out,提高了模型的泛化能力和運行速度,減少了過擬合現象。
綜上所述,該方法可以有效地解決離散制造過程中生產異常難以及時發現和準確評估的問題,提高車間的生產效率。