呂逸夫 王美林



摘要:有效的能耗預測方法對智能制造有著重要的意義。傳統(tǒng)的能耗預測主要基于單臺設(shè)備各種指標和機器學習算法來進行能耗狀態(tài)的判斷,雖然預測效果在不斷地提高,但是對需要多個模塊協(xié)同作用的大型生產(chǎn)設(shè)備的能耗的預測效果時有不佳。提出了一種基于Pearson相關(guān)性分析、RNN算法的多模塊的大型生產(chǎn)設(shè)備的能耗預測方法,該方法首先計算不同模塊能耗的Pearson相關(guān)系數(shù),對不同模塊進行分組,再為各個分組收集多種異常狀態(tài)下的數(shù)據(jù),使用LSTM、GRU等RNN算法進行預測。實驗表明,提出的方法有較高準確度、召回率、F1-score,對多模塊的大型生產(chǎn)設(shè)備的能耗預測具有顯著優(yōu)勢。
關(guān)鍵詞: 多模塊生產(chǎn)設(shè)備;能耗分析;Pearson相關(guān)系數(shù);RNN算法
中圖分類號:TP391? ? ? 文獻標識碼:A
文章編號:1009-3044(2021)28-0004-04
開放科學(資源服務(wù))標識碼(OSID):
Energy Consumption Analysis of Multi-Module Large-Scale Production Equipment Based on RNN
Lv Yi-fu,WANG Mei-ling
(School of Information Engineering, Guangdong University of Technology, Guangzhou 510000,China)
Abstract:Effective energy consumption prediction methods are of great significance to intelligent manufacturing. Traditional energy consumption forecasting is mainly based on various indicators of a single device and machine learning algorithms to judge the energy consumption status. Although the forecasting effect is constantly improving, the energy consumption of large-scale production equipment that requires the synergy of multiple modules is predicted The effect is sometimes poor. Proposes a multi-module energy consumption prediction method for large-scale production equipment based on Pearson correlation analysis and RNN algorithm. The method first calculates the Pearson correlation coefficient of the energy consumption of different modules, groups the different modules, and then collects for each group Data under a variety of abnormal conditions are predicted using RNN algorithms such as LSTM and GRU. Experiments show that the proposed method has high accuracy, recall rate, F1-score, and has significant advantages in energy consumption prediction for large-scale multi-module production equipment.
Key words:multi-module production equipment; energy consumption analysis; pearson correlation coefficient; RNN algorithm
1 引言
在智能生產(chǎn)中,能耗運行狀態(tài)是大型生產(chǎn)設(shè)備的重要的監(jiān)控指標。能耗高于正常指標會導致能源浪費或設(shè)備過載,進而直接或間接地給企業(yè)帶來損失;能耗過低又會帶來產(chǎn)能不足,產(chǎn)品質(zhì)量不高等問題。在智能制造飛速發(fā)展的背景下,已有一些傳統(tǒng)企業(yè)針對大型設(shè)備進行智能化改造實現(xiàn)能耗數(shù)據(jù)的采集,用于實現(xiàn)造智能化能耗監(jiān)控。針對采集的能耗數(shù)據(jù),人們開始嘗試使用大數(shù)據(jù)分析技術(shù)對設(shè)備電機能耗的狀態(tài)預測。
針對PVC大型壓延生產(chǎn)設(shè)備進行智能化設(shè)備改造,實時采集電流、轉(zhuǎn)速等能耗數(shù)據(jù)進行相關(guān)分析。PVC壓延設(shè)備主要用于生產(chǎn)PVC壓延薄膜和裝飾材料,其生產(chǎn)設(shè)備的主要包括有攪拌機、開煉機、過濾機等模塊。在生產(chǎn)工作中,不僅需要單個模塊的正常工作,還需要生產(chǎn)設(shè)備的各個模塊的協(xié)調(diào)工作。因此,各設(shè)備模塊的能耗狀態(tài)的關(guān)聯(lián)性分析,是多模塊大型設(shè)備能耗分析的一個難點。
目前已有許多機器學習技術(shù)被應(yīng)用于能耗分析,并取得了不錯的成果。程亞豪等人使用隨機森林、梯度提升機來進行住宅能耗的預測,并在相應(yīng)數(shù)據(jù)集中有最小的均方根誤差RMSE(9.99)和RMSE(77.07)[1]。陳俊等使用LSTM、SVM、MLP、K近鄰等算法進行虛擬機的能耗預測[2],劉建財?shù)炔捎眉山5乃枷氚袻R和SVR做集成經(jīng)樣本訓練后得到 SLS 模型,進行嵌入式設(shè)備能耗的預測[3]。近幾年,機器學習技術(shù)在能耗預測方面取得了長足的發(fā)展。這些研究多以一臺設(shè)備的數(shù)據(jù)進行能耗分析實驗,沒有對需要多模塊協(xié)同工作的大型生產(chǎn)進行深入研究。
總結(jié)現(xiàn)有的研究成果的同時,實驗團隊針對PVC大型壓延生產(chǎn)設(shè)備,通過計算不同模塊能耗的Pearson相關(guān)系數(shù),對不同模塊進行分組,再使用LSTM、GRU等RNN深度學習算法對各個分組中的所有模塊的能耗進行綜合分析,并使用BP神經(jīng)網(wǎng)絡(luò)、隨機森林、LightGBM等傳統(tǒng)機器學習算法進行試驗與對比,討論RNN算法的多模塊的大型生產(chǎn)設(shè)備的能耗預測性能。
2.1 原始數(shù)據(jù)概況及數(shù)據(jù)來源
實驗團隊所使用的實驗數(shù)據(jù)來源于工廠所使用的五輥PVC壓延機生產(chǎn)線,該生產(chǎn)線包含多個模塊:軋輪機模塊(包含軋輪機A、軋輪機B)、過濾機模塊、輥輪模塊(包含五個滾輪,分別記為1#輪至5#輪)、引取設(shè)備模塊(包含三個引取輪分別記為1號引取設(shè)備至3號引取設(shè)備)、壓花機模塊、冷卻輪模塊(包含五個冷卻輪,分別記為1#冷卻輪至5號冷卻輪)、帶料輪模塊、卷取輪模塊。
通過設(shè)備改造,PVC壓延設(shè)備使用內(nèi)置或外接的傳感器,實時采集各節(jié)點的運行狀態(tài)數(shù)據(jù),包括各模塊多個采集節(jié)點的所采集的開關(guān)量、溫度、電流、轉(zhuǎn)速、壓力。原始數(shù)據(jù)樣式包含數(shù)據(jù)采集點、數(shù)據(jù)類型、數(shù)據(jù)值,數(shù)據(jù)采集頻率為1ms采集一次數(shù)據(jù),其樣式大致如下:
2.2 數(shù)據(jù)預處理
針對大型設(shè)備的能耗關(guān)聯(lián)系分析,實驗團隊篩選出所有模塊采集節(jié)點電流變量進行分析和處理。由于傳感器采集數(shù)據(jù)的頻率為1ms一次,導致數(shù)據(jù)量異常龐大,所以首先以1min為時間窗口進行數(shù)據(jù)的聚合,統(tǒng)計每分鐘內(nèi)變量的平均值,通過與額定電壓相乘來獲取各模塊功率值。然后將聚合后數(shù)據(jù)組成全局狀態(tài)向量:SG<時間,軋A功率,軋B功率,過濾機功率...>。
該PVC壓延生產(chǎn)線共包含19個模塊,所以該實驗數(shù)據(jù)包含20列,第一列是時間變量、剩下19列為每個設(shè)備的在該時刻的功率變量。其部分數(shù)據(jù)如下:
2.3 基于相關(guān)性分析進行分組
獲得SG以后,計算各模塊功率間的相關(guān)系數(shù),并利用相關(guān)系數(shù)對變量進行分組。該實驗使用Pearson相關(guān)系數(shù)確定不同變量間的相關(guān)性,Pearson通過考察變量X、Y的線性關(guān)聯(lián)程度來分析變量的相關(guān)性[4],其公式為:
Cov(X,Y)表示變量X、Y的協(xié)方差:
計算得到各模塊的相關(guān)系數(shù)后,基于此分析結(jié)果對設(shè)備進行分組,并獲得各分組狀態(tài)向量:Sn<時間變量,Sn節(jié)點1功率,Sn節(jié)點2功率,Sn節(jié)點3功率...>,其中Sn表示第n組的分組狀態(tài)。
實驗中,相關(guān)性分析的結(jié)果如下圖所示:
由該結(jié)果可知各模塊功率相關(guān)性如下:
① 由軋輪機A、壓花機、帶料輪、卷曲輪、冷卻1#~5#輪等模塊的功率相關(guān)程度高,可以組成一個分組;
② 1#~5#輪及取引1#~3#輪等模塊的功率相關(guān)程度高,組成一個分組;
③ 由于軋輪機B功率和別的模塊的功率相關(guān)性較低,可以單獨分析其能耗狀態(tài);
④ 由相關(guān)性分析結(jié)果得出,過濾機功率與其他模塊的功率相關(guān)性較低;然而可以看出過濾機的功率雖然起伏較大,但其狀態(tài)與軋輪機A所處的第一組設(shè)備功率走勢高度相似,所以仍然將過濾機放在軋輪機A所在組。
2.4 對數(shù)據(jù)進行標注
在進行實驗之前,還需要為數(shù)據(jù)做標注工作與特征工程。首先是標注工作:根據(jù)每個數(shù)據(jù)所代表的生產(chǎn)健康狀況,為數(shù)據(jù)標上相關(guān)標注,形成新的狀態(tài)向量。
2.4.1 標注數(shù)據(jù)來源
PVC壓延機中,卷取輪是整個生產(chǎn)過程的最后一個模塊,用于卷曲壓延膜成品,其狀態(tài)可反映出該時刻整個設(shè)備的產(chǎn)出的健康狀態(tài)[5];日常生產(chǎn)期間,卷曲輪主機開關(guān)在約95%的時間處于持續(xù)開啟狀態(tài),1.5%的時間處于持續(xù)關(guān)閉狀態(tài),另1.5%的時間處于間斷性開啟,開啟呈現(xiàn)周期性。在卷曲輪主機開關(guān)處于相應(yīng)狀態(tài)時,其轉(zhuǎn)速、電流有以下規(guī)律:
借助上面三種情況作為數(shù)據(jù)的健康程度初步判斷依據(jù)。將處于上表三種情況的數(shù)據(jù)標注為健康狀態(tài),與之有明顯差異的數(shù)據(jù)標注為非健康狀態(tài);收集大量健康的數(shù)據(jù)與部分非健康的數(shù)據(jù),簡單構(gòu)建機器學習算法并訓練。使用該算法預測未標注的實驗數(shù)據(jù),可得到各數(shù)據(jù)是健康的狀態(tài)的置信度,代表該數(shù)據(jù)為正常狀態(tài)的可能性[6],置信度低的數(shù)據(jù)可能有異常;分別獲得置信度高與置信度低的數(shù)據(jù),對比各時間分區(qū)內(nèi)的所有模塊電流平均值、方差并加以分析,以某次測試結(jié)果為例,進行數(shù)據(jù)標注的詳細講解。
測試以第一組的軋輪機A為例,從本次對比可以看出,置信度高的數(shù)據(jù)中,約有80%的時間內(nèi)軋輪機A電流在120~150之間,平均值約為126,其方差約為15.0,表示大部分時間軋輪機在平穩(wěn)工作,有較小的波動;而與之對比,置信度低的數(shù)據(jù)中,約有80%的時間內(nèi)軋輪機A電流在175~250之間,平均值約為189.3,其方差約為309.5,平均值和方差都偏高,可看出此數(shù)據(jù)波動異常巨大,且電流整體偏高,其他時間區(qū)間的對比也有類似的情況。以高置信度數(shù)據(jù)為標準,通過對比低置信度數(shù)據(jù)各模塊功率的平均值,判斷該模塊的異常類型是功率偏高亦或是偏低。
2.4.2 對數(shù)據(jù)進行標注
基于上一步的分析,為每個數(shù)據(jù)標上相應(yīng)的健康狀態(tài)向量,其中健康狀態(tài)向量如下,其中每個狀態(tài)可取值-1、0、1,分別代表電流過高、正常、過低:
Sn健康狀態(tài)向量
最后使用一個月的數(shù)據(jù)進行初步檢測,選取所有低置信度的數(shù)據(jù)進行,經(jīng)分析得到所有錯誤類型。以第1組為例,部分異常狀態(tài)標注如下:
3 使用算法進行訓練與測試
使用RNN算法對數(shù)據(jù)進行實驗,RNN是循環(huán)神經(jīng)網(wǎng)路(Recurrent Neural Network),它以序列數(shù)據(jù)為輸入,并且在演進方向進行遞歸的遞歸神經(jīng)網(wǎng)絡(luò)[7],可以記憶前面的數(shù)據(jù)信息,并應(yīng)用于當前時刻輸出的計算中,從而產(chǎn)生了一個序列當前的輸出與前面的輸出也有關(guān)的效果,所以RNN特別適合應(yīng)用于時間序列數(shù)據(jù)的預測。LSTM和GRU是目前最流行應(yīng)用最廣泛的RNN算法[8]。
實驗涉及3個分組,選取了生產(chǎn)過程中三組都處于正常生產(chǎn)狀態(tài)的2020年7月10日和11日此2天的數(shù)據(jù)做為正樣本,選取若干處于異常狀態(tài)的生產(chǎn)數(shù)據(jù)作為負樣本,由此得到訓練集。并將同樣處于正常生產(chǎn)狀態(tài)的2020年7月12日此1天的數(shù)據(jù),按照1/50的比率抽取數(shù)據(jù)作為測試集中的正樣本,再選取若干數(shù)據(jù)作為測試集負樣本數(shù)據(jù)。
4 實驗結(jié)果
該實驗所解決的問題屬于分類問題,可使用Precision、Recall、F1-score這三個指標來評估實驗的好壞[9],其公式如下:
其中TP:預測答案正確的次數(shù),F(xiàn)P:錯將負類預測為正類的次數(shù),F(xiàn)N:錯將正類預測為負類的次數(shù)[10];precision是準確度,指被分類器判定正例中的正樣本的比重,recall是召回率,表示正類被預測出來的概率,F(xiàn)1-score用于平衡兩者的關(guān)系。
而在該實驗中,由于需要預測出異常狀態(tài),所以將所有異常匯總,并以其作為正例,而將處于正常狀態(tài)的樣本設(shè)為負例。獲得如下結(jié)果:
由上表可以看出,在三組中LSTM、GRU都有較高的準確度和召回率和F1-score,表示這兩種RNN算法不僅能較為準確地分類,且能保證異常情況能夠較好地被判斷出來;BP神經(jīng)網(wǎng)也有較高的準確度和召回率,但對比RNN算法稍有遜色;另外隨機森林和LigthGBM等傳統(tǒng)機器學習算法的成績比起上面三種算法更低,且召回率并不高,表示這兩種算法可能會漏掉不少異常情況,導致沒法對生產(chǎn)線發(fā)出正確的預警。通過對比可以看出,RNN在本次實驗中取得了相對較好的成績。
5 結(jié)束語
此次實驗結(jié)合了PVC壓延機等多模塊大型生產(chǎn)設(shè)備中,不同模塊需要協(xié)同工作的特點,提出了使用相關(guān)性分析為模塊進行分組的分析手段。并且結(jié)合設(shè)備能耗等指標的時序性,采用了RNN算法來進行相關(guān)實驗。并借助了大數(shù)據(jù)技術(shù)獲得了大量的實驗數(shù)據(jù),從而得以匯總出大量不同的能耗異常情況,進而獲得更好的實驗成果??梢钥闯龃舜螌嶒炈峁┑乃悸肪哂幸欢ǖ目茖W性。
參考文獻:
[1] 程亞豪,陳煥新,王江宇.基于機器學習的住宅能耗預測[J].制冷與空調(diào),2019,19(5):35-40.
[2] 陳俊,張芥,田紅珍,等.一種LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)建立虛擬機能耗模型的方法[J].傳感器與微系統(tǒng),2020,39(9):16-19,23.
[3] 章蓬偉,賈鈺峰,劉強,等.基于數(shù)據(jù)挖掘技術(shù)的文本情感分析技術(shù)研究[J].信息通信,2020,33(1):77-78.
[4] 蔡靜,張明輝,朱宇婷,等.基于Pearson相關(guān)系數(shù)的貨運車輛能耗模型研究[J].交通運輸系統(tǒng)工程與信息,2018,18(5):241-246.
[5] 李國利.斜交輪胎三輥壓延生產(chǎn)線自動卷取設(shè)備改造[J].輪胎工業(yè),2019,39(5):306-307.
[6] 郭劍,林俊延,董樹龍,等.基于置信度得分模型的深度學習手勢肌電信號識別方法:CN110598676A[P].2019-12-20.
[7] Greff K,Srivastava R K,Koutník J,et al.LSTM:a search space odyssey[J].IEEE Transactions on Neural Networks and Learning Systems,2017,28(10):2222-2232.
[8] Fu R,Zhang Z,Li L.Using LSTM and GRU neural network methods for traffic flow prediction[C]//2016 31st Youth Academic Annual Conference of Chinese Association of Automation (YAC).November 11-13,2016,Wuhan,China.IEEE,2016:324-328.
[9] Wang W X,F(xiàn)u Y T,Dong F,et al.Semantic segmentation of remote sensing ship image via a convolutional neural networks model[J].IET Image Processing,2019,13(6):1016-1022.
[10] Chiarugi F,Sakkalis V,Emmanouilidou D,et al.Adaptive threshold QRS detector with best channel selection based on a noise rating system[C]//2007 Computers in Cardiology.September 30 - October 3,2007,Durham,NC,USA.IEEE,2007:157-160.
【通聯(lián)編輯:唐一東】