999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

面向不平衡數據集的汽車零部件質量預測

2022-01-24 02:10:36李敏波董偉偉
中國機械工程 2022年1期
關鍵詞:產品質量方法質量

李敏波 董偉偉

1.復旦大學軟件學院, 上海,2004332.復旦大學上海市數據科學重點實驗室, 上海,200433

0 引言

隨著“工業互聯網”和“工業4.0”等概念的提出,工業領域的信息化、智能化發展愈發受重視,越來越多的制造企業建立了生產過程數據采集系統與制造執行系統,積累了大量工業數據。這些工業數據分布在不同的孤立信息系統中,存在實時性高、復雜多樣和類別不平衡等問題。現有的產品質量預測方法往往使用單一系統的數據集,且只面向于特定的制造領域,具有較大的局限性,難以滿足制造企業實時質量抽檢的預測需求。常見的產品質量預測研究往往局限于質量預警和預測性維護等方面,這些研究難以用于實際的工業場景[1-3]。汽車零部件制造存在大批量生產、小樣本抽樣檢測的特點,例如輪胎動平衡為全檢,而部分輪胎企業的均勻性檢測為抽檢,柴油和汽油發動機的部分試車工況測試為抽檢。大批量生產的汽車零部件合格率一般在95%以上,而小樣本抽檢的隨機性會造成不合格產品檢出率較低,增加產品售后返修及物流成本。

制造數據集中,合格與不合格的產品數量差距懸殊,存在嚴重的類別不平衡問題。現有的類別不平衡解決方法分為預處理方法、代價敏感方法、算法中心方法和混合方法[4-6],其中,預處理方法包括特征選擇方法、過采樣方法、欠采樣方法和混合采樣方法。一般來說,過采樣方法具有更高的性能,文獻[7-10]分別利用Lowner John橢球理論、元啟發式方法、構造覆蓋算法的無參數數據清洗方法和自組織圖方法對少數類樣本進行過采樣,極大提高了對多領域不平衡數據集的分類性能。然而在面對信息繁雜且蘊含眾多領域業務特征的制造數據集時,現有方法仍有進一步的改善空間,由此本文提出了基于密度聚類與多工序制造特征的質檢數據過采樣方法。

對制造數據不同層次的類別屬性預測包括故障預測和產品質量預測。產品質量預測在本質上是一個二分類問題,即將生產制造數據集訓練出的有效分類模型用于產品的良率預測與抽檢產品的選擇。文獻[1-3]利用支持向量機(SVM)、隨機森林、決策樹和深度學習等方法,對車輛氣壓系統和機床進行故障檢測及預測的研究。朱海平等[11]應用遺傳算法改良 EWMA控制圖,量化產品質量不合格的概率并優化相關參數。呂旭澤[12]針對發動機多工序裝配的回轉力矩檢測誤差波動大、影響裝配質量的問題,構建了基于粒子群參數優化與最小二乘支持向量機的發動機多工序裝配預測曲軸回轉力矩模型。趙雙鳳[13]提出了結合BP 神經網絡和灰色模型的質量預測模型來預測軸類零件車削加工測量值。于文靖[14]研究了汽輪機模鍛葉片加工質量預測,建立了基于粒子群優化(PSO)算法與SVM算法并結合統計過程控制(SPC)的多工序質量預測控制系統。馮爾磊[15]針對表面安裝工藝中錫膏印刷環節,提出一種基于層次聚類和PSO優化的 RBF神經網絡的錫膏印刷體積預測模型。本文提出了將LightGBM、XGBoost、SVM和MNB模型進行Stacking集成的汽車關重件質量抽檢預測方法。

1 MCDC-MF-SMOTE過采樣方法

大數據下的質量預測控制研究主要集中于質量管控過程框架、數據挖掘方法、在線質量診斷與監控、在線質量預測等領域[16]。常用質量預測方法主要有灰色預測模型、人工神經網絡預測模型、支持向量回歸(support vector regression, SVR)預測模型、模糊預測控制模型以及上述算法的整合模型。針對產品質量預測及其關鍵的類別不平衡問題,本文研究基于密度聚類與制造業務特征(multi class density cluster-manufacture feature-synthetic minority over-sampling technique,MCDC-MF-SMOTE) 的過采樣方法。

SMOTE(synthetic minority over-sampling technique)-Regular算法采用K最近鄰 (K-nearest neighbor,KNN)分類算法模擬生成新樣本來解決數據集分類的類別不平衡問題,但面對高維且分布復雜的數據集時,該算法的分類模型準確率不高,因此出現了SMOTE-borderline、k-means-SMOTE、Random-SMOTE和CURE-SMOTE等改良方法,這些方法考慮了不同類別的數據分布情況和少數類噪聲問題,利用分布邊界、聚類和生成權重調整等方法解決了SMOTE-Regular的諸多問題[17]。制造數據集不僅具有高維且復雜的分布特征,不同類別的樣本數據還有重疊,直接使用上述SMOTE改進方法,難以有效學習到數據中所有質量影響因素的信息,使得產品質量預測模型難以用到實際的生產場景。

圖1所示為基于密度聚類和制造業務特征的數據過采樣方法框架。首先對制造數據集進行適當的預處理(包括缺失值處理、錯誤數據修正、數據標準化等操作),形成高質量且適合模型訓練的數據集。筆者將數據集按產品質量類別標簽分成兩個數據集:一個包含所有不合格產品(少數類)樣本,另一個包含所有合格產品(多數類)樣本。接著對這兩個數據集進行密度聚類,形成對應的類簇集合。利用多工序制造特征計算少數類簇的數據生成權重,然后利用數據生成權重對少數類簇進行數據生成,并對利用多數類簇判斷生成的數據是否合理。最終按照分類模型需要重組數據,形成平衡后的數據集。

圖1 MCDC-MF-SMOTE過采樣方法架構Fig.1 Architecture of MCDC-MF-SMOTEoversampling method

1.1 密度聚類方法分析與選擇

密度聚類方法可以根據數據的分布密集程度考察數據間的相似性,相比于k-means等方法,不需要指定類簇數量就能發現任意形狀的類簇,且對噪聲數據有更高的魯棒性。

為分析不同聚類方法的適應性,利用scikit-learn軟件的datasets工具包合成6種不同分布的數據集。選擇6種基于不同理論的聚類方法對合成的數據集進行聚類實驗,圖2中,從左向右依次為K-means、Agglomerative Clustering、Birch、MeanShift、DBSCAN、OPTICS 6種聚類方法對合成的數據集進行聚類實驗的結果,可以看出,k-means、Birch和MeanShift算法會拆分密度分布相同的類簇,如第六行的數據集6,2個弧形分布數據被錯誤地截斷為不同類簇(第六行的第1、3、4列)。Agglomerative Clustering算法易將數據集4、5中不同的類簇識別為同一類簇。OPTICS算法會將一些密度分布松散的類簇識別為噪聲,且多次參數調整后的效果仍不理想。DBSCAN算法在每一種數據集下都有最好的分類表現,能有效區分不同形狀的類簇,且會引入更少的噪聲數據。所以最終選擇DBSCAN算法對制造質量相關數據集進行聚類,并在不同類簇中生成少數類數據。

圖2 聚類實驗結果Fig.2 Experimental results of clustering

1.2 基于多工序制造特征的過采樣權重定義

產品制造數據集包含人員、設備、物料和操作等影響產品質量的制造特征,這些特征在一段時間內通常會保持相似的狀態。產品質量問題往往是由某一工序環節的制造偏差造成的,整體來看,不合格產品會在某一時間段內重復出現。圖3為輪胎動平衡檢驗的產品質量趨勢圖,橫坐標為動平衡檢驗時刻,縱坐標表示產品質量,1表示合格產品,0表示不合格產品。紅框標注了聚集出現較多不合格品的情況,可利用滑動窗口的方法判斷一定時間內生產的不合格產品數量是否超過閾值。若超過閾值,則滑動窗口內的數據包含更多的低質量產品的信息,應該受到更多的關注,過采樣時,可將此類數據賦予更大的過采樣權重。

圖3 輪胎動平衡質量趨勢Fig.3 Quality trend of tire dynamic balance

利用上述分析的制造數據集特征和數據的密度分布情況,設計對少數類簇進行數據生成時的過采樣權重。首先定義樣本D={(x1,y1), (x2,y2), …, (xn,yn)},其中,n為樣本數量,xi表示樣本i,yi∈{0,1},其中,1表示質量合格,0表示不合格。定義滑動窗口Ls-e為固定時間長度,s、e分別為滑動窗口的開始時間與結束時間;minA為低質量產品的最小出現次數,N0(Ls-e)為滑動窗口內出現的低質量產品數量;deplen為滑動窗口移動步長。N0(Ls-e)>minA時,窗口為有效滑動窗口,屬于某個有效滑動窗口的樣本稱為有效滑動樣本;按照指定步長移動滑動窗口,最終得出有效滑動窗口集合T={Ls,1-e,1,Ls,2-e,2,…,Ls,l-e,l}。由于樣本具有時間屬性,因此可以判斷出每個樣本是否歸為有效滑動樣本。

接著利用基于混合類型距離的DBSCAN算法對原始樣本進行密度聚類,形成少數類簇Ca={ca,1,ca,2,…,ca,v}和多數類簇Cb={cb,1,cb,2,…,cb,w},其中,v、w分別為少數類簇和多數類簇的數量。N(ca,v)為ca,v類簇的樣本數量,D(ca,v)為ca,v類簇空間所包含的多數類樣本數量,S(ca,v)為ca,v類簇含有的有效滑動樣本的數量。類簇包含的有效滑動樣本越多,該類簇的數據權重越大。最終定義的類簇過采樣權重為

(1)

(2)

1.3 過采樣算法流程

基于密度聚類和過采樣權重定義方法,介紹基于MCDC-MF-SMOTE的整體流程。定義Doriginal為原始樣本;過采樣率ηOR為數據生成后的少數類樣本數量與原始多數類樣本數量的比值;J為生成數據無效時所進行的重試次數,防止出現死循環;WDMC表示不同類簇的過采樣權重計算過程算法;Dbalanced為經過該算法處理后的樣本。使用基于混合類型距離Dmix的密度聚類算法DBSCANDmix對原始樣本進行密度聚類,具體算法如下:

輸入:數據集Doriginal←{(x1,y1),(x2,y2),…,(xn,yn)},yi={0,1};

DBSCANDmix; 密度聚類算法參數:半徑∈,最小數量MinPts;

輸出:Dbalanced←{(x1,y1),(x2,y2),…,(xz,yz)},yz={0,1}.

方法:

1./* (1).初始數據集預處理*/

2.Dprocessed←P(Doriginal);

3./* (2).類分割與每個少數類簇的權重定義 */

4.初始化GenWht←?,Dmin←?,Dmaj←?,

Gq←0,i←0,Ca←?,Cb←?,Dnoise←?;

GenWht,Dmin,Dmaj,Ca,Cb←WDMC(Dprocessed,ε

minPts,deplen,Ls-e,minA,β1,β2,β3);

5.Dnoise←Dprocessed(Dmin,Dmaj);

/* (3).根據少數類簇的權重值生成數據,通過多數類簇去除無效數據*/

6.initializeGq←0,Wall←0,Gc←?.

9.fori←1∶vdo

11.endfor

12.whileGq>0do

13.i←i+1,i←i%v;

14.ifGc,i>0do

15.randomly select (xold,0,xold,1)∈Ca,i;

16.initializej←0;

17.whilej

18.j←j+1,xnew←xold,0+Udynamic(0,1)·(xold,1-xold,0);

19./* judge data valid byCb.*/

20.ifxnewis validthen

21.Gq←Gq-1,

22.Dmin _balanced←Dmin _balanced∪xnew;

23.break;

24.endif

25.endwhile

26.endif

27.endwhile

/* (4).數據集重構 */

28.initializeDbalanced←?;

29.Dbalanced←Dmaj∪Dmin _balanced∪Dnoise;

重點為步驟(3),即根據少數類簇權重生成數據,根據多數類簇判斷生成數據的有效性。數據無效時,重新生成數據并判斷其有效性。

圖4所示為不同的少數類簇與多數類簇的分布,用min標識的紅色區域表示少數類簇,用maj標識的綠色區域表示多數類簇,橫縱坐標都為數據的x、y值坐標,它們共有3種分布方式:非重疊分布、包圍分布、重疊分布。對于非重疊分布,從少數類簇區域中隨機選擇2個樣本點,取兩點連接線之間隨機一點為新生成數據。對于包圍分布,當生成數據落在多數類族區域時,重新選擇2個樣本點,并用迭代折半的方法在距離樣本點更近的位置生成數據。對于重疊分布,首先將重疊區域設置為invalid area,然后判斷獨立少數類簇區域是非重疊分布還是包圍分布,并按照響應方法進行數據生成。

(a)非重疊分布 (b)包圍分布

2 Stacking集成的產品質量預測方法

MCDC-MF-SMOTE方法能產生有效的平衡數據集,提高多個分類算法的泛化性能,并使LightGBM(light gradient boosting machine)模型獲得最好的產品質量預測結果。考慮到汽車零部件生產過程和相關制造數據集的復雜性,單一分類算法難以適應各種的制造場景。例如Expo和Higgs數據集上的二分類問題,極限梯度提升(extreme gradient boosting,XGBoost)模型的分類性能強于LightGBM模型。本文提出基于Stacking集成的LXSMS(LightGBM- XGBoost-SVM-MNB Stacking)方法,如圖5所示,具體步驟如下:

圖5 LXSMS方法整體流程Fig.5 Overall flow of LXSMS method

(1)數據預處理。該步驟初步梳理制造數據集,需要考慮數據的類型,如數值型、時間型和文本型的屬性以及屬性背后的實際質量相關性。

(2)多工序制造特征構建。經過對制造數據集的預處理和對多工序制造質量相關影響因素的了解,利用多個已有特征構建新的組合特征,這些組合特征往往在最終模型中起決定作用。

(3)數據集劃分。為保證訓練出的模型符合真實的產品質量預測場景,需在數據平衡及降維之前進行數據集劃分。首先按照業務發生時間對數據進行先后排序,之后將前80%的數據作為訓練數據集,將余下的數據作為測試數據集。

(4)MCDC-MF-SMOTE算法的數據平衡。制造數據集存在類別不平衡問題,嚴重影響分類方法的性能,MCDC-MF-SMOTE算法充分考慮了數據分布和制造業務特征,能生成高質量的平衡數據集,有效解決該問題。

(5)基于特征重要性的維度縮減。數據集特征過多時,部分特征往往是質量影響度很小的冗余特征,且模型需要耗費更長的時間去訓練和調整參數,因此使用隨機森林對所有特征進行重要性排序并剔除部分排名靠后的特征。該方法能在保證特征蘊含足夠知識的前提下,縮短模型訓練時間,提高模型分類性能。

(6)Stacking集成。第一層基分類器主要采用分類模型LightGBM、XGBoost、SVM(支持向量機)和MNB(多項式先驗分布樸素貝葉斯),每個模型都采用五折交叉驗證的方法訓練并輸出預測結果到第二層元分類器層。需要注意的是,五折交叉采樣需采用分層抽樣的方式,以保證不同模型使用同樣分布的數據。LightGBM模型訓練極快且比邏輯回歸模型的分類性能高,所以選擇LightGBM模型作為元分類器,利用第一層得到的預測數據進行訓練并得出最終的產品質量預測結果。

(7)模型評估與參數調整。評估模型需綜合考慮模型的訓練時間和受試者工作特征曲線 (receiver operating characteristic curve,ROC)、ROC曲線下的面積(area under curve, AUC)等指標,并利用網格搜索方法調整參數。模型達到要求時,保存模型為PMML(預測模型標記語言)格式,并將其應用到實際生產業務。

3 實驗設計與結果分析

本文實驗數據源于青島雙星股份公司MES數據庫,輪胎生產均勻性檢驗階段采取的是20%隨機抽檢的方式。利用均勻性檢驗之前的所有數據訓練模型來預測均勻性檢驗階段的產品質量,輔助進行均勻性抽檢工作,降低不合格輪胎的漏檢率。表1所示為相關數據的說明。經過數據預處理,最終使用2019年1月到4月的269 835條輪胎生產制造數據,其中,合格輪胎254 370條、不合格輪胎15 465條,合格率為94.27%,不平衡比為15.4。

表1 輪胎制造數據說明

準確率(Precision)和召回率(Recall)僅關注單一維度的模型性能,難以綜合評估不平衡數據下的模型對不同類別的泛化能力。AUC、ROC等指標有一定偏向性,使用準確召回率曲線面積(precision-recall curve,AUCPRC)能在一定程度上修正AUC、ROC的偏向性,它是以準確率ηp為Y軸、召回率ηrec為X軸所形成的曲線下的面積。針對批量生產的汽車零部件工序抽樣檢驗的質量預測希望預測更多的不合格產品,召回率ηrec允許值更小,針對此類場景,選擇AUCPRC來綜合評價產品質量預測模型更有意義。同時結合抽檢比例的業務特征,最終選擇預測為合格樣本數量與總樣本數量的準確率ηP、召回率ηrec、綜合評價指標F1-Score(SF1)和AAUCPRC作為模型的評價指標。

3.1 不同過采樣方法分類性能對比實驗

本次實驗主要使用算法XGBoost、LightGBM和SVM(支持向量機),其中,GBoost和LightGBM均以binary:logistic為目標函數(objective),已定義評價函數(eval_metric)為AUCPRC,提升類型(booster_type)為梯度提升樹(gradient boosting decision tree,GBDT)算法,學習率(learning_rate)、樹深(max_depth)和樹的個數(n_estimators)參數采用網格搜索選取最優值,其他參數取默認值。SVM使用sklearn.svm.SVC方法,kernel設置為rfb,class_weight設置為balanced,利用網格搜索調整懲罰系數C,其他參數均取默認值。過采樣方法中,Original表示不進行過采樣,其他過采樣方法均使用python算法庫對原始數據進行處理,MCDC-MF-SMOTE算法設置ε=10,minPts=3,ηOR=1,β1=β2=β3=1,jump=3,Ls-e=600,minA=3,deplen=10。最終的實驗結果取五折交叉驗證的平均值。結果如表2所示,可以看出, MCDC-MF-SMOTE方法取得最大的SF1、ηrec和AAUCPRC且ηP均小于0.2,符合輪胎均勻性檢測按20%比例隨機抽檢的業務要求。相比除了Original的其他過采樣方法,MCDC-MF-SMOTE的AAUCPRC增大了5%~49%。此外,LightGBM配合MCDC-MF-SMOTE過采樣方法取得了最大的ηrec、SF1和AAUCPRC值。

表2 不同過采樣方法實驗結果

3.2 不同過采樣率分類性能對比實驗

用過采樣方法處理不平衡數據集時,過采樣率ηOR設為1表示少數類樣本采樣數量與多數類樣本數量相同。不同的過采樣率會影響分類模型的最終性能,應用輪胎制造數據集探討MCDC-MF-SMOTE方法的不同過采樣率對分類性能的影響。LightGBM和XGBoost使用默認參數設置,MCDC-MF-SMOTE僅更改ηOR的參數設置,采用五折交叉驗證,最終結果取平均值。

實驗結果如圖6所示,橫軸表示過采樣率ηOR,ηOR=0表示不進行過采樣。縱軸分別表示ηP、ηrec和AAUCPRC的性能指標值。可以看出,ηOR較小時,XGBoost有更好的性能。隨著ηOR的增大,XGBoost和LightGBM整體性能都在提升,但LightGBM整體性能的提升速度更高。XGBoost在ηOR超過4.5、LightGBM在ηOR超過3后,ηrec和AAUCPRC都趨于穩定,且滿足ηP小于0.2。特別是LightGBM的AUCPRC指標已經到達了0.803, 比ηOR=1時的性能提升了約8%。隨著ηOR的進一步增大,XGBoost和LightGBM的性能趨于穩定,但是ηP卻在逐步增大,超過了0.2的抽檢閾值,不滿足輔助質量抽檢的業務需要。整體來看,LightGBM有著更好的性能,且模型訓練耗時約為XGBoost的1/10。

(a)準確率

3.3 不同分類方法的產品質量預測性能對比實驗

本實驗主要對比算法LXSMS、LightGBM、XGBoost、SVM、隨機森林和MNB。選取輪胎制造數據集的80%數據為訓練數據,余下20%數據作為測試數據。每個算法都采取MCDC-MF-SMOTE方法平衡數據,并設置ηOR為其最優性能時的過采樣率,設置ε=10,minPts=3,ηOR=1,β1=β2=β3=1,jump=3,Ls-e=600,minA=3,deplen=10。

LXSMS在集成模型的第一層中使用了五折交叉驗證,所以除了LXSMS,其他方法的最終實驗結果取五折交叉驗證的平均值。

由表3的實驗結果可以看出,相比單一模型中表現最好的LightGBM,LXSMS的ηrec和AAUCPRC分別提高了約6%和3%;相比表現最差的MNB,LXSMS的ηrec和AAUCPRC分別提高了約36%和31%。這表明基于Stacking集成的LSXMS方法有著更高的產品質量預測性能。

表3 不同分類算法的產品質量預測性能

3.4 不同分類方法產品質量預測穩定性實驗

產品制造是一個持續的過程,會源源不斷產生新的數據,隨著時間的推移,產品質量預測模型的預測能力往往會持續下降。為了分析不同模型的穩定性即模型對新數據的預測能力,本次實驗將269 835條輪胎制造數據按照時間進行排序,取前30%的數據為訓練數據,后70%的數據為測試數據,測試算法LXSMS、LightGBM、XGBoost、SVM、隨機森林和MNB的穩定性。

由圖7可以看出,在每一種數據劃分下,LSXMS的ηrec都最大且下降緩慢,有較高的穩定性。隨著輪胎數量的增長,模型的預測性能持續降低,不適應產品抽檢的業務要求,所以需要在適當時刻,采取增量更新的方式訓練新的模型。

圖7 不同分類方法產品質量預測穩定性Fig.7 Stability of product quality prediction bydifferent classification methods

3.5 隨機抽檢與模型抽檢性能對比實驗

為進一步驗證LXSMS方法在真實產品制造場景中的適應性,將已標記檢驗質量的269 835條輪胎生產數據,按照時間節點劃分,將2019年3月之前的210 808條數據作為模型訓練數據,將2019年4月的59 027條數據作為輪胎檢驗數據。對于輪胎檢驗數據,設置隨機抽檢和模型抽檢對照實驗,并分別進行兩種檢驗處理:隨機抽檢從輪胎檢驗數據中重復10次隨機取出20%的輪胎并標記為抽檢輪胎,結果取平均值(輪胎數量如果為小數則四舍五入為整數);模型抽檢使用LXSMS方法從訓練數據中構建出初始質量預測模型,并利用該模型模擬實時預測過程,將預測不合格的輪胎標記為抽檢輪胎。最后使用已知的輪胎質量結果來判斷兩種抽檢方式的性能,如表4所示。

表4 隨機抽檢與模型抽檢的性能

從實驗結果可以看出,模型抽檢在抽檢了17.1%的輪胎后,達到了85%的不合格輪胎檢出率,而隨機抽檢只檢出22%的不合格輪胎。由此可見,本文提出的LXSMS方法能顯著提高不合格輪胎檢出率,在更低檢驗成本的情況下,檢測出更多的不合格輪胎,幫助企業提升經濟效益。

3.6 深度學習對不平衡制造數據集的適用性分析

深度學習常用于圖像、音頻和文本等領域。對于汽車零部件質量抽檢預測及其相關的多工序制造數據集來說,由于質量不合格品的負小樣本數據較少,因此深度學習難以取得良好的應用效果。

從數據量來說,制造數據集中的有效數據往往是較小規模的樣本,相比動輒過千萬的圖像與文本數據,深度學習算法難以訓練出高泛化能力的模型。基于集成方法的LSXMS能從小樣本數據集中充分學習到數據特征,且支持加入業務規則進行精細化調整,更加適合中小規模數據集的制造數據分析。

從效率來說,深度學習需要耗費更多的計算成本和更長的訓練時間,且往往需要高性能GPU的支持,而LSXMS使用CPU即可進行訓練。模型訓練需要能在普通配置的服務器中進行,更符合企業應用要求。

從業務來說,訓練出的質量預測模型不僅要適應復雜多變的產品質量場景,還能對多工序制造特征進行分析,為產品工藝參數優化提供優化方向。LXSMS模型能夠提取出小樣本特征的重要性,重要性高的特征蘊含著更高的業務影響能力;模型支持反饋訓練及調整,能滿足企業質量預測的需要。

綜上所述,對于有限規模的制造數據集來說,采用何種模型需要結合業務目標來定,并綜合考慮數據量、數據特征、訓練成本和應用場景等問題。

3.7 實時產品質量預測應用設計

基于雙星輪胎制造業務背景,設計了圖8所示的服務框架,將LXSMS產品質量預測方法應用于實際的輪胎制造質量抽檢預測。

圖8 產品質量預測服務框架Fig.8 Service framework of product quality prediction

對于歷史質量檢測與生產制造數據,直接使用Logstash工具將數據從不同系統中批量導入到Elasticsearch集群,方便對數據進行可視化質量分析、構建初始產品質量預測模型。

對生產的實時數據來說,由于PLC只包含終端設備的生產數據,輪胎描述和人員編號等信息需要從MES和ERP等系統抽取集成,而Logstash難以支持復雜的中間數據處理,因此使用Kafka分布式消息隊列對所有數據進行集成,并將數據實時推送到Elasticsearch集群,為實時產品質量分析提供數據來源。由于涉及到數據的重復消費問題,故可以采用“發布-訂閱”的消息傳遞模式,構建多個consumer.group.id來實現數據的多次消費。其中,待檢驗產品數據對應動平衡檢驗工序后所構建的待質量抽檢預測數據。檢驗后產品數據對應均勻性檢驗工序后所構建的包含實際已檢驗的輪胎數據。最終所有數據都會歸檔到Hadoop中,用于構建產品質量預測模型,并導出為支持跨平臺運行的PMML格式文件。該文件由質量預測模型管理服務負責管理,可以方便地被Java解析并完成實時輪胎質量預測任務。

4 結論

針對輪胎制造數據與輪胎檢測數據的不平衡、輪胎均勻性檢測中不合格品檢出率的預測需求,提出了基于密度聚類與多工序制造特征的質檢數據過采樣MCDC-MF-SMOTE方法。與其他數據過采樣方法相比,該方法的AAUCPRC提高5%~49%,有效地解決了合格與不合格的產品數量不平衡對不合格品抽出率預測的影響。為進一步提高產品質量預測方法的適應性,提出了基于Stacking集成的汽車零部件抽檢不合格品預測LXSMS方法,利用MCDC-MF-SMOTE方法解決小樣本檢測數據類別不平衡問題,將LightGBM、XGBoost、SVM和MNB模型進行Stacking集成來預測抽檢工序的不合格品。實驗表明,該方法具有更高的穩定性和不合格品檢出率的預測性能,相比于隨機抽檢,不合格產品檢出率提高了63%。

對于汽車零部件大批量生產、小樣本抽檢的不合格品檢出預測問題,雖然本文所提出的LXSMS集成學習方法性能優異,但是集成學習算法一直存在著模型訓練時間長的問題。未來需要針對制造業小樣本不平衡的數據集,研究更高效的模型訓練方法,以及更加實時穩定的模型應用策略。

猜你喜歡
產品質量方法質量
“質量”知識鞏固
質量守恒定律考什么
產品質量監督抽查的本質與拓展
加強PPE流通領域產品質量監督
勞動保護(2019年7期)2019-08-27 00:41:04
做夢導致睡眠質量差嗎
“望聞問切”在產品質量鑒定工作中的應用
產品質量好 認證不能少
新農業(2016年20期)2016-08-16 11:56:22
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
質量投訴超六成
汽車觀察(2016年3期)2016-02-28 13:16:26
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
主站蜘蛛池模板: 亚洲综合网在线观看| 午夜精品久久久久久久99热下载| 亚洲资源站av无码网址| 99人妻碰碰碰久久久久禁片| 找国产毛片看| 一级不卡毛片| 成人午夜亚洲影视在线观看| 一区二区偷拍美女撒尿视频| 久久综合色视频| 亚洲精品国产日韩无码AV永久免费网| 一级毛片不卡片免费观看| 国产免费人成视频网| 成年A级毛片| 91精品视频在线播放| 国产精品偷伦在线观看| 一级毛片a女人刺激视频免费| 毛片免费高清免费| 国内精品视频区在线2021| 久久久久久久久18禁秘| 欧美日韩国产精品综合| 国产亚洲欧美日韩在线观看一区二区| 久草性视频| 无码网站免费观看| 国产一级在线播放| 亚洲人成成无码网WWW| 成年人福利视频| 国产免费久久精品44| 亚洲视频欧美不卡| 综合天天色| 91美女视频在线| 露脸一二三区国语对白| 亚洲精品天堂自在久久77| 久久不卡国产精品无码| 亚洲日本精品一区二区| 91视频区| 国产剧情一区二区| 欧美高清国产| 国产精品观看视频免费完整版| 欧美成一级| 青青草国产在线视频| 亚洲国产在一区二区三区| 亚洲精品无码久久久久苍井空| 夜夜爽免费视频| 国产欧美精品一区二区| 成人在线观看不卡| 亚洲一级毛片在线观播放| 亚洲天堂成人在线观看| 国产一区成人| 九色在线观看视频| 久久一级电影| 9久久伊人精品综合| 午夜一级做a爰片久久毛片| 四虎精品国产永久在线观看| 尤物午夜福利视频| 国禁国产you女视频网站| 国产精品原创不卡在线| 国产精品久久国产精麻豆99网站| 看国产一级毛片| 国产国产人免费视频成18| 欧美另类精品一区二区三区| 亚洲一欧洲中文字幕在线| 色精品视频| 免费av一区二区三区在线| 精品91视频| 国产h视频免费观看| 国产97公开成人免费视频| 国产精品久久久久久久久久久久| 91精品国产自产在线观看| 欧美一级在线播放| 国产美女自慰在线观看| 国产高颜值露脸在线观看| 无码丝袜人妻| 国产一级α片| 成人欧美在线观看| 狠狠亚洲婷婷综合色香| 国产黄网站在线观看| 久久99国产视频| 久久久波多野结衣av一区二区| 国产一在线| 国产成人无码播放| 国产微拍一区二区三区四区| 精品一区二区三区波多野结衣|