潘建雙
(首鋼京唐鋼鐵聯(lián)合有限責(zé)任公司信息計量部,河北唐山 063200)
隨著工業(yè)智能化的不斷發(fā)展,智能制造熱潮持續(xù)升溫,不同類型的數(shù)據(jù)量呈現(xiàn)指數(shù)增長,但采集到的數(shù)據(jù)準(zhǔn)確性確難以得到保障。因此,需要對采集的數(shù)據(jù)進行實時監(jiān)測,將數(shù)據(jù)采集[1]過程中的異常數(shù)據(jù)識別出來進行及時處理。本文運用控制圖的判異準(zhǔn)則和軌道衡皮重歷史計量數(shù)據(jù)建立數(shù)據(jù)動態(tài)識別模型,用以自動快速識別實時計量數(shù)據(jù)是否正常,以保證軌道衡計量數(shù)據(jù)的準(zhǔn)確性,并通過在軌道衡的應(yīng)用,來輻射冶金及其他行業(yè)數(shù)據(jù)監(jiān)測領(lǐng)域,為識別不同領(lǐng)域的不同類型數(shù)據(jù)提供可靠的技術(shù)支持。
選用一臺軌道衡進行實驗,通過采集該衡器的皮重歷史計量數(shù)據(jù),并按月、季度和年進行歸納和整理,計算皮重的平均值和標(biāo)準(zhǔn)差,來確定控制圖的中心線、制上限以及控制下限,用于識別軌道衡測量的實時計量數(shù)據(jù)中的異常數(shù)據(jù)。當(dāng)識別過程達到預(yù)設(shè)的更新閾值時,對控制圖進行更新,獲得控制圖新的中心線、控制上限以及控制下限,并運用新的控制圖識別軌道衡測量的實時計量數(shù)據(jù)中的異常數(shù)據(jù),以實現(xiàn)對計量數(shù)據(jù)的實時識別,并在軌道衡計量系統(tǒng)中進行顯示、控制與處理。其次,根據(jù)每個月的歷史計量數(shù)據(jù)和計算出的結(jié)果調(diào)整控制上、下限,直至確定常規(guī)皮重的波動范圍。
以9月的歷史計量數(shù)據(jù)為例,利用六西格瑪工具計算出控制圖的中心線、控制上限以及控制下限。其中,有中心線=,控制上限UCL=+Nσ,控制下限LCL=-Nσ,
為歷史計量數(shù)據(jù)的均值,N表示倍數(shù),σ表示歷史計量數(shù)據(jù)的標(biāo)準(zhǔn)差;控制限常規(guī)為均值的3倍標(biāo)準(zhǔn)差,但歷史計量數(shù)據(jù)為皮重數(shù)據(jù),基于該皮重數(shù)據(jù)的歷史計量數(shù)據(jù)中的異常數(shù)據(jù)比例進行分析可確定N的最優(yōu)取值為4,即控制限為均值的4倍標(biāo)準(zhǔn)差,識別效果如圖1。

圖1 9月數(shù)據(jù)不同倍數(shù)下識別結(jié)果及驗證Fig.1 Identification results and verification at different multiples of September data
獲取軌道衡的第一歷史計量數(shù)據(jù),基于第一歷史計量數(shù)據(jù),確定控制圖的第一中心線、第一控制上限以及第一控制下限。基于第一中心線、第一控制上限以及第一控制下限,識別軌道衡測量的第一實時計量數(shù)據(jù)中的異常數(shù)據(jù)。當(dāng)識別過程達到預(yù)設(shè)的更新閾值時,獲取軌道衡的第二歷史計量數(shù)據(jù),對控制圖進行更新,獲得控制圖的第二中心線、第二控制上限以及第二控制下限。基于第二中心線、第二控制上限以及第二控制下限,識別軌道衡測量的第二實時計量數(shù)據(jù)中的異常數(shù)據(jù)。
第一歷史計量數(shù)據(jù)可為毛重或皮重;具體的,第一歷史計量數(shù)據(jù)表示一段時間內(nèi)的所有歷史數(shù)據(jù),例如可為1周(7日)內(nèi)測量獲得的數(shù)據(jù),1個月(或30日)內(nèi)測量獲得的數(shù)據(jù),一個季度內(nèi)測量獲得的數(shù)據(jù),1年(或365日)內(nèi)測量獲得的數(shù)據(jù)。
第二歷史計量數(shù)據(jù)中包含第一實時計量數(shù)據(jù)。具體的,第二歷史計量數(shù)據(jù)可完全由第一實時計量數(shù)據(jù)構(gòu)成,也可由部分第一歷史計量數(shù)據(jù)和第一實時計量數(shù)據(jù)構(gòu)成。
當(dāng)?shù)谝粴v史計量數(shù)據(jù)和第二歷史計量數(shù)據(jù)均為30日的計量數(shù)據(jù)時,預(yù)設(shè)的更新閾值為15日,則第二歷史計量數(shù)據(jù)由15日的第一歷史計量數(shù)據(jù)和15日的第一實時計量數(shù)據(jù)構(gòu)成,這樣可以保留第一歷史計量數(shù)據(jù)的特征,并包含第一實時計量數(shù)據(jù)的特征,保證控制圖更新的連續(xù)性,提高了識別的準(zhǔn)確度。
更新閾值可為第一歷史計量數(shù)據(jù)的計量時長,也可為第一歷史計量數(shù)據(jù)計量時長的1/2、1/3、1/4等,不作限制;此時識別過程達到預(yù)設(shè)的更新閾值表示識別時間達到預(yù)設(shè)的更新閾值。另外,更新閾值還可為實時計量數(shù)據(jù)的數(shù)量,例如更新閾值為10條實時計量數(shù)據(jù)、100條實時計量數(shù)據(jù)、1000條實時計量數(shù)據(jù),等;此時,識別過程達到預(yù)設(shè)的更新閾值表示識別數(shù)量達到預(yù)設(shè)的更新閾值。
第一數(shù)據(jù)獲取模塊,用于獲取軌道衡的第一歷史計量數(shù)據(jù);
控制圖構(gòu)建模塊,用于基于所述第一歷史計量數(shù)據(jù),確定控制圖的第一中心線、第一控制上限以及第一控制下限;
第一識別模塊,用于基于所述第一中心線、所述第一控制上限以及所述第一控制下限,識別所述軌道衡測量的第一實時計量數(shù)據(jù)中的異常數(shù)據(jù);
第二數(shù)據(jù)獲取模塊,用于當(dāng)識別過程達到預(yù)設(shè)的更新閾值時,獲取所述軌道衡的第二歷史計量數(shù)據(jù);其中,所述第二歷史計量數(shù)據(jù)中包含所述第一實時計量數(shù)據(jù);

表1 數(shù)據(jù)動態(tài)實際識別結(jié)果表Tab.1 Data dynamic actual identification results table
控制圖更新模塊,用于基于所述第二歷史計量數(shù)據(jù)對所述控制圖進行更新,獲得所述控制圖的第二中心線、第二控制上限以及第二控制下限;
第二識別模塊,用于基于所述第二中心線、所述第二控制上限以及所述第二控制下限,識別所述軌道衡測量的第二實時計量數(shù)據(jù)中的異常數(shù)據(jù)。
選擇一臺軌道衡,采集其每月皮重歷史計量數(shù)據(jù)。利用采集的皮重計量數(shù)據(jù)構(gòu)建控制圖,并對控制圖進行不斷的更新,來構(gòu)建初始數(shù)據(jù)動態(tài)識別模型。將構(gòu)建的數(shù)據(jù)動態(tài)識別模型固化在計量系統(tǒng)中,對計量數(shù)據(jù)進行實時識別。具體識別結(jié)果如表1。
在表中,下劃線黑體的數(shù)據(jù)為識別出的異常數(shù)據(jù)。
通過運用該數(shù)據(jù)識別方法對輸入的實時皮重計量數(shù)據(jù)進行識別,識別的準(zhǔn)確率可達到100%。同時,此方法可對毛重和凈重進行識別,將自動識別出的異常計量數(shù)據(jù)在軌道衡計量系統(tǒng)中進行顯示。因此,此方法可為識別不同領(lǐng)域的不同類型數(shù)據(jù)提供可靠的技術(shù)支持。