董曉洋 甄業安 徐丙海

摘要:隨著智能制造新時代的到來,工業大數據應用作為企業創新和變革的主要驅動力正受到關注?但是,及時,可靠和準確的高質量數據是工業大數據有效性的前提一首先,我們將梳理工業大數據的基本特征和我們面臨的數據質量問題,研究和分析工業大數據的質量控制方法,最后是工業大數據質量控制的主要工作方向提出初步建議。
關鍵詞:智能制造背景;工業大數據:數據質量控制
前言:在諸如互聯網技術,物聯網技術,云計算技術和大數據技術等先進技術不斷發展的背景下,工業生產正逐漸變得智能化。在這種背景下,數據逐漸成為工業制造公司的核心價值之一。數據分析的利用率越高,公司的運營和開發效率就越高,生產效率也就越高。在智能制造的背景下,大數據正在慢慢改變生活方式和生產方式,并在一定程度上改變了工業制造商的運營模式。基于此,在智能制造的背景下,有必要對工業大數據的數據質量管理策略進行研究。
一、工業大數據特征及其數據質量定義
(一)工業大數據的特征
智能制造環境下的工業大數據展現了大數據的典型“4V”特征。這體現在四個方面:第一,數據量大(Volume)。對于某些企業而言.對設備感知數據的廣泛訪問甚至可以達到EB級。第二,高速生成(Velocitv)。該設備高速運行,數據生成和收集的頻率(機器功率,動態切削阻力,主軸振動,扭矩等)可以達到幾毫秒。第三,模態多樣(Varietv)。工業大數據的種類繁多,包括結構化的(產品開發,人員,財務,生產,供應,營銷,客戶,用戶等)和半結構化的(HTML頁面,XML文本,報表等)。和非結構化(工況,文檔,圖形,音頻和視頻等)數據。第四,價值密度低(Value)。工業大數據的價值密度分布非常不均勻。有一個“二八法則”。20%的結構化數據占價值密度的80%,而80%的非結構化數據僅占價值密度的20%。價值密度低但高價值。此外,工業大數據還具有數據之間的強大關聯性,動態的多個時空時間序列以及對實時數據收集,存儲和處理的高要求。
(二)工業大數據的數據質量定義
在智能制造的背景下,工業大數據是CPS (Cvber PhvsicalSvstem)的輸入原材料,中間產品和最終產品。工業大數據的質量可以定義為:工業大數據的質量特征集可以滿足產品,設計,制造,過程制造,銷售和維護的需求。工業大數據的數據質量特性與特定的應用對象有關,并且可以通過一組維度進行測量。核心指標可以包括以下方面:
1.數據精確性:刻畫數據的測量值與實際值之間的一致性程度。例如,如果實際環境溫度數據為24.8。C,而測量值為23。C,則該數據偏差較大,精度不夠。
2.數據完整性:刻畫數據支持各種應用程序,可以跟蹤源,并且在某種程度上沒有遺漏。例如,由于傳感器或鏈接故障而導致一段時間內缺乏生產過程數據可能會導致數據分析出現偏差。
3.數據一致性:刻畫數據和關聯邏輯關系的兼容性程度中沒有語義錯誤。例如,在設備帳戶信息中,設備A的代碼被錯誤地記錄為設備B的代碼。
4.數據實效性:刻畫數據符合應用時效要求的程度。
5.數據實體同一性:刻畫同一實體在不同信息記錄中擁有同一標識的程度。例如,同一物料存在的“多碼”的問題。
二、工業大數據的數據質量管理面臨的挑戰
在智能制造的背景下,工業大數據與傳統數據有很大的不同。這主要體現在數據收集速度,數據分析過程,數據存儲和數據質量管理上,從而帶來了重大挑戰。表l是工業大數據和常規數據的對比分析表。
從表1中可以看出,與傳統數據相比,工業大數據的結構更加復雜,范圍更廣。因此,數據質量問題傾向于通過某些控件發生,并且主要體現在以下幾個方面:
首先,在數據收集方面,工業大數據源范圍更廣,結構也有所不同。不同數據源之間存在某些沖突和矛盾。如何保證數據管理的完整性和管理質量的可靠性非常重要;其次,工業大數據規模非常大,在獲取,存儲,計算以及與大數據的其他鏈接時會出錯。傳統的手動錯誤檢測方法無法處理大規模數據檢查,也無法快速找到有問題的數據。因此,不可能及時提取有效,有價值的數據;再次,生成數據既快速又復雜,因此更容易創建不一致的數據;最后,有不同類型的數據源,并且有多種類型的結構化數據。結果,在不同的數據源和相同的數據源之間可能會發生沖突和不一致。此外,數據質量控制需要在多個部門之間進行協調,從而大大增加了發生數據處理問題的可能性。
三、智能制造背景下工業大數據的數據質量控制對策
(一)構建數據質量評價體系
完善系統的質量評估體系是確保大數據質量控制水平的關鍵。在智能制造的背景下構建工業大數據數據質量評估系統需要從完整性,一致性和準確性三個方面同時考慮。
(二)全面落實數據質量信息的采集、分析與監控
可以對收集的數據源執行質量分析,以充分了解和掌握生產數據的質量。通過與過去的數據進行比較,可以評估數據質量控制的質量,并可以針對現有問題開發有效的解決方案,從而可以逐步提高工業大數據的數據質量控制水平。
(三)建立數據質量的持續改進工作機制
導致數據質量問題的四個主要問題域影響了工業大數據。主要是:信息問題領域,技術問題領域,過程問題領域,管理問題領域。無論出現什么問題,都會引起數據質量問題。因此,如果發現了數據質量問題,則應該系統地分析問題的根本原因。
結語:綜上所述,文章基于理論實踐,分析了智能制造環境下工業大數據的數據質量控制措施。分析結果表明,在工業生產中,數據質量控制是在整個數據生命周期中執行的,并且包含很多內容。在這種背景下,工業大數據爆炸性增長,對數據質量管理技術和方法提出了更高的要求,以應對當前工業生產中大數據的數據質量管理所面臨的挑戰。
參考文獻:
[1]王振環,基于智能制造背景下的質量大數據[J].智能制造,2018 (08):3638.
[2]段成,智能制造背景下工業大數據的數據質量控制探討[J].機械設計與制造工程,2018,47 (02):13-16.