

摘要:為了解決工業生產數據集成結果可信度較低的問題,文章基于關聯規則算法的工業生產數據智能集成方法展開研究:統一定義各數據源中的狀態信息和位置信息描述形式,完成對工業生產數據冗余的預處理;以車間為關聯規則的制定基礎,同時考慮不同數據的獨立性和特異性,細化生產服務節點,借助生產制造任務對生產服務節點之間的邏輯關系加以描述,實現對數據的集成。測試結果證明,集成數據的查準率和召回率始終穩定在0.9以上,具有較高的可信度。
關鍵詞:關聯規則算法;工業生產數據;智能集成;數據冗余;生產服務節點;邏輯關系
doi:10.3969/J.ISSN.1672-7274.2023.06.018
中圖分類號:TP 399" " " " " "文獻標志碼:A" " " " " " "文章編碼:1672-7274(2023)06-00-03
Abstract: In order to solve the problem of low reliability of industrial production data integration results, this paper conducts research on intelligent integration methods of industrial production data based on association rule algorithms: Uniformly define the description form of state information and position information in each data source, and pre-process the redundancy of industrial production data; Taking the workshop as the basis for the formulation of association rules, taking into account the independence and specificity of different data, the production service nodes are refined, and the logical relationship between the production service nodes is described with the help of manufacturing tasks to achieve data integration. The test results proved that the accuracy and recall rate of the integrated data were always stable above 0.9, with high confidence.
Key words: association rule algorithm; industrial production data; intelligent integration; data redundancy; production service node; logical relationship
隨著信息技術的不斷發展,以工業生產為基礎的多元化數據系統建設逐漸加快[1,2]。針對不同應用環境與信息系統中的信息,建立合理有效的存儲、轉換以及共享管理機制成為極為重要的工作內容之一[3]。受到數據間異構性的影響,在某種程度上,數據的異構性增加了訪問相關數據過程的復雜程度和時間成本[4],為數據管理帶來了一定的困難[5]。在此基礎上,本文基于關聯規則算法,設計工業生產數據智能集成方法。
1" 工業生產數據智能集成方法設計
1.1 工業生產數據冗余處理
為了保障后續工業生產數據智能集成的可靠性,對于采集到的工業生產車間實時數據進行冗余處理是十分必要的[6]。分析該操作的本質,其主要是對數據采集中的無效數據加以清除,通過這樣的方式實現在不影響工業生產數據真實映射的基礎上,最大限度縮減數據采集和傳輸階段的粒度大小[7]。在具體的執行過程中,本文以數據的相關度融合為基礎,實施對無效冗余信息的處理。假設在工業生產車間中,物理車間RFID、環境傳感器對于各類設備數據的展現形式均為數據流,那么其分別可以表示為
式中,為物理車間RFID中的數據信息;為環境傳感器采集到的數據信息;為生產設備的運行狀態數據信息;為RFID標簽的唯一編碼信息;為RFID讀寫器和天線編號信息;為環境傳感器編號信息;為環境傳感器的感知范圍參數;為環境傳感器采集到的數據信息;為工業生產車間的設備編號信息;為工業生產車間設備所在區域信息;為生產車間設備狀態的數據集合參數;t為讀取生產車間數據對應的時間參量。在此基礎上,本文通過定義某狀態信息,以位置信息將式(1)~式(3)中的數據進行統一化描述,其可以表示為
式中,為統一化描述后的生產車間數據信息;為編碼信息;為位置信息。按照這樣的方式,對于任意數據采集設備而言,在任意時間段內,形成的原始數據形式均為式(4)。當數據狀態不發生改變時,僅起始時刻和結束時刻的數據具有集成價值[8]。以此為基礎,對于數據狀態不改變時間段內無效數據的處理流程如圖1所示。
按照圖1所示的方式,根據數據編碼信息對當前生產的狀態進行搜索,通過比較不同時間對應狀態參數,確定其是否為冗余數據,實現數據的預處理,為后續的數據集成提供可靠基礎。
1.2 基于關聯規則算法的數據集成
以空間尺度和單元級為基礎,對車間生產任務特征進行提取,組合車間內的元素,以動態的形式描述整個物理車間的狀態[9]。對生產服務節點之間的關系加以描述,根據生產任務、計劃,對物理車間的邏輯關系進行實時描述,此時生產任務進行動態調整帶來的最直接影響就是物理車間也會相應地發生狀態改變。除此之外,按照空間尺度關聯規則進行數據集成。空間對象構成的多個生產服務節點以及生產服務節點之間的活動組成最終的物理車間。
考慮到不同數據的獨立性和特異性,本文對生產服務節點進行細化,分別劃分為流動生產服務節點、工位生產服務節點,以及緩存生產服務節點。此時整個物理車間數據之間的關系可以表示為
式中,為整體物理車間的狀態數據信息;為流動生產服務節點的狀態數據信息;為工位生產服務節點的狀態數據信息;為緩存生產服務節點的狀態數據信息。生產服務節點自身的動態特性決定了物理車間狀態數據信息中,各生產服務節點的空間關系也是以相對變化的形式存在的。針對此,本文借助生產制造任務對生產服務節點之間的邏輯關系加以描述。那么車間生產數據可以集成為
2" 測試與分析
2.1 測試環境
以某數字孿生車間為基礎開展對比測試,對于測試數字孿生車間生產數據的實時采集等相關功能是通過3個子系統實現的。利用OPC UA服務器實現整個車間的信息傳輸和交互,利用Demo3D可視化仿真軟件實現對車間時間運行情況的模擬和監控,利用總體管理系統實現對生產數據的存儲和管理,并具有延伸性和拓展性,確保其運行參數可實現靈活調整。
分別采用本文所提出的設計數據集成方法以及文獻[2]提出的以機器學習為基礎的數據集成方法、文獻[3]提出的以大數據為基礎的數據集成方法開展對比測試。在測試過程中,通過差異化設置生產數據的異構程度,統計不同方法的集成效果。
2.2 測試結果與分析
以上述測試環境為基礎,分別統計不同數據集成方法下,對于測試數據的管理效果。在評價指標設置方面,本文分別以查準率和召回率作為基準,二者的計算方式分別可以表示為
式中,為查準率;為召回率;為數據集成中未建立的匹配結果;為數據集成中實際為正確的卻預測為錯誤的匹配結果;為數據集成中實際為錯誤的卻預測為正確的匹配結果。結合上述的評價指標設置情況可以看出,集成方法的查準率越高,則對于工業生產數據集成效果的可信度也就越高;集成方法的召回率越高,則對于工業生產數據集成效果的準確性也就越高。以此為基礎,得到的測試結果如表1所示。
結合表1中測試結果對三種不同方法的數據集成效果進行分析,其中機器學習集成方法的集成效果受數據本體異構數量的影響較為明顯,當數據本體異構數量在15以下時,對應的查準率在0.8以上,而當數據本體異構數量在18以上時,查準率下降至0.80以下,最小值僅為0.72(數據本體異構數量為20時)。不僅如此,召回率也表現出了隨著數據本體異構數量的增加顯著下降的趨勢。當數據本體異構數量為4時,召回率為0.902。當數據本體異構數量為20時,召回率下降至0.870。大數據集成方法的測試結果與機器學習集成方法相比表現出了更高的穩定性,但是其整體水平存在進一步提升的空間,在測試過程中,查準率的區間范圍為0.862~0.846,召回率的區間范圍為0.886~0.866。相比之下,在本文所提出的設計集成方法的測試結果中,不僅查準率和召回率始終穩定在較高水平,并且并未受到數據本體異構數量的明顯影響,當數據本體異構數量為20時,查準率分別高于對照組0.181和0.155,召回率分別高于對照組0.03和0.034。綜合上述測試數據以及對比結果可以得出結論,本文基于關聯規則算法的工業生產數據智能集成方法可以實現對多源化工業生產數據的有效管理,具有良好的應用價值。
3" 結束語
本文所提的基于關聯規則算法的工業生產數據智能集成方法,充分考慮了在實際工業生產過程中輸出數據信息的多源化特征,結合其自身的獨立性與分布情況,對數據進行集成處理。設計集成方法不僅顯著提高了工業數據的管理效率,同時也降低了數據訪問階段操作的復雜性,大大提高了數據在利用階段的訪問便捷性。
參考文獻
[1] 徐德馨,彭漢發,肖杰,等.城市全空間三維模型數據一體化集成管理關鍵技術及應用[J].地質科技通報,2023(1):388-397.
[2] 詹勝,楊先睿,曹湘華.基于機器學習的鉆井工程設計文檔識別及數據集成系統研究[J].中國信息化,2023(1):65-67.
[3] 黃勇光,黃兵.基于大數據技術的電力分區多源異構數據集成系統設計[J].電子設計工程,2023(2):34-37,42.
[4] 張莉,丁毛毛,李瑋,等.基于決策樹算法的客服終端冗余數據迭代消除方法[J].計算技術與自動化,2022(4):118-122.
[5] 張維,張浩晨.一種基于最優集成隨機森林的小樣本數據特征提取方法[J].西北工業大學學報,2022(6):1261-1268.
[6] 楊杰,王茜.E-Science環境下高校圖書館科研數據的集成管理與共享模型研究[J].河南圖書館學刊,2022(11):62-66.
[7] 覃俊霖,楊雪薇.基于大數據技術和多源數據集成的經濟運行平臺建設與探析[J].長江信息通信,2022(11):93-96.
[8] 張振山,肖聲,郝明明.城市軌道交通綜合調度指揮系統自感應數據集成方案的實現[J].城市軌道交通研究,2022(10):224-227.
[9] 張留留,賀震,何鳴一,等.基于服務調用和消息隊列的營配數據集成方法及實現[J].電工技術,2022(18):116-120.