李 軍
(上海寶信軟件股份有限公司,上海 201203)
目前深度學習和聚類分析已經廣泛應用于工業生產中,深度學習主要應用于圖像識別、語音識別等方面,是生產控制和工藝研究的一個輔助手段。聚類分析作為無監督學習的關鍵技術也被廣泛應用于工業生產,主要是發現數據間內在結構的相關性,完成自主分類。兩類技術的集成應用也越來越多,如楊琪設計的DBNOC算法,在工業生產領域也有應用,如趙晶晶等提出一種將深度學習、聚類算法結合用于電網快速分區。
鋼鐵行業是中國經濟高質量發展的重要支撐,如何對鋼鐵行業進行精準的優化控制以及趨勢預測至關重要。鋼鐵企業生產過程時刻都在產生海量數據,例如煉鐵高爐各項指標及工藝參數,這些數據規模大、實時性強、結構多樣且維度高,需要及時高效地從中挖掘出關鍵特征指標,通過聚類生成高爐畫像,并通過對標找差的方式實現對高爐生產狀況的精準把控。該文借鑒Lim等人的設計思路,采用有監督學習和無監督學習結合的方式,將各高爐指標數據先抽象化為高維空間中的點,再映射到低維流形中進行聚類,解決了聚類過程中由于指標數量龐大且屬性分布分散帶來的指標權重難以量化分配的問題。
高爐指標聚類算法模型以高爐畫像中高維數據作為輸入,最終輸出結果用以支撐高爐對標管理實際應用需要,主要流程包括數據預處理、特征工程、算法建模及訓練、模型驗證上線及模型自學習等,其總體流程如圖1所示。……