蘇大鵬
摘 要:眾所周知,大數據平臺是以海量數據存儲為基礎,通過分布式實時計算引擎、在線數據分析以及離線批處理引擎提供數據的計算分析,通過大數據和人工智能技術,幫助用戶實現海量數據分析的任務。隨著工業互聯網的完善,工業大數據作為一種大數據的應用生態,得到了廣泛重視。然而,在工業互聯網環境下,如何從用戶角度出發,設計出技術細節透明、交互操作簡單、高效的工業大數據平臺及其上層應用,成為工業大數據開發和應用中的關鍵問題。
關鍵詞:工業大數據;結構;應用
工業大數據是指工業領域相關的海量數據,包括信息化數據、物聯網數據以及跨界數據,已成為新工業革命的核心動力。工業大數據是指在工業領域中,圍繞整個工業產品全生命周期所產生的各類數據以及相關技術和應用的總稱,分為企業信息化數據、工業物聯網數據和外部跨界數據等幾類,涵蓋工業產品研發過程中的設計資料、產品生產過程中的監控與管理、產品銷售與服務過程的經營和維護數據,具有數據量大、類型豐富、實時性強。
一、工業大數據的特點
工業大數據本身不僅具有廣義大數據的 3V 或4V 特點,還呈現出“多模態”、“強關聯”特點。
1、多模態。所謂多模態,是指非結構化類型工程數據,包括設計制造階段的概念設計、詳細設計、制造工藝、包裝運輸等大類業務數據,以及服務保障階段的運行狀態、維修計劃、服務評價等14大類數據。例如,在運載火箭研制階段,將涉及氣動力數據、氣動力熱數據、載荷與力學環境數據、彈道數據、控制數據、結構數據、總體試驗數據等。
2、強關聯。所謂強關聯,一方面是指產品生命周期的設計、制造、服務等不同環節的數據之間需要進行關聯,即把設計制造階段的業務數據正向傳遞到服務保障階段,同時將服務保障階段的數據反饋到設計制造階段;另一方面,在產品生命周期的統一階段會涉及到不同學科、不同專業的數據。例如,民用飛機預研過程中會涉及總體設計方案數據,總體需求數據,氣動設計及氣動力學分析數據,聲學模型數據及聲學分析數據,飛機結構設計數據,零部件及組裝體強度分析數據,多電系統模型數據,多電系統設計仿真數據,各個航電系統模型仿真數據,導航系統模型仿真數據,系統及零部件健康模型數據,系統及零部件可靠性分析數據等,這些數據需要進行關聯。
二、工業大數據體系結構
工業大數據平臺包含數據采集、存儲、加工、處理、分析等方面的功能,在很多應用場合中,還設置了數據分析及控制系統,以充分發揮大數據在預測、控制方面的作用,更好實現以大數據技術提高工藝精度或良品率的目的,工業大數據體系結構,決策與控制子系統采用數據挖掘、預測分析手段實現對生產的精確控制,是上層決策和控制的技術基礎,是實現智能制造的核心部分。數據建模聚焦于為工藝、設備、用戶等建立分析模型,設計并部署不同的應用系統,挖掘出特定的模式和知識,最終生成決策指令,實現生產流程的優化與產品生產的智能化。一般來講,工業大數據的來源涵蓋了生產、銷售、管理、市場等方面的數據,應根據數據來源的不同,在組建工業互聯網的基礎上,設計合適的數據采集與交換系統。目前,由于已經有了較為成熟的數據采集與數據預處理及存儲技術,工業大數據的主要技術難點在于如何準確采集數據,準確處理結構化、半結構化數據,如何設計和實現成熟的挖掘算法,這是工業大數據走向成熟、實現其應用價值的關鍵。此外,與企業已有的 ERP 系統進行互聯,充分整合和利用現有各類系統的數據,也是工業大數據平臺的一個重要功能。
三、工業大數據的功能
工業大數據是配置和利用大數據這一資源的平臺及其應用系統,其功能主要表現在如下方面:促進工業大數據應用。構建工業大數據平臺來推動數據的融合和應用,有利于通過工業大數據來分析和預測市場需求,整合產業鏈和價值鏈,為用戶提供定制化產品和服務,實現工業生產模式和服務體系的創新。挖掘工業大數據的潛在價值,實現工業大數據增值,促進工業大數據的應用。工業大數據應用服務平臺通過對企業生產過程的優化,引導企業認識和利用數據,逐步培養企業的數據利用意識,不但能夠促使企業深入挖掘自身積累的工業數據,而且可以充分利用其它企業的大數據來推進企業自身發展,增強企業應用大數據的動力。通過大數據采集、存儲、分析、交易過程中的一系列專業化服務,將有效拓展大數據產業的市場容量,有利于培育出一批專業化的大數據開發和服務公司,吸引第三方數據服務商向工業大數據領域聚焦,更好地體現出工業大數據的應用價值。
提升工業大數據配置效率。很多企業由于規模、資金、人才等方面的原因,缺乏充分利用大數據的技術手段和交易平臺,導致對自身擁有的數據采集、存儲、分析等處于較低水平。工業大數據平臺能夠通過提供數據采集、清洗、確權、產品開發等服務,使數據得以資產化,讓其價值得到充分體現。
四、工業大數據關鍵技術
1、多時間尺度數據綜合分析,與傳統商務智能BI應用場景不同,工業大數據包括秒/小時尺度的機器工況數據、天/周尺度的車間調度數據和月/年尺度的管理決策數據,在工業大數據應用中不同時間尺度的工業數據需要綜合使用才能驅動智慧企業。例如,智慧礦山企業需要根據跨界數據預測礦石品質需求,依據品質需求生成裝備作業計劃,根據裝備作業計劃實時控制裝備操作。
2、專業分析算法與構件。針對時間序列、時空等弱結構化數據,應提供豐富的特征模板庫,方便對典型物理事件如風速平穩時段、發電機轉速快速下降、環境溫度逐漸上升等進行描述;另外,還應提供豐富的時間序列、時空模式、序列模式的深度挖掘算法庫,提升工業數據分析的建模效率。
3、實時交互分析。工業大數據分析必須能夠滿足大規模、分散控制和交互迭代等需求。在實時處理上,傳統的商業數據分析系統不能有效支持面向大規模數據狀態下的低等待時間復雜事件檢測。在離線分析上,查詢檢索與分析建模應緊密協同,同時前臺探索展現與工業大數據平臺要無縫整合,支持大數據集上的交互挖掘。
4、遺留算法并行化。針對重要的應用需求,工業企業通常具有一定的分析工具和科學計算軟件積累,然而這些工具通常沒有考慮大數據架構。如何有效重用這些分析算法工具,是工業大數據分析應用不能回避的技術問題。
5、領域知識自動化。工業大數據中存在著大量的非結構化數據,將當前深度學習、自然語言處理等人工能力融入到工業大數據分析中來,可以有效輔助把專家知識進行有效的沉淀、萃取和自動化。
總之,我國不僅是制造大國更是使用大國,在裝備應用過程中產生的海量機器數據正是工業大數據的主體,為我國智能制造創新發展提供了獨特而豐富的戰略資源;同時,對于國計民生息息相關的裝備制造業而言,工業大數據更是事關國家安全與主權。工業大數據是一個正在發展的學科領域,在內涵外延、模型理論、技術方法及其實施策略等方面,我國和國際巨頭處在同一起跑線上。必須緊密結合中國國情認真實踐,加大投入,快速研發,走出中國工業大數據自主發展之路,實現國產化工業大數據技術。
參考文獻:
[1] 賀紅燕. 基于大數據的智能電網關鍵技術研究[J]. 電源技術, 2016,40(8):14.
[2] 冉亮,李煒,孫向聚. 基于大數據技術的智能電網系統應用研 究[J].自動化與儀器儀表,2017,(9): 13.
[3] 孟祥萍,周 來,王 暉. 云計算技術在未來智能電網信息處 理平臺中的應用[J].計算機測量與控制,2017,23(10).