賽題背景
對生產設備的維護,傳統的做法主要有兩種:一種是等故障發生后再維修,但這會導致非計劃性的停產,經濟損失大;第二種是按固定計劃進行維護,但維修成本高,停機時間長。預測性維護,則通過分析故障歷史數據和實時監測數據,對設備關鍵部件的剩余壽命或故障進行提前預測預警,并據此進行維護維修,從而減少設備非計劃停機時間、降低維護成本。
砼活塞是混凝土泵車的關鍵部件,也是消耗性部件,砼活塞故障將導致泵車無法正常工作,同時可能導致整個工地其他配套設備無法正常施工,從而帶來相當大的經濟損失。砼活塞壽命與設備的具體工況等密切相關,通過物聯網將泵車的實時工況數據等上傳至工業互聯網云平臺,基于積累的數據建立合適的模型,有望對砼活塞在未來一定工作任務期間內可能出現的故障做出有效的預測預警,從而提醒作業人員在施工前進行必要的維護,避免因計劃外停機而帶來的經濟損失。
任務描述
本賽題由中科云谷提供某類混凝土泵車砼活塞故障有關的數據,包括工作時間、發動機轉速、油溫、壓力等多類工況數據,以及對應情況下,在未來完成給定工作量(混凝土泵送方量)的過程中,砼活塞是否故障的標識信息。希望參賽者利用大數據分析、機器學習、深度學習等方法,提取合適的特征、建立合適的故障預測模型,再根據測試數據預測該活塞在未來給定工作量內(泵送方量),是否會發生故障。
賽題內容和方向
大多數參賽選手可能對混凝土泵車這種工程機械不太了解,砼活塞就可能更陌生了。混凝土泵車的作用,主要是將混凝土泵送到工地的具體施工點,比如在框架結構的樓房施工過程中,支模板、綁鋼筋后,澆筑混凝土就主要是由混凝土泵車完成的。砼缸則是泵車將混凝土泵送到高處施工點進行澆筑的動作主體,砼缸里面的活塞就是砼活塞。主油泵的動力傳送到砼活塞上,活塞推動混凝土通過輸送管到達澆筑位置。
因此,可以說,砼活塞是在泵車第一線干著最苦最臟的粗活,其壽命總是有限的,還可能由于其他復雜的原因出現異常的故障。
中科云谷是工程機械行業最早開展物聯網應用研究實踐的團隊之一,基于中聯重科十余年的探索與積累,中科云谷工業互聯網平臺已經連接超過20萬套價值千億元級別的設備資產,采集超過9000余種數據參數,存量數據已達PB級別。
賽題價值
砼活塞看起來不起眼,卻是混凝土泵車的關鍵部件,也是消耗性部件。砼活塞故障不僅將導致泵車無法正常工作,由于在工地施工過程中,通常都會有多臺攪拌運輸車等多種施工設備配套以及多類施工人員共同工作配合,因為一個小小的砼活塞故障,可能導致整個工地臨時停止運轉,無法正常施工,從而帶來相當大的經濟損失。
本賽題是將大數據分析、機器學習技術應用到工程機械實際業務場景中的一次嘗試,賽題本身具有很好的實際應用價值,同時,對于探索成熟算法在復雜的實際場景中如何應用落地具有很好的啟示作用。
賽題難點
本賽題的特征數據字段包括:活塞工作時長、發動機轉速、油泵轉速、泵送壓力、液壓油溫、流量檔位、分配壓力、排量電流、低壓開關、高壓開關、攪拌超壓信號、正泵、反泵、設備類型。其中,活塞工作時長指的是新換活塞后的累積工作時長,屬于數值型。發動機轉速、油泵轉速、泵送壓力、液壓油溫、流量檔位、分配壓力、排量電流,均為泵車的對應工況值,也屬于數值型。低壓開關、高壓開關、攪拌超壓信號、正泵、反泵,都是開關量。設備類型指的是,該泵車的類型,屬于類別型。
這道題目的難點主要有:
1.特征字段原始數據存在缺失,為簡化賽題,數據在預處理的時候進行了填充,但某種程度的信息缺失仍然是實際存在的。
2.不同類型的設備,其工況不同,活塞壽命損耗情況可能不同,因此可能需要針對不同類型的設備分別建立模型。
3.測試數據中有一部分新的設備,其數據從來沒有在訓練數據中出現過(設備類型出現過),因此如果從訓練集隨機切分一部分樣本作為驗證集,驗證集效果可能不錯,但是在測試集上效果可能不如驗證集。本賽題這么設計,是因為在實際應用中就包含這樣的場景,新投入工作的設備,從來沒有過活塞故障記錄,但仍然希望對其可能的故障進行預測。是否可以將某些遷移學習的思想應用到本題中,需要選手們進行探索。
4.是否是原裝的砼活塞,其工作壽命和故障概率可能會不同。不排除某些混凝土泵車車主,在超過保修期后,更換時采用了非原廠出品的砼活塞,從而表現出不同的壽命。因此,僅僅根據累積工作時間來預測其故障,預測效果可能不會太高。
此外,由于工況數據的具體值都經過了一定的脫敏處理,即不完全是實際測量值,雖然盡量保留特征的相對關系,但不可避免地會有某些信息丟失。