李祥東 牛牧 孫君甫 王磊
(中車長春軌道客車股份有限公司質量管理部 吉林省長春市 130000)
傳統的軌道交通質量管理方法致力于質量的控制和診斷,主要是事后處理。一方面,隨著制造業信息化的深入,企業從日常的生產活動中,收集到大量的、雜亂的數據未能得到充分利用,大多只停留在對數據的簡單統計與圖表的顯示[1],缺少進一步的挖掘及利用隱藏在數據背后的有用信息,不能利用科學的數據計算模型自動給出改進機會,無法對公司質量改進活動提供支撐。
目前,國內外學者對于電力、機械加工等其他質量管理都有著廣泛而深入的研究,但鐵路質量改進自動識別的研究仍然較少。企業現有質量改進主要以過程和運營的重大質量問題為導向開展,對系統內已積累的大量進貨、過程、運營等實物質量問題缺少進一步的挖掘及利用,不能利用科學的數據計算模型自動給出改進機會,無法對公司質量改進活動提供支撐。
針對企業質量管理活動的現狀及需求,本文將質量管理和數據挖掘技術結合,充分利用企業得到大量的質量數據,建立數據模型,挖掘出有利于提高產品質量,降低產品不合格率[1-5],實現對已有質量數據定期自動化分析,識別改進機會,自動推送責任部門,對改進效果進行驗證、評價。將改進模型引入到生產中,發現改進機會,并注入到生產流程中,為質量改進提供數據決策支持。

圖1:系統技術流程

圖3:質量改進系統功能展示圖

圖4:模型預警結果
本文在對動車組的生產過程及售后運營等業務線的數據基礎上,基于hadoop 的大數據技術架構,JAVA、PYTHON,Oracle 數據庫等技術,構建業務實現的邏輯模型,開發和編碼相關的設計內容,包括各實現不同模塊的實體關系,業務流程,詳細用戶界面,模塊對外接口和對外依賴等,建立基于數據決策的質量改進系統,系統技術流程如圖1所示。
質量改進系統通過對動車組的生產過程及售后運營等業務線的數據按照業務需求對數據進行建立預警模型,建立起一套基于數據決策的質量改進系統,監督并幫助自主識別出質量改進機會,進行整改,并對整改效果進行評價,最后將質量改進機會推送給相關責任單位第一管理者,第一管理者指派整改人員進行整改。同時系統完成對質量相關數據較為全面收集,形成不同業務線的數據標準化,實現質量數據的統一管理,方便為決策層提供數據支撐,促使質量改進解決問題更科學化、規范化、標準化,降低產品不合格率,提高產品質量及生產效率,降低生產成本。
系統設計要充分考慮對日常大量數據交互、運算在速度上和穩定性上的要求,同時能夠整合現有各類信息資源,以適應生產任務管理的需求,滿足穩定性、安全性、擴展性、快速開發部署等要求。由于本系統人員權限與公司另一 QMS 系統相同,因此兩系統共用用戶管理,本項目不再單獨設計用戶權限相關內容。
根據大量動車組制造及售后運營的歷史數據,通過構建潛在質量改進機會及一系列評價指標來建立是否是質量改進機會的預警模型,進一步建立一個泛化度較高的智能質量改進分析模型,技術路線如圖2所示。
根據目前動車組現有大量歷史質量數據,確定業務對象,定義出業務挖掘目標。尋找所有與業務對象有關的數據,并從中選擇出適用于數據挖掘應用的原始數據[6]。原始數據中可能會有一些錯誤的或者缺陷的臟數據,對有問題的數據進行預處理,為進一步的分析建模做準備。為了便于挖掘,格式不統一要轉換為統一格式,非數值型數據要轉化為數值型,以便找出真正有用的特征變量。通過已有的字段,構造質量評價指標體系,以及潛在質量改進機會體系的特征。通過對現有字段指標的特征構建,建立預警規則模型。對建立的預警規則模型利用未參與建模的數據進行驗證評價,并將結果與實際情況進行比較。若在此過程發現模型不夠優化,可回到前面的步驟進行調整。

圖5:實際數據分布統計
由于數據池中的數據只記錄檢驗有問題的數據,故采用占比來評價潛在質量改進機會。現有數據池中沒有反應是質量改進機會的特征,需要人為標記,為更好直觀地把質量改進機會評價出來,定義6 個輸出目標特征:當日缺陷占比率、當日缺陷占近5日累計缺陷比率、當日缺陷占近15日累計缺陷比率、當日缺陷占近30日累計缺陷比率、近5日累計缺陷占近30日累計缺陷比率、近15日累計缺陷占近30日累計缺陷比率。通過數據探索分析及對數據庫現有數據字段分析,選取上述的6 個指標,既可通過現有字段獲得,又能評價質量改進機會,同時可對現有的非數值型字段進行無量綱化處理。構建的6 個有梯度的評價指標,來評價潛在質量改進機會是否是質量改進機會的概率。
質量改進機會綜合評價指標是判斷潛在質量改進機會是否是質量改進機會的綜合評價指標,它是潛在質量改進機會是否是質量改進機會的重要依據。綜合評價指標是基于權重系數特征分析前文的6 個評價指標進行求和得到的,通過綜合評價指標可用來自動識別質量改進機會模型的變量,其中,w1-w6 通過熵值法確定權重系數。質量改進機會綜合評價指標計算公式:
綜合評價指標=w1*當日缺陷占比率+w2*當日缺陷占近5日累計缺陷比率+w3*當日缺陷占近30日累計缺陷比率+w4*當日缺陷占近15日累計缺陷比率+w5*近5日累計缺陷占近30日累計缺陷比率+w6*近15日累計缺陷占近30日累計缺陷比率;
由于不同的缺陷等級,對問題不良的影響程度不一樣,故對綜合指標與缺陷等級再次進行權重相加,求出綜合指標。其中,w1,w2權重系數同樣通過熵值法求出。缺陷等級有A、B、C三個等級,根據實際生產過程,將缺陷等級離散化為百分比。具體的計算公式:
質量改進機會綜合評價指標 = w1*質量改進機會綜合評價指標+w2*缺陷等
探索質量改進機會綜合評價指標得數據分布,若為正態分布,質量改進機會動態閾值,依據3sigma 原則,把質量改進機會綜合評價指標偏離均值3 個標準差的數據判定為質量改進機會動態閾值。若不符合正態分布,采用切比雪夫不等式原理,將分布概率低于10%區間內的數據判定為質量改進機會動態閾值。
有了綜合指標及質量改進機會動態閾值,就可判斷潛在質量改進機會是否是質量改進機會,建立預警規則模型。若綜合指標>質量改進機會動態閾值,則自動判斷為是質量改進機會,觸發質量改進機會預警;反之,判斷為不是質量改進機會,則不會觸發預警。質量改進機會的迫切程度是為了判斷潛在質量改進機會是質量改進機會的優先迫切程度,公式為:質量改進機會的迫切程度=綜合指標-質量改進機會動態閾值。若是質量改進機會,迫切程度值比較大,則優先進行質量改進。
按照系統實現功能需求,建立質量改進管理和系統管理2 大模塊。質量改進管理中有質量改進系統首頁、質量改進機會查詢、改進機會整改、改進效果評價幾個功能版塊;系統管理有質量改進模型、改進效果評價周期設置、用戶管理、角色及權限管理幾個功能版塊。部分展示如圖3所示。
當開發完質量改進系統,運行系統,得到的模型結果如圖4所示。
以上結果中,潛在質量改進機會名稱是由“所屬系統”,“產品”,“缺陷類型”三個字段組成。
上面為自動識別改進機會模型測試的結果,可以看出,該潛在質量改進機會發生數量較多,質量改進機會綜合指標達到模型的閾值,發生模型預警,被判為質量改進機會(1-是質量改進機會;0-不是質量改進機會;),以及迫切程度的優先級。從結果可以看出,缺陷等級為B 的但數量不多的缺陷,也被識別出來。
為了對決策模型有效性進行檢驗,從新的未測試的數據庫隨機抽取1307 條歷史數據來測試訓練后的模型,分析當日最多的數據top10 分布,得到如圖5。
通過對模型結果圖4 對應的改進機會當日,5日,15日,30日的數據分布可知,“轉向架_轉向架_表面問題”在上述幾天分布中是數量最多的,其次是“轉向架_輪對軸箱組成_表面問題”數量也較多。當日數據量最多的,在連續累計的5日,15日,30日也是最多的,但除了模型結果圖4 對應的改進機會當日外,后續的一個月內數量幾乎沒增長,也就是說,模型結果圖4 對應的改進機會當日最多的問題,可能是偶發現象,或當日就把問題解決。
模型總體上來說,比較好的反映出質量改進機會的大部分特征,但由于部分數據記錄比較粗略,細化的內容在缺陷描述中,故部分潛在質量改進機會不能全面囊括缺陷特征,如果有更詳細的數據描述用于模型的驗證、評估與優化,該質量改進機會自動識別模型是可以提升其準確度與精確度的,讓相關責任部門更容易定位到具體的問題。
本文依據動車組企業實際需求,利用制造過程及售后運營中積累的大量質量歷史數據,構建質量改進評價指標體系,構建出自動推送質量改進機會的預警模型。在分析出的質量改進機會的前提下,建立基于數據決策的質量改進系統,為企業的產品質量持續改進提供了一定程度的數據支持。經實際數據檢測,該模型所達到的準備率可滿足企業是否自動所識別出潛在質量改進機會是否是質量改進機會及其影響因素診斷決策需求,所獲得的規則對質量管理提供一定指導作用,證明了模型的有效性。