林宗繆 唐 浩
(上海市質量監督檢驗技術研究院 上海201114)
近年來,因網絡媒體發展,各種產品質量安全問題引起廣泛的輿論討論。例如:校園毒跑道、毒地板、毒校服等。一次次產品質量安全事件都給我們的質量監管部門敲響了警鐘——如何更科學有效地監管產品質量安全?產品檢驗檢測機構每年積累了海量的產品質量檢測數據,大量的產品質量信息包含在其中。如何利用質量檢測數據進行數據挖掘去預測產品質量風險具有重要的社會意義。
傳統的數據挖掘方法面對質檢大數據時,效率低下,無法及時有效地獲取預警結果。需要建立一種有效的數據挖掘模型對產品檢測數據進行分析,利用質檢大數據為產品安全動態檢測提供支持,為產品風險監測和預警提供決策依據。由于產品安全檢測數據信息量比較大,更新快,每日產生的大量產品檢測數據需要進行挖掘,因此對質量風險模型提出了并行化、非線性化的要求。
人工神經網絡ANN是一種模擬生物神經網絡的計算模型。ANN通過反復訓練逼近目標函數,具有并行處理、離散性和自學習特點。這種算法可以對大數據進行大規模非線性運算,適合建立學習與預測模型[1~3]。BP反向傳播神經算法是一種常用的訓練人工神經網絡的方法,BP算法非常適合進行機器學習和訓練模型。但BP算法在擬合非線性函數時容易收斂局部最優而非全局最優且收斂速度慢,而遺傳算法可以解決非線性和多維空間尋優問題[4~5]。本文基于遺傳算法優化的BP神經網絡提出一種產品質量風險預警模型,對產品質量安全進行有效的預測。
BP神經網絡算法是一種基于誤差反向傳播的多層感知器,通過反向誤差算法調整權值向量,很好地解決了非線性問題[6~8]。BP三層網絡拓撲如圖2所示。

圖2 遺傳算法流程圖
輸入向量為X=(x1,x2,…,xn),隱層輸出向量為H=(h1,h2,…,hm),輸出層向量為Y=(y1,y2,…,yk),期望輸出向量為D=(d1,d2,…,dk),輸入層到隱層之間的權值矩陣用V表示:V=(v11,v12,…,vnm),隱層到輸出層之間的權值矩陣用W表示為W=(w11,w12,…,wmk)。激活函數f(x)為Sigmoid函數

圖1 BP三層網絡結構圖
BP算法以網絡誤差為目標函數、采用梯度下降法來計算目標函數的最小值[9~10]。誤差反向傳播是將誤差隱層逐層求導梯度下降,計算修正權值。通過反復學習,權值不斷調整,誤差最終調整到可接受的范圍,達到預期目標。
遺傳算法(Genetic Algorithm)是模擬自然界的生物進化過程,在全局中求最優值的算法。首先隨機初始化一個群體,用適應度函數評估每個個體的適應度[11~13]。用選擇函數擇優選擇,再進行交叉產生子代,對子代進行變異,重復循環直到求出最優解。遺傳算法使適應度高的個體有較大機會產生后代,后代就會越來越多,而適應度函數是最優值求解目標函數的正相關函數,因此經過逐代的遺傳優化求得最優解。
BP神經網絡算法求值時存在局部最優和收斂速度慢的缺陷,可以通過遺傳算法對BP神經網絡算法的初始權值和閾值進行優化。GA-BP神經網絡算法具有更優的目標值預測性,具體流程如下:隨機生成初始一個種群,種群里的個體對應BP神經網絡的初始權值和閾值,以BP網絡的輸出值與預期值的差值作為適應度函數,通過選擇、交叉、變異,重復循環求出最優值,從而得出BP神經網絡初始權值和閾值[14~15]。對優化后的BP神經網絡的進行正向反向訓練,建立預測模型。

變異操作:第m個個體的第l個基因xml進行變異操作方法如下:

xmax為基因xml的上界,xmin為基因xml的下界,k為當前迭代次數,Kmax為最大進化次數,r為[0,1]間的隨機數,λ為一個隨機數。
產品質量風險預警模型采用定性和定量相結合的方法對產品進行綜合風險分析,評估步驟如下。
1)以不合格的檢測項目作為風險因子,將不合格率按20%為一級,劃分五個等級。根據表1,確定x值。

表1 風險因子發生的可能性(x)等級劃分及說明
2)將風險因子對風險的影響程度分為5個等級并對各等級賦值,如表2所示。

表2 風險因子的影響程度(y)說明
3)邀請來自產品質量安全、風險評估領域的多名專家,依據專家分析和評估,給風險因子對風險發生的影響程度進行評估并按表4的說明打分,以平均分作為評級依據,確定y值。
4)依據專家分析和評估,確定m和n的值(m+n=1),將風險等級劃分為不同檔,定義風險等級與量化值(Z)之間的對應關系。

式中Z為風險等級值,m為風險因子可能性的權重值,n為風險因子影響程度的權重值,x為風險因子發生的可能性,y為風險因子的影響程度。
5)根據1)至4)步驟計算出風險等級值,按照風險因子發生的可能性和風險因子對風險造成的影響程度構建風險等級劃分矩陣,如表3所示。

表3 風險等級劃分矩陣
6)選取最高風險等級值的風險因子,根據風險等級劃分矩陣,確定產品的風險評估的風險等級。
基于GA-BP神經網絡算法對產品質量預警模型進行設計與訓練,確定輸入層向量、隱層節點數和權值、輸出層向量、激活函數。
1)輸入層向量。產品質量風險預警需要輸入多種產品質量檢測項目,而檢測項目對產品質量的影響程度不同,因此提取影響產品質量的關鍵檢測項目作為BP神經網絡的輸入向量。
2)隱層設計。隱層設計為1層,4個節點數,節點分別對應專家的風險評價(風險因子發生的可能性值x、風險因子的影響程度y、風險因子可能性權重值m、風險因子影響程度權重值n)。
3)輸出層向量。質量安全風險評估結論,3代表高危險,2代表中危險,1代表低危險,0代表無風險。
4)激活函數。選擇單極性S型Sigmoid函數。該函數是兩邊平坦,中間連續可微變化,適合作為激活函數。
智能門鎖是通過無線網絡、NFC、現代生物學或光學、遠程操控等技術,在產品安全性、用戶識別、管理性方面更加智能化簡便化的產品。智能門鎖存在數據泄密風險、重放攻擊、指紋破解、通訊安全等方面存在安全風險。我們基于上述的GA-BP神經網絡風險預警模型對智能門鎖進行風險預警實驗。
我們從上海市質檢院的風險監測數據庫里采集了智能門鎖的風險監測數據220個產品紀錄,共4620條檢測項目數據。抽取200個產品記錄做為訓練樣本,20個為預測樣本。輸入因素選擇防暴力開啟、RFID開鎖安全性、防破壞報警、敏感信息保護、數據加密傳輸、安全掃描、反編譯、網絡安全等21項檢測項目進行綜合評級。項目的檢測結果預處理為合格和不合格。檢測結果如表4所示。

表4 聯網智能門鎖項目檢測結果匯總分析表
算法參數的初始設置。GA-BP算法參數設置為輸入21,隱層節點數為4,輸出節點為1,遺傳種群規模為20,遺傳代數為40,交叉概率為0.5,變異概率為0.3。在Matlab上建立BP神經網絡模型,編程實現基于GA-BP神經網絡優化模型。使用訓練樣本對模型進行訓練。
預測結果分析如圖3、圖4所示,基于遺傳基因算法的BP神經網絡在訓練次數的收斂次數上有了較大的提高,GA-BP的收斂速度是BP的兩倍,提高了訓練速度。預測誤差上,GA-BP對產品質量風險預警的準確度達到85%,相較于優化前的BP模型的準確度75%,GA-BP神經網絡也有具有明顯優勢。因此本文提出的基于GA-BP神經網絡產品質量風險預警方法能更高地對產品風險進行預警。

圖3 GA-BP與BP訓練次數比較

圖4 GA-BP與BP預測誤差比較
本文建立了一種基于GA-BP神經網絡的產品質量風險預警方法,將優化的神經網絡算法應用于產品質量大數據的質量風險預警中,通過實驗表明這種質量預警模型收斂速度快,準確率高。優化后的遺傳神經網絡的準確率提高了10%,收斂速度提高了一倍。該方法有助于為產品質量監管部門提供質量風險預警提示。