徐勝林等



摘 要: 為全面有效地掌握及整合企業信用信息,國家質檢總局建立了一套進出口企業信用管理系統,制定了企業信用管理辦法及評價標準。文章在分析出口食品加工企業檢驗檢疫信用評價指標體系的基礎上,建立了一種基于極限學習機的檢驗檢疫信用評價模型。實驗結果證明,該模型可有效預測企業信用等級,僅需預先確定隱含層神經元數目而無需設置其他參數,減少了人為干擾因素,可為檢驗檢疫信用評價管理提供參考。
關鍵詞: 極限學習機; 檢驗檢疫信用評價; 出口食品加工企業; 評價模型
中圖分類號:TP391.4 文獻標志碼:A 文章編號:1006-8228(2015)05-04-03
Abstract: To control the credit of enterprises comprehensively and effectively, a credit management information system for imports and exports enterprises was constructed by the General Administration of Quality Supervision, Inspection and Quarantine of the Peoples Republic of China (AQSIQ). Meanwhile, the regularization and evaluation criterion for the credit of enterprises were built. In this paper, a rating model for the inspection and quarantine credit of export food processing enterprises is proposed based on the Extreme Learning Machine (ELM). The experimental results prove that the model could effectively predict the credit of enterprises. Only the number of neuron in the hidden layer needs to be set manually. Therefore, the artificial factors are decreased. The model could provide a scientific reference for rating the inspection and quarantine credit.
Key words: extreme learning machine; inspection and quarantine credit; export food processing enterprise; rating model
0 引言
建設社會信用體系,是完善我國社會主義市場經濟體制的客觀需要,是整頓和規范市場經濟秩序的治本之策,是促進社會經濟健康協調可持續發展的先決條件,也是與國際慣例接軌、加強進出口產品質量安全監管、提高中國企業和產品的國際形象與市場競爭力的必經之路。
質檢系統進出口企業檢驗檢疫信用體系是中國社會信用體系建設的重要組成部分。通過建立和完善進出口企業檢驗檢疫信用體系,以檢驗檢疫信用等級評定為基礎,實施進出口企業分類管理。對信用等級較高的企業,減少抽檢和口岸查驗比例;而對信用等級較低的企業,則加大抽檢和查驗比例,從而實現在嚴密監管的基礎上提高工作效率。
為全面、有效的掌握及整合企業信用信息,質檢總局建設了進出口企業信用管理系統,同時制定了企業信用管理辦法及評分標準。通過對進出口企業檢驗檢疫信用等級實施規范化、定量化、科學化的考核,改變以人的主觀判斷來確定企業信用等級的方式,促進進出口企業信用意識和產品質量的提高,同時提高一線檢驗檢疫工作效率。
傳統的信用等級評價方法是根據與檢驗檢疫相關的信用指標設定評定標準,然后建立專家系統進行主觀或者客觀的綜合評價。這種方式存在兩個問題:一是不同指標的一致性問題,信用指標既包括定量指標也包括定性指標,不同評價指標沒有一致的客觀因子分析;二是不同指標的權重選擇問題,不同信用指標在最終評級中所占的權重完全由人為設定,不具備客觀性。
近年來,為準確、客觀、科學的進行企業信用評價,國內外很多學者做了大量研究工作,提出了人工神經網絡法[1]、支持向量機法[3]等。這些方法存在計算復雜、參數設置較多、預測時間長等問題。本文使用極限學習機(ELM,Extreme Learning Machine)以出口食品加工企業為例,對企業檢驗檢疫信用等級進行評價。ELM是一種前饋神經網絡訓練算法[2],它隨機產生輸入層與隱含層間的連接權重及隱含層神經元閾值,且在訓練過程中無需調整參數,只需設置隱含層神經元個數即可獲得最優解。與傳統訓練方法相比,ELM速度快、參數少、泛化性能好[5]。
1 極限學習機
給定X={(xi,ti)|xi∈Rn,ti∈Rn,i=1,2,…,N}作為樣本集,其中xi為n×1維向量,ti為m×1維向量。包含K個隱含層節點、激勵函數為g(x)的ELM為:
其中:wi=(wi1,wi2,…,wid)T表示輸入層和隱含層第i個神經元之間的權重,βi=(βi1,βi2,…,βim)T表示第i個神經元和輸出值間的權重,oj是對應第j個輸入數據的目標值。ELM的目標為,即存在βi,wj和bj滿足:
H為神經網絡的隱含層輸出矩陣,H的第i列為對應輸入x1,x2,…,xN的第i個隱含層神經元輸出。黃[2]在前期研究中證明,ELM中無須調整權重和偏離值,僅須在算法開始執行時任意給定一個輸入值。因此輸出權重可計算為最小均方誤差結果:
其中:為H的Moore-Penrose廣義逆矩陣。因此,最小訓練誤差計算為:
ELM利用公式⑹,可以通過快速學習得到具有很好泛化性能的預測結果。針對本文的問題,企業信用評價指標的輸入、輸出值之間不滿足線性關系,因此選擇單極性函數作為激勵函數:
g(x)=1/(1+e-x) ⑺
2 出口食品加工企業檢驗檢疫信用指標體系構建
出口食品加工企業的信用指標體系由企業衛生注冊年限、出口檢驗檢疫批次不合格率等12項評價要素組成[4],其中包括數字型數據和離散型數據,指標及相應權重見表1。
根據各項指標的得分,加權后可計算得到綜合評分。
3 數據處理方法
利用ELM進行檢驗檢疫信用評價,首先要根據指標體系中要素的要求收集數據。目前,出口食品加工企業檢驗檢疫數據主要來源于已有業務系統數據導入和人工錄入兩種方式。得到初始數據后需要對數據進行轉換處理,包括將非數字值轉換為數字值、歸一化處理等。
歸一化處理是將所有數字歸一化到[0,1]區間內,取消不同來源的數據間量級的差別,提高ELM預測的準確性。本文采用最大最小法對信用評價指標進行歸一化處理:
其中xk表示評價指標數據,xmax和xmin表示所有指標的上下限。
4 實驗結果及分析
本文選取10家出口食品加工企業的檢驗檢疫信用數據進行實驗,ELM算法中隱含層神經元數目定為30。根據第3節中數據處理方法,對選取的指標數據進行數字轉化及歸一化處理,處理結果見表2。
本文首先使用表2中前9家公司的數據構建訓練集,第10家公司的數據作為測試集。圖1中給出對12項評價指標分別預測的結果。表3中給出企業信用評價的預測結果。
接下來,我們使用表2中前8家公司的數據構建訓練集,第9、10家公司的數據作為測試集。圖2(a)和圖2(b)分別給出對這兩家公司12項評價指標分別預測的結果。表4中為這兩家企業信用評價的預測結果。可以看出,由于使用的訓練樣本數比上一組實驗少,預測誤差比上一組實驗稍大。
5 結束語
本文使用ELM構建了出口食品加工企業檢驗檢疫信用評價模型,實現對企業信用歷史數據的訓練和學習。通過設置隱含層神經元個數,自動調整模型中的連接權重,確定輸入、輸出之間的內在聯系,使模型具備預測能力。
通過使用ELM,改變了以人的主觀判斷來確定企業信用等級的方式,弱化了人為因素對預測結果的影響,提高了評價結果的準確性、科學性。同時,與傳統訓練方法相比,ELM速度快、參數少,能夠大大提高模型的訓練速度,使模型更具有實際應用的意義。
參考文獻:
[1] 王曉燕,嚴茂根.基于人工神經網絡的出口食品加工企業檢驗檢疫信用評價[J].計算機應用與軟件,2010.27(5):191-193
[2] G.Huang, Q.Zhu, C.Siew. Extreme learning machines: theory and applications[J]. Neurocomputing,2006.70(1-3): 489-501
[3] 陳華.基于數據挖掘技術的企業信用評估研究[J].科學學與科學技術管理,2007.28(7):192-194
[4] 孫穎杰,廖魯興,鄭華.出口食品加工企業檢驗檢疫信用評價探討[J].檢驗檢疫科學,2006.16(6):47-50
[5] 黃宴委,吳登國,李竣.基于極限學習機的結構健康監測數據恢復[J].計算機工程,2011.37(16):241-243