[摘要] 針對國家提出的建立國家科技計劃信用制度的政策,本文以人工智能中神經網絡技術為手段,站在合格的科技信用評價者或評價機構的角度,提出建立智能化的評價體系,構建神經網絡模型,客觀全面地對申請承擔國家科技計劃項目的行為主體(多數為民營科技企業)進行有效評價。
[關鍵詞] 國家科技計劃 科技信用 評價體系 民營科技企業 神經網絡模型
一、建立國家科技計劃信用管理制度的緊迫性
隨著國家對科技投入的重視,國家采取科技計劃招標形式,吸引了大量民營科技企業。這一舉動,既為國家解決科技難題提供了另一路徑,又為挑選出有實力的民營科技企業承擔國家科技計劃提供了有效方法,推動科技項目的有效實施和社會的經濟增長。近年來,科技信用評價以人為評價為主,涉及到許多人為因素,科技信用評價進程總體良好,但也出現了一些不良現象。為防止問題擴大,應該提早考慮完善措施,規范社會主義科技信用管理,抓好評價環節的工作,更有效評價行為主體遵守承諾、履行約定義務和遵守科學界公認準則的能力和表現。國家科技部提出了《關于在國家科技計劃管理中建立信用管理制度的決定》。信用管理涉及面較廣,本文旨在對民營科技企業的信用評價進行研究。
二、民營科技企業的信用評價
1.民營科技企業信用評價指標
要建立有效的評價模型,首先考慮選取評價指標,組織指標體系,通過對評價指標的綜合分析,得出申請承擔項目的民營科技企業的評分,作為評價企業優劣的依據。
民營科技企業科技信用指標與普遍意義的企業信用指標不盡相同,這是由其自身特殊性決定的。科技信用指標是可以體現從事科技活動企業的職業信用的一些定性和定量概念,包括企業基本信息、企業承擔科技項目的情況和能力與企業從事其他科技活動情況。
(1)企業的基本信息
企業的基本信息是評價一個企業優劣最基礎的指標組,包括企業的成立時間、登記注冊類型、注冊資金、長期職工數量、技工貿總收入、出口創匯額、科技經費支出和所獲得政府撥款。這一部分指標體現了企業承擔科技計劃的基本能力,這在評價模型中要考慮的第一步。
(2)企業承擔科技項目情況
這一信息是企業最終是否能獲得承擔國家科技計劃的重點。包括共承擔過的科技項目數量(屬于國家級科技項目的數量、省級科技項目的數量和市級科技項目的數量)、企業承擔科技項目計劃的類別、項目實施的形式、已完成項目的數量(驗收形式)、未完成項目的數量(原因)。作為評價指標體系的另一子指標體系,企業承擔科技項目情況包含了企業曾做過項目數量和完成質量,有良好信息和不良信息。要評價一個民營科技企業有否承擔科技項目的實力,這一部分指標的評價結果占很大比例。
(3)企業其他科技活動情況
企業其他科技活動情況包括企業主要科技活動類型、從事科技活動人員情況(總人數、博士人數、碩士人數、高級職稱人數、中級職稱人數、初級職稱人數)、曾取得的科研成果(省級以上獎勵、市縣級獎勵、開發新產品數量、新工藝新裝置數量)、發表論文情況(完成論文總量、其中科技論文數和國外發表數、出版著作數量)、專利申請數、專業授權數(發明、實用新型、外觀設計、國外授權)。企業其他科技活動情況是評價企業科技潛力的有益補充,為沒有承擔過國家科技計劃的有實力新興企業增加成功申請的競爭力。
2.運用神經網絡構建科技信用評價模型
人工神經網絡是人工智能技術的一個研究方向,它是對人類神經元系統的一種模仿。人工神經網絡具有自學習、自組織的能力,運用人工神經網絡組建的模型,通過學習參考對象的歷史數據,不斷修改自身權值,使得模型具有參考對象的特性。本文以廣東省59個民營科技企業信用情況作為研究對象。數據來源是廣東省內部分市縣企業所填寫的廣東省民營科技企業信用評價表,對其進行研究有相當的參考價值。在已有企業數據中,隨機選取大部分企業用于訓練評價模型,剩下的企業用于性能檢驗。
(1)評價指標的標準化
用于評價信用的各項指標的形式各不相同,不利于神經網絡系統的識別和運算,所以有必要把各項指標統一于某個范圍,并且這個范圍是神經網絡能夠接受的。根據前面所說的民營科技企業評價指標分類,三類指標組合總計有28個指標。大部分能量化的指標通過以下運算過程標準化成0到1之間的數值:
在以上式子中,Mmin、Mmax為某一指標在59個企業中的最小值和最大值,從為某企業該指標的真實數值,F為經過轉換后的指標數值。
還有少量定性指標例如企業承擔科技項目計劃類別、實施形式等,以企業該類指標對信用評價的重要程度劃分到0到1的范圍。
(2)神經網絡信用評價模型設計
神經網絡的種類較多,BP網絡是近二十多年來應用最廣泛的神經網絡。BP網絡運用誤差反向傳播算法,通過對樣本輸入輸出數據進行學習,也即用樣本數據訓練網絡。訓練完成后,該模型能判斷新輸入數據,得到具有模型特征的輸出。正好為科技信用模型提供了良好的基礎,圖1為該模型的示意圖。
輸入的指標值實際是用于評價某企業科技信用的一系列經過量化及標準化的變量,用Xj(j=1,2,3…n)表示。在該科技信用系統模型中,總共有28個指標,也就是28個變量經量化和標準化后的數據輸入到該網絡模型中,此為輸入層。
輸入層神經元不需要設定傳遞函數,輸入數據直接進入輸入層。要達到隱含層就必須經過權值運算。一般情況下,三層BP神經網絡就可以模擬任意非線性映射,因此,該模型可以采用一個隱含層。對于BP網絡,隱含層神經元和輸出層神經元都必須是連續可微的傳遞函數。對于隱含層任一神經元,有以下數學形式:
模型經過一次以上計算,為一個訓練步,前一次權值加上修正值得到新權值,閾值同理,然后循環不斷,直到最大訓練步或者梯度低于最小設定值,訓練停止,權值和閾值調整結束。η為學習率,0<η<1。如果在訓練過程中η保持常數,會使模型增加訓練次數,降低收斂速度。所以仿真時采用學習率自適應調節的訓練函數對模型進行訓練。
三、仿真模型
利用Matlab7.1的神經網絡工具箱可以方便地建立仿真模型。如前所述,把59組數據分成兩批,隨機選取40組數據作為模型的樣本,剩下19組用于檢驗模型。在模型進行數據訓練初期:先初始化權值和閾值,降低模型陷入局部極值的可能性;設定均方誤差函數MSE為模型性能函數,把樣本數據全部輸入到模型后,一次計算全部樣本輸出值再計算誤差繼而修改權值和閾值。圖1是模型的訓練過程。
圖2中,橫軸是訓練步數,在模型訓練前設定為10000;縱軸為均方誤差性能函數值,是40個輸出的均方誤差值。從圖可以看出,圖像在大約1000步后出現“毛刺”,這是因為在1000步之前,學習率基本不變。1000步之后某些時刻,誤差突然變大,于是取消此次權值和閾值調整,并且減小學習率,因此模型性能函數值總體下降。
模型預先設定了訓練達10000步時停止,這時性能函數值為5.32367×10-6。對原來40組樣本數據進行仿真輸出,與目標相比,只有1組輸出的誤差率達20%,16組輸出的誤差率在1%到10%之間,23組輸出的誤差率在1%以下。下面再把剩下19組用于檢驗的數據輸入模型,比較輸出結果,如表。
表中的19組輸入數據是未經訓練的數據,從其仿真輸出與目標相比,只有第一組數據的輸出誤差率達30%,第五組數據27%,第十五組25%,第四組和第十六組分別13%和12%,剩下的十五組都在0.1%以下,可見模型對新數據的識別率較高。
四、結論
從訓練圖像的趨勢來看,訓練步數如再。增加,誤差性能函數值會繼續下降,模型的識別精確度也會上升,只是收斂速度較慢。
根據隱含層神經元數量計算公式,在設定隱含層神經元個數時,從最小值6到最大值16,模型的訓練圖像大致相同,在此范圍以外,則差別較大。而每次創建網絡模型,由于權值和閾值的初始化值不盡相同,同一隱含層神經元個數的模型重新創建后,所得的訓練結果也略有差別,但不影響整體精度。
基于神經網絡的民營科技企業信用評價模型在某程度上能模擬人腦的思維。在模型建立初期,樣本數據量較少,但已體現出一定的預測能力,隨著樣本數據的增加和訓練步數的增加,模型的評價性能會進一步提升,其特征逐步向參考對象靠近。
但在構建過程中,還需要與相關人員的配合,為模型提供大量樣本數據,同時,網絡的學習算法也是要繼續探討和研究。
參考文獻:
[1]蔡文沽梅姝娥仲偉俊:國家科技計劃信用制度建設初探[J].現代管理科技,2004,6:15~16
[2]科技部:積極推進科技信用管理制度建設[J].政策信息,2004,9
[3]高麗華朱邦毅:基于BP神經網絡的中小企業信用評價[J].商場現代化,2006,467,:79~80
[4]鐘田麗賈立恒:中小企業信用評價的神經網絡法[J].技術經濟與管理研究,2005,5:30~31
[5]陳雄華林成德葉武:基于神經網絡的企業信用等級評估[J].系統工程學報,2002,17-6:570-575
[6]王靜王延濤何德權:基于多層前饋神經網絡的個人信用評分模型[J].經濟師,2004,12:20~21
[7]周繼成等:人工神經網絡-第六代計算機的實現[M].第一版.北京:科學普及出版社,1993,47~51
[8]朱大奇史慧:人工神經網絡原理及應用[M].第一版.北京:科學出版社,2006,34~39
[9] Se Hun Lim, Kyungdoo Nam: Artificial Neural Network Modeling in Forecasting Successful Implementation of ERP Systems [J]. International Journal of Computational Intelligence Research,2006.2-1: 115~119
[10]Ramesh Rajagopalan, Purnima Rajagopalan: Applications of Neural Network in Manufacturing [J]. Proceedings of the 29th Annual Hawaii International Conference on System Sciences,1996: 447~453