汪杰
(北京化工大學,北京 100089)
社會的發展離不開科技的進步,科學技術是第一生產力,我國每年均在鼓勵社會各界進行科技創新,社會每年都在產生著大量科技成果。科技成果的轉化是科技成果變為社會生產力、創造價值的重要一步,科技成果的轉化過程主要包含3 個步驟,分別是基礎研究、技術研究與產品研究。首先在基礎研究上,科研院所通過相關基礎理論的研究在某一領域形成知識形態;接著研發部門根據市場信息進行技術研發,將理論轉化為技術,形成準商品;最終在產品研發階段,技術產品轉移至生產企業,企業經產品孵化,借助規模化的成品產生社會價值[1-6]。
科技成果的轉移是一項涉及面廣、流程復雜的系統工程,在這一過程中,會花費大量的人力、財力資源。若能夠在科技成果孵化為產品之前即可通過智能化的算法預測其社會收益,則對于科學合理地進行科技項目立項、規劃科技投資具有重要的指導意義[7-16]。基于以上目的,該文對科技成果的轉移預測進行了相關研究,并對科技成果的轉移流程進行數學建模,同時介紹該文使用的感應學習網絡理論,使用生產中的實際數據進行仿真,從而驗證該文模型與算法的有效性。
在該文的引言階段,已對科技成果轉化的各個階段內容進行了簡要說明。該文的目的在于通過引入先進的計算機算法,利用科技成果轉化過程中的多方面數據,預估成果轉移的社會效益。因此,仍需對上述過程進行數學化的抽象。通過研究發現,從數學建模的角度出發,科技成果的轉移過程可以分為成果的形成、小型試驗、中期試驗與產品誕生4 個階段。為了承接這4 個階段中的數據流,該文設計了科技成果轉移過程流程圖,如圖1 所示。
圖1 中包含4 個子系統與系統間的數據流向,這4 個子系統分別是針對科技成果進行技術研發的子系統H1;對科技成果進行技術改進的子系統H2;進行中期試驗的中試轉化系統H3 與進行新產品生產的系統H4。每個子系統均有其需要的初始啟動費用Wi;在各個系統實驗中,又會引入新的經費投入Qi;在科技成果轉移過程中,每個階段均會產生一定的成果Ri;系統中還存在表征成果轉移效率的變量Ki。系統的變量說明如圖2 所示。
在圖2(d)中,根據其定義方法,計算方式如下:

圖1 科技轉化流程建模

圖2 系統中變量說明

1.1節中建立了科技成果轉移的數學模型,該模型可以定量描述科技成果轉移過程中的數據流向。為了通過這些數據流向準確地預測一項新的科技成果的社會效益,需要再引入計算機智能算法,該文使用的計算機智能算法是感應神經網絡。在機器學習理論中,將無監督的神經網絡稱為感應神經網絡,而自組織神經網絡即是一個典型的感應神經網絡,其基本結構如圖3 所示。

圖3 自組織神經網絡結構
自組織神經網絡的學習過程分為3 個子過程:競爭、合作與自適應。
1)競 爭
對于一個自組織網絡,其輸入為x、輸入層到競爭層的連接向量wj分別可以記為式(2)。

其中,網絡在競爭層中有l 個單元,式(2)中的j=1,2,…,l。
競爭的依據為x與wj間的歐式距離或余弦距離。x與wj間距離最小的輸入向量為競爭的勝利者,其對應的輸入神經元被選擇為當前網絡的輸入神經元。兩種距離各自的計算方法,如式(3)所示。

2)合 作
競爭僅是確立了最佳的輸入神經元,但一個網絡僅依靠一個神經元是不具備較強的分類性能。因此,自組織神經網絡還會在最佳神經元的鄰域內選擇合作神經元。該鄰域以最佳神經元為圓心,以距離hj,i為半徑,該鄰域的確定依托于兩個條件:
1)當鄰域內的神經元到最佳神經元的距離di,j=0 時,hj,i最大;
2)hj,i是關于di,j的單調遞減函數。
根據上述的兩個條件,該文選擇的di,j與hj,i關系函數為Guass 函數,如式(4)所示。

通過引入式(3),使得hj,i只受合作神經元與最佳神經元距離影響,剔除了最佳神經元坐標變換引起的抖動。對于二維的神經元網格,其di,j的計算方法如式(5)所示。

在自組織神經網絡訓練的過程中,為了保證訓練的效果,可以將式(4)中ξ設置為關于訓練時間的變量,如式(6)所示。

其中,n=0,1,2…。根據式(6),hj,i的最終形式可寫為式(7)。

3)自適應
自適應過程是指在訓練過程中,網絡連接權值隨誤差反向傳播而更新,隨著網絡自適應進程的推進,自組織網絡逐漸達到理想的輸出。在每一次迭代中,權值的變化定義如下:

其中,η是網絡的學習率;g(yj)是一個線性函數,如式(9)所示。

將yi寫成(yj)=hj,i(x)。此時,Δwj如式(10)所示。

最終可以得到n到n+1 時刻權值wj(n+1)的變化公式,如式(11)所示。

基于以上分析,將自組織神經網絡與科技成果轉移預測的系統模型相結合,設計基于感應學習網絡的科技成果轉移預測模型的方法流程,如圖4所示。
該文選取的數據是某科技集團的30 個科技項目。在數據的預處理上,按照圖1 的數據模型進行整理,并將數據進行歸一化。在數據集的劃分上,選取其中20 組作為模型的訓練數據、10 組作為測試數據。模型的參考函數選擇K-G 多項式,其形式如下:

圖4 算法流程圖

式(10)中,共包含5 個初始模型,初始模型的集合為式(13)。

隨后,根據圖4 將輸入向量交叉并獲得神經元,每個神經元均有一個函數序列,如式(14)所示。

在此過程中,神經元的復雜性從y=A0開始遞增,每一次遞增的過程中,通過最小二乘法確定神經元的系數,判定標準為PESS,如式(15)所示。
根據圖1 中的科技成果轉移數據流程,共包含了H1、H2、H3、H4 4 個子系統。每個子系統均可用一個自組織網絡進行描述,通過圖4 的流程,可以得到4 個訓練好的自組織網絡。以H1 技術研發子系統為例,得到的網絡模型如圖5 所示。

圖5 H1網絡參數結構
圖5 所示技術研發子系統的網絡參數,如表1所示。

表1 模型參數
使用得到的自組織網絡與剩余的5 組測試數據進行網絡性能的測試,為了更直觀地評估模型性能,使用回歸分析模型進行對比。表2 中給出了這5 個科技項目的實際社會收益、在回歸分析法下及感應學習模型下的預測收益;表3 給出了兩個模型的相對誤差。

表2 科技項目轉移效益預測結果 單位:億元

表3 算法誤差統計
可以看出,該文提出的算法在該組數據下的平均相對誤差為2.23%,相較于回歸分析法的4.24%提升了約2%,誤差的最大值為3.12%,而回歸分析法的最大誤差為5.71%。文中算法的誤差在平均值附近波動較小,在針對某一項目進行預測時,更接近其真實值。但值得注意的是,回歸分析法的預測結果大多小于實際的社會效益,數據具有較好的一致性。使用回歸分析法進行預測時,只要將其預測值進行一定量的增加,即可接近實際的科技項目轉移獲得的社會收益。
該文對于科技成果的轉移過程進行了抽象化的數學建模,該模型可以準確地描述轉移過程中復雜的數據流向。該文模型的提出,方便了計算機智能化算法在科技成果轉移領域的應用。在未來,科學地分析科技成果的轉移效率對于科技項目立項、研發經費投入均具有重要的指導意義。