孫麗娜, 黃永紅, 丁慎平, 劉 駿
(1.蘇州工業園區職業技術學院 機電工程系,江蘇 蘇州 215123; 2.江蘇大學 電氣信息工程學院,江蘇 鎮江 212013)
海洋生物酶[1~3]發酵過程具有非線性、時變性、強耦合和不確定性等特點。許多關鍵生物參數,如菌體濃度、基質濃度及產物濃度等,還沒有成熟實用的在線測量儀器,給整個發酵過程的在線控制和實時優化帶來很大困難,軟測量技術是解決上述難題的有效方法[4~6]。目前應用最廣泛的誤差反向傳播算法神經網絡存在過擬合和預測推廣性不強的缺點,基于其他算法如動量法、共軛梯度學習算法以及Levenberg-Marquardt(LM)優化算法等[7~9]的神經網絡的泛化能力在海洋生物酶發酵過程關鍵生物參數軟測量中并沒有達到理想效果。
針對以上算法的神經網絡不足之處,本文提出了利用貝葉斯正則化神經網絡[10,11]對海洋蛋白酶(典型的海洋生物酶)發酵過程關鍵生物參數進行軟測量。結果表明:相同條件下,采用貝葉斯正則化算法比其他改進算法網絡泛化能力好,預測精度高。
一般情況下,神經網絡的性能函數取誤差平方和
(1)
式中n為訓練樣本總數,ti為樣本輸出,ai為神經網絡的輸出。為了克服網絡學習過程中的過擬合問題,以正則化方法改進式(1),性能函數變為F=βED+αEW,其中,EW為網絡權值的平方和;α和β的大小決定著網絡訓練目標,本文采用貝葉斯方法選擇α和β。
在貝葉斯框架中,認為網絡的權值是隨機變量,給定數據集后,根據貝葉斯規則調整密度函數的權值有

(2)
式中D為數據集,M為神經網絡模型,w為網絡權向量,ZD(β)=(π/β)n/2,ZW(α)=(π/α)N/2,N為網絡中參數的總數目。
在貝葉斯框架下,最優權值應該極大化后驗概率P(w|D,α,β,M),并等價極小化目標函數F(w)=βED+αEW,F(w)取最小值時,對應的權值wMP處的α和β的最優值為
(3)
貝葉斯優化正則化參數時需要計算F(w)在最小點wMP處的Hessian矩陣。為了提高計算速度,采用LM優化算法來定位最小點, Gauss-Newton近似計算Hessian矩陣。
1)初始化α,β和權值,設置α=0,β=1,并用Nguyen-Widrow方法初始化權值;
2)用LM算法訓練網絡使F(w)=βED+αEW達到最小;
4)由式(3)計算α和β的新估計值;
5)重復步驟(2)~步驟(4)直至收斂。
以海洋蛋白酶發酵過程為例,其發酵過程中,菌體濃度、基質濃度、以及酶活還不能實時在線測量(菌絲濃度采用菌絲干重法測定,基質濃度采用斐林試劑法測定;酶活采用Folin-酚試劑法測定)給整個發酵過程的在線控制和實時優化帶來很大影響。為此,本文建立了基于貝葉斯正則化神經網絡的軟測量模型,在建模過程中,菌體濃度X、基質濃度S、相對酶活P(為了更好地顯示酶活的變化幅度)作為軟測量模型的輸出變量。通過對海洋蛋白酶發酵過程進行機理分析,利用一致關聯度算法[12]確定軟測量模型的輸入變量為基質進給速率u、溶解氧濃度(DO),CO2濃度,pH值。
在海洋蛋白酶發酵過程中,共采集10個發酵批次的數據,每個發酵批次時間跨度為50 h,其中,前9個批次用于軟測量模型誤差的最小訓練,第10個批次的數據作為測試樣本集對軟測量模型進行驗證。另外,由于采集到的樣本數據變化范圍較大,歸一化采用MATLAB中的premnmx函數進行[-1,1]歸一化。
本文建立的神經網絡模型包含1個輸入層、1個隱含層和1個輸出層。在MATLAB環境下,用newff函數建立網絡。主要參數設置:隱含層神經元傳遞函數設置為S型正切函數tansig,輸出層神經元傳遞函數設置為線性函數purelin,訓練函數采用貝葉斯正則化算法trainbr函數。設置最大訓練次數為1 000,訓練誤差為0.000 1。通過結合隱含層節點選擇的原則以及試驗湊試法,尋找最佳隱含層節點數,最終確定隱含層節點數為20,網絡結構為4—20—3。
圖1為網絡訓練過程誤差變化曲線,可以看出當訓練迭代至517步時,達到設定訓練誤差(網絡輸出與期望輸出的均方誤差能得到10-4精度),網絡訓練收斂。

圖1 網絡訓練誤差變化
利用plotregression函數對訓練樣本和測試樣本的神經網絡輸出與期望輸出進行線性回歸(包含基質濃度(g/L)、菌體濃度(g/L)、相對酶活(%)),如圖2和圖3所示。由圖2可以看出,相關系數R=1,所有輸出點均處于斜線以上,說明期望輸出和神經網絡輸出值完全重合,網絡訓練比較充分,訓練效果很好。

圖2 訓練樣本期望輸出和神經網絡輸出的線性回歸

圖3 測試樣本期望輸出和神經網絡輸出的線性回歸
為了驗證模型的有效性,利用測試樣本集對建好的模型進行測試,實驗結果如圖3、圖4所示。由圖3可以看出相關系數R=0.999 99。結合圖2和圖3可以說明貝葉斯正則化很好地平衡了神經網絡對訓練數據的擬合程度和模型的復雜度,從而顯著地提高了網絡模型的泛化能力。
圖4為軟測量值(預測值)和離線化驗值(實際值)曲線,可以看出,對于基質濃度、菌體濃度和相對酶活,基于貝葉斯正則化神經網絡的軟測量建模輸出的預測值均能夠很好跟蹤實際值。

圖4 實際值與預測值曲線
為了更直觀地說明貝葉斯正則化神經網絡的預測性能,文中將貝葉斯正則化神經網絡與LM算法[13,14]的神經網絡進行了對比,采用平均絕對誤差和均方根誤差和最大絕對誤差3個預測性能的評價指標反映模型的預測效果,結果如表1所示。表中2種算法的神經網絡采用了相同的訓練數據、測試數據和網絡參數。可以看出LM算法的神經網絡預測誤差要比前者大得多。結合圖4和表1可以看出貝葉斯正則化神經網絡具有較高的預測精度。
本文針對海洋生物酶發酵過程關鍵生物參數在線測量問題,提出一種貝葉斯正則化神經網絡軟測量建模方法,將該方法應用于海洋蛋白酶發酵過程中,分別驗證了其泛化能力和預測精度,并與LM算法的神經網絡進行了比較。結果說明貝葉斯正則化神經網絡在海洋生物酶發酵樣本軟測量中作用顯著。

表1 軟測量誤差對比