崔世鋼,石蘭婷,張永立,何 林,李欣頎,張靖宇
(天津職業(yè)技術(shù)師范大學(xué),天津 300222)
蝦青素是一種酮類胡蘿卜素[1],比其他天然抗氧化藥物具有更強(qiáng)的抗氧化活性。蝦青素能夠?qū)Χ喾N疾病起到輔助治療的作用,能夠抑制腫瘤生長、保護(hù)中樞神經(jīng)系統(tǒng)、預(yù)防心腦血管疾病等,因此廣泛用于食品、醫(yī)藥和化妝品[2-4]。雨生紅球藻在特定的脅迫條件下可以快速積累蝦青素,最大積累量可達(dá)其干細(xì)胞重量的1%。近年來,國內(nèi)外對(duì)于大量生產(chǎn)蝦青素的研究已經(jīng)逐漸向培育雨生紅球藻靠攏[5]。
侯奇等[6]建立了預(yù)測(cè)李斯特菌生長的二級(jí)BP神經(jīng)網(wǎng)絡(luò)模型。由于雨生紅球藻生長周期長,而且與大多數(shù)微生物不同,其生長狀態(tài)分為2個(gè)階段,不同階段生長條件也不相同,因此很少有可供參考的客觀數(shù)據(jù)。特別是在試驗(yàn)過程中需要消耗大量的時(shí)間對(duì)雨生紅球藻的生長狀況進(jìn)行觀測(cè),但其生長趨勢(shì)依舊很難預(yù)測(cè),導(dǎo)致反復(fù)試驗(yàn)消耗大量的人力物力依舊不容易得到好的培養(yǎng)效果。因此建立雨生紅球藻生長趨勢(shì)的預(yù)測(cè)模型,對(duì)提高雨生紅球藻生產(chǎn)效率的研究提供重要的參考。鑒于此,根據(jù)影響雨生紅球藻生長的主要環(huán)境(pH),建立基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)模型,并對(duì)雨生紅球藻生長狀況進(jìn)行試驗(yàn)驗(yàn)證。
雨生紅球藻(Haematococcuspluvialis)是一種生活在淡水中的單細(xì)胞綠藻,其生長狀態(tài)分為細(xì)胞大量增殖階段和蝦青素積累階段。在環(huán)境適宜營養(yǎng)充足的條件下,該細(xì)胞主要呈現(xiàn)綠色并處于游動(dòng)狀態(tài),此時(shí)繁殖迅速,蝦青素含量少。當(dāng)生存環(huán)境惡劣時(shí),為了保證正常生長游動(dòng)細(xì)胞的鞭毛退化,細(xì)胞停止游動(dòng),為了保證正常生存開始大量積累蝦青素,細(xì)胞逐漸變?yōu)榧t色[7-8]。
根據(jù)雨生紅球藻的生長特性,國內(nèi)外的學(xué)者提出了2階段生產(chǎn)方式的生產(chǎn)模式:第1階段是對(duì)藻細(xì)胞進(jìn)行大量的增殖(也被稱為細(xì)胞增殖階段);第2階段是脅迫雨生紅球藻細(xì)胞快速積累蝦青素(也被稱為蝦青素積累階段)。大量研究表明,雨生紅球藻的生長需要很多適宜的條件,如溫度、光照強(qiáng)度、生存環(huán)境的營養(yǎng)成分、pH等,其中pH是關(guān)鍵因素之一。雨生紅球藻培養(yǎng)過程中,pH的范圍將直接影響藻類細(xì)胞的生長和蝦青素的積累[9]。相關(guān)研究表明,當(dāng)擴(kuò)培階段的藻液處于弱堿性(pH=7.0~9.0)時(shí),光合作用效率大幅提高,藻細(xì)胞大量增殖。當(dāng)誘導(dǎo)階段的藻液pH為7.0~8.0[10]時(shí),蝦青素積累最快[11]。
BP神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Network)是一種多層前饋神經(jīng)網(wǎng)絡(luò),可以通過誤差的反向傳播來修正層間的參數(shù)。通過輸入和期望輸出,學(xué)習(xí)需預(yù)測(cè)的數(shù)據(jù)樣本。通過輸入層將數(shù)據(jù)傳遞給隱藏層中的各個(gè)神經(jīng)元,通過計(jì)算得到預(yù)測(cè)的輸出值,若預(yù)測(cè)值與實(shí)際值相減的誤差不滿足預(yù)測(cè)的精度,則輸入層將所得的誤差返回,從而修改各層之間的權(quán)閾值,使得到的預(yù)測(cè)輸出與實(shí)際輸出之間的誤差逐漸減小,直至滿足預(yù)測(cè)所需的精度。其學(xué)習(xí)規(guī)則采用梯度下降法,以此來得到目標(biāo)函數(shù)的最小值,常用于解決復(fù)雜的非線性模型。
雨生紅球藻的生長環(huán)境參數(shù)與生長情況之間存在著非線性關(guān)系,因此采用對(duì)非線性函數(shù)具有最佳逼近性和全局最優(yōu)性能的神經(jīng)網(wǎng)絡(luò)來預(yù)測(cè)雨生紅球藻的生長條件。該研究將雨生紅球藻的培養(yǎng)時(shí)的pH作為神經(jīng)網(wǎng)絡(luò)的輸入量,其他環(huán)境變量保持不變,將試驗(yàn)測(cè)得的生長狀態(tài)數(shù)據(jù)作為神經(jīng)網(wǎng)絡(luò)的輸出量,建立雨生紅球藻在不同pH生長狀態(tài)預(yù)測(cè)模型。其拓?fù)浣Y(jié)構(gòu)如圖1所示。

圖1 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
遺傳算法(Genetic Algorithm,GA)起源于生物進(jìn)化論,它是模擬自然界生物進(jìn)化過程中優(yōu)勝劣汰的一種優(yōu)化算法。將種群和DNA的概念引入需要優(yōu)化的參數(shù)中,形成參數(shù)種群編碼,按照適應(yīng)度函數(shù)對(duì)遺傳信息進(jìn)行選擇、交叉、變異等操作,從而實(shí)現(xiàn)對(duì)個(gè)體的篩選。保留具有優(yōu)秀基因的個(gè)體,淘汰適應(yīng)度差的個(gè)體。種群不斷地迭代、循環(huán)直至得到滿足條件的最優(yōu)解[12]。
BP神經(jīng)網(wǎng)絡(luò)主要由信息前向傳播和誤差反向傳播組成。信息前向傳播指的是待預(yù)測(cè)數(shù)據(jù)經(jīng)過輸入層傳遞到隱藏層中,在隱藏層通過對(duì)閾值和權(quán)值進(jìn)行計(jì)算得到輸出結(jié)果。將預(yù)測(cè)結(jié)果和實(shí)際值做差得到預(yù)測(cè)的誤差值,將誤差值傳回隱藏層,并通過誤差函數(shù)對(duì)權(quán)值和閾值進(jìn)行更新,不斷重復(fù)上述2個(gè)過程,最終得到理想的參數(shù)[13-15]。
由于BP神經(jīng)網(wǎng)絡(luò)是采用梯度下降法來對(duì)相應(yīng)的參數(shù)進(jìn)行優(yōu)化,因此在優(yōu)化的過程中會(huì)因?yàn)槌踔档倪x取出現(xiàn)局部最小值的問題,這樣不僅訓(xùn)練時(shí)間長,收斂速度也慢。因此,由于遺傳算法具有良好的全局尋優(yōu)能力,故采用其對(duì)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化,從而找到最優(yōu)的權(quán)值和閾值,提高預(yù)測(cè)模型的準(zhǔn)確率。
3.1 BP神經(jīng)網(wǎng)絡(luò)的建立
3.1.1設(shè)定初始參數(shù)。網(wǎng)絡(luò)的訓(xùn)練方法采用梯度下降法。最大訓(xùn)練次數(shù)epochs為2 000,學(xué)習(xí)率μ=0.005,目標(biāo)誤差0.000 01。
3.1.2確定隱含層節(jié)點(diǎn)數(shù)。BP神經(jīng)網(wǎng)絡(luò)選取結(jié)構(gòu)為3層,分別是1個(gè)輸入神經(jīng)元、5個(gè)隱含神經(jīng)元和1個(gè)輸出神經(jīng)元,分別對(duì)細(xì)胞和數(shù)量進(jìn)行預(yù)測(cè)。其中,隱含層神經(jīng)元數(shù)量根據(jù)式(1)確定為5個(gè),并經(jīng)過驗(yàn)證可達(dá)到最佳的預(yù)測(cè)效果。
(1)
式中,n、l、m分別為輸入、輸出以及隱含層節(jié)點(diǎn)數(shù)量,α取1~10的整數(shù)。
3.1.3轉(zhuǎn)移函數(shù)的選取。隱含層的傳遞函數(shù)采用Tanh函數(shù),值域?yàn)?-1, 1)。其定義為:
(2)
輸出層的傳遞函數(shù)采用Sigmoid函數(shù)。其函數(shù)定義見式(3):
(3)
3.2 遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)將遺傳算法的3類遺傳算子與BP神經(jīng)網(wǎng)絡(luò)的權(quán)值與閾值結(jié)合以來,通過對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練,找到最優(yōu)的參數(shù),進(jìn)而達(dá)到對(duì)雨生紅球藻的生長趨勢(shì)的精準(zhǔn)預(yù)測(cè)。其模型建立步驟如下:
3.2.1種群初始化。種群的個(gè)體是BP神經(jīng)網(wǎng)絡(luò)的所有權(quán)值和閾值,對(duì)個(gè)體采用實(shí)數(shù)編碼。編碼采用二進(jìn)制表示,長度為:
S=n×m+m+m×l+l
(4)
種群的規(guī)模要根據(jù)實(shí)際問題進(jìn)行選取,才能使遺傳算法的優(yōu)化性能達(dá)到最好。因此,初始種群為15。
3.2.2適應(yīng)度函數(shù)。通過編碼個(gè)體得到BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值,以BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練得到的輸出與實(shí)際輸出之間的絕對(duì)誤差E推出個(gè)體適應(yīng)度值fi。
(5)
式中,BP神經(jīng)網(wǎng)絡(luò)的預(yù)期輸出和實(shí)際輸出分別為yi、oi。根據(jù)適應(yīng)度函數(shù),期望輸出和實(shí)際輸出的誤差越小,適應(yīng)度函數(shù)越大。
3.2.3選擇操作。從種群中選擇優(yōu)秀個(gè)體作為繁殖后代的母體。方法采用輪盤賭選擇法。主要思想是每個(gè)個(gè)體被選中的概率與適合度成正比。即:
(6)
3.2.4交叉操作。交叉操作是遺傳基因重組的過程,以便將當(dāng)前的最優(yōu)基因傳到下一代并獲得新的個(gè)體。從群體中隨機(jī)選擇2個(gè)個(gè)體進(jìn)行配對(duì),根據(jù)交叉概率pc=0.2交換2個(gè)個(gè)體的部分基因。從而獲得2個(gè)具有新基因的個(gè)體。將隨機(jī)選取的個(gè)體ω1、ω2在第k位基因的交換如下:
(7)
式中,b為[0,1]的隨機(jī)數(shù)。
3.2.5變異操作。變異操作相當(dāng)于生物學(xué)上的基因突變,根據(jù)變異概率pm=0.1對(duì)第i個(gè)個(gè)體的第j個(gè)基因gij進(jìn)行變異,隨機(jī)產(chǎn)生優(yōu)秀的生物個(gè)體,豐富種群的多樣性。其變異方法如下:
(8)
式中,b1為隨機(jī)數(shù),d為當(dāng)前迭代次數(shù),Dmax為最大進(jìn)化次數(shù),gmax為基因gij的上界,gmin為基因gij的下界。
GA-BP神經(jīng)網(wǎng)絡(luò)算法流程見圖2。

圖2 GA-BP神經(jīng)網(wǎng)絡(luò)算法流程
4.1 試驗(yàn)方法與設(shè)計(jì)雨生紅球藻藻種(Haematococcuspluvialis,F(xiàn)ACHB-712)購于上海光語生物科技有限公司藻種庫。藻種培養(yǎng)基選用BG11培養(yǎng)基,按照藻液∶培養(yǎng)基=1∶2的比例進(jìn)行配比。采用直流驅(qū)動(dòng)的單色光照,光照黑暗時(shí)間對(duì)比為12 h∶12 h,每天測(cè)量一組數(shù)據(jù)。
細(xì)胞增殖階段培養(yǎng)基pH分別為7.5、8.0、8.5,將配制好的藻液放置到光照強(qiáng)度為20 μmol/(m2·s)且溫度為室溫的光生物培養(yǎng)架上。
4.2 樣本數(shù)據(jù)采集每次從試驗(yàn)樣本中取出15 mL藻液,在超凈工作臺(tái)進(jìn)行取樣以及數(shù)據(jù)測(cè)量,共測(cè)量70 d增殖試驗(yàn)的藻細(xì)胞半徑和數(shù)量。測(cè)量第35天的數(shù)據(jù)后,在錐形瓶中加入200 mL BG11培養(yǎng)基,為藻的進(jìn)一步增殖提供所需的營養(yǎng)物質(zhì)。
4.3 數(shù)據(jù)預(yù)處理由于需要預(yù)測(cè)的藻細(xì)胞數(shù)量和半徑具有不同的數(shù)量級(jí)且差異較大,會(huì)影響網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果,因此需要對(duì)原始數(shù)據(jù)進(jìn)行歸一化處理。采用Matlab的mapminmax(x)函數(shù)對(duì)數(shù)據(jù)進(jìn)行歸一化處理,使處理后的數(shù)據(jù)范圍在[-1,1],其轉(zhuǎn)換公式為:
(9)
式中,x為藻細(xì)胞數(shù)據(jù)的初始值,xmax為藻細(xì)胞數(shù)據(jù)的最大值,xmin為藻細(xì)胞數(shù)據(jù)的最小值,ymax、ymin為參數(shù),可自己設(shè)定也可默認(rèn)為[-1,1]。經(jīng)過歸一化處理的數(shù)據(jù),在預(yù)測(cè)結(jié)束后需要進(jìn)行反歸一化,將數(shù)據(jù)恢復(fù)到正常值,該研究反歸一化采用postmnmx函數(shù)。
采用Matlab作為預(yù)測(cè)的平臺(tái),利用Matlab自帶的函數(shù)實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)的搭建。將收集到的70 d試驗(yàn)數(shù)據(jù)作為預(yù)測(cè)的訓(xùn)練集和測(cè)試集,前60 d為訓(xùn)練集,后10 d為測(cè)試集。為了得到不同pH下細(xì)胞平均半徑和細(xì)胞數(shù)量變化趨勢(shì),采用BP和GA-BP神經(jīng)網(wǎng)絡(luò)分別對(duì)pH=7.5、8.0、8.5進(jìn)行預(yù)測(cè)。預(yù)測(cè)結(jié)果如圖2~4所示,部分預(yù)測(cè)數(shù)據(jù)如表1、2所示。

表1 BP神經(jīng)網(wǎng)絡(luò)部分預(yù)測(cè)結(jié)果

圖3 pH 7.5時(shí)細(xì)胞增殖階段藻細(xì)胞的生長趨勢(shì)

圖4 pH 8.0時(shí)增殖培養(yǎng)階段藻細(xì)胞的生長趨勢(shì)

圖5 pH 8.5時(shí)增殖培養(yǎng)階段藻細(xì)胞的生長趨勢(shì)
采用平均絕對(duì)百分比誤差(mean absolute percentage error,MAPE)和均方根誤差(root mean square error,RMSE)對(duì)預(yù)測(cè)模型性能進(jìn)行評(píng)價(jià)。
(10)
(11)

其評(píng)價(jià)結(jié)果如表3、4所示。從上述試驗(yàn)可以看出,GA-BP神經(jīng)網(wǎng)絡(luò)的MAPE和RMSE均低于BP神經(jīng)網(wǎng)絡(luò)。因此,可以得出GA-BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的準(zhǔn)確率較高。

表3 GA-BP和BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)半徑評(píng)價(jià)結(jié)果

表4 GA-BP和BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)數(shù)量評(píng)價(jià)結(jié)果
通過對(duì)雨生紅球藻在不同pH下的生長狀況數(shù)據(jù)進(jìn)行訓(xùn)練,得到了根據(jù)時(shí)間預(yù)測(cè)藻細(xì)胞生長趨勢(shì)的模型。從訓(xùn)練結(jié)果看,在不同pH下,GA-BP神經(jīng)網(wǎng)絡(luò)對(duì)10 d數(shù)據(jù)的預(yù)測(cè)結(jié)果精確度高于90%,且較合理地預(yù)測(cè)出了藻細(xì)胞的生長趨勢(shì),說明網(wǎng)絡(luò)架構(gòu)已達(dá)到預(yù)期效果。
該模型的使用一方面可以快速得出雨生紅球藻在一定時(shí)間內(nèi)的生長狀況,克服其周期長的問題;另一方面能夠更節(jié)省人力物力,在試驗(yàn)前通過模擬預(yù)測(cè),可以得到單變量環(huán)境對(duì)雨生紅球藻生長狀況的影響,方便研究人員更好地找到最適合藻細(xì)胞生長的環(huán)境值,在培養(yǎng)過程中能夠更節(jié)省時(shí)間避免過多的重復(fù)試驗(yàn),也能夠大大降低試驗(yàn)的失敗率。