999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于基因表達式編程的番茄葉片CO2交換率建模與預測

2016-11-21 01:29:19李婷婷江朝暉閔文芳姜貫楊
浙江農業學報 2016年9期
關鍵詞:方法模型

李婷婷,江朝暉?,閔文芳,姜貫楊,饒 元

(安徽農業大學信息與計算機學院,安徽合肥230036)

基于基因表達式編程的番茄葉片CO2交換率建模與預測

李婷婷,江朝暉?,閔文芳,姜貫楊,饒 元

(安徽農業大學信息與計算機學院,安徽合肥230036)

針對現有作物生長建模方法存在的不足,引入基因表達式編程算法,開展番茄葉片CO2交換速率與主要環境因子關系的建模和預測研究。采用基因表達式編程算法建立番茄葉片CO2交換速率模型,并將該模型與經典的回歸模型及神經網絡模型進行預測性能比較。經過3組數據的實驗和對比,結果顯示,基因表達式編程模型具有最高的預測精度和最佳的預測時效性,同時該算法的復雜度與神經網絡相當。研究表明,基因表達式編程算法是一種性能良好的作物建模工具,可作為現有方法的補充。

作物生長模型;基因表達式編程;CO2交換率;環境因子

決策支持系統(decision support system,DSS)是精準農業、數字農業和智能農業的重要組成部分,其核心是各種控制、預測或決策模型[1]。作物模型從系統科學的觀點出發,以光、溫、水、氣、肥等條件為環境驅動變量,運用數學物理方法和計算機技術,對作物生育期內光合、呼吸、蒸騰等重要生理生態過程及其與氣象、土壤等環境條件以及耕作、灌溉、施肥等技術條件的關系進行定量描述和預測,再現農作物生長發育及產量形成過程,為溫室和大田作物的生產管理提供有效的支撐。

一般來說,作物模型構建方法可分為數學統計和人工智能兩大類[2]:回歸等經典建模方法的優點在于原理簡單、工具成熟,可獲得顯式的各種類型表達式,在應用中占主導地位,但缺點是表達式類型選擇要依賴經驗、因變量單一、難以精確描述因子間的非線性關系;以神經網絡為核心的人工智能方法對機理復雜的情況有優勢,且可獲得多輸入—多輸出模型,但是存在解析性差、結構和參數難確定、易陷入局部極值、收斂速度慢等問題[3]。因此,面對作物—環境系統這一復雜問題,需要研究或應用新的建模方法。

基因表達式編程(gene expression programming,GEP)是在遺傳算法(GA)和遺傳程序設計(GP)的基礎上產生的,具有知識挖掘、函數發現、優化和預測等多方面的優異性能[4]。作為建模工具來說,可在不必預先知道模型的結構和參數、不必具備領域背景知識前提下,通過進化得到結構簡單、預測精度高的顯式模型,避免了對系統進行機理分析,建立其預測模型的困難,以及以回歸方法為基礎的預先設定模型結構,然后通過統計方法確定參數的主觀性[5]。目前,GEP方法在多個學科和領域獲得成功應用,在農業領域有糧食產量預測、作物分類等[6-7],但是與植物或作物模型相關的研究極少,例如,文獻[8]在植物形態建模中利用GEP進行參數優化,文獻[9]采用GEP進行作物騰發量模擬計算,尚缺乏對建模方法、預測性能等方面的深入研究和探討。

為此,我們以普及型研究作物番茄、作物重要的光合生理參數CO2交換速率及其環境因子為對象,研究基于GEP的生長建模方法,并就模型預測精度、預測時效性及算法復雜性與常用的回歸方法和神經網絡方法進行量化比較,期望為作物建模提供方法補充。

1 數據

采用以色列B.F.Agritech農業技術公司研制生產的PTM-48A型植物光合生理—環境因子監測系統對室外栽培的番茄進行無損監測和數據采集[10]。本文使用的實驗數據有:番茄0712,觀測時間為2015年7月12日12:00至15日11:45,監測時間間隔為15 min,共288組數據;番茄0325,觀測時間為2015年3月25日13:00至26日13:30,監測時間間隔為15 min,共99組數據;番茄0525,觀測時間為2015年5月25日13:00至26日13:30,監測時間間隔為30 min,共50組數據。根據前期的研究結果[11],本研究采用對番茄CO2交換速率直接影響較強、顯著性檢驗最顯著的4個環境因子——光照強度、空氣溫度、蒸汽壓虧空差和露點溫度作為自變量。直接用原始實驗數據進行研究,不進行平滑濾波、異常檢測等任何預處理。

2 方法

2.1 基因表達式編程(GEP)算法

GEP融合了遺傳算法和遺傳程序設計的優點,在表達形式上,它繼承了GA的定長線性編碼簡單快捷的特點;在基因表達(語義表達)上,它繼承了GP的樹形結構靈活多變的特點,用簡單編碼解決復雜問題,比傳統進化計算快2~4個數量級[12]。標準的GEP算法的基本流程[4]如圖1所示。

圖1 GEP算法流程圖Fig.1 The flowchart of GEP algorithm

2.1.1 基因結構

GEP處理的對象是單基因或多基因組成的染色體(基因組)。GEP中的基因是生物學中基因原理的簡化,它由線性的、固定長度的符號串組成。染色體長度雖然固定,但卻能表達出不同大小和形狀的表達式樹(expression trees,ET),從而產生多樣的個體。例如,針對代數表達式(1):

其對應的表達式樹即個體的表現型(phenotype)如圖2所示,圖中q表示平方根函數。將一棵表達式樹按照從上到下、從左到右的順序進行遍歷,即可得到其所對應的K-表達式(K-expression)。

圖2 表達式(1)對應的表達式樹Fig.2 The corresponding expression trees of expression(1)

由圖2可以得到如式(2)所示的K-表達式,這即是GEP中的基因型(genotype)。

GEP將基因分為頭部和尾部,基因頭可由變量或函數構成,基因尾則只能由變量構成,并且頭部長度h與尾部長度t滿足式(3),其中n為函數集中所有函數的最大操作目數。

2.1.2 遺傳算子

GEP在算法中創建初始種群,種群中的每個染色體代表問題的一種解答方案。隨后進行一系列的遺傳操作,生成新的適應度高的子代個體以獲取更優的解答方案。GEP的基本遺傳算子有選擇、變異、倒串、插串、根插串、基因變換、單點重組、兩點重組和基因重組9種[4]。

2.1.3 適應度函數

為了獲取最佳解答方案需要對新產生的染色體進行環境適應能力評價。GEP和其他進化算法一樣也使用適應度函數值(即適應度)的大小來評價染色體的優劣。有時根據求解問題的需要可以自定義恰當的適應度函數。在符號回歸中常用的適應度函數有:復相關系數法、Relative/Hits、Absolute/Hits、均方差(MSE)、均方根差(RMSE)、絕對均差(MAE)、相對方差(RSE)、相對均方根差(RRSE)、相對絕對值差(RAE)[13]。

2.2 對照方法

2.2.1 回歸建模

多元二項式回歸是經典的建模工具,有4種常用類型:線性回歸、純二次回歸、交叉回歸和完全二次回歸。文獻[14]詳細比較了4種多元二項式回歸模型在作物生長建模中的性能,發現純二次回歸模型具有最佳的綜合性能。本文選擇純二次回歸方法建模與GEP模型作對比。所用的純二次回歸模型的數學表達式如式(4)。

2.2.2 神經網絡建模

BP神經網絡是人工神經網絡的一個典型代表。它具有多層神經網絡,每一層都由若干個神經元組成,采用誤差反向傳播算法對網絡權值進行訓練和修正,以提高網絡對輸入模式響應的正確率[15]。本研究中,BP神經網絡建模時的輸入節點數為4,輸出節點數為1。對于隱含層的節點數,使用柯爾莫哥洛夫定理[16]及經驗方程[17],可確定最佳的隱含層節點數的范圍為6~15。經過多次重復試驗發現,當隱含層節點數為6時,相對誤差最小,故設置隱含層節點數為6來建立BP神經網絡模型。

2.3 比較標準

采用相對誤差和均方根誤差RMSE作為標準進行模型預測性能的檢驗及比較,如式(5)、(6)所示。

式中:y′為模型的預測值;y為觀測值;N為樣本總數。

3 結果與分析

3.1 GEP模型訓練

本研究的GEP模型是在Gep soft Automatic Problem Solver平臺上進行的。該軟件的初始版本由GEP算法提出者Ferreira于2001年開發,當時只能進行函數發現。隨著對GEP研究的深入,如今可以在Gep soft Automatic Problem Solver上進行邏輯回歸、時間序列的預測和分類等。用戶通過設定合適的參數,就可以執行GEP算法。該平臺的特點在于具有強大的數據分析和可視化功能,并且可以將結果采用多種形式進行呈現,除了GEP中定義的染色體、表達式樹之外,還可以選擇MATLAB、C、Java等十幾種常用語言表達函數。本試驗的各項參數設置如表1所示,同時選取的函數有+、-、?、/、Exp、Sqrt、Ln、Cos等。

取番茄0712前2日的192組數據用于GEP訓練,獲得穩定的模型。此時R2值為0.900 8,接近于1。對應的染色體為:

表1 基因表達式編程實驗參數Table 1 The parameters of GEPmodel

染色體由5個基因組成,基因之間用“+”連接,隨機常數用隨機數組中的c0到c9表示,隨機常數數組如下。

染色體對應的表達式即最佳擬合函數為

3.2 GEP模型預測

為了驗證所建立的GEP模型的預測效果,將實驗所得GEP模型對番茄0712第3日測試樣本進行預測,并將預測輸出值與實驗觀測值進行對比,對比結果如圖3所示。由圖3-a可以看出,GEP模型的預測結果基本上維持了與實驗觀測值相同的變化趨勢,且數值接近,說明使用GEP方法建立模型能夠較準確地對番茄葉片CO2交換速率進行預測。圖3-b顯示GEP模型預測值與觀測值的擬合度達到0.88,其中少許數據點由于未對原始數據進行平滑濾波和異常檢測等預處理而相距較遠。

圖3 GEP模型的預測值與觀測值比較Fig.3 Comparison of GEP predicted values and observed values

3.3 預測精度比較

將建立的純二次回歸模型和BP神經網絡模型對番茄0712第3日測試樣本進行預測并計算相對誤差,并與GEP模型的預測誤差進行對比。圖4顯示,在3種預測模型中,純二次回歸模型的誤差最大,且明顯大于GEP模型,可知采用GEP方法所建立的模型要優于采用傳統回歸方法所建模型。GEP預測模型的誤差與BP神經網絡預測模型的誤差較為接近,但在某些樣本點上,GEP預測模型的誤差要明顯低于BP神經網絡。為避免偶然性,更加客觀地評價模型效果,利用另外2組番茄0325和番茄0525的監測數據進行建模對比。表2計算出了各模型的誤差,其中平均相對誤差為相對誤差取絕對值后的平均值。

圖4 三種模型預測誤差比較Fig.4 The error comparison of three kinds of prediction models

由表2可以看出,在不同時間段的數據上,GEP預測模型的平均相對誤差和均方根誤差均要低于BP神經網絡預測模型和純二次預測模型,模型的預測效果最好。在對番茄葉片CO2交換率的建模上,回歸方法難以精確描述各自變量與因變量之間的非線性關系;BP神經網絡通過對數據進行訓練得出模型,雖然其平均相對誤差與GEP模型較接近,但是精度遠不如GEP方法所建模型,這在數據量較小時表現尤為明顯,原因在于較穩定的BP神經網絡的建立需要大量訓練數據。

3.4 預測時效性比較

取實驗數據番茄0712的第1日即7月12日12:00至7月13日11:45共96組數據建立番茄CO2交換速率模型,分別對第2日(7月13日12:00至7月14日11:45)和第3日(7月14日12:00至7月15日11:45)的CO2交換速率模型進行預測。采用GEP、純二次回歸和BP神經網絡方法分別建立模型并進行預測,實驗結果如圖5所示。從圖5可以看出,GEP模型的預測誤差變化最小,BP神經網絡其次,純二次回歸的誤差變化最為明顯。可見,GEP和BP神經網絡所建模型具有較佳的預測時效性。從2日預測的誤差范圍上看,GEP模型的預測更加準確。

表2 三種模型預測誤差統計Table 2 The error statistics of three kinds of model

a,GEP;b,純二次回歸;c,BP神經網絡a,Gene expression programming(GEP);b,Pure quadratic regression;c,BP neural network

進一步量化分析,得到3種模型的預測時效誤差統計,如表3所示。由表3得出,3種方法所建模型對第3日的預測誤差較之第2日均有所增加,其中第3日的GEP模型預測誤差較第2日的預測平均誤差增加了0.79,均方根誤差增加了1.20;BP神經網絡模型的平均誤差和均方根誤差增幅分別為0.02和2.41;純二次回歸模型增幅則分別為1.06和1.38。BP神經網絡模型平均誤差的增幅雖小于GEP模型,但均方根誤差增幅較小,同時在單日的預測誤差上,GEP模型的預測精確度要明顯高于BP神經網絡模型,并且純二次回歸方法所建模型的平均誤差和均方根誤差值均最大,是3種模型中預測效果最差的。綜上可得,GEP方法建立的模型具有最佳的預測時效性。另外,在和表2對比后可知,當建模數據由192組減少至96組時,預測模型的精確度也有所降低。可見,建模所用的歷史數據量較多時,所得的模型的預測效果也會相應地提高。

3.5 算法復雜性分析

回歸是統計學中常用方法,其時間復雜性主要受自變量個數和階次影響,理論上所需的時間最小。從算法角度分析,GEP算法中的基本操作為適應度值的計算,而該計算的總次數為種群規模p、訓練集大小n與進化代數g之積。由于本文中種群規模較小,對運行時間的影響可以忽略,故GEP的時間復雜度可以表示為Ο(g×n)。BP神經網絡的基本操作在于誤差的計算和閾值的矯正,對于本文中單輸出的BP神經網絡,其時間復雜度可表示為Ο(g×n)。因此,GEP算法與BP神經網絡的復雜性相當。在實際操作中,GEP中定義了種群,能讓每代個體經歷“優勝劣汰”的過程,加快了尋優速度。而在對BP神經網絡的訓練過程中,經常會出現因陷入極值而結束訓練的現象。另外,對于類似本文的小樣本數據建模,算法的空間復雜性對運行過程的影響可以忽略。

表3 預測時效性誤差統計Table 3 The error statistics of predict time effect

4 結論

為了解決各種建模、預測與決策難題,人們不斷探索新的方法,陸續發展了機器學習[18]、模糊控制[19]、灰色系統[20]等理論。本研究針對當前作物生長建模中存在的不足,引入基因表達式編程方法,開展建模和預測研究。以番茄葉片

CO2交換速率與主要環境因子的關系為對象進行性能驗證,并與傳統的回歸和神經網絡方法比較。結果顯示:GEP模型具有良好的預測精度,平均相對誤差和均方根誤差均小于純二次回歸模型和BP神經網絡模型;GEP模型的預測時效性也優于其他2種模型;GEP算法復雜度與BP神經網絡相當。本研究拓展了傳統作物建模方法,在對GEP算法進一步改進的基礎上,有望發展一種新的作物建模工具,為經典作物建模方法提供重要補充。

):

[1] PAPAGEORGIOU E I,MARKINOS A T,GEMOTS T.A Fuzzy cognitive map based approach for predicting yield in cotton crop production asa basis for decision support system in precision agriculture application[J].Applied Soft Computing,2011,11(4):3643-3657.

[2] 楊靖民,楊靖一,姜旭,等.作物模型研究進展[J].吉林農業大學學報,2012,34(5):553-561.

YANG JM,YANG J Y,JIANG X,et al.Progress of crop model research[J].Journal of Jilin Agricultural University, 2012,34(5):553-561.(in Chinese with English abstract)

[3] 王麗艷,郭樹國.基于BP神經網絡的番茄干重預測研究[J].浙江農業學報,2012,24(5):922-925.

WANG L Y,GUO SR.Prediction study of tomato dry weight based on BP neural network[J].Acta Agriculture Zhejiangensis,2012,24(5):922-925.(in Chinese with English abstract)

[4] FERREIRA C.Gene expression programming:A new adaptive algorithm for solving problems[J].Complex Systems,2001,13(2):87-129.

[5] SAMADIANFARD S,DELIRHASANNIA R,KI?I?,et al. Comparative analysis of ozone level prediction models using gene expression programming and multiple linear regression[J].Geofizika,2013,30(1):43-74.

[6] 元昌安.基因表達式編程算法原理與應用[M].北京:科學出版社,2010.

[7] 李茵.基于基因表達式編程的糧食產量預測研究[D].楊凌:西北農林科技大學,2010.

LIY.Research on grain yield forecasting based on gene expression programming[D].Yangling:Northwest A&FUniversity,2010.(in Chinese with English abstract)

[8] 丁維龍,胡辰,程志君,等.基于基因表達式編程的植物形態建模智能化方法[J].農業工程學報,2013,29(1):134-141.

DINGW L,HU C,CHENG Z J,et al.Intelligent modeling method for plant morphology based on gene expression programming[J].Transactions of the Chinese Society of Agricultural Engineering,2013,29(1):134-141.(in Chinese with English abstract)

[9] 王升,陳洪松,聶云鵬,等.基于基因表達式編程算法的參考作物騰發量模擬計算[J].農業機械學報,2015,46(4):106-112.

WANG S,CHEN H S,NIE Y P,et al.Simulation of reference evapotranspiration based on gene expression programming method[J].Transactions of the Chinese Society for Agricultural Machinery,2015,46(4):106-112.(in Chinese with English abstract)

[10] JIANG Z H,WANG C S,ZHANG J,et al.Online monitoring and analysis of plant photosynthetic physiology and environmental factors[J].Applied Mechanics and Materials,2013,241-244:75-80.

[11] 張靜.小樣本數據作物模型研究[D].合肥:安徽農業大學,2015.

ZHANG J.Research on crop model for small sample size[D].Hefei:Anhui Agricultural University,2015.(in Chinese with English abstract)

[12] FERREIRA C.Gene expression programming:mathematical modeling by an artificial intelligence[M]. Berlin:Springer,2006.

[13] 元昌安.基于GEP函數發現的智能模型庫關鍵技術研究[D].成都:四川大學,2006.

YUAN C A.The research on key techniques in intelligent model base based on function finding by GEP[D].Chengdu:Sichuan University,2006.(in Chinese with English abstract)

[14] ZHANG J,JIANG Z H,WANG C S,et al.Modeling and prediction of CO2exchange response to environment for small sample size in cucumber[J].Computers and Electronics in Agriculture,2014,108:39-45.

[15] 張德豐.MATLAB神經網絡應用設計[M].北京:機械工業出版社,2012.

[16] COTTER N E,GUILLERM T J.The CMAC and a theorem of Kolmogorov[J].Neural Networks,1992,5(2):221-228.

[17] LIY T,GU R R.Modeling flow and sediment transport in a river system using an artificial neural network[J].Environmental Management,2003,31(1):0122-0134.

[18] KODRATOFF Y,MICHALSKIR S.Machine learning:an artificial intelligence approach[M].Berlin:Springer,2014.

[19] IZAKIAN H,ABRAHAM A.Fuzzy C-means and fuzzy swarm for fuzzy clustering problem[J].Expert Systems with Applications,2011,38(3):1835-1838.

[20] 龔娜,楊鎮,王娜,等.植物內生菌次生代謝產物影響大豆主要性狀的灰色關聯度分析[J].浙江農業學報,2013,25(5):933-937.

GONG N,YANG Z,WANG N,et al.Grey correlation analysis of the soybean's main properties impacted by secondary metabolites of endophyte[J].Acta Agriculturae Zhejiangensis,2013,25(5):933-937.(in Chinese with English abstract)

(責任編輯 張 韻)

M odeling and prediction of tomato leaf CO2exchange rate based on gene expression programming

LITing-ting,JIANG Zhao-hui?,MINWen-fang,JIANG Guan-yang,RAO Yuan
(School of Information and Computer,Anhui Agricultural University,Hefei230036,China)

In order to overcome the shortcomings of existing methods in crop growth modeling,gene expression programming(GEP)was introduced and adopted in modeling and prediction of tomato leaf CO2exchange rate response to major environmental factors.A new model was established by GEP in this paper,then the performance of the proposed model was compared with two classical modeling methods-regression and neural network.The experimental results on three sets of data showed that,the GEP based model get the highest predictive accuracy and the best predictive time effect,at the same time,the complexity of the GEP based model was numerically similar to neural network. The study indicated that GEP is a good tool in crop modeling,and will be an important supplement for the existing methods.

crop growth model;gene expression programming;carbon dioxide exchange rate;environmental factors

S24;TP391

A

1004-1524(2016)09-1616-08

10.3969/j.issn.1004-1524.2016.09.23

2015-12-02

安徽省自然科學基金(1508085MF110);安徽省科技攻關項目(1501031102);農業部國際科技合作項目(948計劃,2015-Z44)

李婷婷(1992—),女,安徽合肥人,碩士研究生,從事計算機應用研究。E-mail:1576234742@qq.com

?通信作者,江朝暉,E-mail:jiangzh@ahau.edu.cn

浙江農業學報Acta Agriculturae Zhejiangensis,2016,28(9):1616-1623 http://www.zjnyxb.cn李婷婷,江朝暉,閔文芳,等.基于基因表達式編程的番茄葉片CO2交換率建模與預測[J].浙江農業學報,2016,28(9):1616-1623.

猜你喜歡
方法模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
學習方法
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 亚洲av片在线免费观看| 又粗又大又爽又紧免费视频| 亚洲高清无在码在线无弹窗| 91精品福利自产拍在线观看| 免费播放毛片| 少妇露出福利视频| 亚洲欧美一区二区三区蜜芽| 久久婷婷人人澡人人爱91| 尤物成AV人片在线观看| 中文字幕永久在线看| 国产美女一级毛片| 亚洲人成网线在线播放va| 久久黄色影院| 日本三级精品| 色综合成人| 久久99国产视频| 日本黄色a视频| 亚洲欧洲综合| 中文国产成人精品久久| 激情午夜婷婷| WWW丫丫国产成人精品| 欧美成人看片一区二区三区| 国产无遮挡裸体免费视频| 在线观看国产小视频| 欧美成人午夜影院| 久久久久九九精品影院| 日韩黄色精品| 欧美在线天堂| a亚洲天堂| 久久毛片基地| 日韩美一区二区| 久久99精品久久久久久不卡| 极品av一区二区| 日本在线国产| 亚洲第一视频区| 亚洲天堂网在线播放| 亚洲视频黄| 日韩高清一区 | 在线观看视频99| 国产欧美日韩va| 日韩免费成人| 日本人妻丰满熟妇区| 在线欧美a| 免费毛片网站在线观看| 久久午夜夜伦鲁鲁片不卡| 天天摸夜夜操| swag国产精品| 潮喷在线无码白浆| 日韩一区二区三免费高清| 91亚洲精品国产自在现线| 国产久操视频| 国产成人精品2021欧美日韩| 香蕉国产精品视频| 美女国产在线| 日韩精品毛片| 91黄视频在线观看| 久草视频福利在线观看| 午夜色综合| 欧美啪啪网| 久久99国产综合精品女同| 亚洲 欧美 中文 AⅤ在线视频| 熟女视频91| 国产成人夜色91| 精品国产福利在线| 亚洲欧美成人在线视频| 日本亚洲成高清一区二区三区| 99视频精品在线观看| 精品国产Ⅴ无码大片在线观看81 | 亚洲午夜福利精品无码不卡| 在线欧美国产| 久久精品亚洲专区| 亚洲视频四区| 在线国产综合一区二区三区| 内射人妻无码色AV天堂| 国产在线98福利播放视频免费| 日韩 欧美 小说 综合网 另类| 久久国产亚洲偷自| 毛片免费网址| 无码 在线 在线| 免费中文字幕在在线不卡| 在线五月婷婷| 国产成人精品视频一区二区电影|