盧德全,劉書慧*,康 健,李嘉樂(lè),李 夢(mèng)
(1.四川省南充市氣象局,四川 南充 637000; 2.四川省大數(shù)據(jù)中心,四川 成都 610000; 3.成都信息工程大學(xué),四川 成都 610225)
【研究意義】目前,我國(guó)存在大量低成本、體積小、易于安裝、高密度的農(nóng)田小氣候站,主要用于農(nóng)業(yè)園區(qū)的實(shí)時(shí)氣象監(jiān)控,但由于其數(shù)據(jù)可靠性低,無(wú)法替代國(guó)家自動(dòng)氣象觀測(cè)站的數(shù)據(jù)作為可靠的氣象數(shù)據(jù)進(jìn)行分析,所以,龐大的農(nóng)田小氣候站數(shù)據(jù)應(yīng)用被忽視。為充分發(fā)揮農(nóng)田小氣候站數(shù)據(jù)在農(nóng)業(yè)農(nóng)村發(fā)展中的重要功能和巨大潛力,有力支撐和服務(wù)農(nóng)業(yè)現(xiàn)代化,推進(jìn)“十四五”農(nóng)業(yè)農(nóng)村發(fā)展顯得至關(guān)重要[1-2],怎樣高效利用農(nóng)業(yè)數(shù)據(jù)成為重要環(huán)節(jié)。因此,農(nóng)業(yè)數(shù)據(jù)質(zhì)量的提高顯得尤為重要。【前人研究進(jìn)展】BP神經(jīng)網(wǎng)絡(luò)模型具有較強(qiáng)的自學(xué)習(xí)能力和處理非線性問(wèn)題能力,近年來(lái)在農(nóng)業(yè)相關(guān)領(lǐng)域得到廣泛應(yīng)用。金志鳳等[3]基于BP神經(jīng)網(wǎng)絡(luò)構(gòu)建楊梅生產(chǎn)大棚內(nèi)最高和最低氣溫的預(yù)測(cè)模型,并根據(jù)逐時(shí)轉(zhuǎn)化系數(shù)計(jì)算棚內(nèi)相應(yīng)的逐時(shí)氣溫,以達(dá)到逐時(shí)預(yù)報(bào)大棚內(nèi)氣溫的目的。張漫等[4]利用空氣溫濕度、光照強(qiáng)度和 CO2濃度為輸入?yún)?shù),建立基于BP神經(jīng)網(wǎng)絡(luò)的光合速率預(yù)測(cè)模型,預(yù)測(cè)不同 CO2濃度下的光合日動(dòng)態(tài)。【研究切入點(diǎn)】目前,國(guó)內(nèi)氣象行業(yè)已建成5~10 km的國(guó)家區(qū)域自動(dòng)氣象站,且形成了網(wǎng)格化標(biāo)準(zhǔn)氣象要素收集能力。若能發(fā)揮該網(wǎng)絡(luò)化氣象信息采集模式的優(yōu)勢(shì),建立農(nóng)田小氣候站數(shù)據(jù)同化算法模型,對(duì)提升小氣候站數(shù)據(jù)精度和質(zhì)量,滿足農(nóng)業(yè)園區(qū)精細(xì)化氣象服務(wù)要求具有重要意義。但目前應(yīng)用BP神經(jīng)網(wǎng)絡(luò)模型將農(nóng)業(yè)與氣象領(lǐng)域有機(jī)結(jié)合的研究成果較少。【擬解決的關(guān)鍵問(wèn)題】以四川省溫江國(guó)家氣象觀測(cè)站及農(nóng)田小氣候站2013年的日最高氣溫?cái)?shù)據(jù)為研究材料,基于BP神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)利用國(guó)家氣象觀測(cè)自動(dòng)站的高精準(zhǔn)度數(shù)據(jù)校正農(nóng)業(yè)氣候站數(shù)據(jù)精度的算法模型,以期為提升智慧農(nóng)業(yè)數(shù)據(jù)庫(kù)的數(shù)據(jù)量及智慧農(nóng)業(yè)的發(fā)展提供數(shù)據(jù)支撐。
四川省溫江國(guó)家氣象觀測(cè)站及觀測(cè)場(chǎng)內(nèi)農(nóng)田小氣候站2013年1月1日至12月28日共360 d的日最高氣溫?cái)?shù)據(jù)資料,來(lái)源于四川省溫江區(qū)氣象局。選取國(guó)家氣象觀測(cè)站數(shù)據(jù)作為期望值,農(nóng)田小氣候站數(shù)據(jù)作為輸入值;將數(shù)據(jù)前180 d的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),后180 d的數(shù)據(jù)作為測(cè)試數(shù)據(jù)。
1.2.1 研究要素選擇 溫度是對(duì)作物生長(zhǎng)影響最大的因素之一,作物的光合作用、呼吸作用、蒸騰作用都受其影響。在農(nóng)業(yè)觀測(cè)中,一般氣象站對(duì)氣溫的觀測(cè)只顯示日最高、最低、平均氣溫值的大小,日最高、最低氣溫的高低和出現(xiàn)時(shí)間與水汽蒸發(fā)凝結(jié)等大氣物理過(guò)程的關(guān)系十分密切,是判斷高溫、寒潮、冷害及霜凍等極端氣候事件強(qiáng)度的重要指標(biāo)。全球變暖也是氣候變化研究領(lǐng)域關(guān)注的核心問(wèn)題,特別是“城市熱島”的影響[5-10]讓氣溫成為影響氣候變化的重要因素。其中,日最高氣溫一般出現(xiàn)在14:00—15:00,也是最強(qiáng)光照后的2~3 h,此時(shí)作物剛結(jié)束每日最高速率的光合作用,是作物補(bǔ)充太陽(yáng)輻射重要時(shí)間段。故采用同一環(huán)境下,農(nóng)田小氣候站和國(guó)家氣象觀測(cè)站的日最高氣溫作為研究要素,用于探索數(shù)據(jù)分布的規(guī)律。
1.2.2 BP神經(jīng)網(wǎng)絡(luò)誤差校正 根據(jù)區(qū)域內(nèi)大氣熱力學(xué)原理和大氣運(yùn)動(dòng)模型,以溫度日數(shù)據(jù)為研究對(duì)象,建立BP神經(jīng)網(wǎng)絡(luò)誤差校正模型及日極溫變化率滑窗二次校正模型[11-14]。研究選取國(guó)家氣象觀測(cè)站與同時(shí)段就近區(qū)域的農(nóng)田小氣候站日最高氣溫作為數(shù)據(jù)質(zhì)量控制分析的參考要素,比對(duì)同一環(huán)境條件下的數(shù)據(jù),以農(nóng)田小氣候站的日最高氣溫?cái)?shù)據(jù)作為輸入值,國(guó)家氣象觀測(cè)站日最高氣溫?cái)?shù)據(jù)作為期望值,通過(guò)BP神經(jīng)網(wǎng)絡(luò)方法(圖1)建立相關(guān)算法模型。利用訓(xùn)練好的模型對(duì)后180 d的數(shù)據(jù)進(jìn)行測(cè)試標(biāo)定,然后分析標(biāo)定數(shù)據(jù)的日變化率;結(jié)合原始日最高氣溫日變化率對(duì)數(shù)據(jù)進(jìn)行再擬合。基于溫度誤差補(bǔ)償原理,建立農(nóng)田小氣候站與國(guó)家氣象觀測(cè)站的日最高氣溫誤差補(bǔ)償模型,并利用其對(duì)農(nóng)田小氣候站的氣溫?cái)?shù)據(jù)進(jìn)行補(bǔ)償,以此達(dá)到補(bǔ)償后的輸出結(jié)果,使得輸出結(jié)果趨近于國(guó)家氣象觀測(cè)站的數(shù)據(jù)精度。該研究輸入層和輸出層神經(jīng)元都為1,分別對(duì)應(yīng)農(nóng)田小氣候站和國(guó)家氣象觀測(cè)站傳感器的日最高氣溫?cái)?shù)據(jù)。BP神經(jīng)網(wǎng)絡(luò)建模步驟:

圖1 BP神經(jīng)網(wǎng)絡(luò)用于農(nóng)田小氣候站數(shù)據(jù)質(zhì)量控制的算法整體框架Fig.1 The whole framework of data quality control algorithm for farmland microclimate stations based on BP neural network
1) 數(shù)據(jù)歸一化處理。數(shù)據(jù)輸入前先采用線性函數(shù)歸一化,將原始數(shù)據(jù)轉(zhuǎn)換到[0,1]的范圍。
式中,Tnorm為歸一化后的日最高溫度,T為原始日最高溫度,Tmax為所有測(cè)量值中的最大值,Tmin是所有測(cè)量值中的最小值。
2) 數(shù)據(jù)BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練。在同一個(gè)區(qū)域內(nèi)農(nóng)田小氣候站傳感器日最氣溫?cái)?shù)據(jù)和標(biāo)準(zhǔn)站與區(qū)域站日最高氣溫差值作為輸入數(shù)據(jù),180 d形成2種180個(gè)序列的輸入數(shù)據(jù),在以同區(qū)域內(nèi)國(guó)家標(biāo)準(zhǔn)氣象觀測(cè)站傳感器日最高氣溫?cái)?shù)據(jù)作為期望數(shù)據(jù)的3層BP神經(jīng)網(wǎng)絡(luò)輸出數(shù)據(jù),進(jìn)行訓(xùn)練并輸出訓(xùn)練參數(shù)。在同一個(gè)區(qū)域內(nèi)利用大氣背景趨同的原則,訓(xùn)練出來(lái)的參數(shù)基本上只與傳感器及采集器本身性能相關(guān)。利用國(guó)家標(biāo)準(zhǔn)數(shù)據(jù)、訓(xùn)練出來(lái)的網(wǎng)絡(luò)參數(shù)建立農(nóng)田小氣候站的日最高氣溫?cái)?shù)據(jù)誤差修正模型。
3) 數(shù)據(jù)反歸一化處理。采用反歸一化對(duì)訓(xùn)練后要輸出的數(shù)據(jù)進(jìn)行處理。
T=Tn×(Tmax-Tmin)+Tmin
式中,h為隱含層節(jié)點(diǎn)的數(shù)目,m和n分別是輸入層和輸出層節(jié)點(diǎn)的數(shù)目,a為1~10的調(diào)節(jié)常數(shù)。
5) 數(shù)據(jù)誤差補(bǔ)償校正。經(jīng)BP神經(jīng)網(wǎng)絡(luò)校正后的數(shù)據(jù),由于采集站的地形地貌、下墊面往往區(qū)別較大,導(dǎo)致誤差補(bǔ)償?shù)臄?shù)據(jù)不足或錯(cuò)誤。為此,根據(jù)熱力學(xué)原理,建立日極高氣溫變化率和時(shí)間窗口算法對(duì)BP網(wǎng)絡(luò)誤差補(bǔ)償后的數(shù)據(jù)作更進(jìn)一步的差錯(cuò)控制和質(zhì)量提升。
1.2.3 日極溫二次校正算法設(shè)計(jì) 采用國(guó)家標(biāo)準(zhǔn)日最高氣溫變化率對(duì)農(nóng)田小氣候站經(jīng)BP網(wǎng)絡(luò)校正后的數(shù)據(jù)進(jìn)行再一次同比檢驗(yàn)。△t是原始數(shù)據(jù)的前一日最高氣溫與當(dāng)日最高氣溫的差值,△T是經(jīng)過(guò)BP神經(jīng)網(wǎng)絡(luò)誤差補(bǔ)償后的前一日最高氣溫與今日最高氣溫的差值。當(dāng)|△t-△T|>C時(shí)(C是設(shè)定的判決門限),則需要進(jìn)行二次校正,其他的情況不需要進(jìn)行二次校正。二次校正的數(shù)據(jù)T’是由BP神經(jīng)網(wǎng)絡(luò)誤差補(bǔ)償后的前一天日最高氣溫與△t求和得到。
將測(cè)試數(shù)據(jù)代入1—6月數(shù)據(jù)訓(xùn)練出的BP神經(jīng)網(wǎng)絡(luò)模型中提取誤差校正參數(shù)。利用提取的誤差校正參數(shù),結(jié)合BP神經(jīng)網(wǎng)絡(luò)對(duì)7—12月原始數(shù)據(jù)進(jìn)行校正即可得到校正后的中間數(shù)據(jù),即統(tǒng)計(jì)分析的結(jié)果,但該結(jié)果存在一些偶然因素的影響。為消除不確定因素的影響,再采用日最高氣溫變化率進(jìn)行頻率特征的數(shù)理分析進(jìn)行二次校正。最后輸出的是日最高氣溫?cái)?shù)據(jù)日變化率特征進(jìn)行二次誤差校正后的最高氣溫?cái)?shù)據(jù)。
從圖2看出,將1—6月的農(nóng)田小氣候站和國(guó)家自動(dòng)氣象觀測(cè)站的日最高氣溫?cái)?shù)據(jù)作為訓(xùn)練數(shù)據(jù),訓(xùn)練出BP神經(jīng)網(wǎng)絡(luò)模型,其溫度為2~35℃,農(nóng)田小氣候站(輸入值)和國(guó)家自動(dòng)氣象觀測(cè)站(期望值)的日最高氣溫?cái)?shù)據(jù)基本一致;7—12月的日最高氣溫?cái)?shù)據(jù)訓(xùn)練出BP神經(jīng)網(wǎng)絡(luò)模型,其溫度分布范圍與1—6月的基本一致,溫度為6~36℃,涵蓋全年98%以上的溫度。表明,選取的測(cè)試數(shù)據(jù)能夠讓模型更準(zhǔn)確。

圖2 2013年1—6月和7—12月溫江農(nóng)田小氣候站和國(guó)家自動(dòng)氣象觀測(cè)站日最高氣溫的BP模型Fig.2 The BP model of daily maximum temperature of Wenjiang farmland microclimate station and National Automatic Meteorological Observation Station during Jan.—June and July—Dec. in 2013
從圖3和圖4看出,誤差補(bǔ)償前1—12月農(nóng)田小氣候站與國(guó)家自動(dòng)氣象觀測(cè)站測(cè)量數(shù)據(jù)的原始誤差為-0.1~0.5℃,大部分分布在0.4℃。質(zhì)量控制后,7—12月農(nóng)田小氣候站與國(guó)家自動(dòng)氣象觀測(cè)站測(cè)量數(shù)據(jù)的誤差為-0.1~0.2℃,大部分分布在0.1℃和0℃。與質(zhì)量控制前的誤差相比,控制后的誤差從-0.1~0.5℃降至-0.1~0.2℃,誤差范圍縮小,且出現(xiàn)次數(shù)最多的誤差值從0.4℃降至0.1℃和0℃。表明,在經(jīng)過(guò)本方法誤差補(bǔ)償后的數(shù)據(jù)質(zhì)量誤差得到極為有效的控制。

圖3 1—12月溫江農(nóng)田小氣候站日最高氣溫原始誤差的分布 Fig.3 The original error distribution of daily maximum temperature in Wenjiangfarmland microclimate station during Jan.—Dec.

圖4 7—12月溫江農(nóng)田小氣候站經(jīng)過(guò)BP神經(jīng)網(wǎng)絡(luò)誤差補(bǔ)償及日最高氣溫變化率二次校正后的誤差值Fig.4 The error value of Wenjiang farmland microclimate station after BP neural network error compensation and the daily maximum temperature variation rate after quadric correction from July—Dec.
對(duì)誤差補(bǔ)償前、第1次BP神經(jīng)網(wǎng)絡(luò)誤差補(bǔ)償后及日最高氣溫變化率特征二次校正后3組數(shù)據(jù)的誤差數(shù)據(jù)與整體數(shù)據(jù)進(jìn)行相關(guān)性分析發(fā)現(xiàn),其相關(guān)顯著性系數(shù)分別為0.04、0.002和0,表明,3組數(shù)據(jù)均與整體數(shù)據(jù)顯著相關(guān),說(shuō)明選取的該部分?jǐn)?shù)據(jù)能夠推廣到整體。從表1看出,在進(jìn)行質(zhì)量控制前誤差大多在0.4℃左右,平均誤差為0.28℃。經(jīng)過(guò)BP神經(jīng)網(wǎng)絡(luò)誤差補(bǔ)償后平均誤差為0.07℃,但出現(xiàn)了個(gè)別跳變數(shù)據(jù),使最大誤差和最小誤差更大,不能達(dá)到質(zhì)量控制的要求;在對(duì)此數(shù)據(jù)進(jìn)行日最高氣溫變化率二次校正后誤差全部控制在-0.1~0.2℃,未出現(xiàn)偏離特別大的誤差值,平均誤差為0.05℃,數(shù)據(jù)質(zhì)量控制達(dá)到要求。由此得出,農(nóng)田小氣候站數(shù)據(jù)經(jīng)過(guò)此算法進(jìn)行質(zhì)量控制后能夠大大減小數(shù)據(jù)的誤差,數(shù)據(jù)質(zhì)量達(dá)到國(guó)家氣象觀測(cè)站的精度要求。

表1 部分樣本數(shù)據(jù)質(zhì)量控制前后的差異 Table 1 The differences of some sample data before and after quality control ℃
研究將BP神經(jīng)網(wǎng)絡(luò)運(yùn)用到農(nóng)業(yè)數(shù)據(jù)質(zhì)量控制上,建立了通過(guò)國(guó)家氣象觀測(cè)站數(shù)據(jù)誤差補(bǔ)償修正農(nóng)田小氣候站數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)補(bǔ)償模型。同時(shí),為解決BP神經(jīng)網(wǎng)絡(luò)自身帶來(lái)的誤差,使數(shù)據(jù)精度更為準(zhǔn)確,提出了日最高氣溫變化率特征二次校正的方法,利用氣象數(shù)據(jù)具有時(shí)間連續(xù)性的特點(diǎn),對(duì)神經(jīng)網(wǎng)絡(luò)誤差補(bǔ)償?shù)臄?shù)據(jù)進(jìn)行二次校正。
研究結(jié)果表明,四川省溫江地區(qū)2013年1月1日至12月28日農(nóng)田小氣候站數(shù)據(jù)未進(jìn)行質(zhì)量控制前的誤差平均在0.3℃,最大達(dá)0.5℃;質(zhì)量控制后的誤差大多能達(dá)±0.1℃。即經(jīng)質(zhì)量控制后農(nóng)田小氣候站數(shù)據(jù)的誤差減小至質(zhì)量控制前的50%。農(nóng)田小氣候站的測(cè)量數(shù)據(jù)在經(jīng)過(guò)BP神經(jīng)網(wǎng)絡(luò)誤差補(bǔ)償模型及二次校正提升后基本達(dá)到國(guó)家氣象觀測(cè)站對(duì)數(shù)據(jù)質(zhì)量的要求,不僅可以節(jié)約氣象觀測(cè)的成本,為農(nóng)業(yè)小氣候環(huán)境提供更為準(zhǔn)確的監(jiān)測(cè)數(shù)據(jù),避免農(nóng)作物由于監(jiān)測(cè)數(shù)據(jù)誤差過(guò)大造成的損失,同時(shí)也為我國(guó)農(nóng)業(yè)大數(shù)據(jù)提供了更多滿足數(shù)據(jù)質(zhì)量要求的農(nóng)業(yè)數(shù)據(jù)。