許 可,馮 丹,王 楓,彭秀媛
(1.沈陽理工大學 理學院,沈陽 110159;2.中共遼寧省委黨校 信息中心,沈陽 110004;3.遼寧省農業科學院 信息中心,沈陽 110161)
日光溫室在我國北方農業生產中占有重要地位,利用傳感器采集溫度和濕度等數據,可以實時監測并調控生產環境,對節約資源、提高生產效率尤為重要.但是日光溫室存在內部構造復雜和環境因子分布不均等問題,合理的傳感器布設方案對于保障數據準確度和節省生產成本有著重要意義[1].
多傳感器布設問題是目前的研究熱點,很多學者對相關問題進行了研究.He等[2]以傳感器布設位置的熵值最小化為目標,采用遺傳算法研究了輸電塔的傳感器布設;劉寒冰等[3]基于模態能量評價準則,采用遺傳算法研究了橋梁結構傳感器的布設;溫凱方[4]以三維模態置信準則為優化目標,基于鴿群算法研究了橋梁監測系統傳感器的布設問題;張楚旋等[5]構建了傳感器布設影響方案的評價指標體系,利用逼近理想解的排序法給出了微震監測傳感器的布設方案;孫玉文[6]運用BP神經網絡和自適應加權融合算法對農田傳感器監測數據進行校準融合,給出了傳感器的定位方法;王凡等[7]采用最小二乘法對土壤水分傳感器的埋設位置進行了研究;彭秀媛等[8]采用最佳平方逼近最小二乘法給出了日光溫室傳感器的最佳布設點.
可以看出,目前研究傳感器布設的方法主要可以分為兩類:一類是基于評價準則,通過智能優化算法、TOPSIS等方法評價給定方案來確定最優方案;另一類是基于監測數據,采用最小二乘估計、數據融合等方法確定傳感器布設位置.相對于制定評價準則,基于監測數據分析的方法更加客觀易行,更適合日光溫室環境內傳感器布設.同時,數據融合可以綜合考慮多傳感器和不同時段的監測數據,比傳統的最小二乘估計方法所得結果更準確.
目前,常見的多傳感器數據融合方法有神經網絡、貝葉斯估計、熵融合和自適應加權融合等.相對于神經網絡和貝葉斯等數據融合方法,自適應加權平均融合方法不需要進行概率分析,計算簡單,對數據精度要求較低,適用于環境傳感器的數據融合.但是傳統的自適應加權平均融合算法需要歷史觀測數據用以計算傳感器方差,且適應性不強,無法靈活修改權值.因此,本文將分批估計理論與自適應加權平均融合算法相結合,研究日光溫室的傳感器布設問題.
首先設計實驗方案采集某日光溫室內西紅柿開花坐果期與結果期生長環境數據;其次基于BP神經網絡方法對缺失值進行補全;然后在此基礎上對實驗數據進行分批估計并進行分段自適應加權平均融合,求取融合值與觀測值的相對誤差;最后將總誤差最小的傳感器作為最優傳感器,以此為依據確定傳感器最佳布設區域.
實驗在遼寧省農業科學院用于測試信息化設備的日光溫室內進行,溫室規格為45 m×9 m,溫室內采用基質栽培方式栽培西紅柿,行間距1.1 m.降溫設備包括放風電機、風機、水簾,降濕設備為放風電機,升溫設備包括太陽能、電暖氣,冬季生產晚上還會蓋上棉被,一般8∶00~16∶00打開棉被,其余時間關閉,如遇雨雪天氣則不打開.溫度測量采用Sensirion傳感器公司的SHT10型數字溫度傳感器,溫度測量范圍為-40~+123.8 ℃,測量精度為±0.5 ℃;濕度測量精度為4.5%RH.
目前,常用的日光溫室數據采集均采取采樣點的方式測量.此次實驗的溫室是北方常見的矩形溫室,為了能夠較為全面地檢測溫室內各點的溫濕度情況,選取矩形溫室內種植區域的頂點、中心點、各邊以及對角線中點等典型位置布設11個監測點.各監測點水平位置一致,如圖1所示.實驗數據采集時段為2016.09.30~2017.01.18,覆蓋冬茬西紅柿的開花坐果期與結果期,其中開花坐果期為2016.10.01~2016.10.20,結果期為2016.10.21~2017.01.18,系統設置每隔5 min采樣數據1次.本文希望通過分析處理這11個位置的溫濕度數據,尋找最佳傳感器布設區域,為同類型溫室的傳感器布設提供合理依據.

圖1 日光溫室內傳感器布設位置圖Fig.1 Location of sensor layout in sunlight greenhouse
傳感器在數據采集過程中,由于電壓不穩定、操作不當、設備故障等影響因素,可能會短暫處于不穩定狀態,造成監測數據的異常或少量缺失,這些異常值或缺失值會極大影響數據連續性以及數據分析處理的準確性,需要加以克服.
溫室內溫度范圍為-10~40 ℃,濕度范圍為0~100%RH,首先去掉超出正常值范圍的異常數據,接著需要對缺失數據進行補全.本次實驗傳感器采集的數據具有定距型、樣本量大、宏觀連續的特點,具有充足的訓練樣本,適合采用BP神經網絡算法預測缺失值.
BP神經網絡是一種多層前向型神經網絡,權值調整采用反向傳播學習算法.BP網絡結構包含輸入層、隱含層和輸出層,各層神經元采用全連接方式.采用BP神經網絡進行缺失值預測的關鍵在于構建網絡結構,具體如下:
1) 輸入輸出層.輸入輸出層的神經元數量依據樣本數據確定,根據本次實驗數據特點,確定輸入層神經元個數為10,即輸入變量為已知10個完整的傳感器數據樣本;輸出層為1,即輸出缺失的單個監測數據.
2) 隱含層.采用單個隱含層網絡,通過適當增加隱含節點的個數來實現非線性映射.根據隱含神經元個數經驗公式(1)來確定神經元個數,然后通過對含不同神經元個數的網絡進行訓練對比,最后確定隱含神經元個數.
(1)
式中:k為隱含層神經元個數;p為輸入層神經元個數;t為輸出層神經元個數;m為常數,且1 2.2.1 數據分批處理 直接采用自適應加權算法需要根據歷史數據求得傳感器方差,過于依賴歷史監測數據,在樣本量過大時,方差值發生僵化.分批估計方法將數據分批處理,方差可以根據樣本的改變發生變化,有效避免不同監測結果誤差所導致的融合結果偏差,從而系統地提高魯棒性和容錯性.因此,本文結合分批估計理論,將多個傳感器多次采樣結果進行融合處理. 首先對n個傳感器將全部數據按照時間段分為若干組,然后對每個傳感器各組內的數據做分批處理,步驟如下: 2) 計算每個傳感器該時間段的最小平方誤差,其表達式為 (2) 3) 計算每個傳感器該時間段的融合值,即 (3) 2.2.2 自適應加權平均融合 (4) 數據融合的目標應使總方差最小,即 (5) 依據多元函數極值理論,可得 (6) 此時 (7) 可得最終融合值為 (8) 3.1.1 缺失值補全 表1為某日11個傳感器監測到的7∶00~9∶00的溫度數據.日光溫室白天會掀去草簾接受太陽光照,在白天受外界影響較大,清晨草簾剛掀開后的一段時間內,室內溫度會發生一次較為明顯的下降,因為此時太陽出現不久,室外溫度仍然低于室內,當草簾掀開后室溫下降到室外同一水平,室內溫度才開始回升,本組數據恰好為草簾剛掀開時段的溫度,因此溫度呈明顯下降趨勢.從表1可以看出,A1缺失8∶52的一組數據. 將A2到A11從7∶02至8∶47時間段的溫度數據作為訓練輸入,A1從7∶02至8∶47時間段的數據作為訓練輸出.之后將A2到A11在8∶52時間點的數據作為測試輸入,A1在8∶52時間點的數據作為測試輸出.設定網絡的最大學習迭代次數為100次,學習率為0.05,學習精度為0.000 1.該網絡模型迭代學習10次完成訓練,達到學習精度,預測值為10.984 1 ℃. 表1 神經網絡溫度訓練數據Tab.1 Temperature training data of neural network ℃ 圖2為7∶00~9∶00時間段缺失值補全后的溫度變化曲線.可以看出,此時溫度變化曲線仍然呈連續狀態,預測值前后未出現異常,預測結果可以被接受. 圖2 缺失值補全后溫度變化曲線Fig.2 Temperature change curve after complement of missing values 3.1.2 多傳感器數據融合 將11個傳感器測得的數據按照時間段分為若干組,表2為其中一組,是某日連續11個時間點的溫度監測數據樣本. 運用式(2)、(3)計算本時段11個傳感器的最小平方誤差和溫度融合值,結果如表3所示. 運用式(6)、(7)計算各傳感器的最優權值,結果如表4所示.可得該時段溫度最終融合值,即 同理可得所有時段溫度數據和濕度數據的融合值.圖3、4分別為某日0時至24時基于分批估計的自適應加權平均融合算法的所有時段溫度融合值與濕度融合值. 將基于分批估計的自適應加權平均融合算法、自適應加權平均融合算法和算術平均融合算法的結果進行對比,結果如圖5所示.可以看出,三種方法融合后的數據曲線大致趨勢保持一致,基本反映了當天溫室內溫度變化情況,但是在開始階段和頂點附近融合結果產生較大偏差.在開始階段,相對于算術平均,基于分批估計的自適應加權平均融合與自適應加權平均融合均能反應數據穩定變化的趨勢,較好地彌補了數據突變引起的差異.在曲線頂端,與單純的自適應加權算法相比,采用分批估計理論對單個傳感器分批處理,求得的方差值可以根據樣本改變而變化,避免了由于樣本量過大產生的方差值僵化. 表2 某時段待融合溫度數據Tab.2 Temperature data to be fused at a certain period ℃ 表3 分批估計的融合值與最小平方誤差Tab.3 Fusion values and variances for batch estimation 表4 溫度傳感器最優權值Tab.4 Optimal weight distribution of temperature sensor 圖3 溫度融合值Fig.3 Fusion value of temperature 圖4 濕度融合值Fig.4 Fusion value of humidity 圖5 融合結果對比圖Fig.5 Comparison in fusion results 基于求得的溫濕度融合值計算融合值與觀測值的相對誤差,總誤差最小的傳感器所在區域即為最佳布設區域.根據番茄作物生長周期,將所得監測數據按照開花坐果期與結果期分時段設計布設方案. 表5、6分別為開花坐果期各溫度與濕度傳感器所占最優數據的比率.可以看出在開花坐果期,溫度總誤差最小組占比最大的傳感器是A6,但對比其他傳感器可以發現,A6所占的16.32%并沒有絕對優勢,與之相近的分別是A4的14.41%和A5的13.53%,這三個傳感器占最優數據比例超過44%.可以認為,溫度傳感器最佳布設區域應該是A4、A5、A6圍成的區域.同理濕度傳感器的最佳布設區域應該為A5、A6、A10所在位置區域,最優數據占比和達到51.9%.如果采用溫濕度一體傳感器,可以選取溫度與濕度傳感器最佳布設位置的重合區域,可得開花坐果期傳感器的最佳布設區域為A5、A6所在區域. 表6 開花坐果期濕度傳感器最優數據所占比率Tab.6 Optimum data proportion of humidity sensor during blooming and fruit setting stage % 表7、8分別為結果期各溫度和濕度傳感器所占最優數據的比率.可以看出對于溫度傳感器最佳布設區域為A1、A4、A7、A9四個傳感器所在區域,最優數據占比超過55%;濕度傳感器最佳布設區域為A1、A4、A5所在區域,最優數據占比超過51%,綜合可得,結果期傳感器的最佳布設區域為A1、A4所在區域.結合開花坐果期與結果期分析結果,最終溫度和濕度傳感器布設方案如圖6所示. 最終確定的最優傳感器位置并非一個點,而是日光溫室幾何中心東北側和西北側區域.本文不僅考慮了不同生長期的區別,而且給出的布設方案不是單一點,為一個布設區域.因此,本文確定的最優布設位置不僅符合溫濕度數據變化穩定、受外界影響較小的特點,而且方便操作人員根據溫室內實際情況靈活布設,易于實施. 表7 結果期溫度傳感器最優數據所占比率Tab.7 Optimum data proportion of temperature sensor during fruit setting stage % 表8 結果期濕度傳感器最優數據所占比率Tab.8 Optimum data proportion of humidity sensor during fruit setting stage % 圖6 傳感器最佳布設區域Fig.6 Optimal layout area of sensor 本文針對11個觀測點測得的西紅柿生長濕度數據,首先采用BP神經網絡進行缺失值補全,然后采用基于分批估計理論的自適應加權平均融合算法計算出溫度融合值,最后通過計算融合值與觀測值的絕對誤差分別確定了開花坐果期與結果期的傳感器最佳布設區域.與一般傳感器布設方案只給定單一布設點相比,本文布設方案不僅考慮了不同生長期的區別,而且給出了布設區域,方便操作人員根據溫室實際情況進行安裝布設,更便于實施. 但是本文只研究了溫室內空氣溫濕度傳感器的布設,而溫室內影響作物生長的環境因素還包括光照強度、CO2濃度、土壤濕度等因素,下一步應該在綜合研究其他溫室環境數據的基礎上討論傳感器布設方案.2.2 基于分批估計的自適應加權平均多傳感器數據融合


3 實驗數據分析及傳感器布設方案設計
3.1 數據計算









3.2 傳感器布設方案設計




4 結 論