劉 倩,張向飛,丁永生,2,郝礦榮,2
(1.東華大學信息科學與技術學院,上海 201620;2.數字化紡織服裝技術教育部工程研究中心,上海 201620)
物聯網是通過射頻識別、全球定位系統、激光掃描器等信息傳感設備,按約定協議,把任何物品與互聯網連接起來,進行信息交換和通信,以實現智能化識別、定位、跟蹤、監控和管理的一種網絡[1-3]。物聯網為農田信息獲取提供了嶄新的思路,將傳感器節點布設于農田等目標區域,網絡節點大量實時、精確地采集溫度、濕度、光照、氣體濃度等環境信息,這些信息在數據匯聚節點匯集,網絡對匯集的數據進行分析,幫助生產者有針對性地投放農業生產資料等,從而更好地實現耕地資源的合理高效利用和農業現代化精準管理,推進農業生產的高效管理,提升農業生產效能[4-5]。面向農業物聯網的多環境信息融合的監測判別就是在此基礎上的一次實踐。
信息融合是利用已有的知識經驗來處理從未知世界得到的來自不同領域的數據,強調通過分析來自多個傳感器或多個數據源的信息對目標進行識別估計或做出某種綜合判斷。數據挖掘主要是通過統計或人工智能的方法從大量原始數據集合中推測尋找數據間復雜的潛在關系或蘊涵的模型。本文采用模糊推理方法對采集的環境信息進行決策級的融合分類,并引入由關聯規則挖掘所得的知識庫,定量地分析多種環境信息的協調關系,從而進行多環境信息融合的監測判別,這不僅是監測農業環境的有效手段,而且可為動態地控制環境的各項指標提供依據。
基于多環境信息融合的監測判別關鍵是采用合適的分類融合算法,將采集來的多種環境信息與知識庫中的典型關聯規則相結合,進行決策級融合分類以反映農田環境的狀態,同時建立和諧的人機交互環境,從而對農田的環境狀況進行監測控制。
圖1為面向農業物聯網的多環境信息融合的監測判別模型框架,通過分布在農田的環境信息傳感器采集各種環境信息,將之與從數據庫等媒介中挖掘出的典型關聯規則傳輸到中央處理模塊進行信息融合,最后將監測結果送到用戶交互界面。

圖1 多環境信息融合監測判別模型框架
關聯規則的挖掘問題可形式化地描述如下:設I= {i1,i2,…,im}是項集合,T= {t1,t2,…,tm}是事務集合,其中Ati∈I(1≤i≤n)。A?B稱為T中的關聯規則,其中A?I,B?I,A∩B=C。在事務集合T中,包含A∪B的事務占全部事務的百分比稱為T中關聯規則A?B的支持度記為support(A?B)=P(A∪B);包含A∪B事務占包含A事務的百分比稱為T中關聯規則A?B的置信度,記為 confidence(A?B)=P(A|B)。設min_sup是最小支持度閾值,min_conf是最小置信度閾值。若事務集合T中的關聯規則A?B同時滿足support=(A?B)≥min_sup和confidence=(A?B)≥min_conf,則A?B稱為T中的強關聯規則。包含k個項的集合稱為k-項集,如果項集滿足最小支持度,則稱其為頻繁項集,頻繁k-項集的集合通常記作Lk。
目前有多種產生頻繁項集的算法,最著名的是Agrawal等[6-8]提出的 Apriori算法。Apriori算法使用逐層搜索的迭代方法,k-項集用于搜索 (k+1)-項集,利用“任意頻繁項集的子集都是頻繁項集,任意弱項集的超集都是弱項集”這一性質掃描事務集合。
Apriori算法由兩部分組成。首先使用候選項集找出頻繁項集,基于頻繁k-項集Lk,采用自連接方法產生所有可能頻繁的 (k+1)-項集,即候選 (k+1)-項集Ck+1,再掃描1次事務集合,統計Ck+1中每個候選的支持度,并與最小支持度閾值相比,形成頻繁 (k+1)-項集Lk+1;接著由頻繁項集產生關聯規則,對于每個頻繁項集L,產生L的所有非空子集,對于L的每個非空真子集Lu,如果L的支持度除以Lu的支持度大于等于最小置信度閾值,則輸出規則Lu? (L-Lu)。
模糊推理是采用模糊邏輯并實現由給定的輸入到輸出的映射過程,具體表現為運用模糊語言規則,對已知的模糊判斷或模糊命題進行推導而得出新的近似模糊判斷結論的過程。模糊推理步驟主要包括:輸入變量模糊化;在模糊規則前件中應用模糊算子;根據模糊蘊含運算由前提推斷結論;模糊合成;輸出變量反模糊化[9]。
利用模糊推理可針對復雜系統建立擁有輸入輸出數據的模糊推理系統,同時還可與其他人工智能技術相結合形成智能融合型模糊推理系統。模糊推理信息融合過程為模擬人腦處理不確定性信息的過程,其基本思想可描述為:采用模糊集和隸屬函數描述多傳感器所獲信息;根據不同領域專家知識建立不同的模糊規則;利用各種模糊邏輯算子在進行模糊推理過程中實現多傳感器信息的融合處理;推導出模糊推理信息融合的最終結果。
從農業數據庫中獲取10組環境信息與專家監測判別指標的分析數據 (表1)。由于所有的分析數據均為非離散的數值屬性,故應先進行離散化處理 (表2)。預處理后的數據如表3所示。

表1 歷史數據

表2 各因子離散化等級

表3 預處理后的數據
設min_sup=20%,min_conf=60%。根據Apriori算法編寫程序,搜索原始數據表,得到滿足最小支持度閾值和最小置信度閾值的關聯規則(表4)。這些關聯規則的左邊為各種環境信息所對應的等級值,右邊為監測結果所對應的等級值。

表4 關聯規則挖掘結果
根據表2的各因子離散化等級,確定各種環境信息和監測結果的隸屬函數,為保證基于模糊推理的信息融合的實時性和快速性,采用三角形隸屬函數。接著,將表4的關聯規則挖掘結果轉換成相應的模糊規則,如關聯規則A1C1?E3可解釋為當溫度信息屬于等級1,CO2濃度屬于等級1時,監測結果屬于等級3,此時模糊規則可表示為If(A is A1)and(C is C1)then(E is E3)。
最后對基于模糊推理信息融合的多環境信息融合監測判別進行仿真研究,通過MATLAB語言編程來實現這一過程。用addvar函數定義基于模糊推理信息融合的各種環境信息的輸入變量和監測結果的輸出變量,用addmf函數定義模糊推理系統輸入、輸出變量的隸屬函數,用 rulelist函數和addrule函數來定義模糊規則,至此,基于多環境信息融合監測判別的模糊系統已經設計完成。此外,還可利用showrule函數查看模糊推理系統的模糊規則,利用fuzzy函數調用模糊推理系統的圖形用戶界面,進行信息融合的控制決策仿真,在圖形用戶界面下,還可以查看模糊推理的過程示意圖。通過命令窗口,利用evalfis函數進行實時仿真,將實際監測結果與仿真所得信息融合結果比較 (表5),5組數據中僅1組結果有較大偏差,正確率達80%以上。
本研究探討了將模糊推理的方法運用到基于多環境信息融合的監測判別,并引入關聯規則挖掘,將基于典型數據挖掘出的關聯規則轉換成相應的模糊規則后,監測識別率有明顯的提高。從關聯規則挖掘到信息融合分類,再到最后的監測判別,其中的Apriori算法在產生關聯規則的同時,由于要多次掃描數據庫并產生大量的候選集,故在算法的計算復雜度方面還有待改進;其次,測試數據量有待進一步增加,從而使得測試結果更具精確性和說服力;最后,在多環境信息融合監測判別模型框架中,關聯規則挖掘之前的異構數據庫數據集成和信息抽取,以及模糊推理信息融合后的人機交互界面均有待進一步設計,從而完成整個系統的集成。

表5 實際監測結果與信息融合結果的比較
[1] Teixeira L,Hachem S,Issarny V,et al.Service oriented middleware for the internet of things:A perspective[M] //Towards a Service-Based Internet.Springer Berlin Heidelberg,2011:220-229.
[2] Kulkarni R V, Forster A, Venayagamoorthy G K.Computational intelligence in wireless sensor networks:A survey[J].IEEE Communications Surveys & Tutorials,2011,13(1):68-96.
[3] Atzori L,Iera A,Morabito G.The internet of things:a survey [J].Computer Networks,2010,54:2787-2805.
[4] 張飛舟,楊東凱,陳智.物聯網技術導論 [M].北京:電子工業出版社,2010:6.
[5] 彭力.物聯網技術概論 [M].北京:北京航空航天大學出版社,2011:9.
[6] Agrawal R,Srikant R.Fast algorithm for mining association rules[C].Proceedings of the20th International Conference on Very Large Data Bases.Santiago Chile,1994:487-499.
[7] Srikant R,Agrawal R.Mining quantitative association rules in large relational tables[C].Proceedings of the ACM-SIGMOD Conference on Management of Data.Washington D C,1996:1-12.
[8] Agrawal R,Imielinski T,Swami A.Mining association rules between sets of items in large databases[A].Proceedings of the ACM SIGMOD International Conference on Management of Data,1993:207-216.
[9] 丁永生.計算智能:理論、技術與應用[M].北京:科學出版社,2004.