劉 穎(吉林市北華大學信息技術與傳媒學院,吉林 吉林 132013)
基于模糊規則的土壤分類系統
劉 穎
(吉林市北華大學信息技術與傳媒學院,吉林 吉林 132013)
模糊分類系統一直被用于表示一個集合的分類知識,系統中包含分類知識的可讀規則和對規則的相關解釋。本文討論了如何構建模糊分類規則,以及如何使用模糊分類規則來生成目標土壤數據。在模糊分類系統設計中最重要的任務是從訓練數據中找到一套模糊規則來處理一個特定的分類問題。在本文中,首先定義模糊系統隸屬度函數,根據隸屬度函數確定土壤數據的輸入屬性類別,然后在生成初始模糊規則集的基礎上用函數計算土壤數據的屬性,最后合并這些模糊規則,產生最終的模糊規則集。
模糊分類系統; 土壤分類; 隸屬函數; 模糊規則
DOI:10.16640/j.cnki.37-1222/t.2016.16.173
模糊分類系統被廣泛認為是一個較好用來表示分類知識的分類系統,它具備可讀性和可解釋性的模糊規則庫[1]。模糊分類系統可以將傳統數據抽象為語言變量,利用模糊分類器,人們可以得到系統建議與結論。我們賴以生存的世界是模糊的,同時,絕對清晰的閾值是不存在的。因此,使用模糊規則顯得尤為直觀,指定模糊集有時比指定清晰的時間間隔更為容易[2]。模糊推理系統將“不知何故”處理的不確定性,在處理實際問題時要更為真實。模糊分類系統的模糊規則獲取方法主要包括兩種。一種是直接由專家直接給出;另一種是通過自主學習模糊分類系統自動產生的。近年來,越來越多學者將目光投向后一種方法,通過自主學習來產生模糊規則集解決問題實例。
近些年,土壤問題得到廣泛學者的關注。在對土壤進行分類時,土壤特征具有重要的作用,土壤特征對土地利用和土地管理有著重要的意義。雖然在土壤分類過程中不可避免會丟失一些信息,但是土壤分類能有效地降低上述過程中數據信息的復雜度,這有助于我們了解土壤的主要特征。本文討論了土壤分類方法,提出一種基于模糊規則的土壤分類方法,新方法在對土壤分類時可以減少信息丟失并能根據已有數據準確定位測試土壤的質地。在本文中,我們使用三角隸屬函數的方法來定義隸屬函數的輸入屬性,提出了一種新方法來產生模糊規則,利用一組測試數據對分類系統進行測試,測試結果驗證了系統的有效性。
土壤數據包含111個實例,每個實例由7個輸入屬性和一個輸出的屬性組成。為了能夠清楚地說明提出的模糊規則生成算法,我們選擇了指定情況下,每種類型的土壤數據輸出屬性。
傳統模糊分類系統中有許多類型的隸屬度函數,最常用的隸屬函數三角形隸屬函數、梯形隸屬函數、高斯鐘形曲線隸屬函數和S形隸屬函數。在本文中,我們采用了三角形隸屬函數來描述數據特征。我們假定每個輸入屬性標簽的數量是4個,它們分別是:ZE, PL, PM,PH。輸入的隸屬度函數屬性分別為:depth, Sand, Silt, Clay, Sandbysilt,Sandbyclay, Sandbysiltclay。
本文利用一組訓練數據,提出一種基于模糊規則的土壤分類系統算法。該算法分成四個步驟,詳細步驟如下:
步驟1:將訓練數據中的每個訓練樣本轉換為一條模糊規則,然后將新生成模糊規則放入初始規則集。
步驟2:對初始規則集進行判斷,如果初始規則集為空,或者所有的模糊規則集的初始規則都已被采取,則算法停止;否則從初始規則集中采取一條模糊規則。
步驟3:如果一組已被采取的模糊規則是空的或者存在部分模糊規則有相同的輸出與特征,則合并模糊規則,即模糊規則的成員均不相同。否則進入步驟4。
步驟4:將模糊規則與具備模糊規則相同輸出但是并沒有被采取的模糊規則合并;如果被合并模糊規則與原模糊規則具備相同特征,則合并后的模糊規則將取代原規則,跳轉至步驟2,否則轉到步驟3。
根據上述四個步驟產生最終模糊規則集。接下來,用測試數據驗證系統有效性。首先,我們導入測試數據,然后將測試數據生成系統標簽,最后測試分類系統是否包含明確規則集的模糊規則。
在本節中,我們使用C++語言程序設計進行編程。首先定義隸屬函數的輸入屬性,再將每個訓練數據都轉換成一個模糊規則,從初始訓練數據中選擇訓練數據(91.4,6.85,1.75,13.34,3.91,10.62)。其中,屬性深度值為0.17,我們映射值“0.17”為輸入屬性深度的隸屬函數,并檢查與標簽的隸屬關系,我們可以得到,它的隸屬度值為1。用同樣的方式,我們可以轉換((91.4,6.85,1.75,13.34,3.91,0.17,10.62),1)為(({ZE}, {PH}, {ZE}, {ZE},{ZE}, {PH},{PL}), 1)。重復上述步驟,我們可以將初始訓練數據轉換為初始規則集:
接下來,我們用這些模糊規則來處理分類。我們使用的實例(37.15,0.73,18.25,44,2.07,0.41和0.6)的土壤數據作為測試數據來說明整個分類過程。首先,我們將這個測試數據進行轉換,然后把這個轉換的數據再轉換成其相對的模糊規則,通過對比計算得出分類系統運算時間與分類準確率。
本文提出了一種基于模糊規則的土壤分類系統,新算法首先將訓練數據轉換成初始的模糊規則集,然后根據順序一個接一個合并那些最初產生的模糊規則,以減少模糊規則的數目。最后導入測試數據,驗證系統有效性。新算法對以往算法進行了修改,與原算法不同的是,新算法接受輸入屬性,并生成最后的規則,消除了需要生成初始規則和合并的初始規則,也消除了特征相似度較大的初始規則,仿真實驗表明該程序可以運行接受輸入屬性任意數量的數據,并能立即產生模糊規則的紋理類類型。雖然算法結果令人滿意,但是如何能夠簡化算法的復雜程度,這將是本文下一步的工作。
[1]安紅艷,龍懷玉,張認連,雷秋良,穆真.冀北山地5個土壤發生學分類代表性剖面在系統分類中的歸屬研究[J]. 河北農業大學學報, 2012(04).
[2]閆湘,常慶瑞,王曉強,潘靖平.陜西關中土墊旱耕人為土樣區的基層分類研究[J].土壤學報,2005(04).