








摘 要:針對土地資源管理的業務信息平臺設計任務,本文構建了3個層次的領域驅動模型。模型中的中間層包括基礎設施本體、土地基本信息本體、土地業務信息本體以及業務流程本體,其下又可以進一步細分為多個應用本體。該文構建一種新的數據挖掘方法,通過應用業務的關聯性設置條件概率,進而選擇最合適的節點增加信息熵。測試結果表明:新的數據挖掘方法構建的決策樹更簡潔、挖掘效率更高、挖掘精度更高,滿足土地資源信息管理的實際業務需求。
關鍵詞:領域驅動模型;業務信息平臺;數據挖掘;性能測試
中圖分類號:TP 391" " " " 文獻標志碼:A
在我國的國土資源中包括耕地、林地、草場、山地、建筑用地以及農業用地等不同類型。土地是各種資源的載體,因此土地信息管理也直接關系到其他各種資源的信息管理[1]。我國一直致力于國土資源管理的信息化,并致力于構建資源整合、信息共享、系統集成的國土資源信息平臺。從技術層面看,GIS技術的發展為國土資源信息化建設提供了有力的支撐。但是,從發展情況看,我國土地資源的信息化建設存在以下兩類問題[2]。第一,信息孤島的存在,不同地區、不同系統對國土資源的描述存在時間不統一、空間不對應和信息不對稱的問題,因此,原本同一塊土地卻無法在不同系統中形成對應。第二,業務孤島的存在,土地資源的業務管理環節眾多,從登記、儲備、評估和規劃到審批,不同環節的業務內容存在很大差異,這種差異性導致同一土地信息在各業務環節中無法共享互通。解決該問題的關鍵是從統一的頂層設計出發,構建土地資源信息系統[3]。從技術層面看,領域驅動建模方法是解決土地資源信息系統合理化建設的最佳方法。本文以領域驅動模型法為核心研究內容,完成土地資源信息系統的框架設計,分析數據挖掘功能并進行試驗,研究測試業務信息平臺的性能。
1 業務信息平臺的領域驅動模型創建
國土資源的管理工作涉及多個層次、多個環節和多個部門之間的復雜工作。從管理權限的差異來看,又分為頂層管理、中層管理和底層管理。為了實現各層管理之間的有效銜接,頂層管理的設計應該相對概括、提綱挈領,而底層管理應該相對具體,直接對應于實際業務。由此可見,國土資源管理業務信息平臺的設計特別適合于采用領域驅動模型進行構建。本體是領域驅動建模過程中的核心概念,不同層次都對應設計了自己的本體單元,使整個信息平臺成為一個多層次本體構成的本體系統。
根據本文設計的土地管理業務信息平臺的實際需求,結合領域驅動建模及相關理論,構建土地管理業務信息平臺領域驅動模型體系,如圖1所示。
從圖1中可以看出,土地管理業務信息平臺領域驅動模型一共包括3個層次。處于最頂端的是最高層次,即全局本體層。在全局本體層下是中間層次,即領域本體層次。在這個層次中一共包括4種角色的本體:基礎設施本體、土地基本信息本體、土地業務信息本體以及業務流程本體。
在中間層次下是最底層,即應用本體層。每個領域本體其下,都配置了多個應用本體。在基礎設施本體下,配置了組織機構本體、角色本體、……、權限本體。在土地基本信息本體下,配置了土地調查本體、土地規劃本體、……、基本農田本體。在土地業務信息本體下配置了土地征收本體、土地儲備本體、……、土地供應本體。在業務流程本體下,配置了業務過程本體、業務活動本體、……、實例本體。
為了有效地避免信息孤島的產生,在本文構建的領域驅動模型中,要充分實現本體的共享。這種同一本體的多層共享結構,如圖2所示。
如圖2所示,在領域本體層構建的一個本體單元,在規則及語義的控制下,其涵蓋了適用于應用本體層不同實際業務需求的特征,在不同業務需求中會演化出一個個獨立的、帶有差異性的應用本體。
例如,處于領域本體層中的土地本體,具體到應用本體層時,演變為土地供應業務、土地報批業務下的2個應用本體,因為必須符合實際業務需求所規定的范式,所以就會表現出不同的形式和特征。
如果不是采用了領域驅動模型的建構方法,這2個業務本體就彼此完全獨立、無法有效共享。在本文的領域驅動模型建構下,土地本體的內核特征從應用層面剝離出來,使其無論在土地供應還是土地報批的應用中,都可以實現內核層級的信息共享。
除了體系結構和內核層級的共享外,本文中有關業務信息平臺的設計,還充分考慮了其5個基本配置,以滿足實際使用時的標準化和功能需求,這種配置如圖3所示。
如圖3所示,業務信息平臺作為土地資源管理領域的實用系統,必須要符合信息技術行業的規范,這里要滿足ISO標準和OGC標準。同時,作為一種依托信息技術的軟件產品,業務信息平臺必須要滿足版本控制要求,可以根據市場需求進行升級換代、版本更新。從內部功能的實現來看,業務信息平臺雖然采用了先進的設計理念、獨創的體系結構,但以數據為核心的機制沒有改變,所以必須要做好數據管理。當然,業務信息平臺的功能范疇,必須與土地資源管理的業務范疇相適應,以土地資源管理的專業范式呈現出來。
2 領域驅動模型中的數據挖掘方法設計
在土地資源管理的業務信息平臺中,涉及數量龐大的各類數據。數據之間彼此又帶有關聯,這就需要應用數據挖掘方法,根據業務需求找到最適合的數據,以高效地完成日常工作。因為領取驅動模型中各本體之間的關聯性,本體鏈條的不斷延伸會形成樹狀的數據結構,所以本文構建了一種基于決策樹結構的數據挖掘方法。
決策樹數據挖掘的基本思想是在各種可能的數據網絡中,從源節點到目標節點構建一顆最簡潔的信息樹。這樣,就可以獲得更簡單的關聯描述,從而更快完成這顆信息樹的訪問,高效地獲得準確的挖掘結果。
在土地資源管理信息的龐大數據網絡中,決策樹節點的推進過程中,可能同時會面臨多個競爭節點。為了給每次推進配置更合理的下一層節點,這里采取一種信息熵累積的策略。一個土地資源相關的數據信息,其信息熵的計算過程如公式(1)所示。
(1)
式中:M為一個土地資源相關的數據信息,它是一個包括多種成分的復雜數據,其數據結構可以表示為一個集合分{M1,M2,…,Mn};pi=P(Mi)表示了數據結構中每個成分出現的概率。
根據決策樹數據挖掘的基本原理,決策樹每次生長、節點的深度推進,信息熵的更新是有條件的,這樣公式(1)演變為公式(2)。
(2)
式中:W為土地資源數據的隨機劃分,同時其他參數滿足P(Wj)=kj、。
公式(2)中的條件可能是多種多樣的,這就會導致數據挖掘過程的復雜度提高。這里只考慮正確和錯誤2種情況,進而形成一種快速的信息熵累加策略,如公式(3)所示。
(3)
式中:T為正確;F為錯誤。
由于土地資源信息在應用業務中具有復雜性,一個土地領域本體對應于多個應用本體,將其劃分為多個屬性特征后,再對信息熵進行累加,其計算過程如公式(4)所示。
(4)
式中:A為一個土地領域本體,它同時應用于m個可能情況,這多個應用本體對應的屬性特征分別表示為p1、p2、…、pm,{θ1,θ2,…θm}表示了決策樹下一步可以選擇的節點集合,G(θ1)、G(θ2)、…、G(θm)表示了每個節點對應的信息熵。
3 業務信息管理的性能測試試驗
在前面的工作中,基于領域驅動模型構建了土地資源管理的業務信息平臺,并在常規決策樹方法的基礎上構建了一種基于信息熵累加的數據挖掘方法。接下來,通過測試試驗對業務信息平臺的管理效率進行測試。
在測試過程中,對于一個土地本體分別選擇了6種實際應用業務,分別用W業務、S業務、B業務、V業務、H業務、Y業務來表示。在領域驅動模型下,分別采用常規的決策樹挖掘方法(ID3)和本文建立的基于信息熵累加的決策樹挖掘方法(IID3)來進行信息挖掘。第一組試驗,比較兩種方法對6種土地管理應用業務所構建的決策樹節點情況,結果如圖4所示。
從圖4可以看出,本文構建的基于領域驅動模型業務信息平臺基于信息熵累加的決策樹挖掘方法,所構建的決策樹節點數量明顯更少、這樣就可以具有更快的挖掘效率。6類應用業務的煩瑣程度有所差異,但本文構建的數據挖掘方法都具有明顯的優勢。
進一步比較2種方法對于6類業務的數據挖掘精度的不同,結果如圖5所示。
從圖5中可以看出,對于W業務、S業務、B業務、V業務、H業務、Y業務,本文構建的基于信息熵累加的數據挖掘方法,都可以獲得更高的挖掘精度,有助于更好地完成這6類業務。
4 結論
土地資源信息管理是一項多層次、多環節、高復雜性的工作,常規的信息平臺構建思路并不適用。本文采取了基于領域驅動理論的業務信息平臺構建策略,將土地資源信息管理的系統工作劃分為頂層、中間層、底層三層結構,并通過對應的本體角色單元配置,構建完成的領域驅動模型。在此基礎上,針對常規決策樹挖掘方法進行改進,提出一種基于信息熵累加的新的挖掘方法。業務信息平臺的性能測試結果顯示,領域驅動模型將多種復雜業務關聯在一起,并可以通過數據挖掘方法獲得更好的業務響應,而構建的新的挖掘方法在6類業務中都具有明顯的優勢。
參考文獻
[1]黃光芳,金義富.基于領域驅動設計構建企業級Web平臺的應用[J].實驗室研究與探索,2013,32(8):51-55.
[2]胡世港,田櫻.基于領域驅動設計的物業管理系統建模研究[J].電腦知識與技術:學術版,2014,11(4):7354-7357.
[3]楊德輝,周淦,李林峰.基于領域驅動的測控任務評定系統設計與實現[J].電子技術應用,2023,49(9):138-144.