王君宇 李言 李麗紅
(1.華北理工大學理學院,河北唐山 063210;2.河北省數(shù)據(jù)科學與應用重點實驗室,河北唐山 063210;3.唐山市工程計算重點實驗室,河北唐山 063210)
三支決策(Three-way Decisions,3WD)是姚一豫教授提出的一種分析和解決復雜決策問題的理論[1]。其主要思想是“三分而治”和“化繁為簡”,將整體分為三個獨立的部分,根據(jù)收集到的信息對不同的部分采用不同的處理策略[2]。
目前,基于時間和空間兩個維度,三支決策的研究可以分為靜態(tài)三支決策和動態(tài)三支決策。靜態(tài)三支決策只進行一次三支決策;動態(tài)三支決策實施多階段的三支決策,進而做出最終決策。結(jié)合實際決策背景,如何在動態(tài)決策信息系統(tǒng)下建立動態(tài)三支決策模型,提高決策效率、降低決策代價是當前的熱點問題。學者們提出了序貫三支決策[3]、多粒度三支決策[4]、多分類三支決策[5]等動態(tài)三支決策模型。
在實際決策時,人們往往會隨著所獲信息的更替而不斷改變決策方案。尤其是在大數(shù)據(jù)時代,人們需要在盡可能短的時間內(nèi)快速決策。因此,系統(tǒng)地研究動態(tài)三支決策的理論、模型和應用有重要的意義。本文對動態(tài)三支決策的基本理論、研究現(xiàn)狀和相關應用進行綜述,總結(jié)和展望其未來研究方向。
作為二支決策的拓展,三支決策考慮到不確定因素,引入了延遲決策。經(jīng)典三支決策模型[6]是基于貝葉斯理論進行的決策,具體描述如下:
設狀態(tài)空間 Θ= {X,﹁X}表示對象x的兩種不同狀態(tài),動作集合A={aP,a B,aN}表示對x進行決策采取的三種不同行為,aP,aB,aN分別表示對象x屬于、不一定屬于和不屬于集合X的行為。決策時相應的損失代價函數(shù)如表1所示。

表1 損失代價函數(shù)Tab.l Loss cost function
其中,λPP,λBP,λNP分別表示x屬于X而采取行為aP,aB,aN時的損失,λPN,λBN,λNN分別表示x不屬于X而采取行為aP,aB,aN時的損失。Pr(X|[x])是條件概率,對于x來說,采取一個決策行為時的期望代價為:

在現(xiàn)今信息更新瞬息萬變的時代,傳統(tǒng)的三支決策在復雜動態(tài)的信息系統(tǒng)下更加高效準確地做出決策存在局限,學者們提出并發(fā)展了動態(tài)三支決策理論,實現(xiàn)了實時高效的信息處理和決策分析。動態(tài)三支決策是由多次決策組成的,其過程如圖1所示。

圖1 動態(tài)三支決策Fig.1 Dynamic three-way decisions
在動態(tài)三支決策過程中,動態(tài)決策的情況大致可分為五類:第一,對象的增添和刪除;第二,屬性的增加和減少;第三,條件屬性值或決策屬性值的更新和修改;第四,決策損失函數(shù)的改變;第五,多粒度的更新。通過動態(tài)決策過程對閾值的影響,對三個域進行重新劃分,進而做出最終決策。
在動態(tài)決策信息系統(tǒng)中,對象的增添和刪除可以提高決策的效率。張春英等[7]根據(jù)對象單向遷入和單向遷出的規(guī)律給出了相應算法,設計了對象雙向遷入和遷出的動態(tài)算法,提出了一種基于P S-粗糙集的動態(tài)三支決策算法,最終提高了決策效率。
動態(tài)變化的數(shù)據(jù)會使信息系統(tǒng)不斷更新,原有決策信息系統(tǒng)的信息結(jié)構(gòu)和特點隨之改變,屬性的增加和減少可以提高決策的準確性。李艷等[8]提出了一種優(yōu)勢-等價關系下基于序貫三支決策的約簡更新方法。該方法將多粒度結(jié)合起來形成動態(tài)粒序,當對象集和屬性集變化時,通過重用原有信息快速更新屬性約簡,從而降低知識更新的代價。
在決策過程中,知識內(nèi)涵能具體刻畫對象的屬性值,它使得對象可以參與計算、規(guī)則制定,從而進行決策。條件屬性值或決策屬性值的更新和修改能建立相適應的決策模型。張清華等[9-10]針對數(shù)值型屬性定義了屬性比率,并利用其來描述對象,解決了給定接受域?qū)ο髷?shù)時,通過屬性值更新實現(xiàn)動態(tài)三支決策的問題。根據(jù)字符型屬性對象間的優(yōu)異程度,給出了對象的動態(tài)特征的提取方法,建立了動態(tài)三支決策模型,該模型同樣可以處理數(shù)值型屬性的對象,且減少了決策的更新成本。
損失函數(shù)可以確定動態(tài)三支決策模型的閾值參數(shù),多數(shù)情況下是人為給定,決策損失函數(shù)的改變可以降低決策代價。Liu等[11]針對不完整信息系統(tǒng)中出現(xiàn)的缺失值,利用區(qū)間數(shù)獲取損失函數(shù),將不完整信息表和損失函數(shù)表結(jié)合在一起,用于處理新型的三支決策模型。
序貫三支決策是一種典型的動態(tài)三支決策模型,最早由Yao提出[3]。經(jīng)典的序貫三支決策模型構(gòu)建一個多層次的粒結(jié)構(gòu),自上而下,粒度由粗變細。在某一粒層進行三支決策,再把這一層的邊界域作為下一層的處理對象,直至邊界域的對象被逐漸劃分到正域和負域。實際上,隨著信息的變化,針對不同的任務和目標,不同的粒度劃分和區(qū)域組合都有可能影響最終的決策結(jié)果。
在動態(tài)三支決策過程中,對象的增添和刪除、屬性的增加和減少反映了決策的時間動態(tài)性,而在多粒度空間下決策的過程和粒度的優(yōu)化反映了決策的空間動態(tài)性。三支決策的時間性和空間性不可分割、相輔相成,同時動態(tài)決策過程更強調(diào)決策過程和結(jié)果代價,因此學者們致力于研究對象、屬性、條件屬性值或決策屬性值、決策損失函數(shù)以及多粒度等因素的變化,以降低決策時間、減少決策成本和提高決策質(zhì)量。
在理論研究方面,動態(tài)三支決策主要應用于優(yōu)化屬性約簡方法、代價敏感問題以及動態(tài)決策信息系統(tǒng)下的最優(yōu)選擇問題等,還可用于分類、聚類、規(guī)則學習等數(shù)據(jù)分析模型。在實際應用方面,動態(tài)三支決策的理論和模型等研究成果被廣泛應用到醫(yī)療診斷、圖像識別、郵件過濾和風險決策等領域。
目前人類已經(jīng)進入到一個信息技術(shù)高速發(fā)展的大數(shù)據(jù)和人工智能時代,如何存儲、處理和分析數(shù)據(jù),是現(xiàn)今研究的重點問題。在處理動態(tài)數(shù)據(jù)、分析問題、進行決策時,現(xiàn)有動態(tài)三支決策大多是運用分別決策的策略,通過多分類、多粒度或序貫的思想進行決策。今后,動態(tài)三支決策有望借助區(qū)塊鏈等技術(shù)存儲信息,進行整體決策。此外,可拓學能將事物形式化地展現(xiàn)出來,與可拓學等理論結(jié)合,建立更具應用意義的形式化模型,可拓展動態(tài)三支決策的應用領域。
在動態(tài)三支決策中,損失函數(shù)多數(shù)情況下是人為給定,對于評價函數(shù)的選取也摻雜許多人為因素,所以尋找最優(yōu)閾值設置的新算法很重要。在面向多類數(shù)據(jù)和動態(tài)數(shù)據(jù)時,未考慮動態(tài)決策和規(guī)則沖突問題,規(guī)則獲取過程需要進一步完善。因此,在處理如多類和混合等復雜動態(tài)數(shù)據(jù)時,運用貝葉斯理論、優(yōu)化算法等尋找最優(yōu)閾值設置,基于區(qū)塊鏈的鏈式數(shù)據(jù)結(jié)構(gòu)思想獲取新的決策規(guī)則,建立能夠進行整體決策的數(shù)學模型,拓展決策模型的相關應用,需要進一步研究。
三支決策作為一種能有效處理不精確和不確定性信息的決策工具,具有非常強的普適性和應用性,尤其是動態(tài)三支決策在各領域的作用正得到研究者們的逐步重視。本文對動態(tài)三支決策做了綜述性分析,在動態(tài)決策信息系統(tǒng)下,將對象、屬性、條件屬性值或決策屬性值、決策損失函數(shù)以及多粒度等進行單一變化或者多個變化,能有效提高決策的準確性、降低決策成本。利用動態(tài)三支決策處理信息,建立更具應用意義的決策模型,可作為今后研究的方向。