董延昊,滕東興
(1.中國科學院軟件研究所 人機交互技術與智能信息處理實驗室,北京100190;2.中國科學院研究生院,北京100190)
工作流技術是當前計算機應用領域的一個熱點。隨著社會生產的規范化和流程化趨勢日益明顯,工作流技術在制造業、金融、物流、醫療、通信等各個行業得到了廣泛應用,并發揮著越來越重要的作用[1]。對工作流提供有效的觀察和監控手段成為企業信息化建設的關鍵目標之一。目前的工作流系統產品對業務流程的規范提供了有效支持,在任務間信息傳遞方面提高了效率[2],但缺乏面向管理人員的對大量工作流實例的宏觀展示方法以及監控手段。原因在于,現有工作流管理系統呈現界面元素時只關注當前角色和當前單個實例,而在宏觀層面表現力不足,同時缺乏有效的多流程實例呈現手段,使管理人員容易陷入顧此失彼的大量流程和任務之間的切換查看中,降低了工作效率和決策能力。
目前信息可視化領域中,在流程可視化的研究和應用方面取得了較大的進展[3-4],尤其是在展示靜態流程信息方面較為突出[5-7],但忽略了可視形態的用戶交互模塊,面向管理人員操縱工作流的交互研究仍然不足,主要表現在對于交互任務缺乏深入研究,沒有從用戶目標的角度思考交互目標和構建交互任務集。必須對大量工作流實例的可視形態添加動態交互功能,才能真正為管理人員的監控活動提供有力的支持[8]。
本文基于信息可視化技術,提出一種基于三維管道隱喻可視化方法:對工作流數據進行建模,繼而通過合適的可視隱喻策略,將工作流數據映射到三維可視形態中,對工作流數據進行可視化展示,增強信息工作者對數據的把握能力,提高對工作流數據檢索、分析的效率,同時提供自然便捷的交互方式,從而提供一個對工作流數據分析利用的有力工具。
在信息可視化領域中,針對流程可視化已經提出了若干可視形態和映射方法。目前處理方法主要有樹結構記錄流程、三視圖的方式(數據視圖、知識視圖和過程視圖)實現流程追蹤和再現[9](如圖1所示)。此外,可視化領域提出了一種可視化工作流管理系統的總體框架,討論了框架中各模塊組成和功能,但其可視化功能主要集中于流程定義即工作流設計階段,沒有涉及運行時的呈現手段和監控方法。可視化領域還提出借助過程流網(process flow network)來描述工作流過程,以及相應的建模方法,但并未討論工作流模型與可視形態的映射策略以及可視形態的具體形式。
本文認為,工作流可視化的重點在于對運行階段的大量工作流實例進行呈現,而不僅僅是對單個工作流實例的圖形化定義和展示。本文首先從工作流特點出發,對數據進行分析、分類,繼而對其建模,將模糊的、抽象的工作流數據結構化;然后提出可視隱喻策略和一套三維工作流符號集,實現模型數據到三維可視形態中圖元的映射,從而將大量工作流實例映射到三維空間可視形態中,在三維形態基礎上給出交互目標和相應的交互任務集;最后面向具體應用場景開發原型系統,對上述方法和內容進行驗證。

圖1 Aruvi界面
整個方法在層次上分為四層,分別對應數據采集、模型構建、可視形態和用戶交互,其結構如圖2所示。

圖2 可視化工具系統架構
2.2.1 工作流模板模型
工作流數據主要分為兩個階段:設計階段數據和運行階段數據,因此這兩種類型數據,分別稱之為工作流模板數據和工作流實例數據。
工作流模板即對工作流的過程定義,是業務過程的一種表示,這種表示以計算機可理解的形式來描述,具有支持自動流水執行的性質。業務人員根據工作內容定義業務流程,描述任務序列和邏輯規則,從而形成了工作流模板。工作流模板是一種靜態的、一般不改變的知識,它包含了任務執行過程中可能遇到的所有情況和對應的執行路徑、處理規則。工作流模板需要具備以下3個性質:
(1)完整性:工作流模板必須覆蓋流程執行過程中可能遇到的所有情況,不完整的模板定義如語義缺失、邏輯混亂等,會導致工作流實例在運行過程中無法選擇路徑或陷入死鎖[10]。
(2)無二義性:工作流模板中,活動間的變遷條件必須唯一明確,無語義重疊,否則在工作流實例運行時會出現不期望的路由路線。
(3)極小性:在同一個業務過程可能出現的多種完整的描述方法中,工作流模板采用內容最少的描述方式。
2.2.2 工作流實例模型
工作流實例是指實際運行的一項具體業務,是在執行期根據工作流模板生成的一系列活動集合體,如某位患者的診療流程,某項外銷合同的執行過程等。工作流實例具體由若干活動實例組成,但一個活動實例不能同時屬于幾個工作流實例。對工作流實例進行建模,這里將其定義為一個五元組:
WorkflowInstance=<Node,Transition,Role,Data,Time>,以下對五元組進行詳細介紹:
(1)Node是流程中的步驟即節點,流程中的節點,根據節點的任務和性質不同分為幾類:
任務節點:在該節點執行完定義好的任務,然后向下流轉;
或分支節點:流程的執行路徑在或分支節點處發生分裂,拆分成若干條線并行,流程沿某一條路線前進;
或歸并節點:同或分支節點成對出現,在二者之間的多條路徑中,只要有一條被執行,就繼續向后路由,不管其它路徑是否被執行;
與分支節點:流程的執行路徑在或分支節點處發生分裂,拆分成若干條線并行,后續的幾個并行任務都需要被執行;
與歸并節點:同與分支節點成對出現,在二者之間的多條路徑中,等到所有路徑均執行完畢,才可以繼續向后路由,否則處于等待狀態;
決策節點:帶有轉移條件的節點,當流程到達該節點時,按照預先定義的轉移條件決定流程走向的遷移(Transition)路徑,與分支節點不同的是,分支節點用來實現并行,決策節點必須只能在多個Transition中選擇一個。
(2)Transition即活動連接弧,表示節點之間的路由關系和進行順序。
(3)Role表示工作流中的角色,Action表示在該節點處執行的操作或完成的任務。
(4)Data表示工作流表單,從數據的維度來觀察工作流,可以視為一組表單數據的流動過程。表單從起始節點的空白狀態開始,逐步向后流動,按照事先定義好的規則和路徑進行傳遞,每經過某一節點,就把該任務信息寫入表單中,表單數據獲得一個增量,如此 “滾雪球”式增長,直至任務完成,表單最終生長為一張完整表單,進入歷史庫。
(5)Time表示活動的時間,時間屬性往往是容易忽視的一項屬性,同時也是二維形態難以展示的一項屬性,三維形態在這一方面做了一個有價值的改進,利用Z方向高度信息來表征這一屬性,使二維空間不能展示的信息得以直觀呈現。
2.3.1 三維符號集
符號是直觀表達事物和現象的一種可視化工具[11],按照上文討論,工作流模型涉及到元素和屬性較多,其映射而成的可視形態中必定圖元的類型和屬性也較多。符號集是可視形態的基礎,符號影響到形態的質量和對形態的理解,符號設計應該形象直觀,一目了然。
一個三維虛擬場景一般由大量不同類型的圖元構成,每個圖元分別代表各自不同的含義。為借助三維形態展示工作流,首先需要按照工作流特點給出一套三維符號集(表1),使得模型能夠通過大量不同的可視符號表達出來。

?
2.3.2 可視隱喻
工作流數據是對工作流進行分析的核心,然而重要數據常常掩埋在大量數據中,以其自身固有形式存在,很少能用于直接展現,關鍵的方法在于數據的轉化和呈現。因此,將數據轉化為形態的策略至關重要。上文討論了對數據的建模,將繁雜的工作流數據抽象成易于處理的形式,這里給出可視隱喻,完成工作流數據模型與可視形態之間的映射。映射策略相應分為兩部分,即模板數據的映射和實例數據的映射。
三維空間中,平面z=z0將空間切割為多個切片,最底層的切片稱為底面,從高度上來說,將工作流模板數據置于底面上,作為所有工作流實例的視覺對照標準。將工作流模板的XPDL描述形式進行解析,對照模板符號,按照一定布局算法將其布置在XOY平面上。接下來是工作流實例的映射,根據其執行節點路徑將活動加入到三維空間中,一個活動實例映射為三維空間中的一個膠囊符號,x和y坐標取決于該種類活動對應的底面模板x與y坐標,而z坐標取決于活動的開始執行時間,在活動映射到空間后,按活動間關系生成連接線,于是形成多條管道,呈現工作流實例的進行歷史。每一個活動節點同時又是一個富信息的圖元,包含了任務目標、角色、操作、表單數據等關聯內容。
2.4.1 交互目標
在可視形態的基礎上,提出用戶的可視交互目標,并建立可視交互任務集。用戶的交互目標包括以下3個方面:
(1)工作進度趨勢查看:管理人員需要具有查看全體工作流實例進展情況的整體概覽視圖,從全局角度掌握當前諸多下級人員個人工作進展情況,進行結果統計,使其對流程是否合理、是否需要優化等決策提供直觀感受。
(2)流程活動歷史跟蹤:工作流從控制的角度來看是一組活動的有序組合,當管理人員關注某一具體工作流實例時,需要清晰的查看到執行過程、路由路徑、已完成活動詳情、異常狀態等信息。管理人員需要對各實例進行檢索、過濾、標記、回溯等操作。
(3)表單監控:工作流從信息的角度看是一個各角色之間通信的過程,工作流可以視為一組表單數組在若干有序活動之間流動。管理人員需要能夠在可視形態中很自然便捷的查看所有已完成活動的表單數據、參與者角色和行為。
2.4.2 交互任務集
為達到上述交互目標,建立滿足要求的可視交互任務集,將交互任務分為視圖操作、圖元操作、內容操作和過程操作四大類。
視圖操作的目的是根據用戶需求進行信息呈現和視圖變換,使用戶能夠通過一系列操作將視圖調整到合適的視角;圖元操作包括對圖元的選擇、標記等交互任務。內容操作為用戶提供信息標記、批注和搜索等功能,滿足用戶在分析過程中對視圖添加附加信息的需求,或當前呈現的原始數據進行進一步的統計加工;過程操作指用戶為回顧中間結論、綜合分析而將可視形態返回到先前某個視圖狀態的操作。通過以上任務的組合,提供給用戶對工作流數據進行可視化分析的有效手段。
交互任務集見表2。

表2 交互任務集
三維空間中圖元布局算法
為在三維空間中展示可視圖元和工作流符號,需要解決布局設置問題,即給定有限的布局工具和待布局物體,將待布局物體合理的置于三維空間中,滿足必要的約束,并達到某種最優指標,從而在視覺上排布均勻,高效利用有限空間。
對給定的圖元集合A={a1,a2,…an},該序列按圖元的度降序排列,圖元之間的連接關系為矩陣L

以下給出增量式圖元三維空間布局方法,即在前k-1個圖元已經布置好的基礎上,考慮第k個圖元的布局。布局算法考察總弧長和均勻度兩個方法,給出評價函數:e(a1,a2,…ak)=g(a1,a2,…ak)+λh(a1,a2,…ak),其 中,g(a1,a2,...ak)=·

式(1)反應了布局均勻度,rx,ry,rz分別表示空間3個方向最大坐標與最小坐標之差,h越小,表示圖元占據的空間越接近正方體,當變焦放縮到合適比例時,能夠更大限度的充分利用各個方向顯示空間。算法首先根據當前已有的k-1個圖元的圖重心位置,為第k個圖元給出一組候選位置坐標,然后對每個候選坐標計算評價函數,函數值最小的坐標作為該圖元的坐標。
診療流程是具有典型工作流特征的活動集合,在醫療工作流中,各醫務人員要跟蹤并掌握大量患者的治療經過、醫學檢查結果、用藥方案、健康狀態等信息以及這些信息的實時變化情況,這給醫務人員帶來了繁重的認知負擔和工作壓力。在上文基礎上,開發了面向醫療工作流數據的可視形態,并在其基礎上構建了一個醫療工作流查看分析系統,為管理人員提供易于認知的工作流信息表現形態以及友好的操作界面,對當前活躍的工作流進行直觀展示,輔助管理者自然、高效地完成分析決策任務。
工作流可視形態示意如圖3所示。

圖3 工作流可視形態
醫療工作流可視化工具如圖4所示。

圖4 醫療工作流可視化工具
系統構建了心臟動脈導管未閉診療工作流,多名患者數據呈現在不同高度的三維管道上,可視形態中,不同的患者使用不同顏色的管道表示,z坐標較低的是發生時間較早的活動;同一名患者的診療活動從左向右進行,管道最右側的活動是患者當前處于的活動(包括康復出院)。在該系統中,可以一目了然看到當前本醫院所有該疾病患者的診療經過概況,既可以橫向的觀察某位患者治療歷史,也可以縱向觀察某一活動的執行次數與時間,如最近ASD手術進行了幾例等。
聚集形態反應出的宏觀視圖可以提煉出運行趨勢的信息。形態中,體積較大的節點表示該活動出現頻率較高,較粗的管道反映出該路徑的執行頻率較高,出現頻率較高的路線說明該種治療方案具備典型意義。通過系統發現,ST段有持續性抬高,并符合溶栓指征的情況下,大多采用靜脈溶栓而不是內科保守治療。管理人員可以從中提煉出該疾病的一般診療過程,從而為制定臨床路徑提供依據。
總的來看,所構建的系統能夠以合理的方式對流程實例進行顯示,直觀的呈現總體視圖,減輕分析決策過程中醫務人員的認知和記憶負擔,為臨床路徑的制定提供決策支持,取得了較好的應用效果。
本文針對工作流數據的呈現問題,提出基于三維管道隱喻的可視化方法,根據流程型數據特點提出一個有針對性的可視形態,將數據映射到三維空間中,以信息密度高的三維形態呈現多工作流實例視圖,為分析利用大量工作流數據提供支持,在工作流數據展示、工作流監控和性能分析方面具有參考價值。目前流程可視化的研究仍處于探索階段,可視化形態的交互和分析等問題,都需要進一步研究解決。
[1]LI Jun,WANG Huifen,LIU Tingting.Research on the web service-based workflow management system[J].Manufacture Information Engineering of China,2008,37(5):1-3(in Chinese).[李俊,汪惠芬,劉婷婷.基于Web服務技術的工作流管理系統研究[J].中國制造業信息化,2008,37(5):1-3.]
[2]YANG Kuowu.WU Fengxiang.A review of workflow management and its application[J].Mechanical Science and Technology for Aerospace Engineering,2009,28(2):227-229(in Chinese).[楊擴武,武鳳翔.工作流管理技術及其應用研究[J].機械科學與技術,2009,28(2):227-229.]
[3]Heer J.Design considerations for collaborative visual analytics[C]//Washington,DC,USA:IEEE Symposium on Visual Analytics Science and Technology,2007:171-178.
[4]Unger A,Muigg P.Visualizing statistical properties of smoothly brushed data subsets[C]//London,ENGLAND:IEEE Information Visualization,2008:233-239.
[5]Stasko J,Gorg C,Liu Z,et al.Jigsaw:Supporting investigative analysis through interactive visualization[C]//Washington,DC,USA:Visual Analytics Science and Technology,2007:131-138.
[6]Bavoil L,Callahan S,Crossno P,et al.Vistrails:Enabling interactive,multiple-view visualizations[C]//New York,NY,USA:Proceedings of IEEE Visualization,2005:135-142.
[7]Wright W,Schroh D,Proulx P,et al.The sandbox for analysis:Concepts and methods[C]//New York,NY,USA:Proceedings of the SIGCHI Conference on Human Factors in Computing Systems,2006:801-810.
[8]Unger A.Visual support for the understanding of simulation processes[C]//Beijing,China:Visualization Symposium,2009:57-64.
[9]Shrinivasan Y B.Supporting the analytical reasoning process in information visualization[C]//Proceedings of the twenty-sixth annual SIGCHI conference on Human factors in computing systems.Florence,Italy:ACM,2008:1237-1246.
[10]PANG Shanchen,YAN Chungang,JIANG Changjun.Soundness analysis of the multi-cases workflow model based on home state[J].Acta Electronica Sinaca,2006,34(6):1163-1168(in Chinese).[龐善臣,閆春鋼,蔣昌俊.基于家態的多事務工作流完整性分析[J].電子學報,2006,34(6):1163-1168.]
[11]ZHANG Jinlu,WANG Yingjie,YU Zhuoyuan,et al.A research for the model of the adaptive map symbol[J].Journal of Geo-Information Science,2009,11(4):468-474(in Chinese).[張金祿,王英杰,余卓淵,等.自適應地圖符號模型與原型系統的實現[J].地球信息科學學報,2009,11(4):468-474.]