摘 要:討論了分形工作流管理系統的自仿射分形集合,并用分形迭代系統對其進行描述;結合網格組件,進行了系統規劃,提出了網格平臺下的分形工作流系統模型。基于網格的分形工作流系統有助于簡化復雜的工作流程,充分整合系統資源,有效執行并監視工作流程,銜接不同類型工作流系統的接口。本技術初步在第三方物流系統中實現。
關鍵詞:網格;自仿射;分形;工作流引擎;迭代函數系統(IFS)
0 引言
隨著全球化的市場競爭和信息技術、網格技術的快速發展,很多企業都采用網格來滿足自己關鍵的業務需求,如自動化制造業使用網格方案來加速產品的開發和協作。本文提出的分形工作流網格,可將分布式環境下的閑散資源和優勢資源集成共享,分布式環境下協同工作的群體能夠直接提交作業、實現信息共享,協同完成作業并解決執行工作流機的分解問題。
網格的一個特性就是自相似性,這也是分形模型的一個重要特征。網格的局部和整體之間有著一定的自相似性,這種特性在大自然中普遍存在。工作流管理系統作為非線性的大系統,也可以簡化為一種有自相似性系統的集合。工作流管理系統實現的難點在于對資源動態重構和對復雜協作的支持。
1 工作流系統的分形特性
1.1 基本概念
根據工作流管理聯盟(WFMC)的定義:工作流是一類能夠完全或者部分自動執行的經營過程,它根據一系列過程規則、文檔、信息或任務能夠在不同的執行者之間進行傳遞與執行。而工作流管理系統的作用就是將現實社會中的業務過程轉化成某種計算機化的形式表示,并在此形式的驅動下完成工作流的執行和管理。
分形集合具有精細的結構,在任意尺度下它都有復雜的細節。利用網格和分形理論,可以將復雜的工作流管理系統的工作流程予以簡化。分形理論是研究非線性問題的新興學科,這門學科無論在其數學基礎還是在其他學科的應用方面都得了迅速發展。
分形的自相似原理:假設集合s由,n個不相重疊的子集Si(i=1,2,3……,n)組成,若Si放大(縮小)Si倍后與S重合,則S是一個分形集。當Ri=R(i=1,2,3……,n)時,S為均勻自相似分形集。當放大(或縮小)倍數不全相等時,即每個子集都各有一個相似比Ri(i=1,2,3……,n)時,稱集合S為自仿射集合,是一種非均勻自相似分形集。各種工作流管理系統,及工作流的流程和組織結構也可以被認為是一種自仿射集合。
自仿射原理:設在d維歐幾里德空間,分形集S由n個互不重疊的分形子集Si(i=1,2,3……,n)組成,若Si通過仿射變換Rk(k=1,2,3……,d)后與s重合,則稱s為自仿射分形集。仿射變換的涵義是某點X=(X1,X2,X3,……,XD)變換成另一點,X′=(R1X1,R2X2,R3X3,……RdXd,這里R1,R2,R3……,Rd不全相等,Rk=(R1,R2,R3,……,Rd)為比率矢量。自仿射分形的分維不是惟一的,根據需要,可以引入不同的分維來表征系統的分形特性。
1.2 自仿射分形集合
根據所實現的業務過程,我們用分形集合的方法對工作流管理系統進行描述,生成為元數據為基礎的自仿射分形集合。

上式“s-”前綴表示工作流管理系統的分類,“C-”前綴表示協作行工作流管理系統的組成,“D-”部門級組織單位。根據所實現的業務過程,工作流管理系統包括了協作型(Collaboration),管理型(Administration),設定型(adhoc),生產型(Production)。協作型工作流管理中也會包括處理異常時間(adhoc),管理等相同性質的組織,工作流程的相似性可以簡化流程的操作,降低操作的復雜度。上述組織都是具有一定獨立性的獨立單位,在結構、功能上有相對的內部完整性。
2 分形工作流協作的描述
2.1 迭代函數系統
迭代函數系統(Iterated Function System,簡稱IFS)由M.F.Bamsley于1985年提出,是分形的重要分支。迭代函數系統通過自身部分與整體之間的相似關系,定義了一個由多個部分組成的復雜的自相似分形集。
設(X,d)是完備度量空間,其中x∈R2,是非空閑集,d是x中的度量,在這里我們取d為歐氏距離。則(x,d)和n個壓縮映射Wi:X→X(其壓縮因子分別為S1,S2,……Sn)一起組成一個迭代函數系統,簡稱IFS,記作{x;w1,W2……,wn},s=max(s1,s2,……,sn)稱為IFS的壓縮因子。
迭代函數系統的基本思想是認為幾何對象的整體和局部在仿射變換下具有自相似結構。在迭代函數系統{X;W1,W2,……Wn}中,要求映射wi(i=1,2,……,n)是仿射壓縮變換。將迭代函數系統重復作用于工作流系統的部門,最終可得到分形的工作流系統。基于分形的工作流的作業協作是面向流程的協作,其每次業務流程都有相似之處,是一個對協作流程的信息壓縮的過程,它真實地描述協作工作流系統。
2.2 迭代函數系統描述分形工作流系統
對于給定的分形工作流系統,我們可以用一個迭代函數系統IFS{x:w1,w1,……wn}描述。具體算法如下:

圖1所示,就是用迭代函數系統描述的分形工作流協作模型。其各個子結構都存在相似性。如生產部和市場部之間存在相似性,需要動態調用資源以及相互協作;不同的業務之間,最終分解成元數據(metadata)的操作,作業與作業之間也有不同程度的協作,也涉及到元數據(metadata)的共享、安全性的操作;部門、業務和metadata都具有自相似和自仿射特性,利用分形協作過程的迭代函數系統的信息膨脹來描述協同作業。最終工作流管理系統在仿射變換下,可以分解成為多個部門、多個業務和metadata,執行相應的工作流作業,這樣有助于提高系統效率,使部門之間消除“孤島”,使部門之間的信息能夠順暢地流通,達到資源的最大化的優化。由分形的自相似原理,整個工作流管理系統是一個自仿射集合,可以動態地增加和減少資源。

3 建立基于網格的分形工作流系統模型
工作流管理系統的核心是工作流的執行引擎(WorkflowEngine),它負責把復雜的工作流映射到網格環境中的具體資源,集成特定的服務,網格為工作流實例的執行提供良好的環境,確定開始作業的必要約束,查詢MDS(Globus Monitoringand Discovery Service)查詢資源和收集必要信息,按照分形規則為用戶作業選取執行角色、創建服務、執行作業,并可以在執行過程中監視作業的執行情況。這樣,基于網格環境的工作流引擎不僅是企業經營過程的任務調度器,還對企業資源重新整合,充分利用空閑資源,及時完成作業,處理緊急事務。基于網格的分形工作流技術具有在異構環境中處理復雜事務的能力。基于網格的分形工作流除了具備可視化設計,支持各種復雜流程,執行過程可監控、管理等特點外,最重要的特點是:
(1)分布性
在集成的網格環境中,各種硬件、軟件資源是廣域地分布在不同的虛擬組織中,而且是動態創建和刪除的。

將抽象的分形工作流作業映射到網格環境下的具體資源,分形工作流可分布在計算能力不同的機構中執行,能充分利用不同機構的各種虛擬資源。將網格和分形相結合,利用網格的平臺無關性等各種優勢構架分形工作流系統,能夠消除一些其它分形工作流系統的性能瓶頸,極大地融合各個子系統。
如圖2,根據功能需求,系統為不同的服務請求,如文件審批、存儲及執行,分配相應的匹配角色,充分利用不同機構的各種虛擬資源,發揮網格和分形系統構架結合的優勢。
(2)動態性
由于運行環境和資源的變化,分形工作流可動態地增加其它任務以成功地完成整個執行過程,自動修復分形工作流執行中的錯誤,動態優化分形工作流執行,自動監視作業的完成及分配調度作業的完成如圖3。
(3)服務交互性
在網格的安全構架下,基于網格的分形工作流引擎使得網格服務之間的數據交換和通信更安全,能夠整合不同工作流管理系統之間的接口,和企業原有的各個應用系統更好地集成起來。利用網格的平臺無關性等各種優勢構架分形工作流管理系統,就能夠消除一些其它分形工作流管理系統的性能瓶頸,極大地融合各個子系統,發揮系統的性能。

當從客戶端提交一個作業時,網格對客戶進行身份驗證,并為此次調用生成一個實例。分形工作流引擎將作業放入任務表中,作業所有需要具備的輸入文件都可以通過GridFrP(GridFileTransfer Protoc01)來傳輸、定位給必要的角色。網格的資源管理器可以動態地發現空閑的存儲空間、CPU資源,執行作業的調度、分配任務,將作業分解成若分形metadat。由網格調度器調度分形資源,可以并行執行任務,并由分形工作流的監視工具監視、報告作業的執行情況,必要時可以調度網格分配的虛擬空間和計算能力,因此也適合大流量的分形工作流的執行,并發控制。
4 結束語
本文提出了基于網格的分形工作流管理系統,對其流程、體系結構和優點進行了研究,所述技術已經在第三方物流系統中初步實現,取得了更好的效果。