999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于流程挖掘的業務流程模塊推薦方法研究

2018-07-05 04:31:30復旦大學軟件學院上海200433
計算機應用與軟件 2018年6期
關鍵詞:活動模型

鄭 光 鍵(復旦大學軟件學院 上海 200433)

0 引 言

在市場競爭日益加劇的今天,如何建立合理的業務流程模型,如何提升業務流程的質量與效率已經成為企業發展的重要問題。而業務流程設計正是企業流程管理中的關鍵步驟,但設計業務流程是一件比較耗時耗力的工作。推薦合適的流程模型幫助用戶設計流程,在最近幾年中得到了學術界的充分關注,但目前的方法檢索結果精度較低,粒度較粗,對用戶的建模支持力度有限[1]。

流程挖掘技術在近幾年來不斷受到業界的關注,還為流程推薦研究提供了新的思路和方向。流程挖掘的基礎是流程日志,流程日志準確地記錄了業務流程具體活動與資源組合調度等信息,從中可以有效地挖掘出流程模式與業務流程績效[2-4]。通過流程日志的挖掘能夠最大程度地獲得業務流程的特征信息,從而對流程模塊化推薦提供必要的信息和幫助。

模塊化分析是業務流程推薦的基礎,復雜的業務流程由若干流程模塊組合而成。合理的業務流程模塊應當具有高內聚、低耦合、功能獨特化等特點,且相互之間的依賴程度較小[5]?;诹鞒虊K的業務流程建模能夠重用經過實踐檢驗的流程塊,經過適當調節后從而減少用戶建模的時間,加大對用戶建模的支持力度。Clara等[6]總結了業務流程中的數種變化模式,以及流程模型庫中的可變性,在建模時只要在流程模塊的基礎上進行少量調整便能提高流程建模的效率。Shi-Chen等[7]以松散耦合為目標,提出了基于設計結構矩陣的流程分解方法。而基于Petri網的業務流程建模方法一般采取“任務細化”的方式來進行模塊化分析,文獻[8]則對基于Petri網的復雜工作流模型的簡化提出了自己的策略。但是上述的流程模塊化分析存在注重模型的邏輯結構,而對流程模型的語義重視不夠等問題。Mending等[9]指出,過程模型的價值不僅僅取決于邏輯結構,還取決于模型的標簽語義價值,文章嘗試從認知科學的角度來驗證說明:建模過程中的語義信息是保證建模質量的一個重要標準,通過合理的活動標簽能夠改善人們對建模模型的理解。

目前在基于推薦的流程建模研究中涉及的流程塊是基本的邏輯組成單元或者是單個活動,文獻[10]針對不確定的業務流程,為提高流程的柔性,綜合針對單個用戶以及用戶群的推薦結果,推薦下一個需要執行的活動。這里的活動塊粒度較小,不具備高內聚低耦合的特點,只適合在流程建模時推薦單個或者少數活動,效率不高且同樣在活動的功能語義角度描述方面存在不足。除此之外,還有一些研究嘗試從流程建模過程中角色的角度來入手,文獻[11]提出了一種利用流程挖掘生成角色塊的方法,基于角色塊的流程模型突出角色之間的關系。除此之外,如何對推薦結果進行合理的評價還存有一定的限制,Koschmider等[12]提出了一個基于標簽相似度匹配的流程活動推薦系統,給出相應的相似度評分。但是文章最后僅從認知負荷理論入手,通過問卷調研的方式對所推薦的流程活動進行證明其有效性,缺乏如流程績效、活動質量等定量角度的證明。

合理的流程模型推薦方法能夠幫助用戶推薦合適的流程模塊,從而幫助企業發揮資源價值,改善企業產品的質量,最大程度地提升企業業務流程的績效。針對目前業務流程模塊推薦的現狀,本文提出了一種基于流程挖掘技術的業務流程模塊推薦方法。實驗表明,基于流程挖掘的業務流程模塊推薦方法能夠提高流程模塊推薦的準確性,也更加符合流程模塊推薦中的語義性需求與功能主題的特性。

1 基于流程挖掘的模塊化分析

流程挖掘技術能夠從工作流管理系統WfMS(Workflow Management System)的事件日志中挖掘出所需的流程信息,現在已經成為了企業改進流程質量的一種重要手段[13-14]。本文運用流程挖掘技術從日志中挖掘出流程模型等信息,用于模塊化分析和績效預測。

在獲取到流程日志數據之后,在進行深入分析前還需要對數據進行數據集成、數據清洗等預處理操作。

1.1 活動特征挖掘

基于預處理后的流程日志,我們可以獲得該流程的模型表示、數據流等信息。在實際業務場景中,一個完整的業務流程通常由一系列的活動組成,在流程中執行一次活動稱為一個事件。流程活動特征是流程模塊化分析的基礎,因此,首先要做的是對活動特征進行挖掘。

流程活動具有許多屬性和特征,除了從流程日志中可以直接獲取的執行角色、起始時間、活動成本等,還包括了從流程日志中挖掘出來的活動業務特征及交互信息等[15]。在介紹活動建模特征之前,引入一些符號。A為流程活動集合,即A=(a1,a2,…,an),其中n代表流程中活動的總個數;R為流程資源集合,即R=(r1,r2,…,rk),其中k表示流程中資源的總個數;記流程日志為L;CapR(a)為能夠處理活動a的資源集合。

從流程日志中可以直接定義的活動特征如下:

定義1角色 角色指一個流程活動的執行者,如銷售人員、采購人員等。

定義2時間 時間指完成該活動的時間間隔,取流程日志中該活動所有執行時間的平均值。

定義3地點 指完成該流程活動的所需地點場景。

除此之外,通過流程挖掘技術還可以從流程日志中挖掘出流程的業務特征和交互屬性:

定義4資源偏好度 不同流程活動對完成活動所需資源具有不同的偏好,流程日志中的歷史記錄可以反映這一偏好,具體體現在不同資源對該活動的執行次數上。對活動的資源偏好建模,令流程日志L中資源r執行活動a的次數記為Count(r,a),定義活動a對資源r的偏好度如下:

(1)

式中:AvgCount(a)為資源集CapR(a)中所有候選資源執行活動a的平均次數,σ為相應的標準差,起到了縮放因子的作用。那么活動a的偏好模式可以表示為:ActPrefer(a)=(Prefer(a,r1),Prefer(a,r2),…,Prefer(a,rn))。

定義5協作水平 不同活動在活動交接過程中的合作效率稱為活動間的協作水平。

記活動a1與a2之間的協作水平如下:

(2)

式中:Htime(a1,a2)為活動a1與a2的平均交接時間,AvgT(a1,a2)表示在日志L中所有參與者的平均交接時間。那么活動a的協作水平可以表示為:ActCoop(a)=(coop(a,a1),coop(a,a2),…,coop(a,an)),其中coop(a,a)記為1,不存在協作關系的活動之間的協作水平記為0。

定義6活動質量 隨著活動被執行次數的增加,處理該活動的經驗和技能不斷累積,活動質量也得到了不斷提升,從流程日志L中調取了一些相關數據進行回歸分析后發現,Sigmoid函數能夠較好地擬合這一模式,因此定義活動質量如下:

(3)

式中:n為日志L中活動a被執行的次數,π為縮放系數且π>0。

1.2 流程模塊化約束模型

復雜的業務流程可以由若干流程模塊組成,流程模塊可以看作是業務流程整體的子流程或者流程部件[16]。模塊應當具有較明確的功能定義,模塊內部結構應當結合緊密。不同模塊之間的聯系較弱,且可以通過標準化的接口結合。

因此在模塊化業務流程時應當滿足如下約束:

(1) 高內聚/低耦合。高內聚意味著流程模塊內聚具有明確的功能特性,模塊內活動應當具有緊密的關聯;低耦合意味著模塊之間的相互依賴性較小,模塊之間應盡量保持獨立性。

(2) 標準化接口。模塊之間的輸入輸出應當按照既定的標準完成,這使得模塊之間的替換能夠更加容易。

(3) 時間/地點獨立性。考慮到流程模塊之間的任務轉接,不同流程模塊之間的時間和地點不應該存在混合的關系,應當存有清晰的分界線。

(4) 資源獨立性。若流程模塊之間對于某資源存在搶占沖突,或者同時調用某資源會導致資源超出負荷,則可能導致流程模塊不可用。

在詳細介紹流程模塊化約束模型之前,除了上節符號外,再引入一些符號如下:

BP為從流程日志L中挖掘得到的業務流程,PMi表示其中第i個流程模塊,PMi∈BP,D=(D1,D2,…,Dn)表示活動執行地點集合,P=(P1,P2,…,Pn)表示活動執行角色集合。

定義7流程模塊化約束模型

BP=f(PM1,PM2,…,PMi,…,PMt)=ture

(4)

Resourceconflict(PMi,r)=turer∈R

(5)

(6)

式中:f(·)函數表示模塊之間的組合,t為流程模塊總數目;Resourceconflict(PMi,r)表示在模塊PMi執行時候對所需資源r的可用性;|PMi|表示模塊PMi中活動總數,sign(·)函數為符號函數,當變量相等時取1,否則為0。v(X)表示所有活動集合中資源偏好度的方差,v(Y)表示所有活動集合中協作水平的方差,d(ActPrefer(an,an+1))表示活動an與an+1之間資源偏好度的歐氏距離,d(ActCoop(an,an+1))表示活動an與an+1之間協作水平的歐氏距離。α為歸一化縮放系數,且α>0。φlim為模塊化劃分閾值,取自符合APQC(American productivity and quality center)標準的業務流程模塊化數據進行隨機抽樣分析后的平均值。

2 流程模塊功能主題提取

流程日志中包含活動的案例描述或者執行信息,這些信息往往是基于文本形式存在的。業務流程中的語義信息是反映模型質量的一個重要標準,語義信息還能夠體現出流程模塊的主題特征。從流程日志中經過流程挖掘技術進行模塊化分析后,基于改進的隱狄克雷分布LDA主題模型提取操作,能夠提取流程模塊的多維主題表示,獲得流程模塊主題模型的同時,保證主題模型結構的穩定性。

2.1 面向模塊功能主題的LDA主題模型

隱狄克雷分布LDA是一種基于概率的主題模型,同時也是一種無監督學習算法[17]。通過LDA主題模型提取算法能夠提取出流程模塊的功能主題,進一步揭示模塊功能主題與案例描述等語義信息之間的關系,為流程績效預測與模塊組合推薦打下基礎。該模型將流程日志中語義信息看作由模塊語義信息層、功能主題層和特征詞層組成的3層貝葉斯概率結構,其拓撲結構如圖1所示。

圖1 面向模塊功能主題的 LDA主題模型的3層拓撲結構

面向模塊功能主題的LDA主題模型結構如圖2所示,其中透明圓圈代表隱藏變量,灰色圓圈代表可觀測變量,矩形代表變量的重復。假設流程模塊為D,其中包含了N個流程活動,潛在的功能主題數為K,定義字符含義如下:流程模塊主題為φ1∶k,其中φk為第k個功能主題的詞的分布;第d個活動中主題所占比例為θd,其中θd,k為第k個主題在第d個活動中的比例;第d個流程活動的主題全體為Zd,其中Zd,n是第d個流程活動中第個詞的主題;第d個流程活動中所有詞記為Wd,其中Wd,n是第d個流程活動中第n個詞。

圖2 面向模塊功能主題的LDA主題模型結構

根據圖2所示的結構下的聯合分布以及LDA主題模型的后驗概率分別為:

p(φ1∶k,θ1∶D,Z1∶D,W1∶D)=

(7)

(8)

在上述聯合分布中Zd,n依賴于θd,Wd,n依賴于Zd,n與φ1∶k,θd與φd均服從以α與β為超參數的Dirichlet分布,對于上式中隱藏的參數采用吉布斯抽樣算法(Gibbs Sampling)來進行估計。將獲得的估計參數代入LDA主題模型進行計算,便可以獲得每一個流程模塊的功能主題模型,還可以獲得每一個主題下的詞匯分布及相應的占比。

2.2 基于最優主題結構的模塊LDA主題模型提取算法

面向模塊功能主題的LDA主題模型能夠通過分析模塊中的語義信息,提取出隱含的主題結構。一個模塊可以用多維主題向量及其相應的分布表示,對于其中的每一個主題又可以用為多維特征詞向量及特征詞的分布表示。即M={(Z1,Z2,…,ZT)},Zi={(W1,W2,…,WN)},M表示某一流程模塊的LDA主題模型。理想的模塊主題模型應當使得各個主題之間關聯度較低,即各主題之間獨立性較高。

定義8主題向量相似度 主題在向量空間中的余弦距離可以表示主題向量之間的關聯相似度:

(9)

式中:Zi、Zj表示模塊PM主題模型中的兩個主題向量,Wik、Wjk分別表示Zi、Zj在向量空間中第k個特征詞及分布,1≤k≤N。則sim(Zi,Zj)越小,則主題之間越獨立?;诖耍覀兘o出模塊主題模型的結構穩定程度的定義:

定義9模塊主題模型的結構穩定程度 模塊所有主題之間的平均相似度可以表示該模塊主題模型的結構穩定程度:

(10)

而LDA主題模型的產生過程,就是在給定主題數目的情況下不斷調節主題在向量空間中的詞占比,從而達到各主題之間的關聯度不斷降低的過程。因此給定的主題數目直接影響到模塊功能主題結構的穩定程度。引入主題密度的概念,提出基于最優主題結構的模塊LDA主題模型提取算法。

定義10主題密度 主題密度為以向量空間中該點為中心,以α為半徑區域內主題的個數稱為主題密度,α為給定的半徑距離:

Density(Zi,α)=|distance(Zi,Z)|≤α

(11)

定義11模型基數 給定一個LDA主題模型M和整數n,模型中密度小于等于n的主題數目成為該LDA主題模型的基數,記作Cardi(M,n)。

定義12參考樣本 對于主題分布中的一個主題Z、給定半徑α和閾值n,如果滿足Density(Zi,α)≤n,則稱主題Z為向量空間中一個參考樣本。

給出基于最優主題結構下的模塊LDA主題模型提取算法如下:

算法1基于最優主題結構的模塊LDA主題模型提取算法:

Input:D,流程模塊集合

K,初始主題數目

Output:M,各模塊功能主題模型

Method:

1 根據給定K值以隨機抽樣方式得到初始模塊主題模型M

2n=0

3 whiler、K未收斂 do

4 計算所有主題的平均相似度r=AvgSim(M)

5 計算所有主題的密度Density(Zi,r)

6 計算模型M的基數C=Cardi(M,n)

7Kn+1=Kn+gn(r)(Kn-Cn)

8 ifgn(r)=-1 then

9 將主題按密度從小到大排列,取前C個主題為參考樣本,重新進行主題模型參數估計

10 else

11 重新采用抽樣方式進行參數估計

12 利用Kn+1重新得到模塊主題模型M

13n=n+1

14 end while

其中g(r)為r的變化方向的指示函數,當r的變化方向與前一次相反時,gn+1(r)=-1×gn(r),當r的變化方向與前一次相同時,gn+1(r)=gn(r),g0(r)=-1。

基于改進的LDA主題模型提取算法獲得每一個模塊的主題模型的同時,兼顧了主題模型結構的穩定性,保證各主題之間的獨立性。

3 流程績效預測與模塊組合推薦

通過對流程日志的記錄進行挖掘可以獲取業務流程的整體特征,基于機器學習算法可以預測業務流程績效,從而以最大化流程績效為目標,對流程模塊進行組合動態推薦。

3.1 業務流程特征提取

業務流程是流程活動的邏輯組合,基于活動特征可以進一步挖掘出業務流程特征。從流程日志L中挖掘流程特征的過程如下:

定義13流程時間 在業務流程中,隨著活動長時間被多次執行,各流程步驟的熟練度逐漸上升,處理效率不斷提高,因此時間是影響流程績效的重要因素。定義業務流程BP的時間特征為:

(12)

式中:processi(a)表示活動a第i次的執行時間,h為活動a執行總次數,λn-i為對應的權重,λ為衰減因子且0<λ≤1,即距離現在越久則相應的權值越小。

定義14流程成本 定義業務流程成本為歷史處理總成本的平均值,如下所示:

(13)

式中:costi(a)表示活動a第i次的執行成本。

定義15流程協作水平 業務流程整體協作水平由流程內部各活動之間的協作水平所構成,記流程的協作水平如下:

ProCoop(BP)= (ActCoop(a1),ActCoop(a2),

…,ActCoop(an))

(14)

式中:ActCoop(an)表示流程中活動an的協作水平。

定義16流程活動質量 業務流程活動質量由流程內部各活動質量所構成,記流程的活動質量如下:

ProQuality(BP)= (Quality(a1),Quality(a2),

…,Quality(an))

(15)

式中:Quality(an)其中表示流程中活動an的活動質量。

定義17流程資源熟練度 業務流程最終績效與流程內執行活動的資源的熟練度密切相關,資源對活動執行次數越多,則對該活動的處理越熟練。若某業務流程內每個資源只執行了一次,則該流程資源熟練程度較低。記流程的資源熟練度如下:

(16)

3.2 基于BP神經網絡的流程績效預測

首先定義流程績效的評價指標,流程績效評價指標應該體現流程“輸入- 過程- 產出”的整體框架,兼顧流程整體的性能以及產出質量。定義流程活動的流轉率為其輸出的質量得分與其消耗的時間及成本的比值,令AF(a)為活動a的流轉率,則可給出如下公式:

(17)

式中:Output(a)為活動a的輸出質量,通常由活動的輸出經濟效益表示。

基于活動的流轉率,給出業務流程的績效評價指標如下:

PF(BP)=(∑a∈BPηa×AF(a))/n

(18)

式中:ηa為活動a的權重調和因子。

神經網絡算法能夠自動學習多維輸入與輸出之間的復雜映射關系,并且無需事先知道輸入與輸出之間的數學方程聯系,被廣泛用于各行業的預測問題中。而BP神經網絡發展至今已經得到了多重驗證及訓練,方法比較成熟且結果較為穩定,是迄今運用最為廣泛的神經網絡算法[18-19]。因此本文選取BP神經網絡算法訓練流程績效預測模型。經過本文多次實踐后發現,三層BP神經網絡對流程特征向量與流程績效的建模效果較好,且三層網絡的參數量與業務流程特征數目及訓練集數據大小較為匹配,綜合考慮訓練成本等因素后,本文選取三層BP神經網絡用于模型訓練。而經過多次實踐后,發現Sigmoid激活函數對模型的訓練效果較好,因此本文選用Sigmoid函數用作神經元激活函數:

(19)

(20)

那么該神經網絡在業務流程訓練集TD上的累積均方誤差為:

(21)

為了使得累積均方誤差最小化,對網絡中的參數進行更新估計,則讓累積均方誤差MSETD對各個參數求偏導數,并基于梯度下降策略對各個參數進行調整??紤]到算法的收斂性及運算成本,采用小批量梯度下降法MBGD(Mini-batch Gradient Descent)更新流程績效預測模型中的參數,經過多次迭代后,獲得業務流程績效預測模型。

3.3 流程模塊組合動態推薦

基于訓練好的業務流程績效預測模型,我們可以得到業務流程模塊組合后的流程績效預測值,以最大化流程績效為目標,構建流程模塊組合動態推薦架構如圖3所示,主要分為虛線所示三大板塊。

圖3 流程模塊組合動態推薦架構圖

(1) 主題模型提取板塊。負責從流程日志數據庫中通過流程挖掘技術挖掘活動特征,進而對流程活動進行模塊化。對流程模塊提取相應的主題模型,以方便為模塊組合推薦做準備。

(2) 模塊組合推薦板塊。用戶在進行建模工作之前,通常以需求文檔、設計說明等文本形式的內容來描述流程任務或者建模需求。對用戶業務流程需求文檔集合進行分詞、去停頓詞、取詞干等預處理操作后,同樣對其進行用戶所需功能主題提取,獲取用戶所需功能主題以及相應的特征詞占比。通過文本信息在向量空間模型下的余弦相似度匹配,尋找用戶所需功能主題相近的流程模塊。為了使推薦結果更加多樣化和可選擇化,采用k近鄰思想在向量空間中找到k個相似功能主題的流程模塊組成功能主題模塊集合FTMS。為用戶的需求生成若干個FTMS后,系統會自動從各FTMS中選擇模塊進行動態組合推薦。

(3) 流程績效預測板塊。通過流程挖掘技術從流程日志數據庫中獲取業務流程特征,并且利用日志記錄訓練績效預測模型,對模塊組合推薦板塊生成的業務流程進行績效預測,給出Top-N的推薦列表。

對于無法組合的流程模塊(如輸入輸出無法對應匹配),系統會動態給出各主題下k個相似功能主題的流程模塊清單,附上該模塊所包含的語義信息以供用戶參考。

4 實驗及結果分析

為了評估本文所提出的方法,選取了10家采用APQC標準的流程框架的企業流程日志數據進行實驗分析。每家企業均含有業務部、生產計劃部、財務部等10個以上的部門,每個部門內部含有日常業務流程線2條及以上。數據集總共包含了8 286條流程實例,每條流程實例均包含了起止時間、事件描述、執行成本等所需信息。下面從流程模塊主題模型提取和模塊組合推薦兩個角度對數據集進行對比實驗分析。

4.1 流程模塊主題模型提取實驗分析

4.1.1 主題模型評價標準

采用語言模型的困惑度(Perplexity)作為LDA主題模型的評價標準,通過對主題模型的困惑度的計算可以得出該模型的性能[20]。困惑度指標越小則說明該主題模型的性能越好。給出困惑度的計算公式如下:

(22)

式中:Nd為流程模塊d中語義信息的總詞數;Wd,i為其中的第i個單詞。

同時繼續采用本文2.2節中的平均相似度來表示該模塊主題模型的結構穩定程度。

4.1.2 不同K值對模塊主題模型的影響分析

隨機選取實驗數據集中4條流程實例用作實驗分析,由于各流程活動總數、案例描述不同,流程日志中所包含的語義信息大小也不相同。將各流程日志進行活動特征提取、模塊化等一系列操作后,利用LDA主題模型提取算法對各模塊提取主題模型。隨機選取每一條流程線中的1個模塊的主題模型進行實驗對比分析,分別將4個模塊稱為D1、D2、D3、D4。如圖4所示。

圖4 數據在不同主題數目下困惑度對比

從圖4中可以看出,指定不同的主題K值會對主題模型的性能產生影響,其中D1、D2、D3、D4均在圓圈處達到了困惑度最低值,說明在此處各模塊的主題模型內部相關性較低,各主題獨立性較高,主題模型更加穩定。每一個模塊的最優K值受到模塊內部語義信息的影響,因此各不相同。為了進一步說明主題模型困惑度與穩定性的關系,則對不同主題數目下模塊主題模型的平均相似度進行實驗分析。如圖5所示。

圖5 數據在不同主題數目下平均相似度與困惑度對比

通過比較Perplexity曲線與AvgSim曲線在不同主題數目K值下的走勢發現,兩個變量的變化趨勢基本相同,且同樣在圓圈處達到最優模塊主題模型結構,說明此時的主題模型各主題之間的關聯度最低,獨立性最高,則此時的主題模型最能夠表示模塊的功能主題信息。

4.2 流程模塊組合推薦實驗分析

4.2.1 推薦效果評價標準

通過自助法(bootstrapping)以自助采樣的方式將實驗數據集合中的大部分數據作為訓練集,將剩余數據作為測試集。對測試集中的業務流程日志進行流程挖掘、特征提取、流程模塊化等一系列操作之后,移除最后一個流程模塊,并將最后一個流程模塊作為模塊組合推薦的推薦目標。根據測試集中業務流程的原業務說明文檔對最后一個功能模塊進行預測推薦,將推薦模塊代入原業務流程后判斷流程績效指標是否提升或者保持不變,通過計算測試集中業務流程的推薦模塊中能夠提升或者保持績效不變的模塊數與總推薦模塊數目的比值來評估推薦的效果。即推薦效果RA可以表示為:

式中:RN為向業務流程推薦的功能模塊數目,RNk為推薦模塊中能夠提升業務流程績效或者保持不變的模塊數目(絕大部分是原先的功能模塊),testset表示測試集中的所有業務流程。

4.2.2 基于不同主題模型提取算法的流程模塊組合推薦實驗分析

圖6給出了不同主題模型提取算法下的流程模塊組合推薦效果實驗對比。其中用于對比實驗的分別是指定主題數(K=10)的LDA主題模型提取算法。以及基于開源自然語言處理工具StandfordNL[21]對模塊提取主題的算法。StandfordNL能夠對流程模塊中包含的信息文本進行分詞、去停頓詞、取詞干等預處理操作,再根據詞頻-反向文檔頻率TF-IDF(Term Frequency-Inverse Document Frequency)模型建模,從而獲取模塊的主題模型。

圖6 基于不同主題模型提取算法的流程模塊組合推薦實驗對比

從圖6中可以得出,三種模塊主題模型提取算法的推薦效果都隨著推薦模塊數目的上升先逐步提高,但過了一定數目后開始逐步下降。其中兩種基于LDA主題模型的提取算法的推薦效果在各種數目下均優于StandfordNL主題模型提取算法??梢钥闯鯨DA主題模型能夠更好地從流程模塊的語義信息中提取出代表該模塊功能主題的語義模型。而本文提出的改進的LDA主題模型提取算法能夠更好地提取結構穩定的LDA主題模型,因此在推薦效果上具有更優的性能。

4.2.3 基于不同績效預測模型的流程模塊組合推薦實驗分析

圖7給出了基于不同績效預測模型下的流程模塊組合推薦效果實驗對比。其中用于對比實驗的分別是Apriori關聯規則推薦算法與線性神經網絡。Apriori關聯規則推薦算法能夠挖掘模塊組合與流程績效之間的關聯規則,然后根據關聯規則為業務流程推薦流程模塊。線性神經網絡則是由多個線性神經元組成的另一常見神經網絡算法,它能根據輸出向量與期望輸出向量之間的差距來調整網絡內的神經元閾值和權值,從而獲得預測模型。

圖7 基于不同績效預測模型的流程模塊組合推薦實驗對比

從圖7中可以得出,兩類神經網絡預測模型的推薦效果基本上均優于Apriori關聯規則推薦算法。但在剛開始推薦模塊數目較少時,Apriori關聯規則推薦算法推薦效果要優于線性神經網絡預測模型,這可能是因為推薦數目較少時,Apriori算法能夠直接獲取模塊組合與高流程績效之間的強關聯規則。隨著推薦模塊數目的增加,神經網絡預測模型的優勢開始逐漸顯現,但均過了一定峰值后開始下降,這與上節結論相同。其中BP神經網絡的推薦效果均要顯著優于另外兩種算法的推薦效果,而線性神經網絡缺乏反向傳播誤差等優勢,因此推薦效果不如BP神經網絡算法。

5 結 語

合理的業務流程模型能夠為企業帶來客觀的經濟收益及質量口碑,因此推薦合適的流程模塊幫助企業設計流程已經在近年來得到學術界與工業界的不斷關注。流程挖掘技術在近年來飛速發展為流程推薦研究提供了新的方向和思路。本文提出一種基于流程挖掘技術的業務流程模塊推薦方法,能夠基于流程日志使用流程挖掘技術獲取特征信息,從而能對流程活動建模并模塊化;再使用改進的基于最優主題結構的LDA主題模型提取算法提取流程模塊的功能主題;同時構建業務流程整體特征后,基于小批量梯度下降法的BP神經網絡算法訓練流程績效預測模型。將用戶建模需求做所需功能主題提取后,采用K近鄰思想生成功能主題模塊集合,以最大化流程績效為目標對流程模塊進行動態組合推薦。實驗表明,本文方法對流程模塊推薦具有較好的推薦效果,證明其在流程建模過程中的可行性。

在現實企業流程中,流程信息包含的數據可能會更加復雜及多樣化,未來計劃在建模過程中考慮更多流程元素,進一步加強流程管理與流程建模的結合。未來的另一個研究方向是將流程推薦與業務流程資源分配相結合,提供基于資源分配與流程績效結合的流程模塊推薦。

[1] 趙衛東. 智能化的流程管理[M]. 上海:復旦大學出版社,2014.

[2] Liu Y, Wang J, Yang Y, et al. A semi-automatic approach for workflow staff assignment[J]. Computers in Industry, 2008, 59(5):463- 476.

[3] Nakatumba J, Aalst W M P V D. Analyzing Resource Behavior Using Process Mining[J]. Lecture Notes in Business Information Processing, 2009, 43:69- 80.

[4] Huang Z, Lu X, Duan H. Resource behavior measure and application in business process management[J]. Expert Systems with Applications, 2012, 39(7):6458- 6468.

[5] HornungT, KoschmiderA, Oberweis A. A Recommender System for Business Process Models[C]//17th Annual Workshop on Information Technologies & Systems (WITS),2009.

[6] Ayora C, Torres V, Vara J L D L, et al. Variability management in process families through change patterns[J]. Information & Software Technology, 2016, 74(C):86- 104.

[7] Chen S J, Lin L. Decomposition of interdependent task group for concurrent engineering[J]. Computers & Industrial Engineering, 2003, 44(3):435- 459.

[8] Clempner J. A hierarchical decomposition of decision process Petri nets for modeling complex systems[J]. International Journal of Applied Mathematics & Computer Science, 2010, 20(2):349- 366.

[9] Mendling J, Reijers H A, Recker J. Activity labeling in process modeling: Empirical insights and recommendations[J]. Information Systems, 2010, 35(4):467- 482.

[10] Dorn C, Burkhart T, Werth D, et al. Self-adjusting recommendations for people-driven ad-hoc processes[C]// Proceedings of the 8th International Conferenceon Business Process Management, Hoboken, NJ, USA, September 13- 16, 2010.DBLP, 2010:327- 342.

[11] 趙衛東, 戴偉輝. 基于角色塊的工作流模型挖掘[J]. 系統工程與電子技術, 2008, 30(5):956- 959.

[12] Koschmider A, Hornung T, Oberweis A. Recommendation-based editor for business process modeling[J]. Data & Knowledge Engineering, 2011, 70(6):483- 503.

[13] Aalst W M P V D, Reijers H A, Weijters A J M M, et al. Business process mining: An industrial application[J]. Information Systems, 2007, 32(5):713- 732.

[14] Liu X, Fang X, Wang J, et al. Mining method of business process models based on configuration[J]. Boletin Tecnico/technical Bulletin, 2017, 55(1):77- 84.

[15] Zeng Q, Sun S X, Duan H, et al. Cross-organizational collaborative workflow mining from a multi-source log[J]. Decision Support Systems, 2013, 54(3):1280- 1301.

[16] Lacheheub M N, Maamri R. A formal model for business process decomposition based on resources consumption with security requirement[C]// International Conference on Advanced Aspects of Software Engineering. IEEE, 2017:1- 8.

[17] Limsettho N, Hata H, Matsumoto K. Comparing hierarchical dirichlet process with latent dirichlet allocation in bug report multiclass classification[C]// IEEE/acis International Conference on Software Engineering, Artificial Intelligence, NETWORKING and Parallel/distributed Computing. IEEE, 2014:1- 6.

[18] Armaghani D J, Hajihassani M, Mohamad E T, et al. Blasting-induced flyrock and ground vibration prediction through an expert artificial neural network based on particle swarm optimization[J]. Arabian Journal of Geosciences, 2014, 7(12):5383- 5396.

[19] Yu F, Xu X. A short-term load forecasting model of natural gas based on optimized genetic algorithm and improved BP neural network[J]. Applied Energy, 2014, 134(134):102- 113.

[20] Biggers L R, Bocovich C, Capshaw R, et al. Configuring latent Dirichlet allocation based feature location[J]. Empirical Software Engineering, 2014, 19(3):465- 500.

[21] Manning C D, Surdeanu M, Bauer J, et al. The Stanford CoreNLP Natural Language Processing Toolkit[C]// Meeting of the Association for Computational Linguistics: System Demonstrations. 2014:55- 60.

猜你喜歡
活動模型
一半模型
“六小”活動
少先隊活動(2022年5期)2022-06-06 03:45:04
“活動隨手拍”
行動不便者,也要多活動
中老年保健(2021年2期)2021-08-22 07:31:10
少先隊活動(2021年1期)2021-03-29 05:26:36
“拍手歌”活動
快樂語文(2020年30期)2021-01-14 01:05:38
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
三八節,省婦聯推出十大系列活動
海峽姐妹(2018年3期)2018-05-09 08:20:40
3D打印中的模型分割與打包
主站蜘蛛池模板: 久久青草免费91线频观看不卡| 呦女精品网站| 秋霞一区二区三区| 久久精品视频一| 国产亚洲精久久久久久无码AV| 国产精品偷伦在线观看| 亚洲人在线| 亚洲天堂自拍| 性欧美久久| 精品福利国产| 免费一级毛片不卡在线播放| 日韩毛片免费观看| 超清人妻系列无码专区| 18黑白丝水手服自慰喷水网站| 国产成人精品一区二区三区| 免费三A级毛片视频| 国产97视频在线| 久久精品日日躁夜夜躁欧美| 91欧美亚洲国产五月天| 国产成人高清精品免费软件| 日韩欧美国产三级| 久久中文字幕不卡一二区| 国产SUV精品一区二区6| 在线精品视频成人网| 亚洲成在线观看| 亚洲天堂网在线视频| 久久青草精品一区二区三区| 少妇人妻无码首页| 亚洲手机在线| 四虎影视库国产精品一区| 精品国产亚洲人成在线| 男女性色大片免费网站| 亚洲91精品视频| 国产打屁股免费区网站| 国产精品不卡片视频免费观看| 久青草网站| 97国产在线观看| 狠狠久久综合伊人不卡| 欧美一级夜夜爽| 国产精品免费p区| 在线网站18禁| julia中文字幕久久亚洲| 亚洲热线99精品视频| a毛片在线播放| 国产真实乱子伦精品视手机观看 | 亚洲人在线| 黄色网站在线观看无码| 欧美激情综合一区二区| 无码日韩精品91超碰| 茄子视频毛片免费观看| 无套av在线| 18禁黄无遮挡免费动漫网站| 国产一级毛片在线| 国产精品人成在线播放| 亚洲乱码视频| av在线手机播放| 国产美女在线观看| 色婷婷综合激情视频免费看| 国产视频a| 亚洲国产成人久久精品软件 | 欧美无遮挡国产欧美另类| 欧美伦理一区| 午夜少妇精品视频小电影| 香蕉久久国产精品免| 秋霞国产在线| 亚洲天堂视频在线观看免费| 青青青视频蜜桃一区二区| 国产婬乱a一级毛片多女| 日本五区在线不卡精品| 亚洲—日韩aV在线| 成人亚洲国产| 亚洲一区二区三区麻豆| 亚洲中文字幕无码爆乳| 亚洲水蜜桃久久综合网站| 亚洲不卡影院| 深夜福利视频一区二区| 亚洲bt欧美bt精品| 国产九九精品视频| 亚洲人成网7777777国产| 少妇精品网站| AV不卡在线永久免费观看| 亚洲无码精品在线播放 |