蒲天添
摘 要: 為了使企業能夠更好地適應社會的需求,對市場的變化做出快速地反應。針對工程項目的特點,運用改進的ID3決策樹算法對工程項目管理進行優化。首先,構建工程項目管理的優化屬性,聘請相關專家對屬性與工程項目風險進行評分,然后,對評分進行離散化處理,最后利用ID3決策樹算法對工程項目信息進行充分挖掘,生成工程項目管理優化決策樹,找出其中影響工程項目優化管理的分類規則,分析工程項目的實施情況,給出個性化提示,從而達到對企業工程項目的有效控制和優化。
關鍵詞: 電力系統; 工程項目管理優化; 信息熵; ID3決策樹; 數據挖掘; 離散化處理
中圖分類號: TN911?34 文獻標識碼: A 文章編號: 1004?373X(2018)01?0169?04
Abstract: In order to let the enterprises adapt to the society requirement better, and respond to the changes in the market rapidly, an improved ID3 decision tree algorithm is used to optimize the engineering project management according to the characteristics of engineering project. The optimization attribute of the engineering project management was constructed. The attribute and engineering project risk are graded by relevant experts. And then the scores are discredited. The ID3 decision tree algorithm is adopted to mine the engineering project information fully, generate the decision tree of the engineering project management optimization, find out the classification rules influencing the engineering project management optimization, analyze the implementation of the engineering project, and give the personalized reminder. The ID3 decision tree algorithm can control and optimize the enterprise′s engineering project effectively.
Keywords: electric power system; engineering project management optimization; information entropy; ID3 decision tree; data mining; discretization
0 引 言
隨著中國經濟的快速發展,為了使企業能夠更好地滿足社會的需求,適應市場的快速變化,據相關研究[1?2],我國有90%以上的國有大中型企業都實施了工程項目管理模式,這些企業因為采用工程項目管理模式,能夠對市場的變化做出快速地反應,運行狀況良好,都取得了不錯的成果。但是,由于我國的管理技術落后于西方發達國家,我國推行工程項目管理起步較晚,與西方發達國家的工程項目管理運行效果進行比較,可以發現我國企業推行的工程項目管理與發達國家之間還存在一定的差距[3]。在配套改革、制度創新和機制轉變等方面還需要不斷發展與完善[4]。由于企業在管理方式、競爭程度等方面存在著一定的差異,因此,不同企業的工程項目管理效果有著明顯的不同,因此,為了更好地適應社會、市場的需求,不同的企業應根據自身的資源優勢、行業競爭狀況,對工程項目進行優化管理[5]。
本文將決策樹算法引入企業工程項目管理優化過程中,決策樹算法主要用來對研究數據進行預測與分類,是目前一種應用最為廣泛的數據挖掘算法[6]。研究中,為了加快工程項目管理優化的速度,對傳統的ID3決策樹算法進行改進,將改進的ID3決策樹算法運用于工程項目管理中,通過對企業工程項目的實施信息進行充分挖掘,找到對工程項目實施效果有較大影響的那些分類規則,用于分析企業工程項目的實施情況,對企業的工程項目實施方式給出針對性建議,從而使企業的工程項目管理模式得到優化。
1 ID3決策樹算法
1.1 決策樹算法
決策樹算法主要用于對數據的分類與預測,是目前一種應用最為廣泛的數據挖掘算法之一。它從根節點開始遍歷,在搜索的過程中利用歸納算法選擇其中一個分支,直到選擇某個葉子節點,從而構造成決策樹[7]。在決策樹中,為了實現對數據的分類,按照IF?THEN的分類規則,從根節點到葉子節點將決策樹轉化成多個分類規則。決策樹算法的優點是生成的模式簡單、魯棒性強,同時分類的精度高、速度快。決策樹算法有多種,其中應用最廣泛的是ID3決策樹算法[8]。
1.2 ID3決策樹算法的構造
ID3決策樹算法是將信息增益用作選取分支節點的測試屬性,首先將信息增益最高的節點作為決策樹的根節點,然后找到次高節點,作為決策樹的分支,依次類推,最后遞歸生成一棵簡單的決策樹[9]。
1.2.1 設定信息熵
假設訓練集[S]中包含了[Si](其中[i=1,2,…,m])個數據樣本,分成[m]個類[c1,c2,…,ci](其中[i=1,2,…,m])。endprint
[I(S1,S2,…,Sm)=-i=1mPilog2Pi] (1)
式中:因為信息采用二進制編碼,所以使用的函數為以2為底的對數;[Pi]表示訓練集[S]中某隨機數據樣本屬于類[ci]的概率,[Pi]使用[SiS]進行估算。
1.2.2 選擇根節點
設屬性[A]為樹的根節點,[A]中包含[v]個值[{a1,][a2,…,av}。]訓練集[S]被分為子集[{S1,S2,…,Sv},]設其中[A]的值為[aj,]某子集為[Sj。][sij]是[Sj]中的樣本屬于[Ci]的個數,則:
[E(A)=j=1vs1j+s2j+…+smjSI(s1j,s2j,…,smj)] (2)
式中:[s1j+s2j+…+smjS]是子集[Sj]的權,利用式(2)推導出集合[S]的信息熵為:
[I(s1j,s2j,…,smj)=-i=1mPijlog2Pij] (3)
式中:[Pij]使用 [sijSj]估計,表示子集[Sj]中某隨機數據樣本屬于類[Ci]的概率。
分支[A]的信息增益為:
[Gain(A)=I(S1,S2,…,Sm)-E(A)] (4)
信息增益用來描述樣本子集的純度,信息增益越大,表明劃分后的樣本子集越純,越有利于進行集合的優化與分類。
1.2.3 ID3決策樹算法性能分析
ID3決策樹算法從空樹開始,利用爬山策略遍歷假設空間,對大規模的數據集進行處理,其優缺點如下[10]:
優點:ID3決策樹算法以爬山策略對搜索空間進行遍歷,以信息增益作為測試屬性的技術,為了能夠獲得被測數據的最大類別信息,對每個非葉子節點都進行測試,如果類別信息屬性是非離散性的,為了降低訓練樣本的敏感性,需要對類別信息進行離散化處理。
缺點:由于決策結算法是從根節點開始,對整個決策樹進行遍歷,如果再增加訓練樣例,則需要重新構造新的決策樹,通用性很弱。在選擇分裂節點時,需要對每個屬性的信息熵進行計算來判斷其分裂屬性,計算量較大,如果屬性較多,則增大了決策樹的產生成本,同時,運行的效率亦會受到很大的影響。
1.3 ID3決策樹算法的改進
為了提高ID3決策樹算法的運行效率,利用泰勒公式和麥克勞林公式對傳統的ID3決策樹算法進行改進。當[x-x0]很小時,高等數學中的微分理論知識見式(5):
[f(x)=f(x0)+f(x0)(x-x0)+o(x-x0)] (5)
麥克勞林公式如下:
[f(x)=f(0)+f(0)x+f(0)2!x2+…+f(n)(0)2!xn+R(x)] (6)
其中,[R(x)=f(n+1)(x)(n+1)!(x-x0)n+1]
麥克勞林公式的近似公式見式(7):
[f(x)≈f(0)+f(0)x+f(0)2!x2+…+f(n)(0)2!xn] (7)
式中:若[f(x)=ln(1+x)],且當[x→0],存在[ln(1+x)≈x]。
1.4 改進后屬性信息熵的運算公式推導
由等式:
[I(pi,ni)=-pipi+nilog2pipi+ni-nipi+nilog2nipi+ni] (8)
[E(A)=i=1npi+nip+nI(pi,ni)] (9)
整理得:
[E(A)=i=1n1(p+n)ln2-pilnpipi+ni-ninipi+ni] (10)
因為[1(p+n)ln2]是常量,設[G(A)=][i=1n-pilnpipi+ni-ninipi+ni],存在以下關系式成立:
[ln(1+x)≈x] (11)
[lnpipi+ni=ln1-nipi+ni≈-nipi+ni] (12)
同理:
[lnnipi+ni≈-pipi+ni] (13)
則:
[G(A)=i=1npinipi+ni+nipipi+ni=i=1n2pinipi+ni] (14)
改進后的屬性信息熵公式為:
[H(A)=i=1n2pinipi+niN] (15)
式中[N]表示屬性值的個數。
2 改進ID3決策樹算法的工程項目管理優化算法
1) 選擇企業的某個工程項目,構建工程項目管理優化的相關屬性,聘請相關專家對屬性值進行打分,收集專家的打分結果,構建工程項目管理優化的訓練集;
2) 利用粗糙集理論,對訓練集進行離散化處理;
3) 利用改進ID3決策樹算法,選擇信息增益最高的節點屬性作為根節點;
4) 然后找到次高節點,作為決策樹的分支,依次類推,最后遞歸生成一棵決策樹;
5) ID3決策樹算法中每循環執行一次,生成的決策樹都會被更新一次。
3 仿真試驗
3.1 工程項目管理的三要素分析
工程項目管理以最低成本均衡資源,控制工程質量為目標,根據相關研究成果,可以將工程項目管理屬性歸納為計劃、技術、費用和進度4個基本屬性。在進行工程項目管理時,計劃是為了確保項目的順利實施與完成,事先需要做好周密的計劃安排,預測工程項目在實施時的各種風險;技術是確保項目在設計和實施過程中的技術保障;費用是保證項目在實施過程中的財務預算;進度是指項目設計、建造和安裝等所估算和分配的作業時間。從經濟學角度來看,工程項目管理中計劃、技術、費用和進度的相互制約關系產生了多目標協同問題,即多目標優化。
3.2 基于ID3決策樹算法的工程項目管理優化endprint
在Java平臺的Weka軟件進行試驗仿真,以某國有企業工程項目管理優化為目標屬性,選擇工程項目管理的計劃、技術、費用和進度4個屬性對工程項目管理進行優化,利用ID3決策樹算法提取有用的分類規則,指導企業工程項目優化運行。
3.3 數據準備
分析該國有企業的某個工程管理項目的運行情況,聘請相關專家對這4個指標分別根據樣本實際情況給出評分,并按一定規則得到綜合評分,最后,根據各屬性的綜合評分情況對該工程項目的風險進行綜合評分。表1為收集的10個專家對該工程項目的評分。
3.4 傳統ID3決策樹算法的信息增益
為了減少運行的誤差,利用粗糙集算法對該工程項目的專家評分表進行離散化處理,然后利用式(1)~式(3)計算出該工程項目的項目風險、計劃、技術、費用和進度的期望信息。
項目風險的期望信息:Info(風險程度)=0.998 8
計劃的期望信息:Info(計劃)=0.998 7
技術的期望信息:Info(技術)=0.994 5
費用的期望信息:Info(費用)=0.987 9
進度的期望信息:Info(進度)=0.991 9
利用式(4)計算得到4個屬性的信息增益:
Gain(計劃)=0.998 8-0.998 7=0.000 1
Gain(技術)=0.998 8-0.994 5=0.004 3
Gain(費用)=0.998 8-0.987 9=0.010 9
Gain(進度)=0.998 8-0.991 9=0.006 9
由于進度在屬性中具有最高信息增益,它被選作測試屬性。決策樹創建過程為: 創建一個節點,用進度指標作為標記,并對每個屬性值引出一個分枝,對各個分枝進行如上所述遞歸運算,最終得到的決策樹如圖1所示。
從生成的決策樹來看,為了實現該項目的有效管理,首先必須要保證該項目的進度,然后在確保計劃的完善,最后,要充分地確保項目實施技術的支撐能力,這樣就可以確保該項目的順利實施與完成。
3.5 改進ID3決策樹算法后的信息增益
為了提高工程項目管理優化效率,對ID3決策樹算法進行改進,利用式(15)進行計算:
項目風險的期望信息:Info(風險程度)=0.999 7
計劃的期望信息:Info(計劃)=0.675 3
技術的期望信息:Info(技術)=0.453 7
費用的期望信息:Info(費用)=0.653 4
進度的期望信息:Info(進度)=0.562 4
得到各屬性的屬性信息熵,計算出各指標的信息增益如下:
Gain′(計劃)= 0.999 7-0.675 3=0.324 4
Gain′(技術)=0.999 7-0.453 7=0.546
Gain′(費用)=0.999 7-0.653 4=0.346 3
Gain′(進度)= 0.999 7-0.562 4=0.437 3
Gain′(進度)相對不大,即應把進度指標作為測試屬性創建決策樹,然后對各個分支進行遞歸運算,構建的決策樹與圖1相同。為了比較決策樹ID3決策樹算法改進前后性能的變化,針對不同個數的工程項目管理,處理相同數據所需的耗時對比見圖2。由圖2可見,改進后的ID3決策樹算法的速度要遠遠高于傳統的ID3決策樹算法,工作效率大大增強。
4 結 論
為了企業能夠更好地適應社會、市場的需求,傳統的管理方法已經很難適應環境的變化,因此,對企業工程項目進行針對化的管理成為一種必然趨勢。本文主要通過 ID3決策樹算法構造企業工程項目管理決策樹,得到分類規則,對項目的管理信息進行充分挖掘,實現工程項目管理的個性化提示和針對化管理。
參考文獻
[1] 梁晨.基于神經網絡的機械設備故障檢測技術[J].計算機與數字工程,2015(9):1685?1688.
LIANG Chen. Equipment failure prediction technology based on system network [J]. Computer and digital engineering, 2015(9): 1685?1688.
[2] 劉菁,賴芨宇,孫曉丹.基于物元分析法的施工項目管理績效評價模型[J].工程管理學報,2015(1):124?128.
LIU Jing, LAI Jiyu, SUN Xiaodan. The performance evaluation of construction project management model based on matter?element analysis method [J]. Journal of engineering management, 2015(1): 124?128.
[3] 段彥斌.電力能信工程項目管理組織優化研究[D].北京:華北電力大學,2014.
DUAN Yanbin. The power to channel project management organization optimization research [D]. Beijing: North China Electric Power University, 2014.
[4] 郭鵬,文曉閣.基于BP人工神經網絡的BOT項目風險評估研究[J].科技管理研究,2015,35(21):210?214.endprint
GUO Peng, WEN Xiaoge. Research of BOT project risk assessment based on BP neural network [J]. Science and technology management research, 2015, 35(21): 210?214.
[5] 林紅,孫雅娟.基于優化決策樹的化工企業風險監測算法[J].計算機仿真,2013,30(8):368?371.
LIN Hong, SUN Yajuan. Chemical enterprise production steady quantitative measurement based on optimization decision tree [J]. Computer simulation, 2013, 30(8): 368?371.
[6] 樊妍妍.ID3決策樹算法對教學輔助系統的優化[J].齊齊哈爾大學學報(自然科學版),2016,32(1):85?89.
FAN Yanyan. Application of lD3 decision tree mining in teaching assistant system [J]. Journal of Qiqihar University (natural science edition), 2016, 32(1): 85?89.
[7] 楊洋.決策樹ID3算法及其改進[J].軟件導刊,2016,15(8):46?48.
YANG Yang. Decision tree ID3 algorithm and its improvement [J]. Software guide, 2016, 15(8): 46?48.
[8] 王小巍,蔣玉明.決策樹ID3算法的分析與改進[J].計算機工程與設計,2011,32(9):3070?3072.
WANG Xiaowei, JIANG Yuming. Analysis and improvement of ID3 decision tree algorithm [J]. Computer engineering and design, 2011, 32(9): 3070?3072.
[9] 賈志剛,賀蓉,李仁發,等.一種基于決策樹分類算法的家庭能量動態調度系統[J].計算機應用研究,2016,33(9):2619?2624.
JIA Zhigang, HE Rong, LI Renfa, et al. Dynamic scheduling system of home energy based on decision tree classification algorithm [J]. Application research of computers, 2016, 33(9): 2619?2624.
[10] 溫瑞英,王紅勇.基于嶺回歸:BP神經網絡的管制工作負荷預測方法[J].交通運輸系統工程與信息,2015,15(1):123?129.
WEN Ruiying, WANG Hongyong. A forecasting method of controller′s workload based on ridge regression?BP neural network [J]. Journal of transportation systems engineering and information technology, 2015, 15(1): 123?129.endprint