任冬梅,張宇洋,董新玲
(西南石油大學(xué) 計算機科學(xué)學(xué)院,成都 610500)
應(yīng)用于石油鉆井安全評價的改進(jìn)主成分分析-貝葉斯判別方法
任冬梅,張宇洋*,董新玲
(西南石油大學(xué) 計算機科學(xué)學(xué)院,成都 610500)
(*通信作者電子郵箱dukezyy@163.com)
針對主成分分析-貝葉斯判別法(PCA-BDA)僅支持安全評價但不能發(fā)現(xiàn)危險因素的問題,引入屬性重要度的概念,提出一種改進(jìn)的PCA-BDA算法,并將其應(yīng)用于石油鉆井安全評價。首先,使用原始PCA-BDA方法評估出各條記錄的安全等級;然后,利用主成分分析(PCA)過程中的特征向量矩陣,貝葉斯判別(BDA)過程中的判別函數(shù)矩陣,以及各安全等級的權(quán)重計算得出屬性重要度;最后,通過參考屬性重要度來調(diào)控屬性。安全評價準(zhǔn)確率的對比實驗中,改進(jìn)PCA-BDA方法準(zhǔn)確率達(dá)到96.7%,明顯高于層次分析法(AHP)和模糊綜合評價法(FCE)。調(diào)控屬性的仿真實驗中,調(diào)控重要度最高的3個屬性70%以上的鉆井安全等級得到改善;相對地,調(diào)控重要度最低的3個屬性鉆井安全等級幾乎沒有變化。實驗結(jié)果表明,改進(jìn)PCA-BDA方法不僅能夠準(zhǔn)確地實現(xiàn)安全評價,同時能夠找出關(guān)鍵屬性使石油鉆井安全管理更有針對性。
屬性重要度;貝葉斯判別分析;主成分分析;石油鉆井安全評價
系統(tǒng)安全評價作為一種有效且基本的方法已逐漸應(yīng)用于各類工程領(lǐng)域[1-2]。面對這一問題傳統(tǒng)的做法有安全檢查表法、專家打分法、模糊綜合評價(Fuzzy Comprehensive Evaluation, FCE)[2]和層次分析法(Analytic Hierarchy Process, AHP)[3]等方法, 但這些方法需要依靠專家或技術(shù)人員人工“打分”,從而會不可避免地引入主觀因素[4]。
除了傳統(tǒng)方法以外,一些分類方法也被應(yīng)用于安全評價。例如,決策樹歸納、貝葉斯判別法、支持向量機(Support Vector Machine, SVM)、判別分析法、貝葉斯網(wǎng)絡(luò)等方法[5-6]。在這類算法中,主成分分析(Principal Component Analysis, PCA)配合判別分析使用的方法是一種常見的選擇[5-8],而主成分分析-貝葉斯判別分析(Principal Component Analysis-Bayes Discriminant Analysis, PCA-BDA)正是隸屬于此類的高效算法。
相較于其他方法,PCA-BDA方法有如下三點優(yōu)勢:1)可以杜絕主觀因素;2)可以消除屬性之間的信息重疊;3)可以簡單且高效地完成評價。然而,該方法并不能顯著地表示出屬性與安全等級間的因果關(guān)系。當(dāng)安全狀態(tài)異常時,很難找出關(guān)鍵因素并進(jìn)行針對性的預(yù)防和控制。
本文提出了一種改進(jìn)的PCA-BDA方法,其主要思想是引入屬性重要度的概念[9-10],在實現(xiàn)安全評價的同時發(fā)現(xiàn)關(guān)鍵屬性,從而通過對關(guān)鍵屬性的針對性控制更加高效地避免和減少風(fēng)險。最后通過實驗分析,驗證了本文算法不僅具有良好的評價準(zhǔn)確率,并且所得屬性重要度可以有效幫助企業(yè)降低安全風(fēng)險。
本文相關(guān)的理論基礎(chǔ)包括石油鉆井安全評價系統(tǒng)、主成分分析、貝葉斯判別分析(BDA),以及兩者混合的方法PCA-BDA。
1.1 石油鉆井安全評價體系
石油鉆井安全評價是石油鉆井安全管理的重要組成部分。它利用系統(tǒng)工程的方法為鉆井作業(yè)提供綜合的評估,并且預(yù)測潛在風(fēng)險和可能后果。基于評估結(jié)果,鉆井企業(yè)可以提出相應(yīng)的安全措施,以便減少危險和損失,進(jìn)而提高效率。
作為石油工業(yè)的重要環(huán)節(jié),石油鉆井備受重視。作為一項需要巨大投資的系統(tǒng)工程,它具有多因素、多層次、高風(fēng)險、立體交叉和連續(xù)作業(yè)等特點[11]。所以,石油鉆井安全評價是一項復(fù)雜且必須的任務(wù)。本文所研究的石油鉆井安全評價體系如圖1所示。

圖1 石油鉆井安全評價體系
1.2 主成分分析
主成分分析是一項用于數(shù)據(jù)壓縮和特征提取的技術(shù)[12-13]。在處理多變量問題時,通常變量之間都會存在或多或少的相關(guān),這樣的相關(guān)相當(dāng)于一種信息重疊,會對數(shù)據(jù)分析的準(zhǔn)確性產(chǎn)生影響。主成分分析正好被用于解決此類問題。它可以在很少或是沒有信息重疊的前提下,將原本存在相關(guān)的變量轉(zhuǎn)化為相互獨立的主成分(Principal Component, PC),每個主成分都是原始變量的一個線性組合。
主成分分析的數(shù)學(xué)模型[4,13]如下所示。
假設(shè)樣本數(shù)據(jù)如矩陣X所示:
利用原始數(shù)據(jù)X和特征向量矩陣T進(jìn)行線性組合Y=TX。
所得變換同時滿足以下條件:
1)所得主成分兩兩不相關(guān);
2)Y1的方差最大,它在主成分中的貢獻(xiàn)最大,而Y2,Y3,…,Yp的貢獻(xiàn)率依次遞減;
3)Y1,Y2,…,Yp的方差之和等于X1,X2,…,Xp的方差之和。
則主成分分析的具體步驟如下:
步驟1 對原始數(shù)據(jù)X進(jìn)行標(biāo)準(zhǔn)化處理,同時建立相關(guān)系數(shù)矩陣Co。
步驟2 計算相關(guān)系數(shù)矩陣Co的特征根λ1≥λ2≥…≥λp≥0和對應(yīng)的特征向量T1≥T2≥…≥Tp。
步驟3 計算主成分的方差貢獻(xiàn)率,同時決定選取的主成分個數(shù)m,使得εm達(dá)到累積方差貢獻(xiàn)率的要求(通常要求εm≥85%)。
步驟4 獲得選取主成分的特征向量矩陣T(T=T1,T2,…,Tm),并計算選取的主成分。
1.3 貝葉斯判別分析
判別分析是一種多變量統(tǒng)計分析方法,它根據(jù)已知分類的歷史數(shù)據(jù)確定判別準(zhǔn)則,從而判定一個新樣本的歸屬[13-14]。相較于其他判別分析方法,貝葉斯判別分析法具有兩項優(yōu)勢:1)它考慮了總體各自出現(xiàn)的概率大小; 2)它考慮了錯判所造成的損失[13]。
假設(shè)現(xiàn)有數(shù)據(jù)集Y,其中樣本通過類標(biāo)記被分成k個分組G1,G2,…,Gk(k≥2)。
則貝葉斯判別分析的具體步驟[13,15]如下:
步驟1 計算分組Ga(a=1,2,…,k)中樣本的先驗概率pa,同時計算分組Ga中樣本的屬性均值;
步驟2 計算協(xié)方差矩陣Sa,然后計算聯(lián)合協(xié)方差S;
步驟3 構(gòu)建貝葉斯判別方程,并將參數(shù)代入;
步驟4 使用判別方程判別樣本,并檢驗判別結(jié)果L′是否符合要求。
1.4PCA-BDA方法
一般情況下,在安全評價指標(biāo)體系中會存在或多或少的信息重疊問題,這些信息重疊會在一定程度上影響安全評價模型的準(zhǔn)確性[9]。為了消除這種影響,研究者們將主成分分析與判別分析方法結(jié)合使用[5-8],而作為此類方法的一份子,PCA-BDA也被應(yīng)用于相關(guān)領(lǐng)域。
PCA-BDA的基本原理如圖2所示。在這個混合方法中,主成分分析被用于消除屬性間的相關(guān)性,同時實現(xiàn)數(shù)據(jù)降維; 接著,將得到的主成分作為輸入利用貝葉斯判別法來評估安全等級。如此,安全評價模型得以建立,屬性間的信息重疊得以消除,安全等級的判斷得以實現(xiàn)。這樣的一種結(jié)合被稱為PCA-BDA方法。

圖2 基本的PCA-BDA過程
通過研究原有的PCA-BDA方法原理以及石油鉆井安全評價的特點, 本文提出了一種適用于石油鉆井安全評價的改進(jìn)PCA-BDA方法。
2.1 問題定義
盡管PCA-BDA方法已經(jīng)被廣泛地接受與應(yīng)用, 但是該方法依然存在一些亟待解決的缺陷。試想這樣一種情況:某天PCA-BDA模型顯示當(dāng)天的安全狀態(tài)是危險的,此時,人們卻難以發(fā)現(xiàn)原始屬性與危險狀態(tài)之間的聯(lián)系,難以找到關(guān)鍵的屬性去采取措施。同時,需要注意只有原始屬性才是真實存在且可操作的,所以,需要在原始屬性和評估結(jié)果之間建立清晰的聯(lián)系。
為了解決這一問題,本文提出了改進(jìn)的PCA-BDA方法,其基本原理如圖3所示。在PCA-BDA過程,可以得到如式(1)、式(2)的方程組。式(1) 反映了原始屬性與各主成分之間的直接聯(lián)系;式(2) 反映了各主成分與判別函數(shù)值之間的直接聯(lián)系。可以發(fā)現(xiàn),原始屬性與判別函數(shù)值之間的關(guān)系可以通過聯(lián)立兩個方程組獲得,聯(lián)立兩式可得式(3)。
(1)
其矩陣形式可表示為:Y=TX。
(2)
其矩陣形式可表示為:F=B*Y+Con。
F=B*(T*X)+Con=I*X+Con
(3)
其中I=B*T。

圖3 改進(jìn)的PCA-BDA過程
定義1 重要度矩陣。
I*=abs(I)

由于在前期處理中對原始數(shù)據(jù)進(jìn)行了標(biāo)準(zhǔn)化,所有原始屬性的值域都是基本相近的,所以系數(shù)的絕對值矩陣I*可以被直接理解為相應(yīng)屬性在對應(yīng)判別過程中的重要度度量。
定義2 屬性重要度。
其中:ωa代表安全等級權(quán)重,越危險的等級權(quán)重越大;θaj(j=1,2,…,p)代表在每一個安全等級判別中的屬性得分,其值的大小反映屬性在相應(yīng)判別中所起作用的大小。
2.2 算法描述
本文改進(jìn)的PCA-BDA算法的輸入包括X和L,分別代表石油鉆井作業(yè)過程中每天的原始屬性違反次數(shù)和樣本對應(yīng)的安全等級;算法的輸出包括L′、I*和M分別代表判別分類(評價等級)、重要度矩陣和屬性重要度矩陣。算法可分為以下4步(偽代碼如算法1所示):
步驟1 利用原有的PCA-BDA方法評估石油鉆井的安全等級,建立判別模型;獲取特征向量矩陣T、判別函數(shù)矩陣B和評價結(jié)果L′。這一步關(guān)聯(lián)算法1中的第1)行。
步驟2 計算重要度矩陣I*。這一步關(guān)聯(lián)算法1中的第2)~3)行。
步驟3 計算并保存屬性重要度,得到屬性重要度矩陣M。這一步關(guān)聯(lián)算法1中的第4)~9)行。
步驟4 輸出相關(guān)結(jié)果數(shù)據(jù)L′、I*、M。這一步關(guān)聯(lián)算法1中的第10)行。
算法1 改進(jìn)的PCA-BDA算法。
1)
使用原始PCA-BDA方法處理輸入數(shù)據(jù)X和L,獲得評價結(jié)果L′和對應(yīng)的矩陣B、T;
2)
I=B*T;
3)
I*=abs(I);
4)
foreachFa(X)do
5)

//從大到小
6)
依照排序結(jié)果對θaj賦值;
7)
設(shè)定各安全等級的權(quán)重ωa;
8)
endfor
9)
計算屬性重要度mj,并將其存入矩陣M;
10)
returnL′,I*,M
2.3 舉例說明
使用一個小規(guī)模的數(shù)據(jù)集為例來說明本文算法。該例子所用到的數(shù)據(jù)如表1所示,其中包含分屬于3個類別的6條記錄。為了簡化表達(dá),在此省略了原始PCA-BDA方法的具體過程,著重說明算法的改進(jìn)部分。

表1 舉例數(shù)據(jù)
在此例中,原始屬性X包含4個指標(biāo)X1、X2、X3、X4,類別指標(biāo)L包含3種值(1,2,3)。通過PCA-BDA過程,本文提取到2個主成分(累計方差貢獻(xiàn)率達(dá)到94.1%,意味著保留了原始屬性94.1%的信息),同時獲得判別結(jié)果(正確率達(dá)到100%)。
得到主成分表達(dá)式和貝葉斯判別函數(shù)式,如式(4)、式(5)所示:
(4)
(5)
聯(lián)立方程式(4)和式(5),可以得到相關(guān)系數(shù)矩陣I,然后將I轉(zhuǎn)化為I*,所得I*如表2所示。
通過矩陣I*可以得到在樣本被判入每一類別時各個屬性的重要度排名(從大到小):
1)類別1對應(yīng)的排序:X3,X4,X2,X1。
2)類別2對應(yīng)的排序:X3,X4,X2,X1。
3)類別3對應(yīng)的排序:X3,X4,X2,X1。

表2 重要度矩陣(例子)
考慮到在實際情況中,人們往往更關(guān)注危險程度高的狀態(tài)。本例中按照安全等級的高低類1賦值為1,類2賦值為2,類3賦值為3。同時,依照每個判別中屬性的排序,可以給它們分別賦值(4到1)。隨后,將賦值與權(quán)重相結(jié)合,可以得到屬性重要度。計算過程與結(jié)果如式(6)所示:
(6)
由式(6)所得的屬性重要度便可以找到重要屬性。顯然,本例中最重要的屬性是X3。
為了驗證本文算法在石油鉆井安全評價中的應(yīng)用效果,本章將通過實驗解決以下兩個問題:1)使用本文方法進(jìn)行石油鉆井安全評價的準(zhǔn)確率是否理想;2)通過參考計算得到的屬性重要度是否能準(zhǔn)確地找出重要屬性,以后是否能有效地改善鉆井安全狀態(tài)。
3.1 實驗數(shù)據(jù)
實驗使用某石油鉆探公司連續(xù)90d的安全數(shù)據(jù)來驗證本文方法。數(shù)據(jù)的指標(biāo)體系如圖1所示,屬性X1~X11代表不同的安全監(jiān)督項,記錄的值代表當(dāng)天對應(yīng)屬性的違反次數(shù);屬性L代表記錄當(dāng)天的安全等級(“1”代表安全,表示無事故;“2”代表輕度危險,表示有少量輕傷事故;“3”代表中度危險,表示有較多輕傷事故;“4”代表高度危險,表示有重傷或重傷以上事故)。數(shù)據(jù)樣式如表3所示。

表3 原始數(shù)據(jù)(部分)
3.2 實驗結(jié)果
首先,使用改進(jìn)的PCA-BDA方法分析實驗數(shù)據(jù)。在PCA過程中,從11個原始屬性中提取出了6個主成分,這些主成分的累積方差貢獻(xiàn)率達(dá)到92.9%,意味著這6個主成分表達(dá)了原數(shù)據(jù)92.9%的信息。
然后,建立式(7)所示的貝葉斯判別方程用以判別記錄所對應(yīng)的安全等級。判別過程中僅有3個樣本發(fā)生錯判,判別準(zhǔn)確率達(dá)到96.7%。
(7)
為驗證改進(jìn)PCA-BDA方法安全評價的有效性,使用模糊綜合評價、層次分析法對實驗數(shù)據(jù)進(jìn)行評價,并將判別結(jié)果進(jìn)行比較。判別準(zhǔn)確率對比如表4所示,可以看出本文方法判別準(zhǔn)確率明顯優(yōu)于對比方法。同時,從“模糊綜合評價Ⅰ”和“模糊綜合評價Ⅱ”的結(jié)果可以看出,基于不同專家打分所作評價的準(zhǔn)確率相差較大,證明傳統(tǒng)方法受主觀因素的影響較大,這也是本文方法相較于傳統(tǒng)方法的一大優(yōu)勢。

表4 安全評價準(zhǔn)確率對比
為驗證本文方法所得屬性重要度的有效性,本文設(shè)計了一個模擬實驗。本實驗計算所得的I*如表5所示。綜合考慮石油鉆井作業(yè)的實際情況,設(shè)定安全等級的權(quán)重如表6所示。最后,計算獲得的屬性重要度如表7所示。通過表7可以非常容易地辨別出關(guān)鍵屬性。

表5 重要度矩陣

表6 安全等級的權(quán)重

表7 屬性重要度
接著,通過對比的方式來驗證屬性重要度的作用。首先將90條原始數(shù)據(jù)隨機均分成兩部分:第一部分中,將最重要的三個屬性(X8,X11,X1)的發(fā)生次數(shù)減半;第二部分中,將最不重要的三個屬性(X5,X10,X7)發(fā)生次數(shù)減半,來模擬實際生產(chǎn)過程中對于對應(yīng)屬性的防范與控制。然后,將這兩部分?jǐn)?shù)據(jù)輸入到本實驗所建立的PCA-BDA評價模型中,得到新的安全評價結(jié)果。實驗仿真結(jié)果如圖4所示。

圖4 仿真結(jié)果
圖4(a)和圖4(c)分別表示第一和第二部分原始數(shù)據(jù)的安全等級占比情況;圖4(b)和圖4(d)分別表示第一和第二部分對屬性防范和控制后的安全等級占比情況。對比圖4(a)和圖4(b)可以發(fā)現(xiàn),通過控制最重要的3個屬性,第一部分?jǐn)?shù)據(jù)的安全等級狀況有了明顯的改善。高危(L=4)情況占比從8.9%減少至2.2%,高危天數(shù)從8d減少為2d,減少比例達(dá)到75%;同時中危(L=3)情況占比從22.2%減少至6.7%,中危天數(shù)從20d減少為6d,減少比例達(dá)到70%。然而,如圖4(c)和圖4(d)所示,通過控制最不重要的3個屬性,第二部分?jǐn)?shù)據(jù)的安全等級幾乎沒有變化。結(jié)果表明,本文方法計算得到的屬性重要度可以有效地辨別出重要屬性,通過防范與控制這些重要屬性可以明顯地改善樣本的安全等級狀態(tài)。
本文結(jié)合原有PCA-BDA方法以及石油鉆井安全評價的特點, 引入屬性重要度的概念,創(chuàng)新性地提出了一種改進(jìn)的PCA-BDA方法來解決石油鉆井安全評價問題。該算法不僅能在安全評價中獲得準(zhǔn)確的評價結(jié)果,而且能夠通過計算屬性重要度的方式找出重要屬性,從而可以為石油鉆井安全管理部門提供有力的參考,指導(dǎo)他們有針對性地防范重要屬性。通過實驗分析可以看出,本文方法在安全評價準(zhǔn)確率方面顯著優(yōu)于傳統(tǒng)方法;同時,所計算的屬性重要度可以有效地防范關(guān)鍵屬性,改善鉆井安全狀態(tài)。
)
[1]KHANFI,HUSAINT,ABBASISA.SafetyWeightedHazardIndex(SWeHI):anew,user-friendlytoolforswiftyetcomprehensivehazardidentificationandsafetyevaluationinchemicalprocessindustrie[J].ProcessSafety&EnvironmentalProtection, 2001, 79(2): 65-80.
[2]TSAURSH,CHANGTY,YENACH.TheevaluationofairlineservicequalitybyfuzzyMCDM[J].TourismManagement, 2002, 23(2): 107-115.
[3] 劉剛,金業(yè)權(quán),李峰,等.層次分析法在井控風(fēng)險可控誘因分析中的應(yīng)用[J].西南石油大學(xué)學(xué)報(自然科學(xué)版),2011,33(2):137-141.(LIUG,JINYQ,LIF,etal.TheapplicationofAHPmethodinwellcontrolriskevaluationbycontrollablefactoranalysis[J].JournalofSouthwestPetroleumUniversity(Science&TechnologyEdition), 2011, 33(2): 137-141.)
[4]YUH,WUZR,BAOTF,etal.MultivariateanalysisindammonitoringdatawithPCA[J].SCIENCECHINATechnologicalSciences, 2010, 53(4): 1088-1097.
[5] 劉曉南,葛少成,武宇.FA-FDA判別分析的礦井通風(fēng)系統(tǒng)安全評價[J].遼寧工程技術(shù)大學(xué)學(xué)報(自然科學(xué)版),2014,33(9):1221-1225.(LIUXN,GESC,WUY.FA-FDAonsafetyevaluationofmineventilationsystem[J].JournalofLiaoningTechnicalUniversity(NaturalScienceEdition), 2014, 33(9): 1221-1225.)
[6] 宮鳳強,魯金濤.基于主成分分析與距離判別分析法的突水水源識別方法[J].采礦與安全工程學(xué)報,2014,31(2):236-242.(GONGFQ,LUJT.Recognitionmethodofminewaterinrushsourcesbasedontheprincipalelementanalysisanddistancediscriminationanalysis[J].JournalofMining&SafetyEngineering, 2014, 31(2): 236-242.)
[7]MOKEEVAV,MOKEEVVV.Patternrecognitionbymeansoflineardiscriminantanalysisandtheprincipalcomponentsanalysis[J].PatternRecognitionandImageAnalysis, 2015, 25(4): 685-691.
[8]JOMBARTT,DEVILLARDS,BALLOUXF.Discriminantanalysisofprincipalcomponents:anewmethodfortheanalysisofgeneticallystructuredpopulations[J].BMCGenetics, 2010, 11(2): 94-108.
[9]MINF,ZHUW.Attributereductionofdatawitherrorrangesandtestcosts[J].InformationSciences, 2012, 211: 48-67.
[10]HALLMA,HOLMESG.Benchmarkingattributeselectiontechniquesfordiscreteclassdatamining[J].IEEETransactionsonKnowledge&DataEngineering, 2003, 15(6): 1437-1447.
[11] 劉志坤,李琪,徐自強,等.鉆井事故危險源分析與安全監(jiān)控系統(tǒng)研究[J].石油鉆采工藝,2012,34(3):107-111.(LIUZK,LIQ,XUZQ,etal.Researchofdrillinghazardsandstudyofsafemonitoringsystem[J].OilDrilling&ProductionTechnology, 2012, 34(3): 107-111.)
[12]HANJW,KAMBERM,PEIJ.數(shù)據(jù)挖掘:概念與技術(shù)[M].范明,孟小峰,譯.3版.北京:機械工業(yè)出版社,2012:67-68.(HANJW,KAMBERM,PEIJ.DataMining:ConceptsandTechniques[M].FANM,MENGXF,translated. 3rded.Beijing:ChinaMachinePress, 2012: 67-68.)
[13] 朱建平.應(yīng)用多元統(tǒng)計分析[M].北京:科學(xué)出版社,2012:42-106.(ZHUJP.ApplicationMultivariateStatisticalAnalysis[M].Beijing:SciencePress, 2012: 42-106.)
[14]SAPATINAST.Discriminantanalysisandstatisticalpatternrecognition[J].JournaloftheRoyalStatisticalSociety:SeriesA(StatisticsinSociety), 2005, 168(3): 635-636.
[15]GONGFQ,LIXB,ZHANGW.Over-excavationforecastofundergroundopeningbyusingBayesdiscriminantanalysismethod[J].JournalofCentralSouthUniversityofTechnology, 2008, 15(4): 498-502.
ThisworkispartiallysupportedbytheKeyTechnologyofMajorAccidentPreventionandControlinSafetyProduction(sichuan- 0009- 2016AQ).
REN Dongmei, born in 1977, Ph. D., associate professor. Her research interests include percolation theory of complex oil and gas fields.
ZHANG Yuyang, born in 1991, M. S. candidate. His research interests include data mining.
DONG Xinling, born in 1991, M. S. candidate. Her research interests include data mining, recommendation system.
Application of improved principal component analysis-Bayes discriminant analysis method to petroleum drilling safety evaluation
REN Dongmei, ZHANG Yuyang*, DONG Xinling
(SchoolofComputerScience,SouthwestPetroleumUniversity,ChengduSichuan610500,China)
Focusing on the issue that Principal Component Analysis-Bayes Discriminant Analysis (PCA-BDA) only supports safety evaluation but can not detect the dangerous factors, by introducing the concept of attribute importance degree, an improved PCA-BDA algorithm was proposed and applied to the petroleum drilling safety evaluation. Firstly, the safety ranking of each record was evaluated by the initial PCA-BDA algorithm. Secondly, the attribute importance was computed with the eigenvector matrix in PCA, the classification function coefficient in BDA, and the weight of safety ranking. Finally, the attributes were regulated and controlled with referencing the attribute importance. In the comparison experiments with Analytic Hierarchy Process (AHP) and Fuzzy Comprehensive Evaluation (FCE), the accuracy rate of improved PCA-BDA reached 96.7%, which was obviously higher than that of the AHP and FCE method. In the simulation experiment, more than 70% of safety rankings of petroleum drilling were improved by regulating the 3 most important attributes, while the safety ranking had no change by adjusting the least 3 important attributes. The experimental results show that the improved PCA-BDA can accurately accomplish the safety evaluation, and find out the critical attributes to make the petroleum drilling safety management more targeted.
attribute importance degree; Bayes Discriminant Analysis (BDA); Principal Component Analysis (PCA); petroleum drilling safety evaluation
2016- 10- 12;
2016- 12- 21。 基金項目:安全生產(chǎn)重大事故防治關(guān)鍵技術(shù)科技項目(sichuan-0009-2016AQ)。
任冬梅(1977—),女,黑龍江訥河人,副教授,博士,主要研究方向:復(fù)雜油氣田滲流理論; 張宇洋(1991—),男,陜西寶雞人,碩士研究生,主要研究方向:數(shù)據(jù)挖掘; 董新玲(1991—),女,山東德州人,碩士研究生,CCF會員,主要研究方向:數(shù)據(jù)挖掘、推薦系統(tǒng)。
1001- 9081(2017)06- 1820- 05
10.11772/j.issn.1001- 9081.2017.06.1820
TP301.6
A