高智勇 董榮光 高建民 王榮喜
(西安交通大學(xué)制造系統(tǒng)工程國家重點(diǎn)實(shí)驗(yàn)室,西安 710049)
一種面向化工生產(chǎn)系統(tǒng)的監(jiān)控變量分步選取方法
高智勇 董榮光 高建民 王榮喜
(西安交通大學(xué)制造系統(tǒng)工程國家重點(diǎn)實(shí)驗(yàn)室,西安 710049)
提出一種基于信息熵的監(jiān)控變量分步選取方法。以信息熵與監(jiān)控變量所含系統(tǒng)信息量關(guān)系為基礎(chǔ),采用互信息廣義相關(guān)系數(shù)度量變量間的廣義相關(guān)性,完成監(jiān)控變量分步選取。通過Friedman數(shù)學(xué)模型驗(yàn)證了所提方法的可行性,用Lorenz、Rossler等方程驗(yàn)證了基于信息熵選取單變量的可執(zhí)行性。最后進(jìn)行某煤化工企業(yè)實(shí)際DCS監(jiān)控變量選取,結(jié)果顯示:在化工實(shí)際生產(chǎn)中監(jiān)控變量選取是可行的。
信息熵 DCS監(jiān)控變量 互信息 廣義相關(guān)系數(shù) 變量選取
化工生產(chǎn)系統(tǒng)是典型的耗散系統(tǒng),數(shù)據(jù)采集點(diǎn)和變量數(shù)據(jù)眾多,工業(yè)過程產(chǎn)生的數(shù)據(jù)維數(shù)越來越高,非線性增強(qiáng)[1]。從化學(xué)和物理規(guī)律來說,太多的變量會(huì)對(duì)模型產(chǎn)生作用,而冗雜的模型在后續(xù)的控制和優(yōu)化過程中會(huì)遇到求解障礙[2]。系統(tǒng)中包含的不相關(guān)、冗余或無用的變量往往會(huì)掩蓋重要變量的作用[3]。相對(duì)于單變量相空間重構(gòu)方法,多變量相空間重構(gòu)在系統(tǒng)狀態(tài)分析中能重構(gòu)出更為完備的動(dòng)力學(xué)系統(tǒng)行為,但多變量相空間重構(gòu)對(duì)變量的要求是既要信息量多還要冗余度低。目前變量選取常用的方法有最小平均方差估計(jì)[4]、局部最小平方回歸[5]、貝葉斯分層網(wǎng)絡(luò)[6]、遺傳算法[7]及互信息(Mutual Information,MI)[8]等。對(duì)于無法區(qū)分輸入變量與輸出變量的化工生產(chǎn)系統(tǒng),上述方法并不能被直接應(yīng)用。
互信息對(duì)變量的分布類型沒有任何限定,不僅能描述變量間的線性關(guān)系同時(shí)也能描述變量間的非線性關(guān)系[9],有關(guān)文獻(xiàn)提出了以互信息為基礎(chǔ)的相關(guān)度[10]的概念。筆者提出一種基于信息熵的變量分步選取方法,用以互信息為基礎(chǔ)的廣義相關(guān)系數(shù)去除變量間存在的冗余。
1.1 熵與信息熵
愛因斯坦說:“熵理論,對(duì)于整個(gè)科學(xué)來說是第一法則。”信息論的創(chuàng)始人Shannon首先提出信息的度量方法[11],即利用概率統(tǒng)計(jì)的方法,把熵作為一個(gè)隨機(jī)事件的不確定性或信息量的度量或是關(guān)于一個(gè)系統(tǒng)無知的度量,提出信息熵(又稱Shannon熵),把獲得的信息的多少當(dāng)作被消除的不確定性的多少。Shannon定義信息量為隨機(jī)不確定性程度的減少,與信息熵建立了直接關(guān)系。信息熵值越小的監(jiān)控變量,含有系統(tǒng)越多的信息量。究其原因,信息熵是系統(tǒng)的信息不足或混沌無序的度量,或是關(guān)于一個(gè)系統(tǒng)無知的度量。信息熵最大意味著獲得的總信息最小,也就是“添加”的信息越少[12]。
1.2變量分步選取方法
1.2.1分步選取流程簡(jiǎn)述
基于信息熵的變量分步選取流程如圖1所示。
基于信息熵的變量分步選取的具體步驟如下:
a. 給定輸入、輸出未知的一組監(jiān)控變量的數(shù)據(jù)序列,計(jì)算每一個(gè)變量的信息熵值H(X),選取熵值最小的若干個(gè)(可為一個(gè))變量作為“名義輸出變量”,其余的作為“名義輸入變量組”。如果選取的輸出變量不止一個(gè),則以熵值最小的作為標(biāo)準(zhǔn),計(jì)算與其余輸出變量之間的廣義相關(guān)系數(shù),剔除存在廣義相關(guān)性的輸出變量。
b. 計(jì)算輸出變量與輸入變量之間的互信息I(X,Y)和以互信息為基礎(chǔ)的廣義相關(guān)系數(shù),在置信度0.05下獲取廣義相關(guān)系數(shù)閾值。如果所求廣義相關(guān)系數(shù)值大于設(shè)定閾值,則認(rèn)為兩者之間存在冗余,在“名義輸入變量”中剔除該變量。
c. 經(jīng)過步驟b剔除與“名義輸出變量”存在冗余的變量,獲得新的“名義輸入變量”,計(jì)算兩兩之間的廣義相關(guān)系數(shù),再次剔除存在冗余的變量。

圖1 基于信息熵的變量分步選取流程
d. 將步驟c和a重組,獲得包含盡可能多的系統(tǒng)狀態(tài)信息和冗余程度小的變量組。
其中,步驟a~c中的信息熵、互信息和廣義相關(guān)系數(shù)的估計(jì)算法將在1.2.2節(jié)中給出詳細(xì)說明。
1.2.2k-近鄰互信息估計(jì)與廣義相關(guān)系數(shù)Rg
目前在理論研究和工程應(yīng)用中出現(xiàn)了若干信息熵的估計(jì)算法,有等間距格子法[13]、等概率法[14]、等概率遞推法[15]及k-近鄰互信息估計(jì)[16]等算法,方法的優(yōu)劣比較見表1。

表1 信息熵估計(jì)算法優(yōu)劣比較
綜合各種算法的優(yōu)劣和流程工業(yè)生產(chǎn)系統(tǒng)監(jiān)控變量的特點(diǎn),k-近鄰互信息估計(jì)算法能較好地估計(jì)信息熵。
k-近鄰互信息估計(jì)的基本思路為:在由變量X和Y組成的空間Z=(X,Y)中,將每一點(diǎn)zi=(xi,yi)距離其他點(diǎn)的距離進(jìn)行排序,取εi/2為第k近鄰點(diǎn)的距離,εxi/2為映射至X方向上的距離,εyi/2為映射至Y方向上的距離,取εi/2=max{εxi/2,εyi/2}。nX(i)為距離點(diǎn)xi嚴(yán)格小于εi/2的其他數(shù)據(jù)點(diǎn)的個(gè)數(shù),同理可知nY(i)。
X與Y各自的信息熵可通過下式得出:
(1)
(2)
X和Y的聯(lián)合信息熵通過下式獲得:
(3)
則X和Y之間的互信息為:
I(X,Y)=H(X)+H(Y)-H(X,Y)
(4)
文獻(xiàn)[9]提出基于互信息的廣義相關(guān)系數(shù),并給出其計(jì)算公式:

(5)
同時(shí),文獻(xiàn)[9]還繪制了廣義相關(guān)系數(shù)分位數(shù)表。

2.1Friedman數(shù)學(xué)模型
Friedman數(shù)學(xué)模型為[17]:
Y=10sin(πX1X2)+20(X3-0.5)3+10X4+5X5+ε
(6)
其中,ε為標(biāo)準(zhǔn)正態(tài)分布的噪聲。X1、X2、X3、X4、X5為5個(gè)有效輸入變量,在[0,1]之間均勻分布產(chǎn)生。另外由[0,1]之間均勻分布生成無關(guān)變量X6、X7、X8、X9、X10。引入兩個(gè)冗余變量X11、X12,滿足:X11=0.5X1+0.5ε,X12=0.5X2+0.5ε。
父親是在第二天上午趕到的。陪同父親趕來的還有我的胞弟。那一刻,我正躺在病床上點(diǎn)著滴流,聽老婆講完省城求醫(yī)的經(jīng)過,老父親氣得將家鄉(xiāng)的專家們一通大罵,聲言我要是有一絲差錯(cuò),他和那些狗屁專家們沒完。罵過氣過,還得回歸現(xiàn)實(shí)。老婆便領(lǐng)著老父親去了蔣利學(xué)辦公室,回來之后,老父親便拍板做氣管鏡。
對(duì)X1、X2、X3、X4、X5、X6、X7、X8、X9、X10中的每個(gè)變量隨機(jī)產(chǎn)生數(shù)據(jù)序列長度為1 440的樣本,根據(jù)冗余變量與有效輸入變量之間的關(guān)系得到兩列冗余變量的數(shù)據(jù)序列。
將輸入變量(包括冗余變量)與輸出變量混合,忽略已知的輸入輸出先驗(yàn)知識(shí),然后計(jì)算各個(gè)變量的信息熵值,見表2。

表2 Y、X1、X2、…、X11、X12的信息熵
根據(jù)規(guī)則,選取Y作為“名義輸出變量”,與實(shí)際情況一致。計(jì)算Y與X1、X2、…、X11、X12之間的互信息,見表3。

表3 Y與X1、X2、…、X11、X12的互信息
輸入變量X1、X2、…、X11、X12之間為廣義相關(guān)系數(shù),X11與X12為冗余,如下:

使用筆者所提的分步變量選擇結(jié)果,并與其他變量選取方法對(duì)比,結(jié)果見表4。

表4 Friedman模型變量選擇方法對(duì)比
Friedman數(shù)學(xué)模型驗(yàn)證表明,筆者所使用的信息熵-互信息估計(jì)算法是正確的。
為了驗(yàn)證筆者所提的分步變量選取方法對(duì)非線性系統(tǒng)和混沌系統(tǒng)中的變量選取同樣有良好的效果,對(duì)常見的幾種確定性混沌方程進(jìn)行變量選取。Lorenz方程如下:
(7)
方程參數(shù)σ=10,r=28,b=8/3采用四階Runge-Kutta法產(chǎn)生數(shù)目為32 000的時(shí)間序列樣本,取后1 440個(gè)樣本點(diǎn)進(jìn)行驗(yàn)證,以保證數(shù)據(jù)序列具有混沌性,分析結(jié)果見表5。

表5 非線性方程各變量信息熵
表5中的數(shù)據(jù)說明,Lorenz系統(tǒng)X變量含有系統(tǒng)最多的信息量,其次為Y和Z;Rossler系統(tǒng),變量所含系統(tǒng)信息量的大小順序?yàn)閆>Y>X。數(shù)據(jù)分析結(jié)果與先驗(yàn)知識(shí)理論一致,因此4個(gè)混沌方程的最佳變量為:Lorenz—X、Rossler—Z、Ikeda—X或Y(具有對(duì)稱性)、Henon—Y。為驗(yàn)證所選單變量,分別對(duì)Lorenz的X、Z方向變量相空間重構(gòu),其中時(shí)延為10,嵌入維數(shù)為6,結(jié)果如圖2所示。由圖2可知,X方向能夠重構(gòu)出Lorenz混沌吸引子的“∞型”和“扇貝型”;而使用Z方向只能重構(gòu)出簡(jiǎn)單的“扇貝型”,信息丟失嚴(yán)重。

a. Lorenz—X

b. Lorenz—Z
以某煤化工企業(yè)壓縮機(jī)子系統(tǒng)為例,其部分監(jiān)測(cè)點(diǎn)、變量名見表6。

表6 某煤化工企業(yè)壓縮機(jī)組子系統(tǒng)部分DCS監(jiān)測(cè)點(diǎn)、變量名

(續(xù)表6)
壓縮機(jī)子系統(tǒng)的DCS監(jiān)測(cè)時(shí)間序列采樣間隔設(shè)為1min,則每天的數(shù)據(jù)樣本量為1 440,根據(jù)線性插值在文獻(xiàn)[6]附表1中的廣義系數(shù)可知,Rg=0.1418。各監(jiān)測(cè)變量的信息熵值見表7。

表7 DCS監(jiān)測(cè)變量信息熵
監(jiān)測(cè)變量A_API7621(增壓機(jī)三段進(jìn)氣壓力)和A_API7611(增壓機(jī)一段進(jìn)氣壓力)的熵值最小,兩者廣義相關(guān)系數(shù)Rg′=0.1332。Rg 按照筆者提出的變量選取方法,結(jié)果如下。 綜合以上兩組相關(guān)系數(shù),初步確定輸入變量組為V5、V4、V12、V14、V15、V18、V19。對(duì)初步確定的輸入變量組V5、V4、V12、V14、V15、V18、V19獲取廣義相關(guān)系數(shù),得到如下廣義相關(guān)系數(shù)矩陣: 綜合以上3組相關(guān)系數(shù),變量選取結(jié)果為V4、V6、V7、V14、V15,分別為“汽機(jī)新汽流量”、“增壓機(jī)一段進(jìn)氣壓力”、“增壓機(jī)三段進(jìn)氣壓力”、“軸承座振動(dòng)”、“增壓機(jī)進(jìn)氣流量”。壓縮機(jī)系統(tǒng)的“增壓機(jī)一段進(jìn)氣壓力”是單變量狀態(tài)分析中反饋效果最好的;企業(yè)為“軸承座振動(dòng)”這一監(jiān)測(cè)變量單獨(dú)設(shè)計(jì)了一套監(jiān)測(cè)系統(tǒng),足見其反應(yīng)系統(tǒng)狀態(tài)的程度。結(jié)果表明,選取的監(jiān)測(cè)變量不僅攜帶著表征系統(tǒng)更多的信息,還減少了監(jiān)測(cè)時(shí)間序列的冗余度和后續(xù)狀態(tài)分析的復(fù)雜度,對(duì)多變量相空間重構(gòu)技術(shù)在DCS監(jiān)測(cè)變量序列分析中尤為重要。 提出一種基于信息熵的化工生產(chǎn)系統(tǒng)狀態(tài)監(jiān)測(cè)變量分步選取方法。通過對(duì)DCS監(jiān)測(cè)變量信息熵進(jìn)行分析,獲得含有系統(tǒng)信息量大的若干變量。通過計(jì)算以互信息為基礎(chǔ)的廣義相關(guān)系數(shù),去除變量中存在的直觀上不能判斷的冗余。經(jīng)過算法程序可執(zhí)行性驗(yàn)證、方法可行性驗(yàn)證和企業(yè)DCS監(jiān)測(cè)變量選取結(jié)果,該方法能獲得一組相關(guān)性弱且含有系統(tǒng)最多信息的變量。 [1] 冉永清,楊煜普,屈衛(wèi)東.一種基于KNMF的非線性故障診斷方法[J].化工自動(dòng)化及儀表,2015,42(2):160~164. [2] 顧海杰,榮岡.數(shù)據(jù)驅(qū)動(dòng)方法在流程工業(yè)中的應(yīng)用命題綜述[J].化工自動(dòng)化及儀表,2009,36(5):1~6. [3] Peng H C, Long F H,Ding C.Feature Selection Based on Mutual Information: Criteriaof Max-Dependency, Max-Relevance,and Min-Redundancy[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2005,27(8):1226~1238. [4] Yao W X,Wang Q.Robust Variable Selection through MAVE[J].Computational Statistics and Data Analysis,2013,63:42~49. [5] Jun C H,Lee S H,Park H S,et al.Use of Partial Least Squares Regression for Variable Selection and Quality Prediction[C].International Conference on Computers & Industrial Engineering.Troyes:IEEE,2009:1302~1307. [6] Dridi N,Giremus A,Giovannell J F,et al.Variable Selection for Noisy Data Applied in Proteomics[C].IEEE International Conference on Acoustics,Speech and Signal Processing.Florence:IEEE,2014:2833~2837. [7] Tao H,Ma X P,Qiao M Y.Selection of Reconstruction Variables and Parameters in the Phase Spacereconstruction on Genetic Algorithm[C].Fourth International Workshop on Chaos-Fractals Theories and Applications.Hangzhou:IEEE,2011:332~336. [8] Darudi A,Rezaeifar S, Bayaz M H J D.Partial Mutual Information Based Algorithm for Input Variable Selection[C].13th International Conference on Environment and Electrical Engineering.Wroclaw:IEEE,2013:313~318. [9] 丁晶,王文圣,趙永龍.以互信息為基礎(chǔ)的廣義相關(guān)系數(shù)[J].四川大學(xué)學(xué)報(bào)(工程科學(xué)版),2002,34(3):1~7. [10] 曾令男,丁建偉,趙炯,等.基于互信息的復(fù)雜裝備高維狀態(tài)監(jiān)測(cè)數(shù)據(jù)相關(guān)性發(fā)現(xiàn)與建模[J].計(jì)算機(jī)集成制造系統(tǒng),2013,19(12):3017~3025. [11] Shannon C E,Weaver W.The Mathematical Theory of Communication[M].Chicago:University of Illinois Press,1971:31~32. [12] 張繼國,辛格.信息熵理論與應(yīng)用[M].北京:水利水電出版社,2012. [13] 楊志安,王光瑞,陳式剛.用等間距分格子法計(jì)算互信息函數(shù)確定延遲時(shí)間[J].計(jì)算物理,1995,12(4):442~448. [14] 龍海輝,張佃中.基于等概率符號(hào)分析方法計(jì)算互信息確定延遲時(shí)間[J].計(jì)算物理,2010,27(3):468~474. [15] Fraser A M,Swinney H L.Independent Coordinates from Mutual Information[J].Physical Review A,1986,33(2):7~17. [16] Kraskov A,St?gbauer H, Grassberger P.Estimating Mutual Information[J].Physical Review E,2004,69(6):1~16. [17] Friedman J H.Multivariate Adaptive Regression Splines[J].The Annals of Statistics,1991,19(1):1~67. (Continued on Page 451) ResearchofStep-by-StepSelectionofMonitoringVariablesforProductionSystemStateBasedonInformationEntropy GAO Zhi-yong, DONG Rong-guang, GAO Jian-min, WANG Rong-xi (StateKeyLaboratoryforManufacturingSystemsEngineering,Xi’anJiaotongUniversity,Xi’an710049,China) 2016-03-07(修改稿) 國家科技支撐計(jì)劃項(xiàng)目(2012BAF12B04) TH89 B 1000-3932(2016)04-0421-07


4 結(jié)束語