羅磊,程非凡,邱彤,趙勁松
?
改進CCM算法檢測外部擾動下系統變量間的時滯和因果關系
羅磊,程非凡,邱彤,趙勁松
(清華大學化學工程系,北京 100084)
在化工過程中,可以通過分析變量間的相互作用和時滯關系,推理故障的傳播路徑和網絡,指出故障的根原因。這對提高過程安全性,增強經濟效益具有重要意義,是研究的熱點和難點。常見的互相關函數和傳遞熵等方法,由于只適用于線性或弱非線性系統,或計算量較大,往往無法準確地獲得變量間的時滯信息和作用強度,在實際應用中存在不足。近年來,在生態領域研究中提出的交叉收斂映射(CCM)算法,被認為是一種適用于非線性耦合過程因果分析的方法,可適用于耦合變量間時滯關系的檢測。但對于帶有外部擾動的化工過程,CCM無法根據隨時受到擾動的過程數據構造出穩定的嵌入流形,導致了時滯和因果分析失敗。而基于CCM進行改進的擾動過濾交叉映射(DFCM)方法,通過分析外部擾動對系統的影響,預先篩選擾動數據,再將過濾后的數據代入交叉映射的計算中。算例表明,這種處理能有效地避免擾動下嵌入流形不穩定的問題,適用于處于擾動下的化工過程,并得到良好的時滯和因果關系分析效果。
CCM;因果分析;時滯檢測;算法;過程系統;安全
一直以來針對大型復雜系統的因果關系識別和時滯檢測都較為困難,尤其是當系統具有非線性特征時。目前已有人從不同角度出發提出了若干方法用于解決過程系統中變量間的因果關系識別和時滯分析。最簡單的是互相關函數法(CCF)[1],這一方法通過計算在不同的時滯假設點上的互相關函數值,選取其絕對值的最大值對應的時滯作為時滯檢測的結果。盡管該方法計算簡單,也適用于某些實際過程,但它對非線性系統適應性較差。另一種被廣泛使用的格蘭杰因果檢驗,則往往因為無法滿足待檢測變量間相互獨立的條件,不能適用于耦合系統的分析。Schreiber等[2-10]基于信息熵的概念提出了傳遞熵(transfer entropy)的方法,這一方法也被廣泛地應用于化工、大氣科學、神經科學等領域。但由于其基于概率計算的理論,對概率密度函數分布的計算必須足夠精確以確保結果的準確性,這就帶來了較大的計算量。另外,有時傳遞熵并不能準確地計算出變量間的時滯關系,所以無法獲得類似于符號有向圖(signed directed graph)[11-17]的結果以清晰地總結和分析結論。總之,上述的方法或者基于概率理論,計算量較大;或者只能適用于線性或者是弱非線性系統,難以應用于對非線性系統的分析。
近年來提出的交叉收斂映射算法(convergent cross mapping,CCM)[18],利用非線性耦合系統中變量間微分同胚映射的特點,將原有的因果關系識別轉化為對嵌入流形相互預測效果的對比。Ye等[19]的工作表明CCM算法適用于某些自振系統中變量因果關系的檢測和時滯分析。但是,化工過程中處于常見的外部擾動時,Ye等的方法也許不再適用。本文對CCM算法進行改進,提出DFCM方法,解決了該問題。
CCM算法由Sugihara等[18]在2012年提出,相比于互相關函數和傳遞熵,它能更清楚地把握耦合系統中變量間的相互作用,得到更準確的結果。根據Takens嵌入定理,在一動態系統中,相互關聯兩變量其對應的影子流形M和M都與原系統的流形微分同胚。這里的影子流形M和M都是通過對原始數據和進行時序嵌入重構得到,其元素分別用x和y表示。這樣,流形M和M之間便形成了連續單射的聯系。對于M上選定的點x,1,x,2,…, x,k,在M上也一定能找到對應的y,1,y,2,…, y,k,若所有的x(=1,…,)均收斂于特定的x,0,那么相應地,y(=1,…,)也會收斂于x,0在M上所對應的y,0。對于M上每個點x,CCM都尋找其相鄰點及其在流形M上的對應點,并對y,i進行預測,記作?,i。這樣變量對的預測能力ρ→y即是預測值{?,i}和真實值{y,i}之間的相關系數。隨著樣本總數的增加,預測值序列{?,i}逐漸收斂,ρ→y也將會收斂到一定值,這樣便可使用變量預測,反之亦然。然而,如果變量和之間不存在耦合關系,由于信息傳遞的不對稱將會導致作為結果的某一變量對另一作為原因的變量預測效果的下降。圖1解釋了這一原理。
對于維動態系統
d/d=(,) (1)
其中和分別對應變量和參數向量,=[1,2,…,x]T,=[1,2,…,u]T。對于中的兩變量和,其對應的影子流形構造如下


是嵌入維數,是延遲時間,這樣根據前面所述,便有

若在M上找到一系列最接近M,0的點{M,}={M,1,M,2,…,M,+1},那么M,0的值便可由{M,}進行估計


如果樣本數足夠大以保證{M,}足夠接近M,0,那么最終M預測M的能力ρ→y將會收斂到0和1之間。

Ye等[19]將CCM的應用拓展到對變量間時滯關系的確定中。根據他的想法,如果變量對的作用存在時滯Δ,即()=((?Δ)),那么使用CCM將對進行估計最強的作用應出現在時滯為+Δ的位置,這里正號表示落后于。圖2對Ye等的思想進行了簡要的解釋。
經過計算發現,Ye等的方法在對自振系統進行計算時能取得良好的效果,但是,如果系統變量振蕩來源于外部輸入的擾動,Ye等的方法并沒有考慮到這部分變化對CCM計算結果的影響,計算結果并不理想。圖3列出了將Ye等的方法應用于3個不同的非線性時滯系統的計算結果,例1是一自振系統,例2和例3中都加入了參數的擾動,正是該擾動導致本應穩定的系統出現了波動。從最后的結果可以看出,Ye等的方法能準確地計算出例1中變量之間的時滯,但卻在例2和例3中無法得到準確的結果。
blue line—maps; red line—maps
圖3中具體算例如下。
例1
x+1=x(3.78?3.78x?0.07y3)
y+1=y(3.77?3.77y?0.08x5)
例2
x+1=0.3x+(1+0.3u?y?25)x/5
y+1=0.9y+0.02(x?10?5.5)
u= rand(0,1),=1, 2, 3, …
例3
x+1=x+D[0.4(1+0.1u)?0.2x+0.3y?80]
y+1=y+D[0.2x?50?0.3y?0.4(1+0.1u)y]
u= rand(0,1),=1, 2, 3, …
盡管CCM最初被應用于生態學領域,但其中微分同胚的特點也常見于化工過程數據的重構流形中,因此CCM算法的思想也適用于化工過程,但算例2和例3中參數的頻繁改變使得M和M不再穩定,這導致CCM算法無法識別到正確的時滯并對變量間的相互作用作出計算。以一個二元系統為例,如圖4所示,如果參數被設定為不同值,該系統變量和將會收斂到不同的穩態值。同時,由于穩態點的不斷變化,相軌跡也會出現相互交叉,這將會導致原CCM方法計算準確度的下降。


例如圖4中紅色和藍色軌跡的交點對應于圖5中曲線的突變,這說明,即使在原流形或者M中發現兩相鄰點,由于相軌跡的交叉等原因也并不能保證它們在M中也滿足相鄰條件。還有一種可能是它們對應于不同的參數,只是恰好在圖中相鄰而已。這樣,CCM尋找到的相鄰點在其之后的計算中是沒有意義的。
根據以上對CCM算法的分析,對其進行改進,希望它能對處于外部擾動下的系統進行計算,從而提出擾動過濾交叉映射(disturbance filtrated cross-mapping,DFCM)法。該方法基于以下幾點假設:
(1)系統對于每個有且僅有一個穩態,的擾動不會導致多穩態現象的發生;
(2)穩態點的變化是連續的;
(3)如果參數和0接近,那么對應的從相同初值出發的相軌跡也會收斂到0所對應的相軌跡上。
圖6對該過程進行了闡述。圖中從左至右參數的變化逐漸增大,不同下對應的影子流形與原流形的差別也逐漸增大。這樣,通過限定擾動的變化便可獲得穩定的流形。
blue—original manifold; red—new manifold
圖7是DFCM計算的大致流程。在DFCM中,首先選定合適的嵌入維數和時間延遲,將過程數據根據進行過濾篩選,然后再將篩選后的數據代入交叉收斂映射的計算。
3.1 DFCM對例2和例3的計算
圖8顯示了將DFCM用于之前的例2和例3后的計算結果,對于例2,DFCM的計算表明最強的作用出現在變量比領先Δ=12的位置,這一結果與圖中給出的兩變量的輸出結果相符合,注意為了方便比較,兩輸出的橫坐標已按照DFCM的結果進行了相應平移。對于例3,DFCM不僅在比領先Δ1=50和Δ2=-80發現了時滯點,還發現兩變量的最強作用出現的位置是在Δ=0的位置,這與實際的輸出相符合(圖中兩變量呈反相關)。
blue line—maps; red line—maps
3.2 DFCM對四罐耦合系統的計算
圖9是一個四罐耦合模型[20],模型輸入為泵的輸入電壓v,其對應的流量為kv,γ表示流量分流比。為了維持整個系統的穩定,分別在罐1和罐3加入了液位控制器。




在該模型中假設液體從上游裝置流往下游需要經過一段不可忽略的時間,用藍色數字表示。從圖9中很容易看出罐3和罐4應該比其他兩個罐更容易受到2的擾動的影響,它們應該處于擾動傳播路徑的上游位置。模型的輸出由圖10所示。
從圖11的計算結果可以看出,3始終領先于其他變量,說明它最接近擾動的根源。之后便是4、1和2。這一計算結果與實際輸出和從流程結構出發的分析相符。
blue line—maps; red line—maps
CCM算法是一種新提出的可適用于線性和非線性系統因果分析和時滯檢測算法,但本文發現其對某些受到外部擾動的系統并不能取得好的計算效果,原因是在外部擾動存在的情況下無法構造原方法中的穩定的流形。針對這一問題本文對原方法進行改進,提出了擾動過濾交叉映射(DFCM)方法。算例證明,該方法適用于處于外部擾動下的化工過程中耦合變量之間時滯關系的檢測。未來將會進一步完善相關工作,期待這一方法能在化工和其他領域的因果分析和時滯檢測中有進一步的應用。
[1] BAUER M, THORNHILL N F. A practical method for identifying the propagation path of plant-wide disturbances [J]. J. Process Control, 2008, 18: 707-719.
[2] BAUER M, COX J W, CAVENESS M H,. Finding the direction of disturbance propagation in a chemical process using transfer entropy [J]. IEEE Trans. Control Syst. Technol., 2007, 15: 12-21.
[3] VICENTE R, WIBRAL M, LINDNER M,. Transfer entropy — a model-free measure of effective connectivity for the neurosciences [J]. J. Comput. Neurosci., 2011, 30: 45-67.
[4] 謝中凱, 劉國華, 吳志根. 基于傳遞熵的梁結構損傷動力識別[J]. 浙江大學學報(工學版), 2012, 46(10): 1880-1886. XIE Z K, LIU G H, WU Z G. Dynamic damage identification for beam structures based on transfer entropy [J]. J. Zhejiang Univ. (Engineering Sci.), 2012, 46(10): 1880-1886.
[5] KUEHNERT C, BEYERER J. Data-driven methods for the detection of causal structures in process technology [J]. Machines, 2014, 2: 255-274.
[6] SHU Y, ZHAO J. Data-driven causal inference based on a modified transfer entropy [J]. Comput. Chem. Eng., 2013, 57: 173-180.
[7] 張志森, 龔志強, 支蓉. 利用傳遞熵對Lorenz系統和Walker環流信息傳輸方向的分析[J]. 物理學報, 2013, 62(12): 548-557.ZHANG Z S, GONG Z Q, ZHI R. Analysis of the direction of information transfer of Lorenz system and Walker circulation with transfer entropy [J]. Acta Physica Sinica, 2013, 62(12): 548-557.
[8] 賀丁, 趙勁松. 基于Hopfield網絡的時滯分析故障診斷策略[J]. 化工學報, 2013, 64(2): 633-640. HE D, ZHAO J S. Fault strategy of time delay analysis based on Hopfield network [J]. CIESC Journal, 2013, 64(2): 633-640.
[9] 賀丁, 舒逸聃, 趙勁松. 基于改進的時滯分析算法的化工過程故障定位[J]. 化工學報, 2012, 63(10): 3165-3172. HE D, SHU Y D, ZHAO J S. An improved time-delay algorithm for chemical processes fault identification [J]. CIESC Journal, 2012, 63(10): 3165-3172.
[10] DUAN P, YANG F, SHAH L S,. Transfer zero-entropy and its application for capturing cause and effect relationship between variables [J]. IEEE Transactions on Control Systems Technology, 2015, 23(3): 855-867.
[11] YANG F, XIAO D. Signed directed graph modeling of industrial processes and their validation by data-based methods[C]//2010 Conference on Control and Fault Tolerant Systems. Nice, France: IEEE, 2010: 387-392.
[12] 王杭州, 陳丙珍, 何小榮, 等. 基于開源組件的SDG推理平臺[J]. 化工學報, 2010, 61(7): 1829-1836.WANG H Z, CHEN B Z, HE X R,. Open source signed digraph inference framework [J]. CIESC Journal, 2010, 61(7): 1829-1836.
[13] 盧秉南, 張貝克, 馬昕, 等. 基于SDG模型的控制系統故障診斷方法[J]. 化工學報, 2009, 60(9): 2243-2251. LU B N, ZHANG B K, MA X,. Fault diagnosis of control system based on signed directed graph model [J]. CIESC Journal, 2009, 60(9): 2243-2251.
[14] YANG F, XIAO D Y. Progress in root cause and fault propagation analysis and large-scale industrial processes [J]. Journal of Control Science and Engineering, 2012: 478373.
[15] DUAN P, CHEN T W, SHAH L S,. Methods for root cause diagnosis of plant-wide oscillations [J]. AIChE Journal, 2014, 60(6): 2019-2034.
[16] HE B, CHEN T, YANG X H. Root cause analysis in multivariate statistical process monitoring: integrating reconstruction-based multivariate contribution analysis with fuzzy-signed directed graphs [J]. ComputersChemical Engineering, 2014, 64(7): 167-177.
[17] WAN Y M, YANG F, Lü N,Statistical root cause analysis of novel faults based on digraph models [J]. Chemical Engineering Research and Design, 2013, 91: 87-99.
[18] SUGIHARA G, MAY R, YE H,. Detecting causality in complex ecosystems [J]. Science, 2012, 338: 496-500.
[19] YE H, DEYLE E R, GILATTANZ L J,. Distinguishing time-delayed causal interactions using convergent cross mapping [J]. Sci. Rep., 2015, 5:14750.
[20] SADATI N, RAHMANI M, SAIF M,. Two-level robust optimal control of large scale nolinear systems [J]. IEEE Systems Journal, 2015, 9: 242-251.
An improved convergent cross mapping algorithm for causality identification and time delay analysis between systemic variables under external disturbance
LUO Lei, CHENG Feifan, QIU Tong, ZHAO Jinsong
(Department of Chemical Engineering, Tsinghua University, Beijing 100084, China)
In chemical processes, fault propagation pathways and root cause identification could be discovered though analysis of interactions and time delay relationships among different process variables. Because of its importance in improving process safety and operation profit, fault discovery has been a popular and challenging research topic. Common methods such as correlation and entropy transfer functions, which usually cannot get accurate time delay and interaction strength between variables by limited applicability for linear and weak nonlinear systems or high computation demand, have experienced many disadvantages in actual application. Recently, a new convergent cross mapping (CCM) algorithm in ecology has been considered suitable for causality analysis and time delay identification for nonlinear coupling process variables. However, CCM fails to find application in externally disturbed chemical processes because it cannot establish stable embedded flow from process data. An improved CCM, disturbance filtered cross mapping method (DFCM), overcame many challenges of creating stable embedded flow by analyzing external disturbance, filtering disturbed process data, and applying filtrated data to CCM calculation. Case studies showed good results of time delays and causality analysis, thus DFCM could be applied to chemical processes under external disturbance.
CCM; causality analysis; time-delay detection; algorithm; process system; safety
date: 2016-09-18.
Prof. QIU Tong, qiutong@tsinghua.edu.cn
10.11949/j.issn.0438-1157.20161300
TP 277
A
0438—1157(2016)12—5122—09
國家自然科學基金項目(U1462206)。
supported by the National Natural Science Foundation of China (U1462206).
2016-09-18收到初稿,2016-09-25收到修改稿。
聯系人:邱彤。第一作者:羅磊(1992—),男,碩士研究生。