





收稿日期:2021-12-01;修回日期:2022-02-07" 基金項目:國家自然科學基金資助項目(61876043,61976052)
作者簡介:蔡瑞初(1983-),男(通信作者),浙江溫州人,教授,博導,博士,主要研究方向為因果關系發現、因果性學習、深度學習及其應用(cairuichu@gmail.com);劉躍群(1996-),男,廣東潮州人,碩士研究生,主要研究方向為因果關系;黃正婷(2000-),女,廣東東莞人,主要研究方向為因果關系、自然語言處理;黃曉楷(1999-),男,廣東潮州人,主要研究方向為因果關系、機器學習;陳薇(1993-),女,廣東潮州人,研究員,博士,主要研究方向為因果關系發現、因果性學習;郝志峰(1968-),男,江蘇蘇州人,教授,博導,博士,主要研究方向為機器學習、數據挖掘.
摘 要:離散時序數據的格蘭杰因果關系發現算法具有重要應用價值。現有方法主要采用霍克斯過程建模,無法適用于非獨立同分布數據和帶有時間誤差的數據。為此,提出了一種融合先驗約束的拓撲霍克斯過程格蘭杰因果關系發現算法(PTHP)。首先,使用基于約束的方法篩選出一批顯著性水平較高的因果邊,提升算法對故障發生時間誤差的容忍性;隨后,將上一步獲取的邊作為先驗約束融合到拓撲霍克斯過程中,解決序列間的非獨立同分布問題。模擬數據和真實數據的實驗證明了該方法的有效性,并獲得了PCIC 2021因果推理大賽第一名。
關鍵詞:格蘭杰因果;拓撲霍克斯過程;因果關系發現;因果關系網絡;時間誤差
中圖分類號:TP181"" 文獻標志碼:A
文章編號:1001-3695(2022)06-011-1668-05
doi:10.19734/j.issn.1001-3695.2021.12.0642
Granger causality discovery algorithm for topological Hawkes processes with priori-constraints
Cai Ruichu1,Liu Yuequn1,Huang Zhengting1,Huang Xiaokai1,Chen Wei1,Hao Zhifeng1,2
(1.School of Computer Science,Guangdong University of Technology,Guangzhou 510006,China;2.College of Science,Shantou University,Shantou Guangdong 515063,China)
Abstract:Granger causality discovery algorithm for discrete-time series data has important application value.The existing methods mainly use Hawkes processes modeling,which can not be applied to non-IID data and data with time-skew errors.Therefore,this paper proposed a Granger causality discovery algorithm (PTHP) for topological Hawkes processes integrating a priori constraints.Firstly,it used the constraint-based method to screen a group of causal edges with a high significance level to improve the tolerance of the algorithm to the fault time-skew errors.Then,the edges obtained in the previous step were fused into the topological Hawkes processes as a priori constraints to solve the non-IID problem between sequences.Experiments on simulated data and real-world data show the effectiveness of this method,and it won first place in PCIC 2021 causal inference competition.
Key words:Granger causality;topological Hawkes processes(THP);causal discovery;causal network;time-skew errors
0 引言
時序數據上的因果關系發現算法已經成為當前的熱點問題,被廣泛應用于智能運維[1]、智慧交通[2]、金融交易[3]等領域。目前的時序數據上的因果發現算法主要分為基于約束的方法、基于因果函數模型的方法和基于點過程的方法。基于約束的方法使用假設檢驗的方法來檢測變量之間的關系,其中PCMCI[4]算法是較為常用的算法。基于因果函數模型的方法[5~7]主要適用于連續型數據的因果關系發現,對于離散時序數據的建模存在一定的不足。基于點過程的方法則通過對數據生成過程進行建模來捕獲變量之間的關系,其中霍克斯過程(hawkes processes,HP)[8]是常見的建模方法。上述方法都假設數據是獨立同分布的,而在實際根因定位的場景中,受設備拓撲等信息影響,故障序列數據是非獨立同分布的。為了解決這個問題,拓撲霍克斯過程(THP)[9]在霍克斯過程的基礎上,將數據假設拓展到非獨立同分布特征。霍克斯過程的一個假設是,過去發生的A事件會激勵B 事件在未來的發生幾率,激勵程度由一個衰減核建模。這種假設的前提是數據的時間記錄是準確無誤的。然而,在很多現實場景下,數據受到機器條件的制約等原因,會出現記錄時間存在誤差的問題,不再符合記錄時間是準確的前提。例如,當機器設備對時間記錄的精度是精確到毫秒,而兩個事件以小于1 ms的時間間隔先后發生時,收集到的數據集上這兩個事件記錄就是同時發生的。在這種情況下,霍克斯過程就無法捕獲這兩個事件之間的激勵關系。
拓撲結構下數據記錄存在時間誤差的問題大大降低了基于霍克斯過程的因果關系發現算法的準確率。為了解決從有誤差和非獨立同分布時間序列數據上進行因果關系發現不準確的問題,本文提出融合先驗約束的拓撲霍克斯過程格蘭杰因果關系發現框架(priori-based topological Hawkes processes,PTHP),將因果網絡的搜索劃分為兩階段,從而把基于約束的方法的魯棒性優勢結合到霍克斯過程中。第一階段是先驗邊的搜索階段,通過基于約束的方法先篩選出一批可靠的因果關系邊,將這批邊作為因果網絡的先驗邊固定下來,解決樣本數據存在時間誤差的問題。第二階段是拓撲霍克斯過程的建模階段,使用爬山法[10,11],以第一階段的先驗因果網絡為起點,搜索似然值最大的因果網絡結構,解決非獨立同分布數據下的因果發現問題。本文的貢獻在于:a)提出兩階段的融合先驗約束的拓撲霍克斯過程格蘭杰因果關系發現框架,解決序列數據帶有時間誤差和非獨立同分布問題;b)把PCMCI作為先驗搜索方法結合到拓撲霍克斯過程中,而無須專家知識;c)模擬數據和真實數據證實了本文方法的正確性和有效性。
1 相關工作
目前時序數據上的因果發現算法主要分為基于約束的方法、基于因果函數模型的方法和基于點過程的方法。由于基于因果函數模型的方法較少關注離散事件序列數據,所以在此僅對基于約束的方法和基于點過程的方法進行介紹。
1.1 基于約束的方法
基于約束的方法[12]通過變量間的條件獨立性來判斷變量之間因果關系的存在性。此類方法同時考慮了事件滯后影響和瞬時效應,可以較好地識別有時間誤差下的因果網絡結構中顯著性明顯的邊。常見的條件獨立性檢驗方法有偏相關檢驗、希爾伯特—施密特獨立性準則[13]、核條件獨立性檢驗[14]、基于熵的(條件)獨立性檢驗方法[15]。非時序數據上基于約束的經典方法是PC(Peter-Clark)算法[16]和IC(inductive causation)算法[17]。Runge等人近期將PC算法推廣到多變量時序數據上,提出了PCMCI算法。
1.2 基于點過程的方法
對于如下形式的時序點過程數據X={vi,ti}mi=1,其中vi∈V 和t i∈T是第i個記錄的事件類型和發生時間,點過程模型使用強度函數來表示在給定歷史事件數據下,當前時刻事件的發生強度:
λv(t)dt=λv(t|HVt)dt=E[dCv(t)|HVt](1)
其中:HVt={ti,vi|tilt;t,vi∈V}表示在時間t之前所有類型的事件記錄的集合;Cv(t)∈Euclid Math TwoNAp是事件v到時間t時發生次數的記錄。經典的點過程模型都是基于數據是獨立同分布的假設來建模,比如泊松點過程[18]、霍克斯過程[8]和神經點過程[19]等。基于霍克斯過程的經典算法是MLE-SGL[8]和ADM4[20]算法。Cai等人[9]近期提出了THP算法,將拓撲結構引入霍克斯過程,并從時空領域上對強度函數建模,以發現非獨立同分布的點過程數據上的格蘭杰因果關系。
以上時序點過程模型都是基于數據記錄時間是準確無誤的假設做的工作。而在真實應用場景下,受設備情況影響,數據可能出現時間誤差等各種問題,導致以上的模型效果欠佳。
2 PTHP
2.1 問題定義
在基于約束的方法和拓撲霍克斯過程的基礎上,本文提出了一種融合先驗約束的拓撲霍克斯過程格蘭杰因果關系發現算法,以發現有時間誤差的非獨立同分布下的點過程數據背后的因果關系,稱之為融合先驗約束的拓撲霍克斯過程格蘭杰因果發現算法(priori-based topological Hawkes processes,PTHP)算法。
在PTHP中,X={ni,vi,ti}mi=1表示有時間誤差下的拓撲點過程數據,其中ni表示該條數據記錄所產生的拓撲設備。令無向圖GN=(N,EN)表示數據背后的拓撲網絡結構,其中拓撲網絡的節點集合為N,無向邊的集合為EN。令有向無環圖GV=(V,EV)表示事件類型之間的因果關系網絡,其中事件類型集合為V,有向邊的集合為EV。本文研究的問題可以表示為如何求解PTHP中的GV。
2.2 PTHP框架
為了求解PTHP中的因果網絡結構GV如圖1所示,本文提出了一個兩階段因果關系發現框架。在第一階段,該框架把X按不同事件類型劃分成|V|個時間序列,隨后使用基于約束的因果關系發現方法,篩選出其中一批置信值高的因果網絡邊,作為下一階段中拓撲霍克斯過程的先驗因果網絡結構G*V。在第二階段,將G*V作為拓撲霍克斯過程中爬山法的起點,并且固定先驗因果網絡結構不變動,搜尋剩余因果網絡結構集合中負對數似然最小的因果網絡結構GV。
綜上,PTHP算法首先使用基于約束的方法,通過高置信值篩選出一批可靠的因果網絡邊,將其作為先驗約束融入第二階段的拓撲霍克斯過程格蘭杰因果關系發現中。此融合方法的巧妙之處在于利用基于約束方法的魯棒性特點,尋找顯著性水平較高的邊,由此組成的先驗因果網絡結構可以作為后續算法步驟中可靠的約束。這大大縮小了拓撲霍克斯過程中潛在的因果網絡的搜索空間,同時減少了由于時間誤差導致因果發現錯誤邊的影響,從而有效提升算法在有時間誤差的非獨立同分布數據上進行格蘭杰因果關系發現的效果。
2.3 先驗因果網絡結構構建
在PTHP的第一階段中,一個重要的問題是選用何種基于約束的方法來獲取因果網絡的先驗邊。在實際應用中,本文使用時序數據上的PCMCI算法。考慮如下形式的點過程數據X={ni,vi,ti}mi=1,其時間范圍為ti∈[0,T]。在使用算法之前,本文進行了如下形式的數據預處理,以使其滿足基于約束算法所需的多變量時序數據形式:首先,將原數據按事件類型劃分成|V|個子序列X={X1,X2,…,X|V|};隨后,根據預先設定的時間窗口大小W將每個事件類型v∈V劃分為「TW個時間區間下的離散時序變量Xv={xi},i∈{1,2,…,「TW},若在時間區間i內存在事件v的記錄,則對應xi的值為1,否則為0。
PCMCI算法分為兩階段:a)因果關系骨架連接圖的搜索階段,記變量Xv在時間滯后τ∈{0,1,…,τmax}下的表示為Xvt-τ,則PCMCI第一階段可以表示為使用獨立性檢驗方法搜尋所有與Xvt不獨立的Xv′t-τ的集合,即找到變量Xvt所有可能的父母變量Xv′t-τ的集合(Xvt)={Xv′t-τ|0lt;τ≤τmax,XvtEuclid Math OneMBpXv′t-τ};b)冗余邊去除階段,使用瞬時條件獨立性(momentary conditional independence,MCI)檢測的方法,判斷給定Xvt和Xv′t-τ的父母變量后第一階段變量的不獨立性關系是否仍然成立,若不再成立,則去除掉(Xvt)中的Xv′t-τ,即當Xv′t-τ‖Xvt|(Xvt)\{Xv′t-τ},(Xv′t-τ),令(Xvt)=(Xvt)\{Xv′t-τ}。
在運行完PCMCI算法后,本文將變量間的因果關系轉換為對應事件之間的因果關系,得到了一個因果網絡結構以及每條邊對應獨立性檢驗結果的置信值,通過預先設定的置信值水平,本文篩選出一批高度可信的邊作為先驗邊保留下來,作為下一階段的先驗因果網絡結構G*V。
2.4 融合先驗信息的拓撲霍克斯過程建模
大部分點過程的工作都是基于數據符合獨立同分布的假設,然而很多現實應用中的數據不再符合這個要求。THP假設點過程數據產生過程背后有一個拓撲網絡GN=(N,EN),事件序列的因果強度函數不僅受到自身的歷史數據的激勵,也跟拓撲網絡中鄰居設備的歷史數據有關,從而使數據不再符合獨立同分布的特性。THP的目標可表示為尋找非獨立同分布事件序列背后的因果網絡GV=(V,EV)。基于THP的思想,本文融合先驗因果網絡信息,使用爬山法搜索最優的因果網絡GV。具體過程是,以第一階段的因果先驗網絡結構G*V為初始結構,爬山法中每一步可分為兩個子步驟:a)令S(GV)為在當前因果網絡GV上非先驗邊處執行一次加邊或者減邊之后的網絡結構集合,計算原始數據X在S(GV)中對應的似然最大的網絡結構G′V;b)若G′V對應的似然比GV對應的似然更大,則采納G′V作為下一輪爬山法的起點,否則,停止迭代,輸出當前的因果網絡GV作為最終的因果網絡結構。
算法1 PTHP算法
輸入:觀察數據集X;置信值閾值ρ。
輸出:GV。
將X按事件類型劃分成時間序列X1,X2,…,X|V|
將X1,X2,…,X|V|輸入PCMCI算法,求得因果網絡G*V和每條邊的置信值w*v′,v
for G*V中每條邊e do
if e對應w*v′,v的小于ρ then
從G*V中刪除e
end if
end for
計算X在G*V下的似然l*和模型參數θ*
l←-∞
while llt;l*do
〈GV,θ,l〉←〈G*V,θ*,l*〉
for G′V∈S(GV) do
計算X在G′V下的l′和θ′
end for
〈G*V,θ*,l*〉←l′最大的〈G′V,θ′,l′〉
end while
return GV
3 實驗結果與分析
為了對PTHP算法的實際效果進行驗證和分析,本文分別使用模擬數據和真實數據進行實驗,并與基準方法進行了對比。所對比的基準算法有:基于獨立同分布數據下霍克斯過程的算法,包括MLE-SGL[8]和ADM4[20];基于非獨立同分布數據下霍克斯過程的算法,包括THP[9];基于約束的算法,包括PCMCI[4]。本文就上述基準方法進行簡單介紹,具體如下:
a)MLE-SGL[8]。該算法將最大似然估計器(MLE)與稀疏組套索(SGL)正則化器相結合以進行霍克斯過程建模,學習事件類型間的格蘭杰因果關系。
b)ADM4[20]。該算法結合了乘法器的交替方向方法和主化最小化技術以進行霍克斯過程建模,實現格蘭杰因果關系發現。
c)THP[9]。該算法通過在霍克斯過程中引入事件記錄背后的拓撲網絡結構,從時空領域上建模,實現了非獨立同分布數據下的格蘭杰因果關系發現。
d)PCMCI[4]。該算法在第一階段使用基于約束的方法搜索事件類型在不同時間滯后下的父母事件類型集合,在第二階段引入瞬時條件獨立性檢測去除冗余的因果關系,提高了格蘭杰因果關系發現的準確率。
3.1 模擬數據實驗
模擬數據的生成方法參考了文獻[21,22]提出的點過程數據模擬生成方法,并將其拓展到數據產生背后存在拓撲網絡結構下的非獨立同分布情況以及存在時間誤差數據的情況。主要分為四個步驟實現:
a)隨機生成一個有向因果圖GV和無向拓撲圖GN,并按存在時間誤差的數據比例選定部分因果邊標記為存在時間誤差問題。在圖2中,本文展示了存在10個事件類型的因果圖GV,每條有向邊表示原因事件的發生會提高接下來結果事件的發生概率。在圖3中,本文展示了存在10個拓撲設備的拓撲網絡圖GN,每條無向邊連接了兩個設備,表示其中一個設備上發生的原因事件記錄也會激勵接下來拓撲鄰居設備上的結果事件發生的概率。
b)隨機生成每個事件類型v對應霍克斯過程中的基本強度μv的值,在每個拓撲設備上按泊松分布的參數為μv生成每個事件的根因事件序列。
c)隨機生成事件類型之間對應霍克斯過程中的激勵系數αk,v′,v,即拓撲網絡下k跳鄰居設備之間事件類型v′對事件類型v激勵生成的泊松分布事件序列的參數。對于無時間誤差因果邊的影響,將αk,v′,v作為泊松分布的系數生成原因事件的傳播事件;對于存在時間誤差問題的因果邊的影響,按照原因事件記錄生成時間一致的結果事件記錄。
d)將步驟c)中生成的傳播事件作為原因事件,生成新的傳播事件,重復步驟c)直至無新的傳播事件產生或在給定的時間范圍內無新的傳播事件發生。
基于上述數據生成方法,逐一改變不同參數的取值生成數據,將本文方法與基準方法應用于仿真數據中,對比不同算法的實驗效果。默認生成參數為:拓撲網絡節點數為30,事件類型數為30,樣本數為20 000,因果網絡平均入度為1.2,α取值為[0.03,0.05],μ取值為[0.000 05,0.000 1],存在時間誤差的數據比例為0.03,以及置信值閾值為0.02。所有默認參數都是基于真實數據的特點選定的。實驗環境為CPU配置是Intel Xeon E5-2620v4@2.10 GHz,內存64 GB的服務器。
在所有實驗中,本文使用了準確率(precision)、召回率(recall)和F1值(F1-score)作為算法測量到的因果網絡結構的評價指標,證明本文算法的正確性和有效性。準確率是通過算法學習到事件的因果關系網絡圖中正確的邊數占學習到的因果圖中邊數的比例;召回率是通過算法學習到的事件因果關系網絡圖中正確的邊數占原始的真實因果網絡圖中邊數的比例;F1值是一個綜合準確率和召回率的衡量指標。
F1-score=2×precision×recallprecision+recall(2)
模擬實驗的結果如圖4、5所示。在圖4中,本文對比了模擬數據中不同的時間誤差比例、PTHP中不同的置信值和拓撲網絡中不同的設備數量下的三個實驗結果,且PTHP均取得了最好的結果。隨著數據中存在時間誤差的比例上升和拓撲節點數的增加,PTHP相比THP等其他方法的結果更加平穩且出色,證明其解決了數據中存在時間誤差和數據不符合獨立同分布特征的問題。而在不同置信值閾值下,PTHP實驗結果的F1值先上升后輕微下降,是因為隨著置信值閾值提高,PTHP選擇的因果先驗邊數量增加,準確率會隨之下降以及召回率會上升,在合適的閾值下達到整體的最佳水平。
在圖5中,本文對比了不同傳統參數下的模擬實驗結果,其中PTHP算法的結果最優,THP排在其次。在所有對比實驗中,MLE-SGL、ADM4、PCMCI效果不佳的原因是它們不適用于非獨立同分布的數據。THP算法則因為不能學到有時間誤差下事件記錄背后的因果機制,所以效果上相比PTHP稍遜一籌。在算法的魯棒性方面,PTHP的曲線相比THP等其他對比方法更加光滑,證明了PTHP算法的實用性更好。
3.2 真實數據實驗
3.2.1 數據集說明
實驗數據集是PCIC 2021華為因果推理挑戰賽中因果發現賽道公布的一個無線網絡真實數據集。比賽的目的是征集拓撲網絡下告警事件記錄背后因果關系發現的算法,使運維人員從海量告警事件的人工排查中抽身,達到快速定位故障記錄的根因、修復設備異常的效果。
這個真實數據集是由華為公司對實際設備告警數據進行脫敏,隱去設備名稱和告警名稱后公開的一個數據集。數據集包含的告警事件記錄34 839條,其中事件類型18種,拓撲網絡的節點55個設備,數據背后的因果關系由專家給出。數據集的地址為https://github.com/gcastle-hub/dataset。
3.2.2 實驗結果分析
實驗結果如表1所示。從表1可看出,PTHP在三個評價指標上相比基準方法表現都更好。在圖6中,本文展示了PTHP和基準方法實驗結果的局部結構,其中,實線表示正確發現的因果邊;帶叉號的實線表示錯誤發現的因果邊;虛線表示沒有發現的因果邊。從實驗結果可以發現,相比THP方法,PTHP方法取得較好效果的原因是第一階段使用基于約束的因果關系發現方法學出了THP不能發現的因果邊,有效提高了召回率的水平,同時基于先驗約束進行爬山法搜索,減小了THP算法學習過程中因果關系發現錯誤的邊對結果的影響,也緩解了使用爬山法的算法容易陷入局部最優結構的問題。而相比ADM4、MLE-SGL和PCMCI方法,PTHP表現更好,這是因為PTHP在計算激勵影響時考慮了數據背后的拓撲網絡結構。
通過和專家知識得到的實際情況下的無線網絡告警事件的因果關系圖進行對比發現,PTHP算法得到的大多數因果關系和專家知識的結果是一致的,反映了本文算法發現拓撲網絡下告警事件記錄背后因果關系的結果具有一定的準確性且其結果有助于指導運維人員對故障進行定位和修復。
4 結束語
本文提出了一種融合先驗約束的拓撲霍克過程格蘭杰因果關系發現框架(PTHP),將基于約束的方法結合到拓撲霍克斯過程中,并在真實場景下的故障因果關系發現中證明了算法的有效性。與現有基于約束的算法相比,本文結合了拓撲霍克斯過程,能夠進一步挖掘非獨立同分布數據下的因果關系,并對因果邊進行定向。與拓撲霍克斯過程相比,本文結合了基于約束的方法,能夠更好地發現有時間誤差情況下的因果關系;同時,將兩者進行結合可以提高拓撲時序點過程下的因果發現的能力和準確性。但是,本文考慮基于約束的方法存在不能定向馬爾可夫等價類的問題,后續將對此問題展開進一步的研究,提出更通用的因果關系發現算法。
參考文獻:
[1]Liu Zitong,Sun Jiachen,Shen Feng,et al.Topology sensing of wireless networks based on Hawkes process[J].Mobile Networks and Applications,2020,25(6):2459-2470.
[2]Zhu Shixiang,Ding Ruyi,Zhang Minghe,et al.Spatio-temporal point processes with attention for traffic congestion event modeling[J/OL].IEEE Trans on Intelligent Transportation Systems.(2021-03-30)[2022-01-26].http://doi.org/10.1109/TITS.2021.3068139.
[3]Da Fonseca J,Zaatour R.Hawkes process:fast calibration,application to trade clustering,and diffusive limit[J].Journal of Futures Markets,2014,34(6):548-579.
[4]Runge J,Nowack P,Kretschmer M,et al.Detecting and quantifying causal associations in large nonlinear time series datasets[J].Science Advances,2019,5(11):eaau4996.
[5]Hyvrinen A,Zhang Kun,Shimizu S,et al.Estimation of a structural vector autoregression model using non-Gaussianity[J].Journal of Machine Learning Research,2010,11(5):1709-1731.
[6]Peters J,Janzing D,Schlkopf B.Causal inference on time series using restricted structural equation models[C]//Advances in Neural Information Processing Systems.2013:154-162.
[7]陳薇,蔡瑞初,伍運金,等.基于多組典型相關變量的因果關系發現算法[J].計算機應用研究,2021,38(1):53-56.(Chen Wei,Cai Ruichu,Wu Yunjin,et al.Causal relationship discovery algorithm based on multiple groups of typical related variables[J].Application Research of Computers,2021,38(1):53-56.)
[8]Xu Hongteng,Farajtabar M,Zha Hongyuan.Learning granger causality for Hawkes processes[C]//Proc of the 33rd International Conference on International Conference on Machine Learning.2016:1717-1726.
[9]Cai Ruichu,Wu Siyu,Qiao Jie,et al.THP:topological hawkes processes for learning granger causality on event sequences[EB/OL].(2021-05-23).https://arxiv.org/abs/2105.10884.
[10]張連文,郭海鵬.貝葉斯網引論[M].北京:科學出版社,2006.(Zhang Lianwen,Guo Haipeng.Introduction to Bayesian networks[M].Beijing:Science Press,2006.)
[11]Huang Biwei,Zhang Kun,Lin Yizhu,et al.Generalized score functions for causal discovery[C]//Proc of the 24th ACM SIGKDD International Conference on Knowledge Discovery amp; Data Mining.New York:ACM Press,2018:1551-1560.
[12]蔡瑞初,陳薇,張坤,等.基于非時序觀察數據的因果關系發現綜述[J].計算機學報,2017,40(6):1470-1490.(Cai Ruichu,Chen Wei,Zhang Kun,et al.Summary of causal relationship discovery based on non-time series observation data[J].Chinese Journal of Computers,2017,40(6):1470-1490.)
[13]Gretton A,Fukumizu K,Teo C H,et al.A kernel statistical test of independence[C]//Proc of the 20th International Conference on Neural Information Processing Systems.2007:585-592.
[14]Zhang Kun,Peters J,Janzing D,et al.Kernel-based conditional independence test and application in causal discovery[EB/OL].(2012-02-14).https://arxiv.org/abs/1202.3775.
[15]Frenzel S,Pompe B.Partial mutual information for coupling analysis of multivariate time series[J].Physical Review Letters,2007,99(20):204101.
[16]Spirtes P,Glymour C N,Scheines R,et al.Causation,prediction,and search[M].Cambridge,MA:The MIT Press,2000.
[17]Verma T,Pearl J.Equivalence and synthesis of causal models[C]//Proc of the 6th Annual Conference on Uncertainty in Artificial Intelligence.1990:255-270.
[18]Streit R L.The poisson point process[M]// Poisson Point Processes.Boston,MA:Springer,2010:11-55.
[19]Du Nan,Dai Hanjun,Trivedi R,et al.Recurrent marked temporal point processes:embedding event history to vector[C]//Proc of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.New York:ACM Press,2016:1555-1564.
[20]Zhou Ke,Zha Hongyuan,Song Le.Learning social infectivity in sparse low-rank networks using multi-dimensional Hawkes processes[C]//Proc of the 16th International Conference on Artificial Intelligence and Statistics.2013:641-649.
[21]Lewis P A W,Shedler G S.Simulation of nonhomogeneous Poisson processes with log linear rate function[J].Biometrika,1976,63(3):501-505.
[22]Pasupathy R.Generating homogeneous poisson processes[M]// Cochran J J,Cox L A,Keskinocak P,et al.Wiley Encyclopedia of Operations Research and Management Science.[S.l.]:Wiley,2010.