胡純嚴 ,胡良平 ,2*
(1.軍事科學(xué)院研究生院,北京 100850;2.世界中醫(yī)藥學(xué)會聯(lián)合會臨床科研統(tǒng)計學(xué)專業(yè)委員會,北京 100029*通信作者:胡良平,E-mail:lphu927@163.com)
因果圖理論的4個主要內(nèi)容包括關(guān)聯(lián)的來源、因果圖模型的統(tǒng)計性質(zhì)、識別和調(diào)整以及工具變量,本文在介紹這些理論的基礎(chǔ)上,針對兩個實例,并借助SAS軟件完成用工具變量識別因果效應(yīng)以及用數(shù)據(jù)區(qū)分不同模型的任務(wù)。
在因果圖過程中,每個因果圖模型都必須是有向無環(huán)圖(Directed acyclic graph,DAG)。由DAG表示的因果圖模型對信息在底層數(shù)據(jù)生成過程中的流動方式具有明確的定義。該信息流由三個圖形結(jié)構(gòu)封裝,可用于在DAG中組裝每條路徑[1]。這三個結(jié)構(gòu)對應(yīng)因果圖模型中關(guān)聯(lián)的三個基本來源(即因果關(guān)系、混淆和內(nèi)生選擇),這些結(jié)構(gòu)如圖1所示。

圖1 關(guān)聯(lián)的3個基本來源Figure 1 Three fundamental sources of association
在因果關(guān)系U→V→W中,變量U和W是關(guān)聯(lián)的,這種關(guān)聯(lián)是因果鏈的結(jié)果。如果要對中介變量V進行調(diào)節(jié),那么這將阻塞信息流,從而使變量U和W不再關(guān)聯(lián)。
在混淆的關(guān)系U←V→W中,沒有與變量U和W相關(guān)的因果路徑,然而,U和W仍然是相關(guān)的,這種關(guān)聯(lián)是由混雜變量V引起的,它是變量U和W的共同父項,如果研究者要以共同原因V為條件,那么這將阻塞信息流,從而使變量U和W不再關(guān)聯(lián)。
在內(nèi)生選擇結(jié)構(gòu)U→V←W中,變量U和W共同決定其共同子變量V的值,但變量U和W不相關(guān),然而,如果研究者要以共同的結(jié)果變量V為條件,就可以創(chuàng)建一個信息流,變量U和W就會關(guān)聯(lián)起來[2]。
粗略地說,如果在因果效應(yīng)分析中有一個處理變量(如U)和一個結(jié)果變量(如W),那么目標是消除變量U和W之間的非因果關(guān)聯(lián),并保持因果關(guān)聯(lián)不變?!?br>