999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于因果生成神經(jīng)網(wǎng)絡(luò)的因果特征發(fā)現(xiàn)與預(yù)測(cè)

2022-04-24 03:20:40鐘坤華秦小林陳敏陳芋文
軟件導(dǎo)刊 2022年4期
關(guān)鍵詞:特征模型

鐘坤華,秦小林,陳敏,陳芋文

(1.中國科學(xué)院成都計(jì)算機(jī)應(yīng)用研究所,四川成都 610041;2.中國科學(xué)院重慶綠色智能技術(shù)研究院,重慶 400714;3.中國科學(xué)院大學(xué),北京 100049)

0 引言

機(jī)器學(xué)習(xí)正在成為醫(yī)療保健領(lǐng)域越來越重要的技術(shù)手段。一些基于機(jī)器學(xué)習(xí)算法的人工智能系統(tǒng)在癌癥分類檢測(cè)、糖尿病視網(wǎng)膜病變檢測(cè)方面的水平已經(jīng)接近甚至超過了人類專家。毫無疑問,人工智能將重塑醫(yī)學(xué)的未來。然而,目前已成功應(yīng)用于醫(yī)療問題的機(jī)器學(xué)習(xí)方法僅基于關(guān)聯(lián)而非因果關(guān)系。在統(tǒng)計(jì)學(xué)中,關(guān)聯(lián)在邏輯上并不意味著因果關(guān)系。相關(guān)性與因果關(guān)系之間的關(guān)系由Reichenbach正式確定為共同原因原則,即如果兩個(gè)隨機(jī)變量X和Y在統(tǒng)計(jì)上相互依賴,則必須持有以下因果解釋之一:①X是Y的直接原因;②有一個(gè)隨機(jī)變量Z是X和Y的共同原因。因此,與關(guān)聯(lián)相比,因果關(guān)系進(jìn)一步探索了變量之間更本質(zhì)的關(guān)系。

隨著現(xiàn)代醫(yī)學(xué)技術(shù)的飛速發(fā)展,針對(duì)患者采集的臨床數(shù)據(jù)越來越多,這種增長對(duì)疾病預(yù)測(cè)模型的性能以及檢測(cè)效率均提出了巨大挑戰(zhàn)。理論上使用的特征越多,模型訓(xùn)練效果越好,而在測(cè)試集中效果不理想的現(xiàn)象可解釋為非相關(guān)特征過度擬合,導(dǎo)致模型性能和泛化能力降低。但事實(shí)上,變量越多并不意味著信息越有用,預(yù)測(cè)效果越好。因此,為了減小數(shù)據(jù)集規(guī)模、提高模型預(yù)測(cè)性能,減少特征數(shù)量非常必要。在機(jī)器學(xué)習(xí)中,特征選擇是獲得良好預(yù)測(cè)效果的重要步驟之一。近年來,人們不僅對(duì)基于信息選擇特征進(jìn)行預(yù)測(cè)感興趣,還希望了解這些特征與研究目標(biāo)的相互作用。在這種背景下,一些研究者開發(fā)了一些理論,試圖將圖(Graph)與因果關(guān)系的概念引入到特征選擇中,目的是找到能夠生成數(shù)據(jù)的因果關(guān)系,以便更好地理解數(shù)據(jù)集的底層機(jī)制。以癌癥為例,我們需要知道其是什么原因?qū)е碌模枰褂媚男┳兞恐斡?/p>

1 相關(guān)研究

因果特征選擇作為一種新興的特征濾波方法,其為特征與類屬性之間的關(guān)系提供了因果解釋,從而更好地理解數(shù)據(jù)背后的機(jī)制。與非因果特征選擇相比,因果特征選擇在理論上是最優(yōu)的,回答了最優(yōu)特征選擇包含哪些核心特征,以及特征濾波方法在什么條件下能夠輸出最優(yōu)特征的問題。

傳統(tǒng)的因果特征選擇是在因果貝葉斯網(wǎng)絡(luò)(Causal Bayesian Network,CBN)中尋找類屬性的馬爾可夫毯(Markov Blanket,MB),其中邊X→Y表示X為Y的直接原因(父親節(jié)點(diǎn)),Y為X的直接結(jié)果(孩子節(jié)點(diǎn))。目標(biāo)變量(例如類標(biāo)簽)的MB由父節(jié)點(diǎn)、子節(jié)點(diǎn)以及子節(jié)點(diǎn)的父節(jié)點(diǎn)(配偶節(jié)點(diǎn))構(gòu)成。MB提供了圍繞局部因果結(jié)構(gòu)的完整結(jié)構(gòu),即MB是最小的特征集,其使類屬性在統(tǒng)計(jì)上條件獨(dú)立于所有的其他屬性。在該研究領(lǐng)域,Koller等首先引入MBs進(jìn)行特征選擇,并提出Koller-Sahami(KS)算法,但KS算法并不能保證找到真正的MB;Margaritis等設(shè)計(jì)了一種GS(Growing-Shrinking)算法,可用于貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí);Tsamardinos等改良了GS算法,并提出一系列用于最優(yōu)特征選擇的MB發(fā)現(xiàn)算法,從而形成了IAMB(Incremental Association-based MB)算法家族,包括IAMB、interIAMB、IAMBnPC和FastIAMB等;Goudet等提出因果生成神經(jīng)網(wǎng)絡(luò)(Causal Generative Neural Networks,CGNNs),利用條件獨(dú)立性和分布不對(duì)稱性探索雙變量和多變量的因果結(jié)構(gòu);Kalainathan等提出結(jié)構(gòu)不可知建模(Structural Agnostic Modeling,SAM)方法,該法基于不同參與者之間的博弈,結(jié)合分布估計(jì)、稀疏性和非循環(huán)性約束的學(xué)習(xí)準(zhǔn)則,通過隨機(jī)梯度下降方法進(jìn)行端到端的參數(shù)學(xué)習(xí)。

本文參考文獻(xiàn)[13][14]的研究成果,提出一種基于生成神經(jīng)網(wǎng)絡(luò)和強(qiáng)化學(xué)習(xí)的因果特征選擇和預(yù)測(cè)模型,框架如圖1所示。該模型包含一個(gè)因果門網(wǎng)絡(luò)和一個(gè)因果預(yù)測(cè)網(wǎng)絡(luò),其中因果門網(wǎng)絡(luò)輸入原始數(shù)據(jù),輸出選擇因果概率,然后根據(jù)這些概率對(duì)選擇向量進(jìn)行采樣;因果預(yù)測(cè)網(wǎng)絡(luò)接收所選特征并進(jìn)行預(yù)測(cè)。兩個(gè)網(wǎng)絡(luò)基于真實(shí)標(biāo)簽進(jìn)行反向傳播的訓(xùn)練,然后從預(yù)測(cè)網(wǎng)絡(luò)的損失中減去基線網(wǎng)絡(luò)損失,用于因果門網(wǎng)絡(luò)的更新。

2 因果模型

設(shè)X=[

X

,…

X

X

],表示d+1維隨機(jī)變量向量;

P(X)

為聯(lián)合概率分布;

X′

=[

X

,…,

X

X

],表示

d

個(gè)隨機(jī)特征空間變量向量;

X

為離散的標(biāo)簽空間變量。基于觀察因果發(fā)現(xiàn)從分布

P(X)

中采集獨(dú)立同分布的樣本D={X(1),…,X(j),…,X(n)},X(j)=(

X

,…

X

X

)。為了更清楚地表示患者數(shù)據(jù),將

X

表示為患者的疾病標(biāo)簽Y。

2.1 函數(shù)因果模型

數(shù)據(jù)的底層生成模型假設(shè)為函數(shù)因果模型,定義為一對(duì)(G,f),其中G為一個(gè)有向無環(huán)圖;f=(

f

,…

f

f

),為一組d+1的因果機(jī)制。函數(shù)因果模型假設(shè)每個(gè)變量滿足如下關(guān)系:

2.2 深度神經(jīng)網(wǎng)絡(luò)的因果機(jī)制

通用近似定理指出:具有單個(gè)隱藏層的標(biāo)準(zhǔn)多層前饋網(wǎng)絡(luò)中包含有限數(shù)量的隱藏神經(jīng)元,是對(duì)R緊湊子集上連續(xù)函數(shù)中激活函數(shù)輕微假設(shè)情況下的通用逼近器。因此,本文基于函數(shù)因果模型和神經(jīng)網(wǎng)絡(luò)通用近似定理,利用神經(jīng)網(wǎng)絡(luò)擬合函數(shù)

f

。如圖3所示,深層神經(jīng)網(wǎng)絡(luò)的因果機(jī)制由H隱層神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn),其中

c

=(

c

c

,…,

c

)為因果系數(shù)。如果使用變量

X

生成Y,即

X

→Y在圖G中有一條邊,因此認(rèn)為

X

為Y的原因,

c

為1,否則

c

為0;

E

為高斯噪聲。網(wǎng)絡(luò)結(jié)構(gòu)的數(shù)學(xué)表達(dá)式為:

Fig.1 The proposed model framework圖1 本文模型框架

式中,

c

X

表示兩個(gè)向量之間對(duì)應(yīng)元素相乘,[

c

X

E

]為連接

c

X

和噪聲的d+1維向量,L為隱層中的代數(shù)變換。

Fig.2 Example of functional causal model on X(Left:causal graph G;Right:causal mechanisms)圖2 在X上的函數(shù)因果模型示例(左:因果圖,右:因果機(jī)制)

Fig.3 Neural network causal mechanisms圖3 神經(jīng)網(wǎng)絡(luò)因果機(jī)制圖

3 因果特征選擇與預(yù)測(cè)模型構(gòu)建

如函數(shù)因果模型所描述,特征選擇的目標(biāo)是找到一個(gè)盡可能小的X子集,使基于X的最優(yōu)子集與X全集具有相同的效應(yīng),表示為:

式(3)表明,給定

c

X

,Y的條件分布與給定所有X、Y的條件分布相同。本文使用Kullback-Leibler(KL)散度將式(3)轉(zhuǎn)換為式(4),以最小化兩個(gè)分布的距離,表示為:

本文模型的改良在于設(shè)計(jì)了因果門結(jié)構(gòu),主要基于強(qiáng)化學(xué)習(xí)框架對(duì)特征進(jìn)行因果選擇預(yù)測(cè),學(xué)習(xí)率為0.000 1,激活函數(shù)為ReLu,batch_size為100。

3.1 因果門特征選擇網(wǎng)絡(luò)

設(shè)計(jì)

f

為因果門特征選擇網(wǎng)絡(luò),稱為Actor,是由3層隱藏層組成的全連接網(wǎng)絡(luò),輸入節(jié)點(diǎn)根據(jù)實(shí)際輸入數(shù)據(jù)確定。

f

:X→{0,1},該網(wǎng)絡(luò)輸出每個(gè)特征的選擇概率,給定特征選擇向量的概率為c∈[0,1],則有:

因果門特征選擇網(wǎng)絡(luò)的損失函數(shù)表示為:

3.2 因果預(yù)測(cè)網(wǎng)絡(luò)

設(shè)計(jì)

f

為因果預(yù)測(cè)器網(wǎng)絡(luò),稱為Critical。該網(wǎng)絡(luò)為3層全連接網(wǎng)絡(luò),每層隱藏層有200個(gè)節(jié)點(diǎn),輸入節(jié)點(diǎn)根據(jù)實(shí)際輸入數(shù)據(jù)確定。接受選擇的因果特征向量作為輸入,在c維輸出空間中輸出概率分布。

該網(wǎng)絡(luò)的損失函數(shù)表示為:

式中,

y

為y的第

i

個(gè)分量編碼,

c

X

為因果門選擇的特征。

3.3 預(yù)測(cè)網(wǎng)絡(luò)

f

為預(yù)測(cè)網(wǎng)絡(luò),結(jié)構(gòu)與

f

因果預(yù)測(cè)器網(wǎng)絡(luò)(Critical)一致,隱藏層為200個(gè)節(jié)點(diǎn)的3層全連接前饋神經(jīng)網(wǎng)絡(luò),并經(jīng)過訓(xùn)練以最小化。該網(wǎng)絡(luò)使用所有觀察到的患者數(shù)據(jù)進(jìn)行直接預(yù)測(cè),損失函數(shù)表示為:

使用BP反向傳播算法組合上述3個(gè)損失函數(shù)對(duì)3個(gè)神經(jīng)網(wǎng)絡(luò)進(jìn)行端到端的訓(xùn)練,將患者觀察數(shù)據(jù)輸入訓(xùn)練后的模型,得到特征的最優(yōu)子集和預(yù)測(cè)結(jié)果。

4 實(shí)驗(yàn)方法與結(jié)果分析

4.1 實(shí)驗(yàn)環(huán)境

在合成數(shù)據(jù)、開源數(shù)據(jù)和真實(shí)世界醫(yī)學(xué)數(shù)據(jù)上進(jìn)行驗(yàn)證實(shí)驗(yàn),從特征選擇的相關(guān)性和預(yù)測(cè)的準(zhǔn)確性兩方面評(píng)估模型性能。將特征選擇模型與LIME和Shapley兩種方法進(jìn)行比較,將預(yù)測(cè)模型與XGBoost和Lasso正則化線性模型進(jìn)行比較。

服務(wù)器搭載Ubuntu 16.04 LTS操作系統(tǒng)、Intel Xeon e5-2650 V4處理器和Nvidia GTX 1080 Ti GPU,內(nèi)存64G。基于Pytorch框架構(gòu)建模型,編程工具為Python3.6。

4.2 合成數(shù)據(jù)實(shí)驗(yàn)

針對(duì)每個(gè)數(shù)據(jù)集生成40 000個(gè)樣本,其中20 000個(gè)用于訓(xùn)練,20 000個(gè)用于測(cè)試。特征選擇時(shí)使用真陽性率(TPR,越高越好)和錯(cuò)誤率(FDR,越低越好)評(píng)估算法性能,具體定義見表1和式(12)、式(13);使用接受者操作特征曲線下面積(Area Under the Receiver Operating Characteristic curve,AUROC)、精確召回曲線下面積(Area Under Precision-Recall Curve,AUPRC)評(píng)估預(yù)測(cè)準(zhǔn)確度。

使用Adam優(yōu)化器進(jìn)行訓(xùn)練,初始學(xué)習(xí)率為0.000 1,并采用stepLR學(xué)習(xí)率變化策略,每10步更新1次學(xué)習(xí)率,共訓(xùn)練100epoch。

Tabel 1 Definition of TPR and FDR表1 TPR和FDR的定義

分析特征選擇作為預(yù)測(cè)預(yù)處理步驟的效果。首先進(jìn)行特征選擇,然后訓(xùn)練一個(gè)3層全連接的神經(jīng)網(wǎng)絡(luò),在特征選擇的數(shù)據(jù)上執(zhí)行預(yù)測(cè)。如表2所示,本文模型的TPR和FDR均明顯優(yōu)于LIME和Shapely算法,能有效檢測(cè)相關(guān)特征。如表3所示,當(dāng)丟棄所有不相關(guān)特征時(shí),本文模型性能有顯著提高,但XGBoost和Lasso算法性能提升不明顯。

Table 2 Feature selection result for synthetic datasets表2 合成數(shù)據(jù)集的特征選擇結(jié)果

Table 3 Prediction performance results表3 預(yù)測(cè)性能結(jié)果

4.3 肥胖患者預(yù)測(cè)實(shí)驗(yàn)

使用開源醫(yī)療數(shù)據(jù)集進(jìn)行驗(yàn)證實(shí)驗(yàn),該數(shù)據(jù)集為根據(jù)墨西哥、秘魯和哥倫比亞居民的飲食習(xí)慣和身體狀況估計(jì)肥胖水平的數(shù)據(jù),包含15個(gè)屬性和2 111條記錄。該數(shù)據(jù)集中77%的數(shù)據(jù)是使用Weka工具和SMOTE過濾器綜合生成的,23%的數(shù)據(jù)是通過Web平臺(tái)直接從用戶處收集的。所有數(shù)據(jù)均被標(biāo)記,類變量的值分別為normal和abnormal。數(shù)據(jù)集的具體屬性見表4。

從表5可以看出,本文模型在肥胖預(yù)測(cè)能力方面與全特征預(yù)測(cè)方法的性能基本一致。原因可能是特征數(shù)量很小,并且所選特征與預(yù)測(cè)標(biāo)簽之間有很強(qiáng)的相關(guān)性,因此本文特征選擇模型的優(yōu)勢(shì)沒有得以體現(xiàn)。此外,本文繪制了測(cè)試患者特征選擇概率的熱圖,如圖4(彩圖掃OSID碼可見,下同)所示,模型預(yù)測(cè)肥胖患者的主要原因?yàn)閃eight、FHWO、CAEC和FAF變量。

Table 4 Obesity levelsdata set attributes表4 肥胖水平數(shù)據(jù)集屬性

Table5 Prediction performance results表5 預(yù)測(cè)性能結(jié)果

Fig.4 Feature selection probabilistic heat map圖4 特征選擇概率熱圖

4.4 心衰預(yù)測(cè)實(shí)驗(yàn)

使用心力衰竭數(shù)據(jù)集進(jìn)行驗(yàn)證實(shí)驗(yàn),數(shù)據(jù)來源于第三軍醫(yī)大第一附屬醫(yī)院2014-2018年間住院的1 452例患者,包含66個(gè)測(cè)量特征,標(biāo)簽為心力衰竭。數(shù)據(jù)集的具體屬性見表6。

Table 6 Heart failure data set attributes表6 心力衰竭數(shù)據(jù)集屬性

續(xù)表

如表7所示,當(dāng)丟棄所有不相關(guān)特性時(shí),本文模型預(yù)測(cè)性能相較全特征預(yù)測(cè)方法有輕微提高。圖5描述了男性和女性心力衰竭患者所選特征平均概率熱圖。可以看出,導(dǎo)致成年男性和女性心力衰竭的因素是相同的,這與醫(yī)生的判斷基本一致。

Table 7 Prediction performance results表7 預(yù)測(cè)性能結(jié)果

Fig.5 Female and male heart failure patients'features selected for average probability heat maps(a:Female,b:Male)圖5 女性和男性心力衰竭患者所選特征平均概率熱圖(a:女性,b:男性)

5 結(jié)語

本文針對(duì)特征選擇與預(yù)測(cè)問題,從因果特征分析的視角提供了一種新方法。首先,從定性的角度進(jìn)行特征選擇,然后在強(qiáng)化學(xué)習(xí)框架下,設(shè)計(jì)可解釋的實(shí)例特征選擇與預(yù)測(cè)模型,最后在合成數(shù)據(jù)、開源數(shù)據(jù)以及真實(shí)數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn)評(píng)估,結(jié)果表明該方法可有效選擇屬性進(jìn)行疾病預(yù)測(cè)。本文研究成果能在一定程度上拓展醫(yī)療問題的分析角度,并進(jìn)一步回答病因與疾病的因果關(guān)系,例如醫(yī)療健康領(lǐng)域存在哪些反事實(shí)問題,哪些反事實(shí)問題能夠得以解決,以及醫(yī)療健康領(lǐng)域是否存在因果鏈等。本文研究也存在一定的局限性,例如關(guān)注的只是患者的靜態(tài)屬性數(shù)據(jù),尚不能應(yīng)用于動(dòng)態(tài)的時(shí)間序列數(shù)據(jù),如圍術(shù)期的監(jiān)護(hù)數(shù)據(jù)。后續(xù)將嘗試進(jìn)行動(dòng)態(tài)數(shù)據(jù)、混合數(shù)據(jù)的因果分析,例如采用循環(huán)神經(jīng)網(wǎng)絡(luò)替換本文模型中的網(wǎng)絡(luò),以適用于醫(yī)療健康領(lǐng)域中的時(shí)間序列數(shù)據(jù)研究。

猜你喜歡
特征模型
一半模型
抓住特征巧觀察
重要模型『一線三等角』
新型冠狀病毒及其流行病學(xué)特征認(rèn)識(shí)
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
如何表達(dá)“特征”
不忠誠的四個(gè)特征
抓住特征巧觀察
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
主站蜘蛛池模板: 国产麻豆91网在线看| 77777亚洲午夜久久多人| 无码日韩精品91超碰| 欧美亚洲欧美区| 亚洲日韩Av中文字幕无码| 久久国产乱子| 九九热这里只有国产精品| 国产亚洲高清在线精品99| 好紧太爽了视频免费无码| 3D动漫精品啪啪一区二区下载| 亚洲黄色激情网站| 亚洲国产成熟视频在线多多| 国产原创演绎剧情有字幕的| 亚洲熟女中文字幕男人总站| 欧美国产视频| 久久久久中文字幕精品视频| 国产靠逼视频| 亚洲婷婷丁香| 在线精品亚洲国产| 亚洲欧美日韩中文字幕在线一区| 欧美日韩国产在线人| 国产欧美日韩另类| 国产喷水视频| 久久久久九九精品影院| 亚洲 日韩 激情 无码 中出| 小蝌蚪亚洲精品国产| 国产高清在线观看91精品| 成人年鲁鲁在线观看视频| 精品无码人妻一区二区| 香蕉99国内自产自拍视频| 亚洲免费成人网| 国产无套粉嫩白浆| 欧美第一页在线| 在线精品亚洲一区二区古装| 日韩国产欧美精品在线| 欧美亚洲日韩不卡在线在线观看| 一个色综合久久| 欧美一级高清视频在线播放| 国产在线视频导航| 国产永久在线视频| 国内精品视频| 国产成人一二三| 又黄又爽视频好爽视频| 伊人欧美在线| 国内精品91| 国产高潮流白浆视频| 欧美精品成人| 欧美a在线视频| 成人小视频网| 国产拍揄自揄精品视频网站| 激情无码字幕综合| 欧美日本视频在线观看| 亚洲欧美不卡视频| 欧美a级在线| 日本精品αv中文字幕| 成人福利一区二区视频在线| 久久91精品牛牛| 欧美另类图片视频无弹跳第一页| 成人免费网站久久久| 欧美成人手机在线观看网址| 国产精欧美一区二区三区| 精品夜恋影院亚洲欧洲| 久久国产毛片| AV片亚洲国产男人的天堂| 40岁成熟女人牲交片免费| 亚洲成aⅴ人在线观看| 亚洲国产天堂在线观看| 欧美性猛交一区二区三区| 国产精品私拍在线爆乳| 午夜视频免费一区二区在线看| 中文字幕无线码一区| 男人天堂亚洲天堂| 国产黄网永久免费| 亚洲成人网在线观看| 欧美亚洲欧美| 国产精品一区二区在线播放| 免费国产一级 片内射老| 国产美女人喷水在线观看| 亚洲码在线中文在线观看| 亚洲一级色| 国产三级国产精品国产普男人| 欧美在线国产|