999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于度量學習的無監督域適應方法及其在死亡風險預測上的應用

2022-03-09 05:42:10蔡德潤李紅燕
計算機研究與發展 2022年3期
關鍵詞:特征提取特征方法

蔡德潤 李紅燕

(北京大學信息科學技術學院 北京 100871)

(機器感知與智能教育部重點實驗室(北京大學) 北京 100871)

突發公共衛生安全事件往往會對社會醫療資源造成巨大的壓力.例如2020年初新冠肺炎疫情的暴發所帶來的醫護人員人手短缺、醫療資源擠兌等問題.其原因之一是新型冠狀病毒感染者容易出現“炎癥風暴”[1],導致病情迅速惡化,死亡風險上升.醫護人員需要投入大量的精力去觀察和跟蹤患者生理狀況的變化,并需要根據患者死亡風險程度調配不同的醫療設備.例如體外膜肺氧合設備能夠為搶救贏得寶貴的時間,但是數量比較少,適用于重癥心肺功能衰竭患者.如果能夠利用患者的生命體征數據構建深度學習模型,對死亡風險上升的患者發出預警,則可以節省醫護人員的精力,及時對醫療設備進行合理的配置,增加醫療資源的利用率[2-7].

深度學習模型的成功應用是建立在大量帶標簽訓練數據上的,并往往要求測試數據和訓練數據服從同一分布,這在實際應用中常常不能得到滿足.由于各種現實條件的限制,收集到的訓練數據具有一定的局限性,例如可能某年齡段[8]、某科室或者某種并發癥占據了大多數.這種局限性導致深度學習模型不能夠對其他情況下的數據進行普適地預測.域適應(domain adaptation)方法能夠利用源域和目的域的相似性,將源域上學習到的知識遷移到目的域上,從而解決該問題.

但是,將域適應方法應用在重癥監護病人死亡風險預測任務上時還遇到主要來自3個方面的困難:整體數據分布偏移、類別之間的數據分布偏移以及時序數據的多樣性和復雜性.其中整體數據分布偏移與類別之間的數據分布偏移如圖1所示:

Fig. 1 Data distribution shift圖1 數據分布偏移

整體數據分布偏移指的是源域和目的域整體的數據分布往往不相同.例如,在重癥監護室內收集到的數據中可能老年人占據大多數.圖1中老年患者A與青年患者B的生命體征不相類似,表示以老年患者為主體的源域和以青年患者為主體的目的域的數據分布是有差異的.以醫療領域的MIMIC-Ⅲ(medical information mart for intensive care Ⅲ)數據集為例,血壓作為反映患者生理狀況的重要指標之一,在不同年齡段的患者之間的分布是不同的.如圖2所示,患者的平均血壓隨著年齡增加而逐漸變低.這些生理指標分布的差異導致在老年患者數據上訓練的模型不能夠很好地泛化到青年患者的數據上.域適應方法能夠適當減小患者A與患者B的高級特征之間的距離,消除整體數據分布偏移所帶來的影響.

Fig. 2 Distribution of mean blood pressure with age圖2 平均血壓隨年齡的分布情況

類別之間的數據分布偏移指的是不同域之間同一類別的數據分布往往不同.無論特征來自哪個域,相同類別的特征之間應該相隔較近,不同類別的特征之間應該相隔較遠.因此需要在域適應的基礎上進行類別適配.如圖1所示,患者A與患者C的年齡相近,數據分布也類似.但二者的存活結果不相同,屬于不同的類,因此需要進行類別適配,增加二者高級特征之間的距離.

時序數據的多樣性和復雜性所帶來的困難指的是患者各項生理指標構成了數據分布互不相同的不同通道,不同通道的時序變化趨勢共同描繪了病人的生理狀況.深度學習模型只有在理解不同時間步之間復雜的時序依賴關系并且有效地提取高級特征之后,才能進行域適應.

本文提出了一種基于域對抗和加性余弦間隔損失的無監督域適應方法(additive margin softmax based adversarial domain adaptation, AMS -ADA).其中域對抗是一種類似生成對抗網絡的方法,能夠解決整體數據分布偏移的困難.加性余弦間隔損失引入了度量學習的思想,能夠解決類別之間數據分布偏移帶來的困難.此外,本文使用帶有注意力機制的雙向長短程網絡作為特征提取器來應對時序數據的多樣性和復雜性.

1 相關研究工作

無監督域適應問題指的是利用源域的數據和標簽以及目的域的數據訓練深度學習模型,希望模型能夠在目的域上取得盡可能高的準確度.與許多其他的遷移學習方法[9-13]相比,域適應對目的域上的標簽不做要求,進一步降低了獲取標注數據的壓力.深度學習模型可以簡單地視作特征提取器和分類器2個部分.如果深度學習模型的特征提取器能夠從不同域之間的數據提取出域不變(domain invariant)的特征,那么在源域上訓練的分類器就可以很好地應用在目的域上.域不變的特征是指在源域和目的域都具有表現力和判別力的特征,蘊涵了源域和目的域之間可以共享的知識.為了實現提取出域不變特征的這一目標,減少整體數據分布的偏移,通常的做法有2種:

1) 基于特征映射的方法.對深度學習模型從源域和目的域提取出的高級特征之間施加距離約束,使得神經網絡學習出的高級特征的分布相似.如DDC(deep domain confusion)[14],DAN(deep adaptation network)[15]等方法使用了最大均值差異來衡量高級特征之間的分布差異,Deep CORAL[16]方法采用CORAL距離來衡量高級特征之間的分布差異.

2) 基于域對抗的方法.引入生成對抗網絡的思想,用域判別器判斷深度學習模型學習出的高級特征屬于源域還是目的域.以對抗訓練的方式使特征提取器和域判別器達到平衡.當域判別器無法辨別特征來自哪一個域的時候,說明特征提取器提取了具有域不變性的特征.如Adversarial Discriminative Domain Adaptation[17],Domain Adversarial Neural Networks[18]等.

近年來,域對抗方法以其優異的表現而備受關注.為了減少類別之間的數據分布偏移,進一步提升無監督域適應的效果,一些工作在域對抗方法的基礎上引入了度量學習的思想.例如Wang等人[19]和Yin等人[20]在域適應任務中引入了三元組損失(triplet loss),在一定程度上最小化類內距離和最大化類間距離.但是三元組損失的計算需要遍歷大量樣本對,增加了額外的計算量,并且需要選取合適大小的隱層特征作為三元組損失的優化對象,增加了調整超參數的負擔.

2 基于域對抗和加性余弦間隔損失的無監督域適應方法

為了解決將域適應方法應用在死亡風險預測任務上時遇到的困難以及相關工作的不足,本文提出了一種基于域對抗和加性余弦間隔損失的無監督域適應方法AMS -ADA.該方法在沒有目的域樣本標簽的情況下,利用源域帶標簽的數據和目的域不帶標簽的數據進行訓練,提升模型在目的域的準確度.該方法主要由特征提取器G、域判別器D和加性余弦間隔損失分類器C組成,其架構圖如圖3所示,源域和目的域數據流向分別用實線和虛線的箭頭表示.

Fig. 3 Overall architecture圖3 整體架構

2.1 問題定義

本文的研究目的是將無監督域適應方法應用在重癥監護病人死亡風險預測任務上.在重癥監護室內各種醫療設備每隔一段時間記錄下病人的各項生命體征,這些記錄可以自然地視為時序數據.

2.2 特征提取

特征提取器負責從輸入數據提取有效的高級特征.為了應對時序數據的復雜性和多樣性所帶來的困難,本文選取了帶有注意力機制的雙向長短程記憶網絡作為特征提取器.其中雙向長短時記憶網絡(bidirectional long short term memory, BiLSTM)作為嵌入層,對輸入的特征進行初步的提取,捕捉基本的時序信息.嵌入層將輸入x∈m×d變成輸出H∈u×d,即每個時間步的特征維度從m變為u,并且包含了上下文的信息.

為了更好地提取時序信息,本文使用了自注意力機制[21],對嵌入層輸出的每一個時間步計算注意力值ai,i=1,2,…,d,再根據注意力值對所有時間步進行加權求和.注意力機制能夠使得深度學習模型更關注重要的時間步,從而能夠提取出表現力更強的特征.

記W1∈na×u,W2∈r×na為參數矩陣,na為計算注意力的隱層向量維度,r為注意力頭的個數.Softmax操作對每個行向量進行,目的是使得每個時間步的注意力值的和為1.注意力矩陣A∈r×d的計算方式表示為

A=Softmax(W2tanh(W1H)).

(1)

最后,注意力層的輸出即為整個特征提取器的輸出G(x)∈r×u,表示為

M=AHT.

(2)

2.3 域對抗

域判別器的作用是以域對抗的形式進行域適應,學習到域不變的特征,試圖解決整體數據分布偏移的問題.域對抗借鑒了生成對抗網絡的思想,使特征提取器和域判別器之間相互競爭,當域判別器無法辨別特征來自源于還是目的域時,特征提取器學會了如何提取域不變的特征.

記源域和目的域的概率分布為p(Xs)和p(Xt),域判別器D的優化目標可以表達為

(3)

特征提取器G的優化目標可表示為

(4)

特征提取器和域判別器的優化目標可以結合在一起,寫成極小極大的優化形式:

(5)

特征提取器和域判別器都是深度學習模型,在實踐中通常以梯度下降最小化損失函數的形式進行優化.記特征提取器和域判別器的模型參數為θG和θD,域判別器的損失函數Ldisc(θG,θD)可以寫為

(6)

在對抗訓練的過程中,特征提取器和域判別器的優化是交替進行的,形式化地表達為

(7)

以域對抗的方式進行域適應,能夠利用生成對抗網絡強大的擬合數據分布的能力,更好地提取出域不變的特征.

2.4 加性余弦間隔損失分類器

加性余弦間隔(additive margin softmax, AM-Softmax)損失引入了度量學習的思想,能夠增強不同類別的樣本之間的可區分性.它作為最終的分類損失函數,能夠同時端到端地最小化類內距離和最大化類間距離,不需要再耗費時間去選取深度學習模型中哪一層的特征作為優化目標.相比于三元組損失函數,它不需要額外計算樣本對之間的距離,節省了訓練所需時間.此外,在角度空間端到端地對類內距離和類間距離進行優化相比于三元組損失對隱層向量進行優化能取得更好的效果.接下來以對Softmax損失進行改進的形式介紹加性余弦間隔損失的動機和原理.

記n為當前批次訓練樣本的數量,yi為樣本xi的類別標簽,共有c類.Ⅱ(·)為示性函數,當括號內表達式為真時其值為1,當表達式為假時其值為0.p(j|xi)為模型給出的樣本xi屬于第j類的概率.Softmax損失函數LS可以寫為

(8)

記樣本xi對在深度學習模型中最后一層的輸入為fi,W為最后一層的權重矩陣,Wj為權重矩陣中對應輸出類別j的行向量.省略偏置項,Softmax損失函數進一步寫為

(9)

記fi與Wj的夾角為cosθi,j,對權重矩陣和輸入進行歸一化,即令‖fi‖=1,‖Wj‖=1.記縮放值為η,Softmax函數可以用余弦值來表示:

(10)

將向量內積寫成夾角的形式,使得對決策邊界的分析從歐氏空間轉變為角度空間.現在以二分類的場景對決策邊界進行分析,如圖4所示.此時類別數c=2.當cosθi,0>cosθi,1時,樣本xi被判定為c0類.同理,當cosθi,1>cosθi,0時,樣本xi被判定為c1類.當前情況下,Softmax損失能夠為不同類別劃分清晰的界限,但是沒有顯式地優化類間的離散度度以及類內的聚合度.為了增加決策邊界的寬度,引入邊界閾值m.現在對決策邊界施加更加嚴格的要求,當cosθi,0-m>cosθi,1時,樣本xi被判定為c0類,當cosθi,1-m>cosθi,0時,樣本xi被判定為c1類.將二分類的情況推廣為多分類便可得到加性余弦間隔損失.記特征提取器和分類器的參數分別為θG和θC,加性余弦間隔損失LAMS(θG,θC)形式化地表達為

(11)

Fig. 4 Comparison between AM-Softmax Loss and Softmax Loss圖4 加性余弦間隔損失和Softmax損失的對比

對決策邊界施加的限制能夠在角度空間最大化分類器的決策邊界,從而達到最小化類內距離和最大化類間距離的目的.

2.5 訓練流程

本文提出的方法含有可訓練參數的部分為特征提取器、域判別器和分類器,其參數分別記為θG,θD,θC.由式(6)和式(11)可得最終的損失函數L(θG,θC,θD):

L(θG,θC,θD)=LAMS(θG,θC)-λLdisc(θG,θD),

(12)

其中λ為平衡因子,調節LAMS和Ldisc的比例.

本文提出方法的詳細訓練流程如AMS-ADA算法所示.首先對特征提取器、域判別器和分類器的參數進行隨機的初始化.訓練過程中對這些參數以梯度下降的形式進行交替優化.本文選用深度學習領域中常用的Adam優化器完成梯度下降的任務.在對抗訓練的每次迭代的過程中,為了使得域判別器能夠更好地指導特征提取器生成域不變的特征,需要增加域判別器的更新次數,即域判別器更新Ndisc次之后,特征提取器和分類器才更新一次.域判別器的更新是指計算Ldisc(θG,θD)后通過反向傳播更新域判別器的參數.特征提取器和分類器的更新也是類似地計算各自的損失函數后通過反向傳播對參數進行更新.當損失函數收斂之后,得到訓練好的模型.此時將目的域的數據輸入模型,得到最終的預測值.

算法1.基于域對抗和加性余弦間隔損失的無監督域適應方法.

① 隨機初始化θG,θD,θC;

② repeat

③ fori=1,2,…,Ndiscdo

④ 根據式(6)計算Ldisc(θG,θD);

⑥ end for

⑦ 根據式(12)計算L(θG,θC,θD);

⑩ until模型參數收斂

3 實 驗

本文選用MIMIC-Ⅲ數據集[22]進行實驗.MIMIC-Ⅲ數據集是麻省理工大學維護的公共臨床數據庫,包含2001—2016年之間約6萬例的住院記錄,每條記錄包括人口統計特征、醫療干預記錄、成像報告、生命體征記錄、護理記錄等信息.

Harutyunyan等人[2]在MIMIC-Ⅲ數據集的基礎上定義了死亡風險預測任務.一般來說,患者進入重癥監護室后的48 h以內的情況較為危急,因此本文選取患者進入重癥監護室之后的48 h以內的數據對患者的存活結果進行預測.

根據Harutyunyan等人[2]的工作,本文在MIMIC-Ⅲ數據集中提取了76維的特征,包括心率(heart rate)、舒張壓(systolic blood pressure)、收縮壓(diastolic blood pressure)、血氧飽和度(SpO2)、毛細血管填充率(capillary refill rate)等60維的連續特征和格拉斯哥昏迷指數(Glasgow coma scale)等12維的離散特征以及4維的關于患者信息的常量.經過數據清洗和預處理后,最終得到的輸入數據共有48個時間步,每個時間步有76維的特征.

Purushotham等人[23]嘗試在不同年齡段的急性低氧性呼吸衰竭患者之間進行了遷移學習.本文沿用了該文的實驗設置,將MIMIC-Ⅲ數據集的ICU數據庫中所有患者按照年齡分為4組,如表1所示:

Table 1 Different Domains of MIMIC-Ⅲ Dataset表1 MIMIC-Ⅲ數據集不同域的劃分

由于數據集中的正負樣本比例相差較大,且屬于二分類問題,為了避免正負樣本不均衡對評價指標帶來的影響,本次實驗采用ROC曲線(receiver operating characteristic curve)下的面積值(area under curve, AUC)作為評價標準.本文采用了5種方法與本文提出的AMS-ADA方法進行對比:

1) BiLSTM.使用結合自注意力機制的BiLSTM網絡作為基線,在源域上訓練,在目的域上測試,沒有使用任何無監督域適應學習方法.

2) CORAL.使用結合自注意力機制的BiLSTM網絡提取特征,采用基于特征映射的遷移學習方法Deep CORAL[16].該方法以CORAL距離衡量源域特征分布和目的域特征分布的差異.

3) DAN.使用結合自注意力機制的BiLSTM網絡提取特征,采用基于特征映射的遷移學習方法DAN[15].該方法以最大均值差異衡量源域特征分布和目的域特征分布的差異.

4) ADA(adversarial domain adaptation).與1)~3)所述方法采用相同的特征提取器,并且使用了域對抗方法,使用Softmax損失函數.

5) Tri-ADA(triplet loss guided adversarial domain adaptation)[19].與1)~4)所述方法使用相同的特征提取器.使用了域對抗方法.并且在此基礎上加上三元組損失函數,以解決類別之間的數據分布偏移的問題.

本文在4個不同年齡段,即4個域之間兩兩進行無監督域適應任務,實驗結果如表2所示.例如將青年患者的數據作為源域,將中年患者的數據作為目的域,無監督域適應任務記為青年→中年.

Table 2 Experimental Results of Mortality Prediction Task Based on Unsupervised Domain Adaptation表2 基于無監督域適應的死亡風險預測實驗結果

本文提出的AMS-ADA方法在12個無監督域適應任務中的10個取得了最高的AUC值,說明了該方法的有效性.BiLSTM方法沒有使用任何無監督域適應方法,因此表現較差.對于相隔較遠的域,BiLSTM方法的表現下降較為明顯.比如對于任務中年→青年,BiLSTM方法的AUC值為0.867,而對于任務中年→高齡老年,BiLSTM方法的AUC值下降為0.754.相隔較遠的域意味著年齡相隔較大,數據的分布差異更為顯著,因此對模型的準確度影響較大.CORAL方法和DAN方法使用了基于特征映射的遷移方法嘗試解決全局的數據分布差異的問題,從結果上可以看出這2種方法相比BiLSTM方法有一定的提升.ADA方法引入了域對抗,相比于基于特征映射的方法能夠更好地減少全局的數據分布差異,因此效果更好.Tri-ADA以域對抗的形式進行域適應,并且加入了三元組損失以減少類別之間的數據分布差異.實驗結果較之CORAL和DAN方法有了一定的提升.為了更精細地對齊類別之間的數據分布,本文提出的AMS-ADA方法引入了加性余弦間隔損失,相比ADA方法和Tri-ADA方法的準確度有了進一步的提升,說明了本文提出方法的有效性.

為了直觀體現本文提出方法的優越性,分別訓練BiLSTM,Tri-ADA,AMS-ADA這3種方法,取各個方法的分類器的最后一層輸出特征投影到角度空間進行可視化.選取青年患者的數據作為源域,高齡老年患者的數據作為目的域.BiLSTM方法的源域和目的域特征可視化結果分別如圖5和圖6所示.BiLSTM方法在目的域的準確度下降,其原因之一是類別之間的分布偏移.在源域訓練時,不同類別的特征之間具有明顯的界限.但是決策邊界不夠寬,在目的域測試時由于分布偏移導致分類錯誤.

Fig. 5 Source domain feature visualization of BiLSTM method圖5 BiLSTM方法的源域特征可視化

Fig. 6 Target domain feature visualization of BiLSTM method圖6 BiLSTM方法的目的域特征可視化

因此,模型應該顯式地增大決策邊界,保持類內緊湊性和類間可分離性.Tri-ADA方法的源域和目的域特征可視化結果分別如圖7和圖8所示.Tri-ADA方法在源域訓練時以三元組損失的形式增大了類間距離,因此在目的域測試時不同類別的特征之間可分離性加強,從而降低了錯誤率.

Fig. 7 Source domain feature visualization of Tri-ADA method圖7 Tri-ADA方法的源域特征可視化

Fig. 8 Target domain feature visualization of Tri-ADA method圖8 Tri-ADA方法的目的域特征可視化

AMS-ADA方法引入了AM-Softmax損失函數,能夠進一步在角度空間增加決策邊界的寬度,其源域和目的域特征可視化結果分別如圖9和圖10所示.存活患者的特征與死亡患者的特征的重疊部分進一步縮小,取得了很好的類間可分離性和類內緊湊性.得益于更寬的決策邊界,在源域上訓練的分類器對類別偏移的敏感程度下降,因此在目的域上測試時能夠取得更好的準確度.

Fig. 9 Source domain feature visualization of AMS-ADA method圖9 AMS-ADA方法的源域特征可視化

Fig. 10 Target domain feature visualization of AMS-ADA method圖10 AMS-ADA方法的目的域特征可視化

4 結束語

深度學習模型的實際應用中容易遇到訓練數據不足、整體數據分布偏移和類別之間數據分布偏移的問題.本文提出了一種基于域對抗和加性余弦間隔損失的無監督域適應方法應對這些問題.本文以域對抗的形式減少了整體數據之間數據分布偏移.為了進一步改善無監督域適應的效果,引入度量學習的思想,以最小化加性余弦間隔損失的形式減少了類別之間的數據分布偏移.所提出的方法在重癥監護病人死亡風險預測任務上進行了驗證,在MIMIC-Ⅲ數據集上的實驗結果和可視化分析結果證明了該方法的有效性.未來的工作會嘗試將所提出方法擴展到醫療領域的其他任務中,例如疾病預測和住院時長預測等任務.

作者貢獻聲明:蔡德潤提出算法思路、完成實驗并撰寫論文;李紅燕提出了指導意見并修改論文.

猜你喜歡
特征提取特征方法
如何表達“特征”
基于Gazebo仿真環境的ORB特征提取與比對的研究
電子制作(2019年15期)2019-08-27 01:12:00
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
一種基于LBP 特征提取和稀疏表示的肝病識別算法
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
基于MED和循環域解調的多故障特征提取
線性代數的應用特征
河南科技(2014年23期)2014-02-27 14:19:15
主站蜘蛛池模板: 亚洲欧美成人在线视频| 国产乱码精品一区二区三区中文 | 亚洲高清日韩heyzo| 亚洲高清无在码在线无弹窗| 热久久这里是精品6免费观看| 亚洲欧美国产视频| 久草中文网| 中文毛片无遮挡播放免费| 九九线精品视频在线观看| 99伊人精品| 青青久视频| 欧美日本在线观看| 人妻中文久热无码丝袜| 欧美性久久久久| 国产精品无码久久久久AV| 免费国产高清视频| 色综合激情网| 欧美精品色视频| 国产欧美日韩在线在线不卡视频| 亚洲色精品国产一区二区三区| 五月婷婷精品| 国产精品林美惠子在线播放| 浮力影院国产第一页| 中国成人在线视频| 手机精品福利在线观看| 亚洲午夜福利精品无码| 日韩精品成人在线| 2020国产在线视精品在| 亚洲性日韩精品一区二区| 国产超薄肉色丝袜网站| 国产黄在线观看| 久久一级电影| 国产毛片网站| 在线观看国产精品一区| 亚洲男人的天堂久久香蕉| 男人天堂伊人网| 成年女人a毛片免费视频| 欧美综合区自拍亚洲综合绿色| 少妇露出福利视频| 国产精品免费露脸视频| 亚洲色图欧美一区| 一级毛片免费播放视频| 男女猛烈无遮挡午夜视频| 久久免费精品琪琪| 波多野结衣国产精品| 55夜色66夜色国产精品视频| 99久久精品免费看国产免费软件 | 狼友视频一区二区三区| 日韩a级毛片| 免费一级全黄少妇性色生活片| 亚洲精品无码专区在线观看| 2020最新国产精品视频| 91精品专区| 五月婷婷亚洲综合| 免费亚洲成人| 曰韩人妻一区二区三区| 国产欧美日韩在线一区| 奇米影视狠狠精品7777| 国产欧美日韩另类| 中文字幕永久视频| 国产精品毛片一区视频播| 孕妇高潮太爽了在线观看免费| 亚洲另类第一页| 欧美在线三级| 欧美成人精品一区二区| 色哟哟色院91精品网站| 亚洲欧洲自拍拍偷午夜色| 日韩天堂视频| 亚洲第一精品福利| 99视频在线观看免费| 亚洲午夜福利精品无码不卡| 一级毛片在线免费视频| 一级毛片在线播放免费观看| 无码专区国产精品第一页| 免费无码又爽又黄又刺激网站| 国产精品视频系列专区| 成人免费午夜视频| 欧美激情综合一区二区| 毛片基地美国正在播放亚洲 | 伊人久热这里只有精品视频99| 国产免费高清无需播放器| 欧美人与牲动交a欧美精品|