999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于異構(gòu)圖嵌入學(xué)習(xí)的相似病案推薦①

2020-11-13 07:12:30王亦凡李繼云

王亦凡,李繼云

(東華大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,上海 201620)

患者病案包括臨床中患者本人對(duì)自己健康狀況的描述以及醫(yī)療人員對(duì)患者的客觀檢查結(jié)果以及對(duì)患者的病情的分析、診療的記錄.通過比較患者病案的相似程度可以為醫(yī)生提供具有較高可信度的病案參考.隨著醫(yī)院和診所中的臨床病案數(shù)據(jù)的不斷積累,如何充分利用這些記錄是相當(dāng)重要的,許多研究使用臨床醫(yī)療病案來協(xié)助醫(yī)生進(jìn)行臨床決策和預(yù)后[1].

相似病案是包含相同臨床意義的醫(yī)療實(shí)體,具有相似屬性的病人的病案.目前,部分研究將相似病案衡量任務(wù)視作具有不同醫(yī)療實(shí)體的臨床文本多分類問題[2–4].部分研究通過提取病案中的隱藏信息并依據(jù)醫(yī)療代碼進(jìn)行對(duì)齊,以便衡量各個(gè)組成部分的距離[5],從而對(duì)相似病案進(jìn)行度量.這樣的度量有助于精準(zhǔn)醫(yī)療中不同種類的患者細(xì)分[6],作為醫(yī)生診療的參考.在本文中,我們將醫(yī)療實(shí)體定義為與患者治療相關(guān)的醫(yī)療專有名詞.如果某一患者病案中的兩個(gè)醫(yī)療實(shí)體共同出現(xiàn),我們就認(rèn)為這對(duì)醫(yī)療實(shí)體存在某種關(guān)系.我們利用基于異構(gòu)圖嵌入的方法來學(xué)習(xí)病案表示,通過計(jì)算患者病案表示的余弦相似度可以獲取相似病案.

以上的方法通過對(duì)患者病案中的醫(yī)療實(shí)體標(biāo)簽化或者根據(jù)醫(yī)療實(shí)體對(duì)應(yīng)的醫(yī)療代碼進(jìn)行距離度量,但它們丟失了患者病案中的細(xì)節(jié)信息.比如僅保留關(guān)鍵的疾病分類分期分型信息,而丟失了疾病分布位置以及發(fā)展情況這些判斷依據(jù).

醫(yī)療實(shí)體網(wǎng)絡(luò)研究中僅僅考慮了單一醫(yī)療實(shí)體的影響,忽略了同一醫(yī)療實(shí)體在不同患者病案場(chǎng)景下的含義可能不同的問題.在患者病案的場(chǎng)景中,病史中存在某種疾病(病史關(guān)系)和診療中發(fā)現(xiàn)某種疾病(病癥關(guān)系)是截然不同的情況,可能是長(zhǎng)期存在某種病癥,也可能是疾病復(fù)發(fā)導(dǎo)致.

針對(duì)同一醫(yī)療實(shí)體在不同患者病案場(chǎng)景下具有不同含義這一問題,本文提出構(gòu)建基于醫(yī)療實(shí)體和實(shí)體關(guān)系的患者病案異構(gòu)圖嵌入模型.通過學(xué)習(xí)醫(yī)療實(shí)體及其不同類別的關(guān)系表示,提升相似病案的推薦效果.

1 相關(guān)工作

1.1 圖嵌入學(xué)習(xí)

網(wǎng)絡(luò)結(jié)構(gòu)一般包括諸多節(jié)點(diǎn)和邊,用于反映事物之間的復(fù)雜關(guān)系.采用圖嵌入的目的是為了學(xué)習(xí)網(wǎng)絡(luò)中高維向量的低維表示,圖嵌入學(xué)習(xí)主要應(yīng)用于節(jié)點(diǎn)分類和推薦算法等任務(wù)中.網(wǎng)絡(luò)表示學(xué)習(xí)采用低維向量表示網(wǎng)絡(luò)中的節(jié)點(diǎn),盡可能地學(xué)習(xí)網(wǎng)絡(luò)中的潛在信息.傳統(tǒng)的網(wǎng)絡(luò)表示學(xué)習(xí)算法主要關(guān)注于網(wǎng)絡(luò)的結(jié)構(gòu)信息.相關(guān)研究工作包括:DeepWalk[7]使用隨機(jī)游走來學(xué)習(xí)潛在的嵌入,將Word2Vec 算法應(yīng)用于圖中.Node2vec[8]采用通過隨機(jī)游走實(shí)現(xiàn)深度遍歷和廣度遍歷之間的平衡.LINE (Large-scale Information Network Embedding,大規(guī)模信息網(wǎng)絡(luò)嵌入)[9]定義了二階相似度來保持圖的結(jié)構(gòu).GF (Graph Factorization,圖因式分解)[10]將結(jié)點(diǎn)內(nèi)積視作邊權(quán)來優(yōu)化節(jié)點(diǎn)向量,達(dá)到降維的效果.Struc2vec[11]考慮空間結(jié)構(gòu)的相似性.雖然這些算法一步步地完善節(jié)點(diǎn)的潛在結(jié)構(gòu)表示,但僅僅利用網(wǎng)絡(luò)中的結(jié)構(gòu)特點(diǎn),學(xué)習(xí)到表示向量缺乏對(duì)下游任務(wù)的支持與擴(kuò)展.圖嵌入學(xué)習(xí)的結(jié)果對(duì)下游任務(wù)的效果有較大的影響.現(xiàn)實(shí)世界中廣泛存在著異構(gòu)的網(wǎng)絡(luò),包括不同類型的節(jié)點(diǎn)或不同類型的邊.充分利用這些異構(gòu)信息有助于提高表示向量的表征能力.

目前基于異構(gòu)網(wǎng)絡(luò)的算法主要包括基于矩陣分解的方法以及基于神經(jīng)網(wǎng)絡(luò)的方法.CMF (Coordinate Matrix Factorization,坐標(biāo)矩陣分解)[12]通過矩陣分解獲取實(shí)體與類別之間的潛在聯(lián)系,構(gòu)建更多關(guān)系矩陣.KGCN (Knowledge Graph Convolutional Networks,知識(shí)圖卷積網(wǎng)絡(luò))[13]通過圖卷積神經(jīng)網(wǎng)絡(luò)對(duì)物品之間的不同關(guān)系進(jìn)行建模,提高推薦的多樣性.目前異構(gòu)圖的研究主要著眼于不同類型節(jié)點(diǎn)或者不同類型的邊,同時(shí)考慮它們的研究較少.

多數(shù)生物醫(yī)學(xué)網(wǎng)絡(luò)上的圖嵌入學(xué)習(xí)都著眼于藥物[14],蛋白質(zhì)和疾病之間的關(guān)聯(lián).在生物醫(yī)學(xué)領(lǐng)域內(nèi)的圖嵌入研究目前主要基于同種類型的關(guān)系.GameNet[14]將藥物相互作用知識(shí)和患者醫(yī)療記錄進(jìn)行融合,實(shí)現(xiàn)對(duì)藥物組合的推薦.實(shí)際上,醫(yī)療領(lǐng)域內(nèi)醫(yī)療實(shí)體存在不同類型的關(guān)系,而同構(gòu)網(wǎng)絡(luò)學(xué)習(xí)算法不可以直接應(yīng)用于這樣的圖網(wǎng)絡(luò)中.因此,將患者病案引入醫(yī)療網(wǎng)絡(luò),將患者病案與醫(yī)療實(shí)體的不同關(guān)系作為補(bǔ)充信息,可以提升患者病案推薦的效果.

1.2 相似病案

病案數(shù)據(jù)是我國(guó)主要的臨床醫(yī)療數(shù)據(jù)之一.基于醫(yī)療數(shù)據(jù)的相似性比較是醫(yī)療數(shù)據(jù)的預(yù)測(cè)以及預(yù)測(cè)建模中的研究方向之一[1].SimSVM[2]使用與新患者相似的臨床記錄對(duì)化療后的患者的生存情況進(jìn)行分類.標(biāo)準(zhǔn)醫(yī)療編碼如ICD-10 可以用于概念層次的相似度比較,醫(yī)療概念層次模型可以應(yīng)用于判斷住院天數(shù)是否長(zhǎng)期,并且針對(duì)不同年齡層次進(jìn)行住院天數(shù)的細(xì)分[3].在獲取了相似醫(yī)療數(shù)據(jù)后,醫(yī)生就可以進(jìn)行病程的比較,也有助于預(yù)測(cè)和推理等下游任務(wù)[15].雖然這些方法都是基于臨床的診療過程進(jìn)行研究,但是診療過程中由于臨床中存在事件的先后次序,因此數(shù)據(jù)之間存在著依賴關(guān)系,需要考慮此種關(guān)系的影響.

本文將相似度比較按照數(shù)據(jù)抽取及建模方法分為如表1所示的3 種類型,從醫(yī)療數(shù)據(jù)中提取特征,對(duì)醫(yī)療數(shù)據(jù)進(jìn)行距離度量或者學(xué)習(xí)醫(yī)療數(shù)據(jù)的表示.PSF (Patient Similarity evaluation Framework,患者相似度評(píng)估框架)提出了具有臨床意義的患者距離評(píng)價(jià)方法,并將有監(jiān)督方法和無監(jiān)督方法進(jìn)行融合來評(píng)判心力衰竭診斷的結(jié)果[16].PSDML (Patient Similarity Measuring using Deep Metric Learning,基于深度度量學(xué)習(xí)的患者相似度比較)利用ICD-10 編碼來優(yōu)化腦卒中疾病的監(jiān)督距離,并進(jìn)行kNN (k-Nearest Neighbor,k 最近鄰)分類[17].卷積神經(jīng)網(wǎng)絡(luò)可以用于學(xué)習(xí)患者臨床記錄表示[18].

表1 醫(yī)療數(shù)據(jù)相似性比較框架

盡管這些方法在各自的疾病領(lǐng)域內(nèi)具有較大的提升.然而這些方法需要對(duì)不同領(lǐng)域疾病進(jìn)行不同處理[19],并且忽略了現(xiàn)實(shí)世界中醫(yī)療數(shù)據(jù)的依賴性,需要我們對(duì)實(shí)體之間的復(fù)雜關(guān)系進(jìn)行建模,學(xué)習(xí)高維數(shù)據(jù)的表示.

2 問題描述

為了準(zhǔn)確描述面向診療過程的患者病案表示問題,我們對(duì)以下概念進(jìn)行定義.

定義1.患者病案:對(duì)于患者,患者病案可以定義為醫(yī)療實(shí)體以及其關(guān)系的集合Pi=.病案中的醫(yī)療實(shí)體列表經(jīng)過融合函數(shù)就可視作患者的表示.融合函數(shù)可以為簡(jiǎn)單的算數(shù)平均函數(shù)或者使用attention機(jī)制的加權(quán)平均函數(shù).其中e1代表某一醫(yī)療實(shí)體,n代表存在n個(gè)醫(yī)療實(shí)體.

定義2.醫(yī)療實(shí)體:患者病案中存在的具有臨床診療意義的醫(yī)療術(shù)語視作一個(gè)醫(yī)療實(shí)體.

定義3.醫(yī)療實(shí)體的關(guān)系:給定患者病案Pi的病案,假設(shè)存在T={t1,t2,···,tk}代表病案與醫(yī)療實(shí)體的關(guān)系類型,若存在醫(yī)療實(shí)體e,那么該病案與e存在二元關(guān)系t=(Pi,e),t∈T.

根據(jù)以上概念,可以構(gòu)建醫(yī)療實(shí)體網(wǎng)絡(luò),采用圖嵌入算法對(duì)醫(yī)療實(shí)體及其關(guān)系進(jìn)行建模,得到患者病案的低維向量表示,患者病案相似度可以根據(jù)患者病案表示計(jì)算得到.

定義4.患者病案相似度:給定一個(gè)患者病案Pi,可以通過計(jì)算其余患者病案表示和患者病案Pi的余弦相似度,得出該患者病案和其余患者病案的相似度分?jǐn)?shù)列表Si={si,1,si,2,···si,i?1,si,i+1···},其中si,1代表患者病案Pi和患者病案P1的余弦相似度,Si代表患者病案Pi對(duì)應(yīng)的余弦相似度分?jǐn)?shù)集合.

3 病案表示模型

針對(duì)同一醫(yī)療實(shí)體在不同患者病案場(chǎng)景下具有不同含義這一問題,本文在關(guān)系建模中引入病案節(jié)點(diǎn),將病案節(jié)點(diǎn)與臨床醫(yī)療實(shí)體節(jié)點(diǎn)劃分為二部圖,構(gòu)建基于醫(yī)療實(shí)體和實(shí)體關(guān)系的患者病案異構(gòu)圖嵌入模型,如圖1所示.

圖1 基于隨機(jī)游走的病案表示學(xué)習(xí)

本文將患者病案的表示視作醫(yī)療實(shí)體經(jīng)過某種融合函數(shù)的結(jié)果,由于每個(gè)醫(yī)療實(shí)體包含了一個(gè)節(jié)點(diǎn)信息(醫(yī)療實(shí)體)和一些帶有類型屬性的邊(醫(yī)療實(shí)體關(guān)系),我們需要學(xué)習(xí)醫(yī)療實(shí)體及其關(guān)系的表示.

3.1 醫(yī)療實(shí)體表示

醫(yī)療實(shí)體表示可以通過構(gòu)建醫(yī)療實(shí)體的共現(xiàn)來獲取.如圖1(a)圖所示,對(duì)于存在于同一病案的不同醫(yī)療實(shí)體,我們將他們視作共現(xiàn),病案中每個(gè)醫(yī)療實(shí)體兩兩之間包含了共現(xiàn)關(guān)系,可以構(gòu)建出醫(yī)療實(shí)體網(wǎng)絡(luò),如圖1(b)所示.通過隨機(jī)游走的方法獲取醫(yī)療實(shí)體的序列,采用skip-gram 進(jìn)行更新,可以獲得醫(yī)療實(shí)體的表示,如圖1(c)下圖所示.在實(shí)際醫(yī)療場(chǎng)景中,醫(yī)療實(shí)體存在不同含義,本文把不受醫(yī)療場(chǎng)景影響的實(shí)體表示記為醫(yī)療實(shí)體的公共表示,而受到其影響的實(shí)體表示記為基于關(guān)系的實(shí)體表示.為了建模這種醫(yī)療實(shí)體與患者病案的關(guān)系,本文在圖中引入了患者病案節(jié)點(diǎn).

3.2 醫(yī)療實(shí)體與患者病案

引入病案節(jié)點(diǎn)后,病案與醫(yī)療實(shí)體構(gòu)成的醫(yī)療網(wǎng)絡(luò)變?yōu)楫悩?gòu)圖網(wǎng)絡(luò),包含異構(gòu)的節(jié)點(diǎn),即病案節(jié)點(diǎn)與醫(yī)療實(shí)體節(jié)點(diǎn)類型不同,以及異構(gòu)的邊,即兩種節(jié)點(diǎn)之間可以通過不同的關(guān)系連接.醫(yī)療實(shí)體與患者病案的關(guān)系類型不同,我們可以分別為每個(gè)關(guān)系類型學(xué)習(xí)一個(gè)表示,如圖1(c)上圖所示.關(guān)系之間并不是完全獨(dú)立的,因此需要對(duì)相互之間的影響進(jìn)行建模.

對(duì)于每個(gè)醫(yī)療實(shí)體,為每種類型的關(guān)系提出一個(gè)公共表示和基于關(guān)系的表示,如式(1)所示.其中ei,e代表醫(yī)療實(shí)體的公共表示,ei,r代表醫(yī)療實(shí)體關(guān)系的表示.

醫(yī)療實(shí)體的公共表示不受醫(yī)療實(shí)體關(guān)系的類別變化的影響.在異構(gòu)邊條件下,需要分別對(duì)醫(yī)療實(shí)體的關(guān)系表示進(jìn)行學(xué)習(xí),通過聚合鄰居節(jié)點(diǎn)獲取關(guān)系t下的醫(yī)療實(shí)體表示,經(jīng)過k次聚合后,此時(shí)對(duì)應(yīng)的醫(yī)療實(shí)體表示如式(2)所示.

其中,j代表相鄰的節(jié)點(diǎn),N是相鄰節(jié)點(diǎn)的個(gè)數(shù),σ是激活函數(shù),ωk是需要訓(xùn)練的參數(shù).由于我們不知道醫(yī)療實(shí)體關(guān)系的聯(lián)系,利用self-attention 建模不同醫(yī)療實(shí)體關(guān)系之間的權(quán)重,依據(jù)上述公式,醫(yī)療實(shí)體ei基于關(guān)系的表示如式(3)所示.

其中,t為醫(yī)療實(shí)體的關(guān)系類型.對(duì)于任意t類型,隨機(jī)游走序列中的節(jié)點(diǎn)e,假設(shè)它的位置為i,我們將ei?b,···,ei?1,ei+1,···,ei+b視作它的鄰居節(jié)點(diǎn).其中,b是窗口大小的一半.

為了建模異構(gòu)的病案節(jié)點(diǎn)和醫(yī)療實(shí)體節(jié)點(diǎn),我們預(yù)先設(shè)置序列的隨機(jī)游走模式,比如醫(yī)療實(shí)體-病案-醫(yī)療實(shí)體,獲取隨機(jī)游走的轉(zhuǎn)移概率.因此,給定醫(yī)療實(shí)體的序列,我們的目標(biāo)是最小化如式(4)所示的目標(biāo)函數(shù).

對(duì)于每一個(gè)邊,如式(5)所示,由醫(yī)療實(shí)體ei生成醫(yī)療實(shí)體ej的條件概率可利用Softmax 函數(shù)獲得.

其中,e′是醫(yī)療實(shí)體上下文的向量表示.最后,通過負(fù)采樣來近似目標(biāo)函數(shù),如式(6)所示.

其中,σ是Sigmoid 函數(shù),可以表示成σ(x)=1/(1+exp(?x))的形式.

由于我們的模型是基于隨機(jī)游走的方法,假設(shè)我們有T個(gè)關(guān)系類型的子網(wǎng)絡(luò)和E個(gè)節(jié)點(diǎn),模型的時(shí)間復(fù)雜度為O (TE).模型的內(nèi)存復(fù)雜度是O ((d+dt·T)·E).

3.3 患者病案表示

最終我們從醫(yī)療網(wǎng)絡(luò)中可獲取醫(yī)療實(shí)體節(jié)點(diǎn)和患者病案節(jié)點(diǎn)兩類節(jié)點(diǎn)的表示.患者病案表示對(duì)病案中所有醫(yī)療實(shí)體的節(jié)點(diǎn)表示經(jīng)過算術(shù)平均或者加權(quán)平均計(jì)算獲取.如果直接采取患者病案節(jié)點(diǎn)作為患者病案的表示會(huì)丟失醫(yī)療實(shí)體之間的共現(xiàn)信息.此外,采用這種方式,我們不僅可以獲取患者病案的全局表示,還可以根據(jù)不同的醫(yī)療實(shí)體關(guān)系獲取不同醫(yī)療場(chǎng)景下的患者病案表示.由于患者病案是不定長(zhǎng)的醫(yī)療實(shí)體集合.通過融合函數(shù)對(duì)不同醫(yī)療實(shí)體表示進(jìn)行處理,便可以獲取同一維度的患者病案.通過醫(yī)療實(shí)體獲取患者病案表示的公式如式(7)所示.

其中,g函數(shù)可以為簡(jiǎn)單算數(shù)平均或者加權(quán)平均函數(shù).給定一個(gè)患者病案Pi,推薦任務(wù)的目標(biāo)是推薦給醫(yī)生個(gè)有序的病案列表.為了完成這個(gè)任務(wù),對(duì)于患者病案Pi以外的患者病案均計(jì)算出一個(gè)分?jǐn)?shù),這個(gè)分?jǐn)?shù)值是衡量患者病案Pi,和其他患者病案之間的相似度.最后將相似病案推薦給當(dāng)前的患者.患者病案之間的相似度分?jǐn)?shù)定義如式(8)所示.

最后,根據(jù)相似性分?jǐn)?shù)的相對(duì)大小排序,就實(shí)現(xiàn)了基于患者病案表示的相似病案推薦.

圖2 病案表示的建模流程

4 實(shí)驗(yàn)

本節(jié)主要介紹實(shí)驗(yàn),包括實(shí)驗(yàn)的數(shù)據(jù)集、評(píng)測(cè)指標(biāo)、實(shí)驗(yàn)結(jié)果以及結(jié)果分析等多個(gè)方面的內(nèi)容.將未考慮醫(yī)療實(shí)體關(guān)系類型的圖嵌入算法和所提出的方法進(jìn)行對(duì)比.選取圖嵌入算法中具有代表性的方法,包括基于隨機(jī)游走的DeepWalk 算法、基于矩陣因式分解的GF 算法以及基于神經(jīng)網(wǎng)絡(luò)的LINE 算法.

圖2展示了本文提出的患者病案表示方法的建模主要流程.首先,確定醫(yī)療實(shí)體的標(biāo)注標(biāo)準(zhǔn)并進(jìn)行人工標(biāo)注.使用Bi-LSTM-CRF 模型對(duì)數(shù)據(jù)集進(jìn)行訓(xùn)練,以便從病案中提取醫(yī)療實(shí)體.其次,通過圖嵌入算法學(xué)習(xí)患者病案對(duì)應(yīng)的不同種醫(yī)療實(shí)體關(guān)系以及學(xué)習(xí)不同關(guān)系的相互作用.最后,將病案中醫(yī)療實(shí)體列表經(jīng)過融合函數(shù)作為患者病案表示.

4.1 實(shí)驗(yàn)數(shù)據(jù)集

本文的患者病案數(shù)據(jù)是來自于某三甲醫(yī)院的真實(shí)世界數(shù)據(jù).由于真實(shí)世界數(shù)據(jù)并非為了研究而特意收集,存在大量的冗余以及缺失的字段,存在完整性問題,并且難以獲取結(jié)構(gòu)化的數(shù)據(jù)信息,醫(yī)療場(chǎng)景下的患者病案存在大量的醫(yī)療術(shù)語,并且患者病案的表述因人而異.

目前國(guó)內(nèi)針對(duì)患者病案尚沒有通用的框架,難以適應(yīng)不同源的數(shù)據(jù).我們采用命名實(shí)體識(shí)別技術(shù)對(duì)患者病案進(jìn)行信息抽取,便于從自由醫(yī)療文本中獲取醫(yī)療實(shí)體以及其關(guān)系.原始醫(yī)療數(shù)據(jù)消除敏感性信息后,如表2所示.經(jīng)過Bi-LSTM-CRF 模型的訓(xùn)練后,能夠自動(dòng)獲取病案中的醫(yī)療實(shí)體信息.表2中加粗字段為輸出對(duì)應(yīng)的醫(yī)療實(shí)體.

表2 患者病案樣例

首先通過關(guān)鍵字從數(shù)據(jù)中選取乳腺疾病的患者.經(jīng)過人工標(biāo)注,數(shù)據(jù)集中包含1002 個(gè)患者以及285 146個(gè)醫(yī)療實(shí)體.將其中80% 的數(shù)據(jù)作為訓(xùn)練集,20%的數(shù)據(jù)作為測(cè)試集,并設(shè)計(jì)了如表3所示的醫(yī)療實(shí)體分類.

表3 醫(yī)療實(shí)體分類

4.2 評(píng)價(jià)方法

患者最終的臨床診斷可以用來評(píng)價(jià)患者表示學(xué)習(xí)模型的效果.根據(jù)出院的診療結(jié)果以及病理結(jié)果將患者分類.遵循乳腺疾病發(fā)展規(guī)律,依據(jù)診斷的嚴(yán)重程度進(jìn)行劃分.對(duì)于患者病案,本文在實(shí)驗(yàn)中使用ROC 和F1 作為相似任務(wù)中常用的評(píng)價(jià)標(biāo)準(zhǔn).值越高,相似病案的推薦效果更好.本文采用DeepWalk 作為基準(zhǔn)方法,實(shí)驗(yàn)結(jié)果如表4所示.

表4 患者表示學(xué)習(xí)結(jié)果

從實(shí)驗(yàn)結(jié)果可以看出我們的方法對(duì)于患者相似度衡量的結(jié)果優(yōu)于現(xiàn)有的算法,證明了該方法的有效性.

4.3 參數(shù)敏感性

患者病案表示模型中實(shí)驗(yàn)參數(shù)對(duì)實(shí)驗(yàn)結(jié)果有重要的影響,因而需要對(duì)參數(shù)敏感度進(jìn)行分析.本文同時(shí)對(duì)于向量維度、隨機(jī)游走步數(shù)、類型維度對(duì)實(shí)驗(yàn)結(jié)果的影響進(jìn)行探討,并對(duì)實(shí)驗(yàn)結(jié)果的可能因素進(jìn)行分析,實(shí)驗(yàn)結(jié)果如圖3所示.

從圖3中可以看出選擇的參數(shù)均對(duì)結(jié)果有一定的影響.患者病案表示模型基于隨機(jī)游走,因此需要充分考慮對(duì)于隨機(jī)游走過程中的步長(zhǎng)和步數(shù),這里本文選取20 作為步長(zhǎng)和10 作為步數(shù).步數(shù)是對(duì)一個(gè)節(jié)點(diǎn)的不同鄰居進(jìn)行反復(fù)學(xué)習(xí)的數(shù)目,進(jìn)而獲取完整的節(jié)點(diǎn)信息,如果節(jié)點(diǎn)較為稀疏或造成一定的過度學(xué)習(xí).一般來說,步長(zhǎng)越長(zhǎng),可以學(xué)習(xí)到更遠(yuǎn)的結(jié)構(gòu)信息,從而把握全局的結(jié)構(gòu).在實(shí)際中,遠(yuǎn)處鄰居對(duì)節(jié)點(diǎn)表示影響不大,所以步長(zhǎng)不宜設(shè)置過大.由于更大的維度可以容納更多的信息,起初隨著維度的增大可以產(chǎn)生更好的結(jié)果.但是當(dāng)維度到達(dá)某一階段后,對(duì)于結(jié)果產(chǎn)生了負(fù)面的影響,這可能是由于高維信息增加了模型的復(fù)雜度,并且考慮到高維信息會(huì)導(dǎo)致下游任務(wù)耗費(fèi)更多時(shí)間,因此選擇100 維作為表示維度.對(duì)于類型維度而言,本文設(shè)置其大小為30,增加外部類型信息可以擴(kuò)充信息量,進(jìn)而提高模型的準(zhǔn)確率.但類型維度過高會(huì)造成對(duì)于補(bǔ)充信息的過分依賴,反而忽視了原本的主要表示信息.

圖3 參數(shù)敏感性

5 總結(jié)

本文提出了一種面向醫(yī)生的患者病案推薦算法,通過在醫(yī)療實(shí)體網(wǎng)絡(luò)引入患者病案節(jié)點(diǎn),將患者病案對(duì)應(yīng)的不同種醫(yī)療實(shí)體關(guān)系進(jìn)行建模,通過異構(gòu)圖嵌入方法獲取了在患者病案相似度衡量中更為優(yōu)越的病案表示,最大程度地利用了數(shù)據(jù)當(dāng)中的信息,并基于此實(shí)現(xiàn)了患者病案推薦.本方法在各個(gè)評(píng)價(jià)指標(biāo)上均有上升.在真實(shí)世界中,由于醫(yī)療實(shí)體的數(shù)目繁多,難以全部涵蓋于模型中,因此存在冷啟動(dòng)的問題.下一步,將會(huì)考慮利用時(shí)間因素進(jìn)行建模,對(duì)患者入院后的醫(yī)生的每個(gè)診斷后進(jìn)行在線學(xué)習(xí),提高實(shí)時(shí)性能.

主站蜘蛛池模板: 四虎国产精品永久在线网址| 久久伊人操| 亚洲三级片在线看| 精品三级网站| 欧美高清视频一区二区三区| 久久精品国产精品青草app| 久久精品国产91久久综合麻豆自制 | 一本久道久综合久久鬼色| 欧美激情综合一区二区| 91久久偷偷做嫩草影院电| 国产色婷婷视频在线观看| 日韩视频免费| 少妇露出福利视频| 她的性爱视频| 国产女人喷水视频| 国产香蕉国产精品偷在线观看| 亚洲日本一本dvd高清| 2021国产精品自拍| 久久国产精品电影| 日韩欧美成人高清在线观看| 成人中文在线| 亚洲国产中文欧美在线人成大黄瓜 | av一区二区无码在线| 中文字幕在线不卡视频| 国产精品无码久久久久久| 久久人搡人人玩人妻精品| 久久久久国产一级毛片高清板| 国产成人8x视频一区二区| 婷婷色狠狠干| 国产微拍一区二区三区四区| 国产黄在线观看| 日韩大片免费观看视频播放| 中文字幕久久波多野结衣| 99久久国产综合精品女同| 中文成人在线视频| 精品国产黑色丝袜高跟鞋| 一级爱做片免费观看久久| 激情爆乳一区二区| 伊人色综合久久天天| 美女亚洲一区| 国产乱码精品一区二区三区中文 | a毛片基地免费大全| 精品国产一二三区| 九一九色国产| 丝袜亚洲综合| 在线观看91精品国产剧情免费| 在线播放国产一区| 91外围女在线观看| 亚洲经典在线中文字幕| 色婷婷成人| 日韩高清成人| 8090午夜无码专区| 久久精品嫩草研究院| 色妞www精品视频一级下载| 欧美精品不卡| 亚洲专区一区二区在线观看| 中文字幕乱码二三区免费| 欧美国产菊爆免费观看| 亚洲成人播放| 久久semm亚洲国产| 在线精品视频成人网| 91美女在线| 性视频一区| 456亚洲人成高清在线| 亚洲天堂网在线观看视频| 国产精品主播| 欧美成人一区午夜福利在线| 久久综合五月| 亚洲AV人人澡人人双人| 亚洲女同欧美在线| 欧美成人日韩| 一级片一区| 国产日韩丝袜一二三区| 操操操综合网| 国产精品部在线观看| 国产亚洲成AⅤ人片在线观看| 午夜三级在线| 色网站在线免费观看| 国产福利在线免费| 黄片在线永久| 亚洲综合第一页| 亚洲最大情网站在线观看|