999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于異構圖卷積網絡的藥物-細胞系響應預測

2023-05-24 09:29:18郭帥旗閆效鶯
智能計算機與應用 2023年5期
關鍵詞:特征

郭帥旗,閆效鶯

(西安石油大學 計算機學院,西安 710065)

0 引言

近年來,卷積神經網絡(Convolution Neural Network,CNN)在圖像處理、機器視覺和自然語言處理等領域均取得了較好的應用。但隨著大量非結構化圖數據,如交通網絡、社交網絡和生物信息學領域中蛋白質作用關系網絡(PPI)等的出現,圖卷積神經網絡(Graph Convolution Network,GCN)應運而生,并迅速發展,已成為圖表示學習的重要方法之一。

隨著健康理念的發展,精準醫療已成為疾病診療的方向,如何在分子水平上精確測定個體病人對藥物治療的響應情況,是精準醫療的基礎和關鍵。然而,對個體病人進行大量藥物臨床試驗是不可行的,因此需要建立模型,預測藥物對個體疾病的敏感性響應關系。隨著高通量測序技術的發展,藥物敏感性數據庫,如NCI-60 數據[1]、癌癥細胞系百科全書(CCLE)[2]和癌癥藥物敏感性基因組學數據庫(GDSC)[3]等相繼發布,這些數據庫中整合收錄了大量細胞系與藥物之間的敏感性關系數據。基于此,近些年國內外學者提出了許多藥物-細胞系響應的預測方法。這些方法大致可分為基于回歸模型[4]、基于網絡推斷[5]、基于矩陣分解[6]和基于深度學習[7]的預測方法等等。如:Iorio 等人[4]通過彈性網絡和LASSO 構建基因表達值與響應值之間的回歸預測模型,但其缺點是忽略了藥物的相關信息;Yang 等人[5]利用網絡表示學習提取特征,并采用SVM 預測藥物響應關系(NRL2DRP);Stanfield 等人[8]提出基于異構網絡的帶重啟隨機游走算法預測藥物敏感性響應(HRWR);Yan 等人[6]提出一種具有可解釋性的三矩陣分解方法,預測藥物敏感性響應(TMF);Li 等人[9]提出一種應用堆疊的深度自動編碼器方法預測藥物敏感性響應(DeepDSC)。

雖然上述算法已極大推動了藥物-細胞系作用關系預測的研究,但預測精度仍有很大的提升空間。特別是近幾年圖神經網絡的出現,已成功應用于藥物-靶蛋白,藥物-藥物作用關系預測等生物信息學相關問題研究[10-11]之中。考慮藥物-細胞系敏感關系中網絡節點的異質性,本文對適用于同構網絡的GCN 算法進行改進,提出了一種新的基于異構圖卷積網絡和深度神經網絡的藥物-細胞系響應預測方法(HGCNDCP)。該方法首先分別計算藥物相似性和細胞系相似性,并融合藥物相似性特征、細胞系相似性特征以及藥物-細胞系響應關系,構建異構網絡;然后在異構網絡上使用圖卷積操作,通過不斷聚合鄰居節點特征,可同時捕獲異構圖網絡的拓撲結構特征和節點特征,得到藥物和細胞系兩類對象的特征表示數據,最后使用深度神經網絡(DNN)預測藥物-細胞系響應關系,并在GDSC 數據集中對算法進行驗證。

1 基于異構圖卷積網絡的預測方法HGCNDCP

1.1 圖卷積網絡GCN

GCN 是CNN 算法在圖數據領域應用的產物。GCN 模型可用于捕獲非歐氏空間中存在的復雜網絡關系及對象(或實體)間的各種依賴關系。該模型通過不斷聚合鄰居節點信息,來更新自身節點特征,可同時獲捕圖結構拓撲特征和節點特征。因此,GCN 可從原始圖數據和節點特征中,更好地進行特征表示與學習。基于同構圖的GCN 模型定義如下:

給定圖G =(V,E),其中V是n個節點的集合,E是節點之間邊的集合;對應的鄰接矩陣記作A,其元素aij代表節點vi與vj之間的連接關系,節點特征矩陣記為X∈Rn×p;一 階GCN 模型定義為為歸一化的鄰接矩陣,Hl、Wl分別為l 層的節點表示和映射權重矩陣。

1.2 異構網絡構建

1.2.1 構建藥物相似性矩陣

藥物特征描述符主要包括化學結構描述符、分子指紋等。本文采用Pubchem 數據庫中記錄的藥物分子指紋描述符[6],將藥物表示為881 維的子結構特征。因此,藥物特征矩陣可表示為Fd∈RN×p,p =881,N為藥物數目。其中,藥物di的特征記為=[si1,…,sil,…,sip]。若第l個子結構特征在藥物di中存在sil =1,否則sil =0。由于具有相似化學結構的藥物在細胞系中表現出相似的反應,在此使用Jaccard 系數計算藥物結構相似性,其公式如下:

1.2.2 構建細胞系相似性矩陣

對于細胞系的基因表達譜數據來說,每個細胞系均包含16 383個基因的表達值,因此細胞系的特征矩陣可表示為Fc∈RM×q、q =16 383,M為細胞系數目,其中細胞系ci的特征記為fci =[gi1,…,gil,…,giq],gil表示第l個基因在細胞系ci中的表達值。由于具有相似基因表達譜的細胞系會表現出相似的藥物反應。本文使用皮爾遜相關系數計算細胞系之間的相似性,公式如下:

1.2.3 藥物-細胞系響應關系網絡

已知的藥物-細胞系響應關系可以表示為二分圖G =(V,E),其中V ={Vc,Vd}表示藥物和細胞系兩類節點,E表示藥物與細胞系之間已知的IC50 響應值。本文使用Iorio 等人[12]提供的閾值,將已觀察響應值劃分為敏感性和耐藥性兩類。其中,敏感響應16 804 個,耐藥響應125 647 個,未知響應33 595個,由此構建鄰接矩陣為Acd。

由藥物相似性矩陣、細胞系相似性矩陣和藥物-細胞系響應關系構建形成的異構網絡模型如圖1 所示。

圖1 藥物-細胞系響應異構網絡Fig.1 Drug-cell line heterogeneous network model

1.3 基于異構圖卷積的藥物-細胞系響應預測算法

基于異構圖卷積的藥物-細胞系響應預測模型如圖2 所示,算法實現步驟如下:

圖2 HGCNDCP 網絡模型圖Fig.2 The flowchart of HGCNDCP pipeline

Input:藥物相似性網絡Sd、細胞系相似性網絡Sc、藥物-細胞系二分圖網絡Acd(邊權重“1”和“0”,分別表示敏感性和耐藥性響應類別);

Output:藥物-細胞系響應關系預測得分。

Step 1對Sd、Sc以及Acd按如下方式重構,得到異構網絡鄰接矩陣A和特征矩陣S。

Step 2矩陣歸一化

Step 3基于異構網絡的圖卷積操作,得到藥物和細胞系嵌入特征表示為F':

Step 4特征向量聚合,將藥物嵌入特征和細胞系嵌入特征拼接形成藥物-細胞系對的特征X∈RK×P,K為樣本數,P為樣本特征的維度,見公式(6)。

Step 5構建預測器。使用深度神經網絡(DNN)作為HGCNDCP 的預測器。

其中,Zout和Zk(k =0,…,l)是DNN 模型中對應權重Wout、Wk和偏置bout、bk的隱層神經元,Z0=X。y∈RK×t為K個藥物-細胞系樣本對的預測值。

2 數據來源與實驗方法

本文使用開源的GDSC[3]作為基準數據集,網址為http:/ /www.cancerrxgene.org/,其中包括256 個藥物、1 001 個癌癥細胞系,以及藥物和細胞系的對數變換半抑制濃度值IC50[13]。該值代表要使50%的細胞生長受到抑制所需的藥物濃度,是藥物-細胞系響應的測量值。考慮到實驗的具體進行,需要對GDSC 基準數據集進行篩選、清洗等預處理。經預處理后,本文得到183 種同時具有化學結構特征和藥物反應數據的藥物,962 種同時具有基因組特征和藥物反應數據的細胞系。在這些藥物與細胞系之間,藥物-細胞系響應總共有176 046 個,其中敏感響應16 804 個,耐藥響應125 647,未知響應33 595個。

使用PyCharm 集成開發環境,Pytorch 1.7.1 作為框架。采用文獻[5]的驗證方法,基于上述預處理后的數據集,采用5-CV 交叉驗證方法進行實驗,即將數據隨機分成大致相等的5 份,每一份輪流作為測試樣本,其余4 份做訓練集。對測試集中每個藥物-細胞系對樣本進行預測,并將預測結果與實際標簽進行對比。使用ROC曲線下面積AUC表征模型預測性能。AUC值越大,表示算法性能越好。

3 實驗結果與分析

3.1 損失函數與參數設置

本文算法包括基于異構GCN 的特征表示和DNN 預測器兩部分,其中第一部分的損失函數采用二元加權交叉熵,第二部分采用二元交叉熵,見公式(10)、公式(11)。

公式(10)中,p(aij)為aij的真實標簽,q(aij)=是由異構GCN 生成的兩類節點嵌入特征向量內積計算出的預測概率,Wpos為負樣本與正樣本數目比的權重;公式(11)中,s(aij)是DNN預測的得分值,其值越大表示該樣本呈現敏感性的概率越大,T為類別數量,β為權值衰減系數。式子前一項旨在對所有類別計算平均損失,后一項旨在為權值矩陣和偏置矩陣提供L2 范數約束。兩部分均使用Adam 優化器[14]、ReLU 激活函數和批量歸一化[15]處理。通過尋找損失函數的最小值和最佳精度對參數進行網格搜索。其中,基于異構GCN 的特征表示部分,分別設置嵌入特征數ne ={5,25,50,75,100},并根據式(10)計算訓練損失。由圖3 可見,不同數量的嵌入特征,訓練過程相似,在200 輪訓練之前,損失快速下降,在1 000 輪之后,陸續趨于收斂狀態。其中潛在因子數ne為75和100 時,損失值相差無幾,誤差可縮小至10-3數量級。本文設定ne =100,學習率lr =0.01。DNN 預測器的各層維度分別為[200,128,96,64,2],lr =3.25e-5,衰減系數β =1e-5。

圖3 隱層節點數對異構圖GCN 特征提取的影響Fig.3 Influence of the number of latent factors on the heterogeneous GCN feature extractor

3.2 方法比較

采用5 -CV 交叉驗證方法,將本文算法HGCNDCP 與HNMDRP[16]、HRWR[8]、NRL2DRP[5]和TMF[6]算法進行比較。數據集中敏感性數據為正樣本,耐藥性為負樣本。ROC曲線下面積AUC結果詳見表1。

表1 算法性能比較結果Tab.1 Performance comparison

由表1 可見,HGCNDCP 的AUC值比HNMDRP提高了20.97%、比HRWR[8]算法提高了10.14%、比NRL2DRP 提高了16.06%、比TMF 提高了12.32%,證明HGCNDCP 具有更優的預測性能。

3.3 k-CV 交叉驗證對模型性能的影響

為了評估不同k-CV 對模型性能的影響,本文分別進行2-CV、5-CV 和10-CV 交叉驗證,其對應AUC結果如圖4 所示。

圖4 不同交叉驗證方法下預測性能Fig.4 Prediction performance under different cross validation methods

結果表明,預測精度隨著訓練數據集的增多而增加,10-CV 驗證的訓練數據集大于2-CV 驗證和5-CV 驗證,其AUC值也高于兩者。

4 結束語

為了更高效地預測藥物-細胞系之間的敏感性響應關系,本文在圖卷積神經網絡的基礎上提出了基于異構圖卷積網絡的藥物-細胞系響應預測方法(HGCNDCP)。研究表明:

(1)使用藥物結構分子指紋特征數據、細胞系的基因表達譜數據和藥物-細胞系作用關系數據,對學習藥物、細胞系的特征提取有重要影響。

(2)通過構建異構網絡,使用圖卷積神經網絡,能夠有效地聚合鄰居特征信息,得到較好的藥物和細胞系的表征。

(3)通過使用GDSC 數據集,并與其它算法的一系列實驗比對,HGCNDCP 具有較高的預測精度,能夠較好地預測藥物細胞系響應,從而為藥物細胞系響應預測提供有效的思路和方法。

猜你喜歡
特征
抓住特征巧觀察
離散型隨機變量的分布列與數字特征
具有兩個P’維非線性不可約特征標的非可解群
月震特征及與地震的對比
如何表達“特征”
被k(2≤k≤16)整除的正整數的特征
中等數學(2019年8期)2019-11-25 01:38:14
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
詈語的文化蘊含與現代特征
新聞傳播(2018年11期)2018-08-29 08:15:24
抓住特征巧觀察
基于特征篩選的模型選擇
主站蜘蛛池模板: 亚洲欧洲日韩久久狠狠爱| 亚洲精品动漫| 久久国产香蕉| 欧美在线精品怡红院| 日韩视频免费| 岛国精品一区免费视频在线观看| 欧美国产日韩在线观看| 91亚洲免费| 亚洲黄色成人| 波多野结衣一二三| 91亚洲国产视频| 亚洲成a人片77777在线播放| 92精品国产自产在线观看| 日韩精品亚洲精品第一页| 2022精品国偷自产免费观看| 精品国产成人av免费| 欧美精品成人| 国产黄在线免费观看| 五月婷婷伊人网| 四虎影视库国产精品一区| 婷婷六月在线| 99免费视频观看| 91精品国产91久久久久久三级| 亚洲天堂网在线视频| 欧美日韩精品一区二区视频| 国产精品福利导航| 中文无码毛片又爽又刺激| 亚洲天堂啪啪| 中文精品久久久久国产网址 | 亚洲AV无码一区二区三区牲色| 欧美午夜一区| 精品天海翼一区二区| 亚洲美女一级毛片| 啪啪永久免费av| 思思99热精品在线| 午夜精品区| 中文字幕1区2区| 伊人久久久久久久| 一级毛片在线免费看| 无码 在线 在线| 日韩A∨精品日韩精品无码| 午夜在线不卡| 精品一区二区三区视频免费观看| 欧美日韩国产综合视频在线观看| 露脸真实国语乱在线观看| 国产第二十一页| 天天色天天综合网| 精品無碼一區在線觀看 | 久久婷婷六月| 欧美亚洲国产精品久久蜜芽| 久久无码av三级| 免费无遮挡AV| 亚洲精品国产综合99久久夜夜嗨| 国产精品三级专区| 色欲色欲久久综合网| 99久久人妻精品免费二区| 欧美精品1区| 欧美一区二区三区国产精品| 美女无遮挡免费网站| 成人福利一区二区视频在线| 国产9191精品免费观看| 日韩欧美高清视频| 国产免费精彩视频| 亚洲成a人片| 国产精品第| 亚洲va在线观看| 三上悠亚在线精品二区| 国产精品无码作爱| 在线国产毛片| 性色一区| 国产91九色在线播放| 国产欧美精品午夜在线播放| 国产精品久久久久久搜索| 91在线激情在线观看| 天天色天天综合| 国模极品一区二区三区| 99在线国产| 国产三级国产精品国产普男人| 狠狠综合久久| 国内老司机精品视频在线播出| 国产一区二区三区在线观看视频| 成人欧美日韩|