999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

藥物-靶標相互作用預測平臺設計與實現

2023-05-15 07:27:46任浩然鄧博韜李建華孝大宇
現代計算機 2023年5期

任浩然,鄧博韜,李建華,孝大宇

(東北大學醫學與生物信息工程學院, 沈陽 110169)

0 引言

藥物在疾病的預防和治療中發揮著重要作用,不斷開發新的藥物是人類戰勝疾病的必要手段。新藥開發成本高昂,從抽象概念到市場產品,一種新藥研究和開發成本估計為1.61~45.4 億美元[1]。舊藥新用,也稱為藥物重定向,是對現有藥物發現新的適應癥[2]。藥物重定向極大減少了藥物開發的時間與成本,目前已經取得一些突破性的成果。例如,研究發現,傳統的止痛藥阿司匹林具有降低腦卒中復發、預防心肌梗死等功效。

自新冠肺炎疫情暴發以來,藥物重定向成為國內外諸多科學家與研究機構的關注焦點。2022 年7 月25 日,中國國家藥監局應急附條件批準阿茲夫定用于治療普通型新冠肺炎成年患者,這是我國首個國產新冠口服藥,而該藥原本用于治療艾滋病。

利用計算機發現潛在的藥物-靶標相互作用(drug-target interaction,DTI)是藥物重定向的一種重要方法。設計和開發一款藥物-靶標相互作用預測平臺,對相關生物醫學知識的科學普及、學生科研訓練及藥物重定向研發具有重要意義。

1 平臺框架

在藥物重定向的過程中,可以先利用計算機預測出可能的藥物-靶標相互作用,然后在實驗室和臨床驗證這些相互作用的真實性。所設計的藥物重定向平臺將實現篩選潛在藥物-靶標相互作用的功能,為了評估平臺的有效性,需要確定實驗的數據集、數據處理、預測方法、評估標準及測試流程等。預測方法決定著平臺的預測性能,將在第2節專門介紹。

1.1 標準數據集

本平臺采用文獻報道的標準數據集[3],根據藥物-靶標相互作用類型數據集分為Enzyme、IC、GPCR 和NR 四個子集。每個子集中包括藥物名稱、靶標名稱、藥物-靶標相互作用的信息。同時,對于每種藥物計算了該藥物與其他藥物的化學結構相似性(DS_CS),對于每種靶標計算了該靶標與其他靶標的蛋白質序列相似性(TS_Seq)。表1列出了標準數據集中各子集包含的藥物、靶標及相互作用的數量。

表1 藥物-靶標相互作用預測標準數據集

1.2 相似性計算與Logistic變換

目前很多藥物是通過靶標蛋白發揮治療作用的。因此,基于藥物-藥物相似性、靶標蛋白-靶標蛋白相似性及藥物-靶標相互作用可以推測尚未發現的藥物-靶標關聯。除了前述標準數據集中的DS_CS和TS_Seq,基于藥物-靶標相互作用能夠計算出新的藥物相似性和靶標相似性數據。

藥物-靶標相互作用可以視為由0 和1 組成的矩陣。藥物和靶標分別構成矩陣的行和列,如果藥物與靶標相互作用,那么相應的位置為1,否則為0。藥物di與所有靶標的相互作用情況可用一維向量IP(di)表示,靶標ti與所有藥物的相互作用情況可用一維向量IP(ti)表示。

根據向量夾角余弦公式,可得到兩種藥物di和dj的余弦相似性:

同理,可得到兩種靶標ti和tj的余弦相似性:

根據文獻報道的高斯內核方法[4],可以計算兩種藥物di和dj的高斯內核相似性:

其中

類似地,也可以獲得兩種靶標ti和tj的高斯內核相似性:

其中

一般地,設γd′=1,γt′=1,nd表示藥物的數量,nt表示靶標的數量。

最終,獲得3 種藥物相似性數據:DS_CS、DS_Cos和DS_Gauss,以及3種靶標相似性數據:TS_CS、TS_Cos 和TS_Gauss。各種相似性數據值域為[0,1]。表2 列出了從Type1 到Type4 共4種組合類型,不同組合對預測結果的影響將在后文闡述,更復雜的組合可按照相同的思路研究。相似性數據本質上是一個方陣,因此也稱之為相似性矩陣。

表2 藥物和靶標相似性數據的組合

表2 中的第二、三列是DS和TS,可以選擇是否經過Logistic 變換處理,通過對比預測結果,可以確定這種變換的作用。藥物和靶標的Logistic變換如下面公式所示:

其中,C為常數,可以通過交叉驗證確定,本研究取C=-20。為了處理相似性數據為0的情況,設d=log(9999)。

1.3 驗證方法

本平臺采用網絡一致性投影(network consistency projection,NCP)法預測潛在的藥物-靶標關聯[5]。為了評估NCP方法的預測性能,采用5折交叉驗證。將已知的DTI數據隨機分為5份,每次取4 份作為訓練集,剩余的1 份作為驗證集,循環5次,每份都將作一次驗證集。

將預測結果與驗證集比較,可以得到真陽性率和假陽性率,進而繪制接受者操作特性曲線(receiver operating characteristic curve,ROC)。ROC 曲線下的面積為AUC 值,該值越大,性能越好。本文以AUC值作為評估標準。

1.4 預測流程圖

本平臺預測流程如圖1 所示?;谒幬?靶標相互作用可以獲得藥物和靶標的余弦相似性數據和高斯內核相似性數據。將相似性數據組合,獲得4種組合類型。每種類型在實驗時選擇是否采用Logistic 變換。然后,藥物相似性數據進行網絡一致性投影(DNCP),靶標相似性數據進行網絡一致性投影(TNCP),將兩種投影數據合成(DTNCP),獲得預測的藥物-靶標關聯。在每種組合類型下,分別5 折交叉驗證,以AUC值評判預測性能。

圖1 藥物-靶標相互作用平臺預測流程

2 預測方法

每種組合都包含了藥物相似性矩陣DS和靶標相似性矩陣TS。DS中行向量DS(i, :)表示藥物i與其他藥物的相似性,TS中列向量TS(:,j)表示靶標j與其他靶標的相似性。矩陣A表示藥物-靶標相互作用,A中各行表示藥物,各列表示靶標,A(i,:)表示藥物i與各靶標的相互作用信息,A(:,j)表示靶標j與各藥物的相互作用信息。網絡一致性投影預測藥物-靶標關聯分為三步。

第一步,通過藥物相似性,計算藥物i和靶標j之間的關聯值DNCP(i,j):

第二步,通過靶標相似性,計算藥物i和靶標j之間的關聯值TNCP(i,j):

第三步,通過DNCP(i,j)和TNCP(i,j),計算藥物i和靶標j之間的預測關聯值DTNCP(i,j):

在上述公式中,對于向量x,‖x‖表示對x取模運算。當采用Logistic變換時,將公式(9)~(11)中的DS和TS分別替換為從公式(7)和(8)得到的DS_L和TS_L。

3 系統測試與分析

本系統以Matlab為開發和運行環境。Matlab具有強大的矩陣運算能力,適于計算藥物相似性矩陣DS、靶標相似性矩陣TS,并結合藥物-靶標相互作用矩陣A,實現NCP 預測算法。首先,基于原始相似矩陣預測;然后,選擇Logistic變換對原始相似矩陣處理后再進行預測。

3.1 基于原始相似數據的預測

首先,從Type1 到Type4 組合,4 種組合中DS和TS不采用Logistic 變換,對Enzyme、IC、GPCR 和NR 中藥物-靶標相互作用矩陣A進行5折交叉驗證,實驗結果如表3所示。

表3 不同相似性組合預測AUC比較

從表3可見,對于每種標準數據子集,采用余弦相似性的Type1 和Type2 總體優于采用高斯內核相似性的Type3和Type4。Enzyme和IC中包含更多的藥物和靶標,AUC 值高于0.9,GPCR和NR中包含藥物和靶標較少,AUC值低于0.9。

對于每種標準數據子集,Type1對應的AUC值大于Type3的值,意味著僅基于藥物-靶標相互作用數據,余弦相似性變換優于高斯內核相似性變換。例如,GPCR 數據子集中,Type1 的AUC值為0.8992,而Type3 對應的為0.7641,前者比后者高出17.68%。對于每種標準數據子集,Type2 對應的AUC 值均大于Type4 的值,意味著結合藥物化學結構相似性和靶標序列相似性,余弦相似性變換依然優于高斯內核相似性變換。

進一步分析發現,對應每種數據子集,基于藥物-靶標相互作用獲得的藥物相似性和靶標相似性,在分別結合藥物化學結構相似性和靶標序列相似性后,AUC 提高并不明顯,有些反而下降。例如,在Type1 下,IC 對應的AUC 為0.9340,而在Type2 下,AUC 為0.9356,增加很??;對于Enzyme 和GPCR,AUC 反而有所降低。比較Type4 和Type3,IC、GPCR 和NR 的AUC 提高,只有Enzyme 的AUC 值略有降低,表明采用高斯內核相似性變換時,結合藥物化學結構相似性和靶標序列相似性總體上是有利的。

3.2 基于Logistic變換的預測

為了對比分析,4 種組合中DS和TS采用Logistic 變換,對Enzyme、IC、GPCR 和NR 中藥物-靶標相互作用矩陣A進行5 折交叉驗證。Logistic 變換中參數C對結果有影響,為了避免過擬合,實驗中C=-20,實驗結果如表4所示。

表4 不同組合Logistic變換后預測的AUC比較(C=-20)

比較表4 和表3,采用余弦相似性的Type1和Type2,經過Logistic變換后,8個AUC值中的6 個有所增加,Type2 條件下增加更加明顯,2個降低的值出現在GPCR 中Type1、NR 中Type2。NR 中僅包含54 個藥物,26 個靶標,90個相互作用,因數據量小結果不穩定。Type2條件下,GPCR 對應的AUC 增加最多,從0.8854增至0.9222,提高了4.16%。就4 個數據子集平均而言,對應Type1,AUC 值提高0.65%;對應Type2,AUC 值提高了1.78%,后者的增量是前者的近3倍。

在表4 中,采用高斯內核相似性的Type3 和Type4 與相應表3 中的數據比較,Type3 條件下除NR 數據子集外,AUC 值反而降低,而Type4條件下AUC值全部提高??傮w上,對于Type3,4個數據子集AUC值平均降低3.78%;對于Type4,AUC值平均提高了2.00%。

由表4數據可知,對應任意一種標準數據子集,Type2 條件下的AUC 值高于Type1 條件下的,平均提高1.73%。Type4 條件下的AUC 值高于Type3 條件下的,平均提高10.51%。這表明藥物-靶標相互作用矩陣無論采用余弦變換還是高斯內核變換,融合藥物化學結構相似數據DS_CS 和靶標序列相似數據TS_Seq 后,預測性能明顯提高。

3.3 對比分析

從上述分析可見,在Type2 條件下,經過Logistic 變換后NCP 方法性能最高。將NCP 方法與文獻報道的DVM方法比較[6],除NR數據子集外,在其他3 個子集上AUC 值都高于DVM,顯示本方法具有一定的優越性。

表5 NCP與DVM預測結果的AUC比較

4 結語

通過計算方法篩選潛在的藥物-靶標相互作用有利于節約藥物重定向的成本。本研究基于Matlab 語言開發一個藥物-靶標相互作用預測平臺,實驗證明該平臺是穩定、可行的。平臺采用的NCP 預測方法具有一定優越性,對于如何更合理設置各種參數需要深入研究。該平臺基于模塊化思想設計,可靈活替換不同預測方法,快速獲得實驗結果。因此,該平臺的開發對生物醫學知識科普、學生科研訓練和藥物重定向研究都是有益的。

主站蜘蛛池模板: 国产91丝袜在线播放动漫 | 国产美女免费| 制服丝袜亚洲| 又粗又大又爽又紧免费视频| 又爽又大又黄a级毛片在线视频 | 免费一级全黄少妇性色生活片| 在线欧美日韩国产| 久热这里只有精品6| 欧美福利在线| 曰韩人妻一区二区三区| 国产日韩欧美中文| 美女国产在线| 欧美午夜在线视频| 日韩精品成人在线| 尤物精品视频一区二区三区 | 国产精品久久久精品三级| 日韩国产精品无码一区二区三区| 国产激爽爽爽大片在线观看| 国产又黄又硬又粗| 免费欧美一级| 美女裸体18禁网站| 亚洲第一黄片大全| 日本人真淫视频一区二区三区| 毛片一级在线| 色色中文字幕| 国产免费久久精品99re丫丫一| 亚洲欧洲免费视频| 91青青视频| 亚洲va视频| 黄色网址手机国内免费在线观看| 在线不卡免费视频| 天堂av综合网| 午夜国产不卡在线观看视频| 99er精品视频| 久久无码av三级| 99re在线视频观看| 一本大道香蕉中文日本不卡高清二区| 中文字幕va| 视频二区欧美| 亚洲一道AV无码午夜福利| 国产精品亚洲αv天堂无码| 毛片在线区| 一级毛片免费高清视频| 噜噜噜久久| 狠狠色丁香婷婷| 国产精品3p视频| 精品久久香蕉国产线看观看gif| 女同国产精品一区二区| 国产精品私拍在线爆乳| 欧美区一区| 国产日产欧美精品| 永久免费av网站可以直接看的| 午夜一级做a爰片久久毛片| 亚洲中文字幕手机在线第一页| 四虎影视国产精品| 国产福利2021最新在线观看| 在线免费看片a| 精品中文字幕一区在线| 国产精品自在在线午夜| 欧美视频在线不卡| 日韩无码真实干出血视频| 国产另类乱子伦精品免费女| 国产91丝袜在线播放动漫| 国产亚洲视频中文字幕视频| 手机在线免费毛片| 91精品综合| 成人午夜福利视频| 国产日本欧美亚洲精品视| 国产高清在线丝袜精品一区| 久久性视频| 2022国产91精品久久久久久| 香蕉蕉亚亚洲aav综合| 色噜噜在线观看| 一本大道香蕉久中文在线播放| 欧美一区中文字幕| 人妻免费无码不卡视频| 国产在线拍偷自揄观看视频网站| 久操线在视频在线观看| 国产精品亚洲专区一区| 美女一区二区在线观看| 国产高清在线观看91精品| 精品视频在线观看你懂的一区|