999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于重啟隨機(jī)游走算法的生物信息學(xué)關(guān)聯(lián)預(yù)測(cè)模型

2021-07-05 12:00:14張銘文劉志豪盧星辰
電子技術(shù)與軟件工程 2021年10期
關(guān)鍵詞:關(guān)聯(lián)語(yǔ)義模型

張銘文 劉志豪 盧星辰

(曲阜師范大學(xué)網(wǎng)絡(luò)空間安全學(xué)院 山東省濟(jì)寧市 273100)

1 引言

miRNA 是在真核生物中發(fā)現(xiàn)的一類內(nèi)源性的具有調(diào)控功能的非編碼 RNA, 其大小長(zhǎng)約 20~25 個(gè)核苷酸。在醫(yī)學(xué)界,研究人員主要利用生物實(shí)驗(yàn)的相關(guān)方法去探究 miRNA 和疾病之間的關(guān)系。但是,生物實(shí)驗(yàn)方法通常具有耗時(shí)長(zhǎng)、費(fèi)用高和盲目性大等缺點(diǎn)。因此,借助預(yù)測(cè)疾病‐miRNA 之間潛在關(guān)聯(lián)的計(jì)算模型,利用各種已經(jīng)驗(yàn)證的生物學(xué)數(shù)據(jù),可以挖掘出二者之間關(guān)聯(lián)概率得分最高的疾病‐miRNA 對(duì),再針對(duì)性地進(jìn)行生物實(shí)驗(yàn),便可以有效降低實(shí)驗(yàn)時(shí)間和實(shí)驗(yàn)成本。因此,探究更為準(zhǔn)確的疾‐miRNA 之間的關(guān)聯(lián)關(guān)系,將不僅有利于人類理解疾病的發(fā)病機(jī)制,為預(yù)防和診治疾病提供新的思路[1],而且可以反哺醫(yī)學(xué)研究,為準(zhǔn)確開展生物實(shí)驗(yàn)提供可靠指引。科學(xué)研究表明,功能相似的 miRNA 在調(diào)控疾病方面也比較相似,反之亦然。通過(guò)測(cè)量相似度的方法來(lái)預(yù)測(cè) miRNA‐疾病的關(guān)聯(lián),作為較早的預(yù)測(cè)思路之一, 現(xiàn)如今依然有著良好的發(fā)展[2‐6]。2009年,Jiang 等人[7]通過(guò)構(gòu)建疾病的表型相似網(wǎng)絡(luò)、miRNA功能相關(guān)網(wǎng)絡(luò) 和疾病的表型‐miRNA 網(wǎng)絡(luò),預(yù)測(cè)得到了疾病‐miRNA之間關(guān)聯(lián)關(guān)系。該方法首次基于miRNA 的相關(guān)信息和疾病的表型信息,構(gòu)建了能夠預(yù)測(cè)疾病和 miRNA 之間關(guān)聯(lián)關(guān)系的網(wǎng)絡(luò)模型,為生物信息學(xué)的未來(lái)研究工作提供了新的思路。然而,該方法也存在一些不足之處,為了改進(jìn)不足之處,Jiang 等人[8]在2010年再次提出了一種融合基因組數(shù)據(jù)的預(yù)測(cè)方法,利用樸素貝葉斯模型實(shí)現(xiàn)了多種來(lái)源數(shù)據(jù)的融合,構(gòu)建了基于基因之間功能關(guān)系的信息模型,實(shí)驗(yàn)取得了較好的預(yù)測(cè)結(jié)果。2013年,在疾病相似性網(wǎng)絡(luò)上,Chen 等人[9]應(yīng)用隨機(jī)游走算法實(shí)現(xiàn)了 miRNA‐疾病關(guān)聯(lián)預(yù)測(cè),此后,Liu 等人[10]融合疾病的語(yǔ)義相似信息、miRNA 的功能相似信息和 miRNA 與疾病之間已知的關(guān)聯(lián)信息,構(gòu) 建了多源異構(gòu)網(wǎng)絡(luò),繼而利用隨機(jī)游走算法預(yù)測(cè)疾病‐miRNA 之間的關(guān)聯(lián)關(guān)系。實(shí)驗(yàn)表明,該方法可以預(yù)測(cè)未知miRNA 關(guān)聯(lián)信息的新疾病。值得介紹的是,多 源異構(gòu)網(wǎng)絡(luò)的應(yīng)用對(duì)后續(xù) miRNA‐疾病關(guān)聯(lián)的預(yù)測(cè)研究具有巨大的借鑒價(jià)值。2018年,Chen 等人[5]提出了一種基于歸納矩陣填充的算法來(lái)預(yù)測(cè) miRNA‐疾病之間的關(guān)聯(lián)。首先利用 miRNA的功能相似性、疾病語(yǔ)義相似性和高斯相似 性來(lái)計(jì)算 miRNA 和疾病各自的集成相似性,然后采用歸納矩陣填充的方法從中歸納出miRNA 和疾病的有效特征信息,并用來(lái)填充 miRNA‐疾病關(guān)聯(lián)矩陣中的缺失信息。2019年,Chen 等人[4]提出一種基于二分異構(gòu)網(wǎng)絡(luò)聯(lián)合近鄰的 miRNA‐疾病關(guān)聯(lián)預(yù)測(cè)算法,根據(jù)網(wǎng)絡(luò)上簡(jiǎn)單路徑的數(shù)量計(jì)算出來(lái) miRNA 和疾病各個(gè)結(jié)點(diǎn)的初始關(guān)聯(lián)分?jǐn)?shù),而疾病和miRNA 各自的次級(jí)空間關(guān)聯(lián)得分則由其自身的相似性 網(wǎng)絡(luò)和初始關(guān)聯(lián)得分計(jì)算得出,最后將二者的次級(jí)空間得分加以整合得到了最終的 miRNA‐疾病關(guān)聯(lián)預(yù)測(cè)得分。2020年,Wang 等人[6]提出了一種基于數(shù)據(jù)融合的miRNA‐疾病關(guān)聯(lián)預(yù)測(cè)算法,通過(guò)將miRNA功能相似性網(wǎng)絡(luò)、基因功能相似性網(wǎng)絡(luò)和疾病語(yǔ)義相似性網(wǎng)絡(luò)融合在一起來(lái)對(duì) miRNA 和疾病之間的關(guān)聯(lián)關(guān)系進(jìn)行預(yù)測(cè),彌補(bǔ)了以往因?yàn)槭褂玫鞍踪|(zhì)之間相互作用網(wǎng)絡(luò)而造成假陽(yáng)性結(jié)果的不足。但以往的研究都忽略了數(shù)據(jù)自身的拓?fù)浣Y(jié)構(gòu),因此本文采用重啟隨機(jī)游走的算法充分挖掘了數(shù)據(jù)的拓?fù)渚W(wǎng)絡(luò)相似性,使得預(yù)測(cè)模型的準(zhǔn)確性得到進(jìn)一步的提高。RWRCMF 模型流程圖如圖1所示。

圖1:RWRCMF 模型流程圖

2 數(shù)據(jù)獲取及預(yù)處理

2.1 已知的miRNA-疾病關(guān)聯(lián)

現(xiàn)有的HMDDv2.0[11]數(shù)據(jù)庫(kù)中包含了383 個(gè)疾病和495 個(gè)miRNA 之間5430 已被驗(yàn)證的關(guān)聯(lián)信息。本文利用5430 個(gè)已知關(guān)聯(lián)構(gòu)建出一個(gè)鄰接矩陣用來(lái)存儲(chǔ)這些數(shù)據(jù),其中n 表示miRNA 的個(gè)數(shù),m 表示疾病的個(gè)數(shù)。經(jīng)實(shí)驗(yàn)驗(yàn)證后的miRNA mi如果和疾病dj有關(guān)聯(lián),則矩陣元素Yij為1,否則為0。

2.2 miRNA的功能相似性

研究發(fā)現(xiàn),那些功能相似性的miRNA 往往更可能與相似的疾病有關(guān)聯(lián),反之亦然[12‐13]。借助Wang 等人[14]的研究,本文得到了miRNA 之間的功能相似性分?jǐn)?shù),并以此為據(jù)構(gòu)造出了miRNA的功能相似性矩陣矩陣中的各個(gè)元素值代表了miRNA mi和mj二者的功能相似性得分。

2.3 疾病語(yǔ)義相似性

本文根據(jù)Wang 等人[14]提出的層級(jí)有向無(wú)環(huán)圖(DAG)計(jì)算得出了疾病的語(yǔ)義相似性。疾病之間的DAG 圖從MeSH 數(shù)據(jù)庫(kù)中下載。DAGd=(d, Td, Ed)表示疾病d 的DAG 圖,其中Td表示疾病的集合,Ed表示DAG 圖中互相連接關(guān)系的結(jié)合。由此,本文將根據(jù)DAG 圖按照以下公式計(jì)算疾病D 的語(yǔ)義值:

其中,DD(d)表示疾病d’對(duì)疾病d 的語(yǔ)義貢獻(xiàn)值,如公式(2)所示,表示語(yǔ)義貢獻(xiàn)因子,由Wang 等人[14]文獻(xiàn)可知=0.5。

因此,根據(jù)兩個(gè)疾病在DAG 圖上重復(fù)越多,則其彼此之間相似性更大的理論假設(shè),本文由公式(3)計(jì)算得到疾病di和dj之間的語(yǔ)義相似性,并構(gòu)建出了疾病的語(yǔ)義相似性矩陣其中矩陣的每個(gè)元素SD(di, dj)表示為疾病di和dj之間的語(yǔ)義相似性得分。

2.4 miRNA和疾病的拓?fù)湎嗨菩?/h3>

為了提高預(yù)測(cè)結(jié)果的準(zhǔn)確性,本文借助公式(4)和(5)在相似網(wǎng)絡(luò)上運(yùn)用重啟隨機(jī)游走算法(RWR)得到了miRNA 和疾病各自的拓?fù)湎嗨菩浴?/p>

在經(jīng)過(guò)數(shù)次迭代后,我們得到了一個(gè)穩(wěn)態(tài)矩陣S∞,當(dāng)Sim 的值為矩陣SM 時(shí),所得的S∞=SRM,表示miRNA 的拓?fù)渚W(wǎng)絡(luò)相似性矩陣;當(dāng)Sim 的值為矩陣SD 時(shí),所得的S∞=SRD,表示疾病的拓?fù)渚W(wǎng)絡(luò)相似性矩陣。

2.5 高斯核相互作用譜相似性

以往許多對(duì)miRNA‐疾病之間關(guān)聯(lián)預(yù)測(cè)的模型都運(yùn)用了高斯核相互作用譜相似性來(lái)度量疾病和miRNA 各自的相似性,并達(dá)到了較好的預(yù)測(cè)結(jié)果,本文用IP(di)和IP(mj)分別表示疾病di和miRNA mj的相互作用譜,并根據(jù)公式(6)計(jì)算疾病di和dj之間的高斯核相互作用譜相似性。

類似的,本文借助公式(7)計(jì)算miRNA mi和mj的高斯核相互作用譜相似性。

其中的核帶寬βm、βd由如下公式定義,和為原始帶寬。

因此,疾病和miRNA 的高斯核相互作用譜相似性分別用矩陣GD、GM 來(lái)表示。

2.6 此疾病語(yǔ)義相似性

根據(jù)上述各種方法完成了miRNA 和疾病相似性度量,并將這些相似性進(jìn)行整合得到了最終的miRNA 相似性和疾病相似性,其中miRNA 的功能相似性矩陣SMM 由公式(10)計(jì)算得來(lái),疾病的語(yǔ)義相似性矩陣SDD 由公式(11)計(jì)算得來(lái),元素SMM(mi, mj)表示miRNA mi和mj的相似性,元素SDD(di, dj)表示疾病di和dj的相似性。

2.7 加權(quán)K近鄰(WKNKN)預(yù)處理

將n 個(gè)miRNA 和m 個(gè)疾病分別用集合M={m1,m2,…mn}和D={d1,d2,…dn}來(lái)表示。已知鄰接矩陣表示現(xiàn)有數(shù)據(jù)庫(kù)中的miRNA 和人類之間的疾病關(guān)聯(lián),但矩陣Y 中的元素過(guò)于稀疏,因此利用加權(quán)K 近鄰(WKNKN)算法對(duì)矩陣Y 進(jìn)行預(yù)處理,使得矩陣中的0 元素會(huì)被一個(gè)0 到1 之間的約數(shù)所替換。WKNKN 的具體步驟如下:

首先,根據(jù)miRNA mq與其他K 個(gè)最近鄰miRNA 的相似性和所對(duì)應(yīng)的K 相互作用關(guān)系,得到下列相互作用譜:

公式中,m1到mk是將與mq相似性進(jìn)行降序排列之后所得的miRNA。表示權(quán)重參數(shù),且mi和mq之間相似的分越高,權(quán)重參數(shù)值越大。是衰減控制項(xiàng),是用來(lái)歸一化的參數(shù)。

同理可得,疾病dp和其K 個(gè)近鄰疾病的相似性以及對(duì)應(yīng)的K相互作用譜,得到了如下疾病作用譜。

二公式中dl到dk是由各自與dp的相似性按照降序排列之后的疾病,表示權(quán)重參數(shù),且dj和dp之間相似性得分越高則權(quán)重就越大。類似的,是歸一化參數(shù)。

最后,將關(guān)聯(lián)矩陣Y 中的0 元素用Ym和Yd的平均值替換下來(lái),并按照公式(12)對(duì)原始矩陣Y 進(jìn)行更新。

3 改進(jìn)協(xié)同矩陣分解

3.1 標(biāo)準(zhǔn)協(xié)同矩陣分解

此Shen 等人[15]將協(xié)同矩陣分解模型用在了miRNA‐疾病關(guān)聯(lián)預(yù)測(cè)問(wèn)題上,并達(dá)到了預(yù)期效果。CMF 目標(biāo)函數(shù)如下:

3.2 基于圖拉普拉斯正則化的協(xié)同矩陣分解

處為了降低數(shù)據(jù)的過(guò)擬合問(wèn)題,提升模型在預(yù)測(cè)miRNA‐疾病關(guān)聯(lián)過(guò)程中的準(zhǔn)確性,本文在原有矩陣分解的基礎(chǔ)上引入圖拉普拉斯正則化,并構(gòu)造出了如下目標(biāo)函數(shù):

3.2.1 初始化A、B

在miRNA‐疾病關(guān)聯(lián)矩陣Y 進(jìn)行預(yù)處理的過(guò)程中,本文采用奇異值分解(SVD)的方式初始化矩陣A、B,過(guò)程如下:

3.2.2 優(yōu)化過(guò)程

本文采用最小二乘法對(duì)矩陣A、B 進(jìn)行迭代求解。首先,將目標(biāo)函數(shù)用L 來(lái)表示,然后令求得更新之后的迭代規(guī)則,此時(shí)A、B 將按如下公式迭代更新直到收斂。

4 實(shí)驗(yàn)結(jié)果分析

4.1 性能評(píng)估

為了進(jìn)一步對(duì)重啟隨機(jī)游走算法改進(jìn)后的協(xié)同矩陣矩陣分解預(yù)測(cè)模型(RWRCMF)進(jìn)行預(yù)測(cè)性能的評(píng)估,本文將RWRCMF 與三個(gè)主流模型ICFMDA[16]、SACMDA[17]、IMCMDA[18]進(jìn)行對(duì)比,模型的評(píng)估標(biāo)準(zhǔn)使用機(jī)器學(xué)習(xí)方法中的五折交叉驗(yàn)證和留一交叉驗(yàn)證。

降根據(jù)留一交叉驗(yàn)證的結(jié)果,本文繪制了對(duì)應(yīng)的接收器操作特性(ROC)曲線,因此可以通過(guò)計(jì)算得出ROC曲線下的面積(AUC值)來(lái)評(píng)估預(yù)測(cè)模型的性能。AUC 值的大小介于0 到1 之間,并且模型的預(yù)測(cè)性能和AUC 值的高低成正比。由圖2 可知,RWRCMF、IMCMDA、ICFMDA 和SACMDA 所對(duì)應(yīng)的AUC 值分別為:0.9506、0.8384、0.9072、和.8777,顯然RWRCMF 預(yù)測(cè)模型在上述方法中獲得了最佳的預(yù)測(cè)表現(xiàn)。

圖2:RWRCMF、IMDMDA、ICFMDA 和SACMDA 的留一交叉驗(yàn)證ROC曲線以及對(duì)應(yīng)的AUC 值

在對(duì)模型的五折交叉驗(yàn)證過(guò)程中,首先將已知的miRNA‐疾病關(guān)聯(lián)樣本任意分成五部分,然后選擇其中的四部分作為模型在學(xué)習(xí)過(guò)程中的訓(xùn)練樣本,余下的作為評(píng)價(jià)模型的測(cè)試樣本。類似于留一交叉驗(yàn)證,所有未知關(guān)聯(lián)的miRNA‐疾病關(guān)聯(lián)樣本來(lái)作為候選樣本。同時(shí)因?yàn)榭紤]到樣本在劃分過(guò)程中因?yàn)殡S機(jī)性而導(dǎo)致的偏差,本文進(jìn)行了100 次的劃分,也就是執(zhí)行了100 次的五折交叉驗(yàn)證,最終得到了各個(gè)模型的ROC 曲線和對(duì)應(yīng)的AUC 值。圖3 結(jié)果表明RWRCMF 模型的預(yù)測(cè)效果最好,其AUC 值為0.9468,而IMCMDA、ICFMDA 和SACMDA 的AUC 值分別為0.8330、0.9046和0.8773。

圖3:RWRCMF、IMDMDA、ICFMDA 和SACMDA 的五折交叉驗(yàn)證ROC曲線以及對(duì)應(yīng)的AUC 值

5 總結(jié)

越來(lái)越多的研究發(fā)現(xiàn)miRNA 的異常表達(dá)影響著人類復(fù)雜疾病的產(chǎn)生和發(fā)展,傳統(tǒng)實(shí)驗(yàn)的方法探究miRNA 和疾病之間的關(guān)聯(lián)有著耗時(shí)長(zhǎng)、成本高的缺點(diǎn),因此開發(fā)更高效的計(jì)算模型用于miRNA‐疾病的潛在關(guān)聯(lián)識(shí)別顯得尤為重要。在本文中,我們提出了一個(gè)基于重啟隨機(jī)游走算法改進(jìn)后的協(xié)同矩陣分解預(yù)測(cè)模型(RWRCMF)用于識(shí)別miRNA‐疾病之間的新關(guān)聯(lián),通過(guò)重啟隨機(jī)游走算法處理疾病和miRNA 的相似性數(shù)據(jù),并整合高斯核譜相似性來(lái)作為最終的數(shù)據(jù)集。借助協(xié)同矩陣分解中的目標(biāo)函數(shù)獲得了miRNA‐疾病的關(guān)聯(lián)得分矩陣,并在實(shí)驗(yàn)評(píng)估環(huán)節(jié)采用留一交叉驗(yàn)證和五折交叉驗(yàn)證橫向?qū)Ρ攘薘WRCMF 與以往模型的預(yù)測(cè)準(zhǔn)確性,證實(shí)了RWRCMF 在miRNA‐疾病關(guān)聯(lián)預(yù)測(cè)方面有著較為出色的表現(xiàn)。

猜你喜歡
關(guān)聯(lián)語(yǔ)義模型
一半模型
“苦”的關(guān)聯(lián)
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
語(yǔ)言與語(yǔ)義
奇趣搭配
智趣
讀者(2017年5期)2017-02-15 18:04:18
3D打印中的模型分割與打包
“上”與“下”語(yǔ)義的不對(duì)稱性及其認(rèn)知闡釋
認(rèn)知范疇模糊與語(yǔ)義模糊
主站蜘蛛池模板: 国产福利在线免费| 欧美www在线观看| 国产真实乱了在线播放| 亚洲综合色区在线播放2019| 国产成人综合久久| 国产一区二区三区在线观看视频| 国产麻豆另类AV| 久久午夜夜伦鲁鲁片无码免费 | 美女被躁出白浆视频播放| 免费A级毛片无码免费视频| 久久久噜噜噜| 亚洲欧美日韩另类在线一| 亚洲av色吊丝无码| 日韩欧美综合在线制服| 国产精品xxx| 亚洲综合精品第一页| 99久久99这里只有免费的精品| 风韵丰满熟妇啪啪区老熟熟女| 欧美无遮挡国产欧美另类| 久久国产乱子伦视频无卡顿| 人妻丰满熟妇AV无码区| 国产女人在线| 亚洲综合第一区| 自慰高潮喷白浆在线观看| 国产成人精品男人的天堂| 精品国产亚洲人成在线| 欧美激情网址| 91亚瑟视频| 国禁国产you女视频网站| 中文字幕 91| 久久综合婷婷| 久久国产免费观看| 免费一级毛片在线播放傲雪网| 97免费在线观看视频| 日韩福利视频导航| 亚洲午夜福利精品无码不卡 | 色婷婷成人| 久久国产亚洲偷自| 极品尤物av美乳在线观看| 熟妇丰满人妻av无码区| 国产精品色婷婷在线观看| 香蕉网久久| 91高清在线视频| 亚洲日产2021三区在线| 精品一区二区久久久久网站| 亚洲AV免费一区二区三区| 国产91精品久久| 国产99欧美精品久久精品久久| 亚洲欧美一区二区三区图片| 99在线观看免费视频| 91小视频在线观看免费版高清| 欧美国产在线精品17p| 亚洲爱婷婷色69堂| 99中文字幕亚洲一区二区| 99精品高清在线播放| 国产H片无码不卡在线视频| 全免费a级毛片免费看不卡| 午夜视频免费试看| 日韩人妻精品一区| 自慰高潮喷白浆在线观看| 成人另类稀缺在线观看| 青青国产视频| 精品国产www| 高清免费毛片| 精品伊人久久久久7777人| 色综合五月婷婷| 国产噜噜在线视频观看| 亚洲免费人成影院| 国产精品专区第1页| 伊人久久福利中文字幕| 亚洲男女天堂| 色婷婷在线播放| 日韩在线观看网站| 欧美人与牲动交a欧美精品| 国产成人啪视频一区二区三区| 国产精品香蕉在线| 欧美中文字幕第一页线路一| 国产真实二区一区在线亚洲| 欧美在线黄| 一级毛片免费不卡在线视频| 91美女视频在线| 国产精品一区在线观看你懂的|