999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于網(wǎng)絡(luò)相似性整合算法的lncRNA與miRNA相互作用預(yù)測(cè)研究

2021-07-23 10:18:56丁尉哲吳卷書劉宏生
關(guān)鍵詞:功能方法模型

丁尉哲,南 洋,吳卷書,崔 迪,張 力,2,3,劉宏生,2,3

(1.遼寧大學(xué)生命科學(xué)院;2.遼寧省生物大分子計(jì)算模擬與信息處理工程技術(shù)研究中心;3.遼寧省藥物分子模擬與設(shè)計(jì)工程實(shí)驗(yàn)室,遼寧 沈陽 110036)

lncRNA是一類長(zhǎng)度超過200個(gè)核苷酸的非編碼RNA,可通過多種機(jī)制發(fā)揮其生物學(xué)功能[1]。miRNA是生物體內(nèi)源基因編碼的長(zhǎng)度約為21~25個(gè)核苷酸的非編碼小RNA,主要通過與靶mRNA互補(bǔ)配對(duì)在轉(zhuǎn)錄水平上對(duì)基因的表達(dá)進(jìn)行負(fù)調(diào)控。越來越多研究表明,lncRNA與miRNA的相互作用也共同控制著一些復(fù)雜疾病的生理過程[2-3]。目前已有多種計(jì)算方法用于lncRNA-蛋白質(zhì)相互作用和lncRNA-疾病相互作用預(yù)測(cè),但只有少數(shù)幾個(gè)模型能用于預(yù)測(cè)lncRNA-miRNA相互作用[4]。本研究基于lncRNA和miRNA的序列、功能和表達(dá)譜數(shù)據(jù)及已知的lncRNA-miRNA互作數(shù)據(jù),通過網(wǎng)絡(luò)相似性整合算法,預(yù)測(cè)lncRNA與miRNA互作對(duì)。該研究為lncRNA-miRNA互作預(yù)測(cè)建立了新的方法,同時(shí)也為疾病機(jī)理分析提供了新思路。

1 材料與方法

1.1 材料

1.1.1 lncRNA與miRNA關(guān)聯(lián)數(shù)據(jù) 本研究中l(wèi)ncRNA與miRNA相互作用數(shù)據(jù)來源于lncRNASNP2數(shù)據(jù)庫(kù)(http://bioinfo.life.hust.edu.cn/lncRNASNP#!/)[5]。在刪除無效和重復(fù)的記錄后,共下載了10597條互作數(shù)據(jù),其中包括780種不同類型的lncRNA和275種不同類型的miRNA。

1.1.2 lncRNA和miRNA的序列信息 lncRNA的序列信息來自LNCipedia數(shù)據(jù)庫(kù)(https://Incipedia.org/)[6]。miRNA的序列信息來自miRBase數(shù)據(jù)庫(kù)(http://www.mirbase.org/index.shtml)[7]。在刪除重復(fù)的記錄及無效的序列信息之后,共獲得7263個(gè)相互作用對(duì)。此外,為了更好地驗(yàn)證本研究方法的有效性,進(jìn)一步考慮了表達(dá)譜相似性和功能相似性信息。lncRNA的表達(dá)譜信息和功能注釋信息來自NONCODE數(shù)據(jù)庫(kù)(http://www.noncode.org/)[8]。去除無效和冗余信息后獲得了用于計(jì)算表達(dá)譜的449個(gè)lncRNA和用于計(jì)算功能注釋的264個(gè)lncRNA。此外,在刪除無效和重復(fù)的信息后,在microRNA數(shù)據(jù)庫(kù)(http://www.mirbase.org/)中獲得了230個(gè)miRNA的表達(dá)譜信息,并在miRTarBase 7.0數(shù)據(jù)庫(kù)(http://miRTarBase.mbc.nctu.edu.tw)中獲得272個(gè)miRNA的功能數(shù)據(jù)[9]。

1.2 方法

1.2.1 lncRNA序列相似性的測(cè)定 使用基于字符串匹配的Needleman-Wunsch算法[10]對(duì)lncRNA進(jìn)行序列比對(duì),并將lncRNA序列相似性結(jié)果歸一化到0到1的范圍內(nèi),其中1對(duì)應(yīng)于兩個(gè)lncRNA完全相同,而0則對(duì)應(yīng)于缺少與該序列相關(guān)的相似性信息。具體公式如下:

(1)

其中LR(li,lj)為lncRNAli和lj之間的序列相似性,ns(li,lj)為lncRNA中兩個(gè)比較序列之間的最大匹配數(shù)。

1.2.2 miRNA序列相似性的測(cè)定 miRNA序列之間相似度可由下列公式計(jì)算:

(2)

其中MR(mi,mj)為miRNAmi和mj之間的序列相似性,ns(mi,mj)為miRNA中兩個(gè)比較序列之間的最大匹配數(shù)。

1.2.3 預(yù)測(cè)lncRNA與miRNA關(guān)聯(lián)數(shù)據(jù) 通過引入鄰接矩陣Y可以更好地描述lncRNA-miRNA的關(guān)系。若lncRNAli與miRNAmj相互作用,則矩陣元素Yij為1,否則為0,其中字母l和m分別代表實(shí)驗(yàn)中涉及的lncRNA和miRNA。同時(shí),序列相似性數(shù)據(jù)中矩陣Y的維數(shù)被設(shè)為780×275,而利用表達(dá)譜相似性數(shù)據(jù)和功能相似性數(shù)據(jù)得到的矩陣維數(shù)則分別為449×230和264×272。

1.2.4 NSILMI方法預(yù)測(cè)lncRNA與miRNA相互作用 本研究提出通過整合miRNA和lncRNA的向量空間得分來計(jì)算潛在的lncRNA-miRNA互作得分的方法,命名為:NSILMI(Network Similarity Integration Method for predicting LncRNA-MiRNA Interactions,NSILMI)。在本研究中,主要采用余弦相似度來計(jì)算向量空間得分。

在lncRNA向量空間中,向量VLRi被用來描述lncRNAi與所有l(wèi)ncRNA之間的相似性并由LRi(矩陣LR的第i行)來表示。同樣地,向量VYj被用來描述miRNAj和所有l(wèi)ncRNA之間的相似性并由Yj(矩陣Y的第j列)進(jìn)行表示

VLRi=LRiVLRi=LRi

(3)

VYj=YjVYj=Yj

(4)

lncRNA空間分?jǐn)?shù)被定義為:

(5)

其中VLRi·VYjVLRi·VYj是向量VLRi和VYj的點(diǎn)積,||VLRi||是向量VLRi的范數(shù),||VYj||是向量VYj的范數(shù),而NSILMI_L(i,j)則為向量VLRi和VYj的余弦相似度。當(dāng)VLRi和VYj之間的夾角越小時(shí),向量空間分?jǐn)?shù)NSILMI_L(i,j)就越大。

因此,在lncRNA-lncRNA相似網(wǎng)絡(luò)中,與lncRNAi相關(guān)的lncRNA空間相似性越高,lncRNAi與miRNAj之間的關(guān)聯(lián)相似度就越大。同樣地,與miRNAj相關(guān)的lncRNAs的空間相似性越高,lncRNAi與miRNAj之間的關(guān)聯(lián)相似度也就越大。

而在miRNA向量空間中,向量VMRj被用來表示miRNAj與所有miRNAs之間的相似性并由MRj(矩陣MR的第j列)來表示它。向量VYi則被用來表示lncRNAi與所有miRNAs之間的相似性并由Yi(矩陣Y的第i行)表示

VLRj=LRj

(6)

VYi=Yi

(7)

MiRNA空間分?jǐn)?shù)被定義為

(8)

其中VYi·VMRj是向量VMRj和VYi的點(diǎn)積;||VMRj||是向量VMRj的范數(shù),||VYi||是向量VYi的范數(shù),而NSILMI_M(i,j)則為向量VMRj和VYi的余弦相似度。當(dāng)VMRj和VYi之間的夾角越小時(shí),向量空間得分NSILMI_M(i,j)就越大。

所以,在lncRNA-miRNA相似網(wǎng)絡(luò)中,與lncRNAi相關(guān)的miRNAs空間相似性越高,lncRNAi和miRNAj的關(guān)聯(lián)相似度就越大。同樣地,與miRNAj相關(guān)的miRNAs的空間相似性越高,lncRNAi與miRNAj的關(guān)聯(lián)相似度越大。

1.2.5 整體打分 將lncRNA空間分?jǐn)?shù)和miRNA空間分?jǐn)?shù)集成為

NSILMA(i,j)=α×NSILMA_L(i,j)+(1-α)×NSILMA_M(i,j)

(9)

其中,α是平衡兩個(gè)空間相似性的貢獻(xiàn)的參數(shù),α∈(0,1) ,NSILMI(i,j)是lncRNA i對(duì)miRNA j的預(yù)測(cè)相關(guān)分?jǐn)?shù)。

1.2.6 模型評(píng)估 本研究采用100次重復(fù)的5折交叉驗(yàn)證檢驗(yàn)NSILMI的準(zhǔn)確性。采用ROC (receiver operating characteristic,ROC)曲線和ROC曲線下面積(area under curve,AUC)作為性能指標(biāo)來評(píng)價(jià)NSILMI的預(yù)測(cè)準(zhǔn)確性。一般情況下,AUC值在0.5和1.0之間,AUC值越大,模型越好[11]。

TPR(True Positive Rate)為分類器預(yù)測(cè)的陽性樣本中真陽性樣本的比例,同時(shí)也是ROC曲線的x坐標(biāo)(以Sensitivity表示)。FPR(False Positive Rate)則表示陽性樣本占分類器預(yù)測(cè)的陰性樣本的比例,同時(shí)也是ROC曲線的縱坐標(biāo)(以1-specificity表示)。在本研究中,使用如下公式進(jìn)行計(jì)算

(10)

(11)

其中FP、TP、FN和TN分別是假陽性、真陽性、假陰性和真陰性。之后采用Logistic回歸分類器,將每個(gè)樣本概率設(shè)為正值并通過界定臨界值(0.6)將大于或等于0.6的概率為陽性,小于0.6的概率為陰性。然后通過計(jì)算一組FPR和TPR可以得到平面上相應(yīng)的坐標(biāo)點(diǎn)。最終,隨著臨界值的逐漸降低,越來越多的樣本歸為陽性,但這些陽性也與真陰性混在一起,即TPR和FPR會(huì)同時(shí)增加。而當(dāng)臨界值最大時(shí),對(duì)應(yīng)的坐標(biāo)點(diǎn)為(0,0)。相反,當(dāng)臨界值最小時(shí),對(duì)應(yīng)的坐標(biāo)點(diǎn)則為(1,1)。

2 結(jié)果

2.1 整體打分結(jié)果為了找到合適的值,通過實(shí)驗(yàn)考察了從0.1到1的不同值。圖1顯示,當(dāng)為0.7時(shí),基于序列的NSILMI獲得了最高的預(yù)測(cè)性能。

圖1 不同α值下NSILMI的平均AUC

2.2 NSILMI與文獻(xiàn)中報(bào)道模型的比較為了測(cè)試NSILMI模型的預(yù)測(cè)準(zhǔn)確性,通過計(jì)算AUC值對(duì)NSILMI和其他網(wǎng)絡(luò)預(yù)測(cè)方法的質(zhì)量進(jìn)行了評(píng)估。在本研究中,NSILMI與其他五種方法:LMFNRLMI[12]、NDALMA、LMI-INGI[13]、KATZLDA[14]和CF[15]進(jìn)行了比較。在這些網(wǎng)絡(luò)預(yù)測(cè)方法中,CF是常用的協(xié)同過濾算法。通過挖掘lncRNA已知互作數(shù)據(jù),CF能夠預(yù)測(cè)出與lncRNA顯著相關(guān)的miRNAs,并根據(jù)不同的參數(shù)對(duì)lncRNA組進(jìn)行劃分,以便推薦具有相似參數(shù)選擇的miRNAs。KATZLDA算法則可以合成已知關(guān)系來構(gòu)建異構(gòu)網(wǎng)絡(luò)。其主要利用lncRNA-miRNA關(guān)聯(lián)矩陣構(gòu)建組合網(wǎng)絡(luò),并計(jì)算綜合異構(gòu)網(wǎng)絡(luò)中每個(gè)節(jié)點(diǎn)的數(shù)目和長(zhǎng)度,從而推斷出lncRNA-miRNA對(duì)的得分。

圖2展示了五種方法計(jì)算的AUC值。由圖2可知,NSILMI獲得了更好的AUC值(0.9814),高于LMFNRLMI (0.9554)、NDALMA (0.9255)、LMI-INGI (0.8917)、KATZLDA (0.8253)和CF (0.6713)。因此,與其他方法相比,NSILMI方法在推斷潛在的lncRNA-miRNA相互作用方面擁有更高的精度。

圖2 NSILMI與LMFNRLMI、NDALMA、LMI-INGI、KATZLDA和CF預(yù)測(cè)性能的比較

2.3 不同類型相似度比較為了進(jìn)一步驗(yàn)證NSILMI的有效性和適用性,我們分別使用基于表達(dá)譜相似度和基于功能相似度的數(shù)據(jù)作為測(cè)試集。為了更直觀地比較不同類型相似度計(jì)算的效果,圖3展示了AUC值的比較結(jié)果。

如圖3所示,基于功能相似度和表達(dá)譜相似度計(jì)算的AUC值分別為0.8831和0.8654并低于基于序列相似度的0.9814。因此,雖然基于表達(dá)譜相似度和功能相似度的AUC值低于基于序列相似度的AUC值,但是結(jié)果仍都在0.85以上,這充分證明了我們方法的適用性和優(yōu)越性。

圖3 基于不同相似度的NSILMI預(yù)測(cè)性能的比較

2.4 實(shí)例測(cè)試為了評(píng)估了NSILMI模型預(yù)測(cè)未知lncRNA-miRNA相互作用的能力,使用lncRNASNP2數(shù)據(jù)庫(kù)的更新版本預(yù)測(cè)了新的lncRNA-miRNA互作對(duì)。表1列出了由NSILMI模型預(yù)測(cè)并排名前20個(gè)的lncRNA-miRNA互作對(duì),其中16個(gè)互作對(duì)已被實(shí)驗(yàn)證實(shí)存在。

表1 NSILMI預(yù)測(cè)的前20個(gè)新互作對(duì)及其在預(yù)測(cè)中的排名

3 討論

先前基于miRNAs的研究已經(jīng)證明,miRNAs參與了人類疾病的病理過程并可以作為某些疾病的標(biāo)志物。其中,miR-193b-3p的下調(diào)可能通過介導(dǎo)NCAPG的上調(diào)來促進(jìn)胃癌細(xì)胞的增殖[16]。這些結(jié)果證明了NSILMI模型在預(yù)測(cè)lncRNA-miRNA相互作用的實(shí)用性。盡管仍有部分未被實(shí)驗(yàn)證實(shí),但隨著實(shí)驗(yàn)文獻(xiàn)和數(shù)據(jù)庫(kù)的完善,將會(huì)有越來越多的lncRNA-miRNA互作對(duì)得到證實(shí)。

lncRNA和miRNA在細(xì)胞的生理調(diào)控中發(fā)揮了至關(guān)重要的作用。其中,lncRNA DILC可以在膽囊癌組織中高水平表達(dá),并且與生存預(yù)后有關(guān)[17]。而膀胱癌組織中miR-212的相互作用則與HMGA2密切相關(guān),并能通過靶向調(diào)控HMGA2影響膀胱癌細(xì)胞的增殖、遷移和侵襲能力[18]。

而lncRNA和miRNA的相互作用在一些復(fù)雜疾病中也參與了重要作用。其中LncRNA UCA1通過膠質(zhì)瘤中miR-206/CLOCk軸促進(jìn)了細(xì)胞的生長(zhǎng)和侵襲,因此LncRNA UCA1/miR- 206/CLOCk軸可能是神經(jīng)膠質(zhì)瘤的一個(gè)潛在的新靶點(diǎn)[19]。此外,lncRNAs HIF1A-AS2則通過與miR-153-3p結(jié)合來促進(jìn)HIF-1α的上調(diào),從而促進(jìn)缺氧狀態(tài)下HUVEC中的血管生成[20]。因此,lncRNA和miRNA的相互作用被認(rèn)為是一些復(fù)雜疾病的重要原因。

本研究利用lncRNA和miRNA的序列、功能和表達(dá)譜信息,以及已知的lncRNA-miRNA相互作用信息,采用網(wǎng)絡(luò)相似性整合算法,建立了可靠的lncRNA-miRNA互作預(yù)測(cè)模型。通過與其他網(wǎng)絡(luò)預(yù)測(cè)方法比較,證明了NSILMI模型在推斷潛在的lncRNA-miRNA互作對(duì)具有較好的效果。同時(shí),我們也利用表達(dá)譜相似度和功能相似度驗(yàn)證了該模型的適用度并取得了較好的結(jié)果。這些結(jié)果均表明NSILMI模型在預(yù)測(cè)lncRNA-miRNA相互作用上具有可靠性和適用性。

同時(shí),雖然上述實(shí)驗(yàn)取得了較好的效果,但基于本模型的預(yù)測(cè)仍存在一定的局限性。首先,由于該算法依賴于已被實(shí)驗(yàn)測(cè)定的相互作用數(shù)據(jù),導(dǎo)致樣本缺乏,可能會(huì)導(dǎo)致過擬合,因此需要使用了更多的實(shí)驗(yàn)數(shù)據(jù)進(jìn)行訓(xùn)練和學(xué)習(xí)。其次,因?yàn)槟P偷膮?shù)選擇非常復(fù)雜,很難得到完美的組合來提高預(yù)測(cè)精度。最后,本研究所使用的表達(dá)譜相似度、功能相似度、序列相似度,相似度矩陣的計(jì)算依賴于大量的計(jì)算資源。因此,在實(shí)際應(yīng)用中,相似度的計(jì)算會(huì)給在線預(yù)測(cè)工具的開發(fā)帶來困難。

綜上所述,我們利用lncRNA和miRNA相互作用數(shù)據(jù)建立了NSILMI,成功對(duì)lncRNA-miRNA互作對(duì)進(jìn)行預(yù)測(cè)。該項(xiàng)研究為lncRNA-miRNA關(guān)聯(lián)的預(yù)測(cè)提供了新手段,也為復(fù)雜疾病的研究提供新方法和思路。

猜你喜歡
功能方法模型
一半模型
也談詩的“功能”
中華詩詞(2022年6期)2022-12-31 06:41:24
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
關(guān)于非首都功能疏解的幾點(diǎn)思考
可能是方法不對(duì)
3D打印中的模型分割與打包
用對(duì)方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
主站蜘蛛池模板: 91青青草视频在线观看的| 亚洲Av综合日韩精品久久久| 五月激情综合网| 国产精品福利导航| 波多野结衣一区二区三区AV| 国产一区成人| 人人艹人人爽| 国产超薄肉色丝袜网站| 国产成人免费高清AⅤ| 亚洲欧美极品| 园内精品自拍视频在线播放| 欧美成人国产| 狠狠色婷婷丁香综合久久韩国 | 在线毛片网站| 国产成人一二三| 国产迷奸在线看| 老汉色老汉首页a亚洲| 亚洲视屏在线观看| 中文字幕亚洲专区第19页| 亚洲精品欧美日本中文字幕| 日韩国产综合精选| 色亚洲激情综合精品无码视频| 亚洲中文精品人人永久免费| 国产乱人激情H在线观看| 亚洲伊人天堂| 精品人妻无码区在线视频| 综1合AV在线播放| 在线观看亚洲精品福利片| 欧美一区二区三区香蕉视 | 91九色视频网| 欧美人与性动交a欧美精品| 99re这里只有国产中文精品国产精品 | 国产清纯在线一区二区WWW| a天堂视频| 午夜精品一区二区蜜桃| 99在线观看精品视频| 精品国产黑色丝袜高跟鞋| 久久精品亚洲热综合一区二区| 性激烈欧美三级在线播放| 欧美亚洲另类在线观看| 伊人久久综在合线亚洲2019| 国产午夜福利在线小视频| 亚洲欧洲自拍拍偷午夜色无码| 久久综合AV免费观看| 真实国产乱子伦高清| 嫩草国产在线| 东京热一区二区三区无码视频| 亚洲无码91视频| av在线5g无码天天| 5555国产在线观看| 国产亚洲精品97AA片在线播放| 国产va视频| 无码福利日韩神码福利片| 久久精品国产亚洲麻豆| 亚洲av无码专区久久蜜芽| 性欧美精品xxxx| 国产无码网站在线观看| 欧美色视频日本| 亚洲综合九九| 国产午夜不卡| 91小视频在线观看免费版高清| 国产成人精品18| 国产对白刺激真实精品91| 欧美综合激情| 欧美一级色视频| 亚洲国产天堂久久综合226114| 青青操视频免费观看| 成人在线观看不卡| 中文字幕有乳无码| 69视频国产| 日韩在线播放中文字幕| 亚洲综合在线最大成人| 亚洲高清中文字幕在线看不卡| 亚洲欧美极品| 99999久久久久久亚洲| 波多野结衣无码视频在线观看| 国内精品久久人妻无码大片高| 依依成人精品无v国产| 国产成人无码AV在线播放动漫 | 一级毛片免费观看久| 97精品国产高清久久久久蜜芽| 免费三A级毛片视频|