999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

面向基因調(diào)控網(wǎng)絡(luò)的弱關(guān)聯(lián)調(diào)控優(yōu)化方法*

2022-04-11 08:19:50王夙加劉云奇孫啟軒高任飛王之瓊
智庫(kù)時(shí)代 2022年17期
關(guān)鍵詞:數(shù)據(jù)處理關(guān)聯(lián)優(yōu)化

王夙加劉云奇孫啟軒高任飛王之瓊

(1.東北大學(xué)醫(yī)學(xué)與生物信息工程學(xué)院;2.東北大學(xué)理學(xué)院;3.東北大學(xué)軟件學(xué)院)

基因本身蘊(yùn)含著非常龐大且復(fù)雜的生物信息[1],通過(guò)建立基因調(diào)控網(wǎng)絡(luò)可以直觀地了解基因之間的相互作用機(jī)制,基因?qū)M織細(xì)胞的調(diào)控機(jī)理等除此之外,我們通過(guò)對(duì)基因?qū)用娴难芯浚梢愿由钊氲亓私饧膊〉陌l(fā)生與發(fā)展,從而可以針對(duì)疾病的診斷和治療采取更為適當(dāng)且有效的手段,達(dá)到治療疾病、造福人類的目的[2]。特別是近幾年的在癌癥治療上的應(yīng)用,例如靶向藥的研發(fā)與使用就達(dá)到很好的治療效果。它可以針對(duì)癌細(xì)胞特異性的給藥,相對(duì)于傳統(tǒng)的化療等癌癥治療手段來(lái)說(shuō)可以極大地減輕患者治療時(shí)的痛苦。這種靶向藥物的研發(fā)很大程度上依賴于準(zhǔn)確的基因調(diào)控網(wǎng)絡(luò)的分析與研究,因此,基因調(diào)控網(wǎng)絡(luò)優(yōu)化的研究成為了重要的研究?jī)?nèi)容。近些年來(lái),人們提出了許多基因調(diào)控網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化的方法,Jamshid等人[3]基于卡爾曼濾波和線性回歸方法改進(jìn)了貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)的搜索策略,并且利用條件互信息對(duì)構(gòu)建好的網(wǎng)絡(luò)進(jìn)行了結(jié)構(gòu)優(yōu)化。Margolin等人[4]提出了基于信息論的ARACNE算法來(lái)構(gòu)建基因調(diào)控網(wǎng)絡(luò),消除了大多數(shù)由共表達(dá)方法得出的間接交互,從而推斷轉(zhuǎn)錄調(diào)控蛋白與靶點(diǎn)基因間的直接調(diào)控關(guān)系,Liu等人[5]提出了一種利用最小冗余網(wǎng)絡(luò)(MRNET)算法減少冗余邊的優(yōu)化方法,通過(guò)減少基因的非調(diào)控和弱間接調(diào)控來(lái)減少基因間冗余關(guān)系進(jìn)而獲取優(yōu)化網(wǎng)絡(luò)。Xing等人[6]提出了洪水-修剪-爬坡算法(FPHC)作為一種基于貝葉斯網(wǎng)絡(luò)的基因調(diào)控網(wǎng)絡(luò)重建的新型混合方法。

以上這些優(yōu)化方法雖然取得了一定的研究進(jìn)展,但當(dāng)前仍有待深入地研究與探索更為有效且精確性高的優(yōu)化算法。想要達(dá)到高效準(zhǔn)確地優(yōu)化基因調(diào)控網(wǎng)絡(luò)的目的,就必須要準(zhǔn)確地尋找出基因間的冗余關(guān)系并刪除它們。基于此,我們將弱間接調(diào)控關(guān)系的分析與判斷作為尋找冗余邊的重點(diǎn)并開展了相關(guān)研究。首先,利用互信息(MI)來(lái)計(jì)算任意兩個(gè)基因間的相關(guān)性,通過(guò)這種方法可以對(duì)基因間的相關(guān)程度進(jìn)行量化評(píng)估。接著使用洪水—剪枝算法,把目標(biāo)基因進(jìn)行數(shù)據(jù)處理等級(jí)劃分(DPI),劃分出的目標(biāo)基因間的弱關(guān)聯(lián)調(diào)控關(guān)系作為待刪除的邊。此外,引入了聚類算法的思想,首先采用重要程度評(píng)分(IDS)對(duì)基因間的相關(guān)聯(lián)程度進(jìn)行評(píng)估,然后結(jié)合使用k-means聚類算法,其中表現(xiàn)較差的類也歸為待刪除的邊。最后,將兩種方式同時(shí)尋找并確定為待刪除的邊進(jìn)行刪除。最終經(jīng)過(guò)實(shí)驗(yàn)對(duì)此優(yōu)化算法的準(zhǔn)確性等進(jìn)行進(jìn)一步驗(yàn)證對(duì)比,發(fā)現(xiàn)此方法在敏感性、特異性、精確性、準(zhǔn)確性等評(píng)估指標(biāo)上均優(yōu)于其他傳統(tǒng)方法,可提高優(yōu)化效率,具有很好的應(yīng)用性。

一、基于信息論的基因調(diào)控網(wǎng)絡(luò)弱關(guān)聯(lián)調(diào)控優(yōu)化

(一)總體框架

通過(guò)分析基因芯片探測(cè)基因表達(dá)數(shù)據(jù),可以構(gòu)建基因調(diào)控網(wǎng)絡(luò)。關(guān)聯(lián)網(wǎng)絡(luò)與關(guān)聯(lián)性背景相似性是基于信息論的基因調(diào)控網(wǎng)絡(luò)構(gòu)建常用方法。然而,使用這兩種方法很容易引入由間接調(diào)控引起的假性陽(yáng)邊。

面向基因調(diào)控網(wǎng)絡(luò)的弱關(guān)聯(lián)調(diào)控優(yōu)化方法主要可以分為以下三個(gè)步驟:計(jì)算基因間的相關(guān)性,分別采用洪水—剪枝算法和K-means算法計(jì)算弱關(guān)聯(lián)調(diào)控邊,根據(jù)兩種算法綜合判斷弱關(guān)聯(lián)調(diào)控關(guān)系并刪除。步驟一,計(jì)算基因間相關(guān)性。根據(jù)輸入的基因表達(dá)數(shù)據(jù),計(jì)算基因間的互信息值。步驟二,計(jì)算弱關(guān)聯(lián)調(diào)控邊。通過(guò)基因之間的互信息值對(duì)基因調(diào)控邊進(jìn)行重要程度打分,然后利用K-means算法(類別設(shè)為4),選出重要程度打分較低的一類作為待刪邊集合A。使用洪水—剪枝算法對(duì)每個(gè)基因進(jìn)行操作,找到每個(gè)基因相關(guān)的待刪邊集合B。步驟三,已經(jīng)計(jì)算出洪水—剪枝算法和K-means算法分別計(jì)算出的待刪邊集合,查詢其中共同判斷為弱關(guān)聯(lián)調(diào)控的邊并刪除,更新基因的調(diào)控網(wǎng)絡(luò)。

查找目標(biāo)基因相關(guān)基因集沿用了“關(guān)聯(lián)背景相似性方法”的思想:若某些基因的互信息呈一定的概率分布,他們之間可能會(huì)存在聯(lián)系,于是本算法首先對(duì)于每一個(gè)目標(biāo)基因與其他基因的互信息進(jìn)行升序排序,并且設(shè)置斷點(diǎn)K,將集合分為兩個(gè)部分。數(shù)據(jù)處理不等式存在一定的局限性,所以本算法可以設(shè)定數(shù)據(jù)處理級(jí)別,根據(jù)數(shù)據(jù)處理不等式對(duì)相關(guān)點(diǎn)集中的基因進(jìn)行級(jí)別定義與閾值的設(shè)定,找出閾值以上的基因集合set 1。同一類事物往往具有相似的性質(zhì),所以本項(xiàng)目算法基于聚類技術(shù)選擇弱調(diào)控基因,首先對(duì)基因的重要程度進(jìn)行特定的打分,再利用K-means算法對(duì)打分結(jié)果進(jìn)行聚類,與目標(biāo)基因同一類的被選為弱調(diào)控基因,其中與set1集合的交集為與目標(biāo)基因存在假陽(yáng)邊關(guān)系的基因集合set2。算法的總體框架如圖1所示。

圖1 面向基因調(diào)控網(wǎng)絡(luò)的弱關(guān)聯(lián)調(diào)控優(yōu)化方法整體算法框圖

(二)洪水—剪枝算法

已知目標(biāo)節(jié)點(diǎn)X和所有其他節(jié)點(diǎn)的互信息向量M={T1,T2,......,Tm},m=n-1,并將所有互信息按升序排列。根據(jù)以上分析,零假設(shè)和備選假設(shè)如下:

零假設(shè):沒有斷點(diǎn)存在

備選假設(shè):一個(gè)重要的斷點(diǎn)存在,即在向量M中存在一點(diǎn)將集合分為相關(guān)節(jié)點(diǎn)和其他節(jié)點(diǎn)兩部分。在零假設(shè)下,若所有互信息均來(lái)自相同分布,則概率為。在備選假設(shè)下,在向量中存在目標(biāo)節(jié)點(diǎn)X的一個(gè)斷點(diǎn),位于K∈[1,m]的位置,故兩類節(jié)點(diǎn)來(lái)自兩個(gè)不同的分布,可以定義如下式:

之后使用數(shù)據(jù)處理等級(jí)(DPI)對(duì)目標(biāo)節(jié)點(diǎn)X的假陽(yáng)性邊進(jìn)行修剪。節(jié)點(diǎn)Ti∈Rx的數(shù)據(jù)處理級(jí)別定義如下:

如果Ti是第一個(gè)節(jié)點(diǎn),定義數(shù)據(jù)處理等級(jí)為1;如果不是,對(duì)于每個(gè)在Ti前的節(jié)點(diǎn)定義一個(gè)三元組,Ti的數(shù)據(jù)處理等級(jí)被定義為的最大數(shù)據(jù)處理等級(jí),如滿足數(shù)據(jù)處理等級(jí)不等式,則i+1。數(shù)據(jù)處理不等式如下:

(三)K-means聚類算法

在計(jì)算了互信息(MI)和重要程度打分(IDS)后,得到每個(gè)基因與其他基因的相關(guān)性系數(shù),通過(guò)此系數(shù),刪除那些相關(guān)性較差的基因關(guān)系[8]。我們使用K-means聚類算法,將每個(gè)基因與其它基因的相關(guān)系數(shù)進(jìn)行聚類,經(jīng)過(guò)百余次試驗(yàn)發(fā)現(xiàn),將結(jié)果聚為4類,能得到最好的結(jié)果。刪去4類中結(jié)果最差的一類,保留余下的3類,得到最后的網(wǎng)絡(luò)結(jié)構(gòu)。

流程如下所述:首先,讀取通過(guò)IDS算法得到的IDS矩陣(隨機(jī)設(shè)置4個(gè)聚類中心),分配數(shù)據(jù)點(diǎn),并計(jì)算數(shù)據(jù)的平均誤差,若最終仍有結(jié)果為空,則重新隨機(jī)設(shè)置4個(gè)聚類中心,再進(jìn)行計(jì)算,直到結(jié)果不為空;逐步更新聚類的中心,計(jì)算平均誤差,比較前后兩次的平均誤差是否相同,直到兩次的誤差相同,得到最終的分類結(jié)果。我們選擇最差的一類,作為最終的刪邊矩陣。

二、實(shí)驗(yàn)結(jié)果分析

(一)實(shí)驗(yàn)設(shè)置

實(shí)驗(yàn)所選用帶金標(biāo)準(zhǔn)網(wǎng)絡(luò)的大腸桿菌Dream4中的基因表達(dá)微陣列數(shù)據(jù)multifactorial數(shù)據(jù),此數(shù)據(jù)共有五個(gè)網(wǎng)絡(luò),每個(gè)網(wǎng)絡(luò)各有100個(gè)基因數(shù)據(jù),我們選取了其中更具代表性的網(wǎng)絡(luò)一進(jìn)行分析。分別對(duì)本算法、ARANCNE算法和GRNInfer算法的性能進(jìn)行評(píng)價(jià),在對(duì)算法進(jìn)行評(píng)價(jià)時(shí),選用了敏感性、特異性、精確性、準(zhǔn)確性、馬修斯相關(guān)系數(shù)5個(gè)指標(biāo),各指標(biāo)說(shuō)明如表1所示。

表1 各評(píng)估指標(biāo)說(shuō)明表

其中,TP表示真陽(yáng)邊,即邊實(shí)際為陽(yáng)性邊且被判斷為陽(yáng)性的邊;FP表示假陽(yáng)邊,即邊實(shí)際為陰性邊卻被判斷為陽(yáng)性的邊;TN表示真陰邊,即邊實(shí)際為陰性邊且被判斷為陰性的邊;FN表示假陰邊,即邊實(shí)際為陽(yáng)性邊卻被判斷為陰性的邊。

(二)實(shí)驗(yàn)結(jié)果

實(shí)驗(yàn)結(jié)果顯示了三種算法的五個(gè)評(píng)估指標(biāo)對(duì)比,如表2所示。

表2 各算法的五項(xiàng)評(píng)估指標(biāo)對(duì)比

從表2中的信息我們可以得知,WRO算法五項(xiàng)評(píng)估指標(biāo)優(yōu)于ARANCNE和GRNInfer算法,在基因調(diào)控網(wǎng)絡(luò)中的優(yōu)化效果更加優(yōu)良。在準(zhǔn)確率的方面,WRO算法的準(zhǔn)確率可以達(dá)到98%以上,比ARANCNE和GRNInfer算法的準(zhǔn)確率提高2%-4%。特異性水平達(dá)到99%,為進(jìn)一步研究基因調(diào)控網(wǎng)絡(luò)的優(yōu)化打下基礎(chǔ)。在精確性、敏感性和MCC評(píng)估指標(biāo)上,相較于ARANCNE和GRNInfer算法,WRO算法提升36%-45%,假陽(yáng)邊比例顯著降低,篩選掉的假陽(yáng)邊數(shù)量和準(zhǔn)確度較大幅度提升,從而使最終真陽(yáng)邊所占比例明顯升高,實(shí)現(xiàn)了在正確刪除假陽(yáng)邊的同時(shí)減少錯(cuò)誤刪除真陽(yáng)邊概率的目標(biāo)。馬修斯相關(guān)系數(shù)MCC的評(píng)估結(jié)果提升,也表示預(yù)測(cè)的結(jié)果與實(shí)際結(jié)果之間的誤差減小,可以更加準(zhǔn)確地預(yù)測(cè)優(yōu)化結(jié)果。此外,WRO算法可操作性強(qiáng),具有廣闊的應(yīng)用發(fā)展前景。

三、結(jié)語(yǔ)

為進(jìn)一步提高基因調(diào)控網(wǎng)絡(luò)的精確度,提升優(yōu)化網(wǎng)絡(luò)效率,本文提出了面向基因調(diào)控網(wǎng)絡(luò)的弱關(guān)聯(lián)調(diào)控優(yōu)化方法,該方法將洪水—剪枝算法和K-means聚類算法合理有效的相互結(jié)合,準(zhǔn)確地判斷出基因調(diào)控網(wǎng)絡(luò)中的弱關(guān)聯(lián)調(diào)控關(guān)系。通過(guò)實(shí)驗(yàn)證明,該方法有效地提高了分析和判斷弱間接調(diào)控關(guān)系的能力,減少了錯(cuò)誤刪除冗余邊的概率,同時(shí),對(duì)比其他先進(jìn)方法,本方法在五項(xiàng)評(píng)估指標(biāo)上均較優(yōu)。

猜你喜歡
數(shù)據(jù)處理關(guān)聯(lián)優(yōu)化
超限高層建筑結(jié)構(gòu)設(shè)計(jì)與優(yōu)化思考
認(rèn)知診斷缺失數(shù)據(jù)處理方法的比較:零替換、多重插補(bǔ)與極大似然估計(jì)法*
“苦”的關(guān)聯(lián)
ILWT-EEMD數(shù)據(jù)處理的ELM滾動(dòng)軸承故障診斷
民用建筑防煙排煙設(shè)計(jì)優(yōu)化探討
關(guān)于優(yōu)化消防安全告知承諾的一些思考
一道優(yōu)化題的幾何解法
奇趣搭配
智趣
讀者(2017年5期)2017-02-15 18:04:18
基于希爾伯特- 黃變換的去噪法在外測(cè)數(shù)據(jù)處理中的應(yīng)用
主站蜘蛛池模板: 丁香婷婷久久| 美女潮喷出白浆在线观看视频| 欧美亚洲激情| 精品无码国产自产野外拍在线| 色天天综合| 精品视频免费在线| 综合色88| 91精品伊人久久大香线蕉| 日本在线视频免费| 日韩欧美国产三级| 在线国产毛片手机小视频| aⅴ免费在线观看| 毛片在线播放a| 成人亚洲国产| 免费女人18毛片a级毛片视频| 欧美激情首页| 久久久亚洲国产美女国产盗摄| 欧美中文字幕在线播放| 日韩在线视频网站| 自拍偷拍欧美| 国产理论最新国产精品视频| 秋霞一区二区三区| 亚洲中文字幕手机在线第一页| 久久精品一卡日本电影| 国产一级视频久久| 91精品福利自产拍在线观看| 欧美一级黄片一区2区| 无码日韩人妻精品久久蜜桃| 毛片网站观看| 亚洲三级视频在线观看| 亚洲一区二区日韩欧美gif| 亚洲国产成人自拍| 国产成人一区在线播放| 欧美成人aⅴ| 免费看美女自慰的网站| 亚洲色图综合在线| 亚洲国产欧美目韩成人综合| 91精品国产情侣高潮露脸| 浮力影院国产第一页| 无码一区中文字幕| 国产色偷丝袜婷婷无码麻豆制服| 亚洲一区二区三区中文字幕5566| 亚洲国产天堂久久综合226114| 国产精品成人免费综合| 在线视频一区二区三区不卡| 自慰高潮喷白浆在线观看| 国产在线精彩视频二区| 国产精品漂亮美女在线观看| 成人精品区| 国产欧美一区二区三区视频在线观看| 亚洲三级电影在线播放| 伊人五月丁香综合AⅤ| 无码日韩视频| 99这里只有精品免费视频| 亚洲色图在线观看| 国产激情无码一区二区APP| 国产青榴视频| 成人在线第一页| 91精品国产一区| 日韩福利在线视频| 国国产a国产片免费麻豆| 免费中文字幕在在线不卡| 亚洲日本中文字幕乱码中文| 精品久久777| 伊人成人在线| 亚洲视频欧美不卡| 成人va亚洲va欧美天堂| 国产电话自拍伊人| 国产日韩欧美成人| 黄色网页在线播放| 国产精品永久久久久| 18禁色诱爆乳网站| 国产熟睡乱子伦视频网站| 亚洲精品桃花岛av在线| 无码丝袜人妻| 亚洲一区二区黄色| 国产91成人| 欧美亚洲国产日韩电影在线| 亚洲天堂免费| 99无码中文字幕视频| 久久久久88色偷偷| 不卡午夜视频|