999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

利用改進的3DMax算法重構染色體3D結構

2021-12-30 09:17:14劉立偉么會麗
生物信息學 2021年4期
關鍵詞:優化結構模型

劉立偉,么會麗

(大連交通大學 理學院,遼寧 大連 116028)

染色體構象捕獲技術,特別是Hi-C技術的發展,使基因組空間構象的分析和研究成為生物信息學和計算生物學的重要課題。在高通量下一代測序技術的幫助下,Hi-C技術可以生成全基因組范圍的、大規模的染色體內和染色體間相互作用數據,能夠詳細描述基因組內的空間相互作用。這些數據可以用來重建染色體的三維結構,用于研究DNA復制、基因調控、基因組相互作用、基因組折疊和基因組功能[1-9]。目前,根據構建染色體三維模型原理上的不同,可將結構模型分為兩大類:即基于概率約束的預測模型和基于距離約束的預測模型。由于細胞染色體的三維結構是動態的,我們可以用一些概率分布來描述它,從而將染色體三維結構的構建問題轉化為概率模型的構建問題。實現這一過程的方法稱為基于概率約束的預測模型。其中有一些方法是通過兩步來進行染色體基因組三維結構建模,即將Hi-C數據中片段對之間的相互作用頻率(IF)轉換為片段對之間的距離,然后通過對距離值進行優化,推斷出最能滿足距離的3D結構,即求解出染色體片段的三維空間坐標,實現這兩步過程的方法稱為基于距離約束的模型。在對距離值進行優化的過程中,常用梯度迭代優化算法優化目標函數,目前現有的隨機梯度優化算法有SGD、Momentum、Nesterov、Adagrad、Adadelta、Adam、Adamax、Nadam[10-16],本文根據目前存在的隨機梯度優化算法的優點和缺點,提出了XNadam算法。

1 3DMax 算法原理簡介

3DMax算法[17]是由Oluwadare等人提出,它使用最大似然方法從Hi-C數據中推斷染色體的三維結構。3DMax比現有的大多數方法都要快,它只依賴于通過最小二乘殘差來優化預測模型的結構坐標。3DMax算法也是基于距離約束的預測模型,該算法首先通過初始化一組染色體空間坐標,計算出染色體片段之間的歐氏距離,然后通過轉換函數將輸入的接觸頻率矩陣轉換成的距離矩陣,并假設距離矩陣中的每一個數據點獨立并服從正態分布,從而構建一個基于正態分布的對數似然目標函數,再采用梯度上升算法迭代優化目標函數直到算法收斂,在迭代過程中同步更新染色體三維坐標。在3DMax算法中,采用梯度上升算法對目標函數進行迭代優化的過程中,計算出距離斯皮爾曼相關系數(DSCC),并選出最大DSCC系數對應的轉換參數,最優轉換參數下的染色體片段坐標,是我們推斷出最能滿足距離的可視化染色體結構。3DMax算法還有一個變體,稱為3DMax1,它在輸入噪聲時對輸入接觸矩陣進行額外的預處理和濾波。

在3DMax1算法中,Oluwadare等人,使用的隨機梯度上升算法是自適應梯度算法(AdaGrad)[18]。自適應梯度算法(AdaGrad)是一種基于梯度的優化方法,它可以使學習速率適應每個參數,可以對低頻的參數做較大的更新,對高頻的做較小的更新,也因此,對于稀疏的數據它的表現很好。它的缺點是分母會不斷積累,內存需求較大,這樣學習率就會收縮并最終會變得非常小,甚至趨于零。

2 XNadam算法原理簡介

除了3DMax1算法中應用到的自適應梯度算法(AdaGrad)以外,目前現有的隨機梯度優化算法還有SGD、Momentum、Nesterov、RMSprop、Adadelta、Adam、Adamx、Nadam。本文提出了一種新的隨機梯度上升算法XNadam,是Nadam的一個變體。Nadam(Nesterov-acceler Adaptive Moment Estimation)是將Adam與Nesterov算法結合在一起,具備二者的優勢。它對學習率的約束將更強,使得此算法在某些問題上效果更好。Nadam的優點主要在于經過偏置矯正后,每一次迭代學習率都有個確定范圍,為不同的參數計算不同的自適應學習率,使得參數比較平穩,同時內存需求較小,也適應于大多非凸優化,適應于大數據和高維空間。由于加入了Nesterov項,則在梯度更新時做一個校正,避免前進太快,同時提高靈敏;XNadam作為Nadam的一個變體,原理跟Nadam類似。區別是XNadam采用正弦的相關方式進行學習率的衰減,同時利用正弦方式的衰減率對一階矩估計進行修正,所以XNadam具有Nadam算法的所有優點。

3 XNadam算法

XNadam算法要求:初始學習率α0,最小學習率αmin要求:矩估計的指數衰減速率β2,β1,取值區間均為[0,1)內要求:用于數值穩定的小常數δ(默認10-6)要求:初始化一階和二階矩變量n=0,m=0,初始化時間步長t=0計算梯度:gt+1=‰f(St)對梯度更新:g^t+1=gt+11-∏t+1i=1βi1更新有偏二階矩估計:nt+1=β2·nt+(1-β2)·g2t+1修正二階矩的偏差:n^t+1=nt+11-βt+12更新有偏一階矩估計:mt+1=β(t+1)1·mt+(1-β(t+1)1)·gt+1衰減速率:β(t)1=β1·0.5·(1+sin(tπT))T=t(t+3)2對一階矩修正:m^t+1=mt+11-∏t+2i=1βi1繼續修正一階矩:m-t+1=β(t+2)1·m^t+1+(1-β(t+1)1)·g^t+1學習率:αt=α0·[(1-αmin)·0.5·(1+sin(tπT))+αmin]計算更新:ΔSt+1=αt+1m-t+1n^t+1+ε應用更新:St+1=St+ΔSt+1

4 模型相似性和準確性的測量

為了測試該算法,利用3DMaxAdaGrad,3DMaxNadam和3DMaxXNadam算法對酵母染色體三維結構進行重構,進而比較他們的性能。3DMaxAdaGrad、3DMaxNadam、3DMaxXNadam是3DMax算法的一個變體,其中3DMaxAdaGrad是結合了極大似然算法和AdaGrad算法預測模型,而3DMaxNadam是結合了極大似然和Nadam優化算法的預測模型,3DMaxXNadam是結合了極大似然和XNadam優化算法的預測模型。在比較的過程中,3DMaxXNadam算法中β1=0.6,β2=0.999 9,αmin=0.000 1,只有學習率是變化的。

本文采用距離均方根誤差(Distance Root Mean Squared Error ,DRMSE)、距離斯皮爾曼相關系數(Distance Spearman Correlation Coefficient ,DSCC)、距離皮爾森相關系數(Distance Pearson Correlation Coefficient,DPCC)[19-22]來量化結構的相似性,從而衡量預測方法的性能。

在本研究中輸入的歸一化接觸頻率值所選擇的數據集是酵母的Hi-C數據,酵母Hi-C數據用Yaffe和Tanay等人[23]提出的技術進行了歸一化。3DMaxAdaGrad,3DMaxNadam和3DMaxXNadam算法對1-12號染色體三維空間結構重構的DSCC、DPCC 和DRMSE三個評價指標結果(見圖1)。

圖1 3DMaxAdaGrad,3DMaxnadam和3DMaxnadam算法重構染色體三維結構的評估結果Fig.1 Evaluation results for 3DMaxAdaGrad, 3DMaxNadam, and 3DMaxXNadam

圖1中的柱形圖表示了3DMaxAdaGrad,3DMaxNadam和3DMaxXNnadam三種算法重構染色體三維結構的DSCC、DPCC和 DRMSE評估結果。第一列黃色柱形圖代表三種算法對酵母1-12號染色體三維結構重構的DSCC結果,觀察圖形可知,對于1號、2號染色體,3DMaxAdaGrad算法重建染色體三維結構的DSCC值最大,其次是3DMaxXNnadam算法的DSCC值,其中3DmaxNadam算法的DSCC值最小;對于8號染色體,3DmaxNadam算法重構染色體三維結構的DSCC值最大,其次是3DmaxXNadam算法的DSCC值較大,最小的是3DMaxAdaGrad的DSCC值;除了上述三條染色體,其余的染色體都是3DmaxXNadam算法重構染色體三維結構的DSCC值最大。

第二列綠色柱形圖代表三種算法對酵母1-12號染色體三維結構重構的DPCC結果,從圖可以看出,除了7號染色體,其余11條染色體中,3DmaxXNadam算法重構染色體三維結構的DPCC值最大,其次是3DmaxNadam算法的DPCC值,最小的是3DMaxAdaGrad算法的DPCC值。

第三列紅色柱形圖代表三種算法對酵母1-12號染色體重構的三維結構DRMSE結果,從圖可以看出,除了7號染色體,其余11條染色體中,3DmaxXNadam算法重構染色體三維結構的DRMSE值最小,其次是3DmaxNadam算法的DRMSE值,最大的是3DMaxAdaGrad算法重構染色體三維結構的DRMSE值。

根據上述實驗結果可知,3DmaxXNadam算法的性能更好。

5 染色體三維結構可視化

通過算法比較,3DmaxXNadam算法對染色體三維結構進行重構具有較高的準確度。在此,使用該算法對酵母 1-12號染色體三維空間結構進行重構,得了酵母1-12 號染色體的三維效果圖(見圖2)。

圖2 染色體的三維空間結構重構效果圖Fig.2 Sketch of 3D structure reconstruction of chromosomes

6 結 論

本研究在Nadam優化算法的基礎上發展了一種新的梯度上升優化算法(XNadam),并引入最大似然算法分別和AdaGrad、Nadam、XNadam算法相結合得到3DMaxAdaGrad,3DMaxNadam和3DMaxXNadam算法。利用3DMaxAdaGrad,3DMaxNadam和3DMaxXNadam算法對酵母染色體三維結構進行重構,并且計算了生成的染色體優化結構的DSCC、DPCC 和DRMSE的值,從而衡量預測方法的性能。在真實數據集上的實驗結果表明,3DmaxXNadam算法可以更有效地從Hi-C接觸矩陣中重建染色體模型,同時與其他方法相比,它速度更快,對內存的要求也較低。這個結論說明新的梯度上升優化算法(XNadam)在優化對數似然目標函數上,它的表現比大多數其他優化方法更好。

猜你喜歡
優化結構模型
一半模型
超限高層建筑結構設計與優化思考
房地產導刊(2022年5期)2022-06-01 06:20:14
《形而上學》△卷的結構和位置
哲學評論(2021年2期)2021-08-22 01:53:34
民用建筑防煙排煙設計優化探討
關于優化消防安全告知承諾的一些思考
一道優化題的幾何解法
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
論結構
中華詩詞(2019年7期)2019-11-25 01:43:04
論《日出》的結構
主站蜘蛛池模板: 欧洲亚洲一区| 亚洲综合九九| 日本草草视频在线观看| 日本免费新一区视频| 女人18毛片一级毛片在线 | 99久久精品免费观看国产| 成人免费网站久久久| 亚洲天堂777| 多人乱p欧美在线观看| 日本精品影院| 国产99视频免费精品是看6| 国产喷水视频| 欧美一级大片在线观看| 国产精品制服| 夜夜操天天摸| 国产免费人成视频网| 极品av一区二区| 狠狠亚洲五月天| av色爱 天堂网| av午夜福利一片免费看| 久久久久久高潮白浆| 操国产美女| 精品国产91爱| 色婷婷天天综合在线| 天天躁狠狠躁| 国产成人亚洲毛片| 五月天在线网站| 精品无码国产一区二区三区AV| 大香网伊人久久综合网2020| 国产99精品视频| 亚洲开心婷婷中文字幕| 在线观看国产网址你懂的| 日韩AV手机在线观看蜜芽| 亚洲自拍另类| a级毛片毛片免费观看久潮| 欧美色综合网站| 幺女国产一级毛片| 久久久波多野结衣av一区二区| 国产亚洲精品资源在线26u| 在线精品视频成人网| 亚洲人成人伊人成综合网无码| 中文精品久久久久国产网址| 日韩高清无码免费| 国产三区二区| 国内精品久久久久鸭| 国产欧美日韩va另类在线播放| 亚洲无码精品在线播放| 强乱中文字幕在线播放不卡| 无码人中文字幕| 无码国产伊人| 午夜精品久久久久久久无码软件| 9久久伊人精品综合| 制服丝袜国产精品| 色播五月婷婷| 国产白丝av| 99热这里只有成人精品国产| 欧美亚洲日韩不卡在线在线观看| 99偷拍视频精品一区二区| 亚洲精品视频免费看| 天堂中文在线资源| 手机在线看片不卡中文字幕| 九一九色国产| 久草中文网| 国产亚洲欧美日韩在线一区二区三区| 91福利在线看| 在线日韩一区二区| 91丝袜在线观看| 欧美α片免费观看| 亚洲精品视频免费观看| 欧美中文一区| 亚洲国产日韩一区| 国模粉嫩小泬视频在线观看| 中文字幕一区二区人妻电影| 99视频在线免费| 国产无码在线调教| 国产一区二区三区在线观看免费| 中国毛片网| 亚洲人成人伊人成综合网无码| 久操中文在线| 亚洲精品大秀视频| 久久久国产精品免费视频| 女人18毛片一级毛片在线 |