歐秀娟 肖奕
(華中科技大學物理學院,武漢 430074)
RNA分子三級結構模建是分子生物物理學研究的基本問題之一,對理解RNA的功能和設計新的結構有重要意義[1-3].RNA分子三級結構模建是給出RNA分子的核苷酸序列構建其三級結構[4-10].RNA三級結構可以分為主鏈結構和側鏈結構,主鏈結構由螺旋區和環區構成,由6個扭轉角(α,β,γ,δ,ε,ζ)確定,側鏈方向由扭轉角χ確定(圖1).RNA分子主鏈和側鏈結構還涉及共價鍵鍵長和鍵角,但這些鍵長和鍵角會相對平衡位置進行微振動,在生理溫度這些參數的變化關于平衡位置對稱,影響將相互抵消[11].因此,扭轉角被認為是RNA分子三級結構的決定因素,預測這些扭轉角可以幫助模建RNA分子的三級結構.
扭轉角預測在蛋白質分子三級結構模建中已經有深入的研究.與RNA分子不同,蛋白質分子三級結構主要由主鏈上的2個扭轉角ψ和φ確定.從2007年以來,人們提出了不同的神經網絡模型預測扭轉角ψ和φ.2007年,Real-SPINE1.0使用一層全連接神經網絡預測蛋白質主鏈ψ角,角度的平均絕對誤差(mean absolute error,MAE)為54°[12];2008年,Real-SPINE2.0使用同樣神經網絡和輸入特征,角度標簽[0°,180°]不變,[-180°,0°]加上360°做一個平移,同時預測蛋白質主鏈ψ和φ角,角度的MAE分別為38°和25°[13];2009年,Real-SPINE2.0使用兩層全連接網絡,ψ和φ角預測精度進一步改進,MAE分別為36°和22°[14];2009年和2012年,SPINE XI和SPINE X使用多步神經網絡,ψ角預測的MAE分別為33°[15]和35°[16];2015年SPIDER2使用深度學習3層全連接神經網絡預測角度的正弦和余弦值,ψ角預測的MAE降低到30°[17];2017年,SPIDER3使用4層雙向LSTM模型使ψ角預測的MAE進一步下降為27°[18];2019年,SPOT-1D使用10層以上的LSTM(long short-term memory)殘差網絡預測角度的正弦和余弦值,ψ角預測的MAE為23°[19];2020年,使用3層全連接網絡,滑動窗口特征,ψ角預測的MAE僅為18°[20].對于RNA分子,2021年,SPOTRNA-1D首次使用1層普通卷積和2層膨脹卷積預測RNA的7個扭轉角和2個自定義偽角(η,θ)(圖1)的正弦和余弦值,α,β,γ,δ,ε,ζ,χ,η,θ的平均絕對誤差分別為43.94°,21.94°,32.98°,14.61°,20.69°,33.27°,19.59°,30.25°和32.91°[21].可以看到,相對于蛋白質分子,RNA分子扭轉角預測的精度還有待提高.
本文提出了一種基于時序網絡深度學習模型預測RNA分子扭轉角的方法1dRNA,分別使用深度殘差卷積模型(deep residual CNN,DRCNN)和深度超長短期記憶模型(deep HyperLSTM,DHLSTM)預測RNA分子的7個扭轉角和2個偽角,以此分析抓取相鄰核苷酸特征的卷積網絡和抓取全局核苷酸特征的循環網絡,哪種網絡更合適扭轉角預測問題,并將兩個模型的結果和抓取間隔核苷酸特征的SPOT-RNA-1D比較.DRCNN模型基于只能看到相鄰核苷酸特征的一維卷積,卷積過程不改變序列長;DHLSTM模型基于能看到全部核苷酸的特征、并能改變常規長短期記憶(LSTM)網絡權重共享范式的超LSTM網絡.結果表明,本文采用的兩個深度學習模型都可以進一步提高RNA分子扭轉角的預測精度,不同模型在不同角度上各有優勢,δ,ζ,χ,η和θ角的預測更適合卷積網絡,β和ε角的預測更適合循環網絡,而在α和γ角中,抓取間隔核苷酸的膨脹網絡更好.
DRCNN模型架構如圖2所示,由一個一維卷積層[22]開始,輸入通道為4,輸出通道為512 (卷積輸出通道超參數512比256效果好和1024效果類似),訓練批次為8 (本文模型在一張11G顯存GTX 1080 Ti顯卡上能容下的最大樣本數),卷積核為15 (卷積核超參數15比7和30效果好),填充方式為“same”,其他為默認值.初始卷積層之后,是4個殘差塊的依次疊加(殘差塊的數目1到6測試顯示4個殘差塊效果最好),每個殘差塊[23]依次包含: 一維批歸一化層BatchNorm1d[24](特征維度為512,添加在卷積網絡中,有助于模型訓練的穩定,效果比LayerNorm樣本歸一化要好),ReLU激活函數[25](對本文模型激活函數ReLU比tanh和Leaky ReLu效果好),一維卷積層(輸入通道維度為512,輸出通道維度為512,卷積窗口一次能看到的核苷酸數目為15,填充方式為“same”,其他為默認值),再一維批歸一化層,ReLU激活函數和一維卷積層,最后將此層卷積的輸出和殘差塊的輸入相加,相加的結果再輸入下一個殘差塊中,重復4次.數據流出殘差塊后,經過一個ReLU激活函數(激活函數放在殘差塊外訓練效果更好),一維批歸一化層(特征維度為512),dropout層(和全連接層連用,減少網絡的過擬合,采樣概率0.4,比0.2和0.5效果好),全連接層(輸入維度512,輸出維度18),tanh激活函數(輸出區間在[-1,1],和預測角度的正弦和余弦值區間一致)得到輸出.

圖2 DRCNN (a) 模型架構;(b) 模型中一維卷積層的原理;(c) 輸出層.B,L,N,KS和Filters分別為訓練中更新一次模型參數選擇的序列數目、序列的長度、輸入特征維度、卷積核的小大(卷積窗口一次能看到的相鄰核苷酸數目)、卷積核的數目(卷積層的輸出維度)Fig.2.DRCNN: (a) Network architecture;(b) Conv1d layer;(c) output layer.B,L,N,KS and Filters are batch size,sequence length,the size of the input,the size of the filter (the filter can see the number of nucleotides at one time),the number of filters.
DHLSTM模型結構如圖3所示,里面的Hyper-LSTM層原理來自于文獻[26],輸入數據的維度是(512,8,4),模型更新一次參數選取的樣本批次數目為8,描述一個核苷酸的初始特征向量維度為4;然后經過一個HyperLSTM層(這里的超參數,外部大LSTM層[27]的輸出維度Hidden取64、內部小LSTM層的輸出維度和改變LSTM層權重的Hypercell單元里線性投影的維度Hyper都取16;Hidden超參數64比16,32和128效果好,Hyper超參數16比32和64效果好),具體來說,第t個核苷酸特征向量和兩類隱藏態進入HyperLSTM cell單元,得到第t+1個核苷酸新的特征向量和兩類隱藏態,這里每個核苷酸使用不同的Hyper LSTMcell權重參數,依次算完所有核苷酸,得到描述一個批次每個核苷酸新特征數據維度(512,8,64);接著經過另一個HyperLSTM層(這里三層HyperLSTMcell單元的超參數Hidden都取64,Hyper都取16),具體來說,上一層輸出的第t個核苷酸特征向量和兩類隱藏態(維度(8,64))依次進入三個HyperLSTMcell單元,得到第t+1個核苷酸新的特征向量(維度(8,64))和兩類隱藏態輸出(維度分別為(8,64),(8,16)),依次算完所有核苷酸,得到描述一個批次每個核苷酸的新特征數據維度(512,8,64);最后將第二層HyperLSTM的輸出和第一層的HyperLSTM輸出相加,作為一個殘差塊;數據流出殘差塊后,進入全連接層(輸入維度512,輸出維度18),tanh激活函數得到輸出.

圖3 DHLSTM (a) 模型架構;(b) HyperLSTM層;(c) 對每個核苷酸的處理單元HyperLSTMcell,其中ht,ct和ht -1,ct -1分別是外部更大的LSTM在t和 t -1時刻的隱藏態;,和, 分別是更小的LSTM在t和t -1時刻的隱藏態;(d) Hypercell單元.L,B,N,Hidden,Hyper和n_z分別為序列的長度、訓練中更新一次模型參數選擇的序列數目、輸入特征維度、大LSTM層的輸出維度、內部LSTM層的輸出維度和改變大LSTM層權重的Hypercell單元里線性投影的維度,Px和Ph為動態可訓練參數,綁定在內部超網絡里,作用在輸入態xt -1和隱藏態,初始值為全零張量Fig.3.DHLSTM: (a) Network architecture;(b) HyperLSTM layer;(c) HyperLSTMcell;ht,ct and ht -1,ct -1 are the states of the larger outer LSTM at time t and t -1,respectively;, and , are the states of the smaller LSTM at time t and t -1.(d) Hypercell.L,B,N,Hidden are sequence length,batch size,the size of the input,the size of the LSTM,and Hyper is the size of the smaller LSTM that alters the weights of the larger outer LSTM,n_z is the size of the feature vectors used to alter the larger LSTM weights,Px and Ph are dynamically trainable parameters,bound in the internal hypernetwork,acting on the input state xt -1 and the hidden state,and the initial value is an all-zero tensor.
DHLSTM和DRCNN訓練都使用MSE損失函數和RMSprop優化器[28]訓練(優化器學習率取0.001、正則化系數取0.0001,此優化器比Adam和AdamW優化器效果好,學習率0.01比0.1,0.001,0.0001和0.00001效果好,正則化系數經過嘗試取學習率的百分之一0.0001比較好);同時預測9個角和單獨預測一個角,預測結果基本一致,故DHLSTM和DRCNN都同時預測9個角;DHLSTM模型在訓練過程中,訓練損失隨著epoch的增大一直下降,驗證損失在第85個epoch后開始逐步上升,如圖4(a)所示,故取第85個epoch的模型為最終模型;DRCNN模型在訓練過程中,訓練損失隨著epoch的增大一直下降,驗證損失在第109個epoch后開始逐步上升,如圖4(b)所示,故取第109個epoch的模型為最終模型.DHLSTM和DRCNN的實現都使用Facebook的PyTorch深度學習框架[29].

圖4 (a) DHLSTM模型和 (b) DRCNN模型驗證損失(MAE)隨epoch的變化Fig.4.Validation loss curve with the epoch by (a) DHLSTM and (b) DRCNN.
為了比較,采用了SPOT-RNA-1D 使用的訓練集、驗證集和測試集(https://github.com/jaswinder singh2/SPOT-RNA-1D/tree/main/datasets)[21].訓練集含有286個結構,從PDB結構數據庫[30]目前可以下載到284個結構(6N5R_A,6N5L_A下架),本文訓練集為這284個結構;驗證集含有30個結構,都可從PDB下載;測試集有3個分別含有63,30和54個結構,從PDB數據庫分別下載到62 (5Y85_B內含脫氧核苷酸下架)、30和54個結構.
SPOT-RNA-1D 數據集來自于2020年10月3日PDB數據庫中所有X衍射分辨率小于3.5 ?的RNA結構;用CD-HIT-EST[31]軟件對所有這些結構的序列設置相似度0.8進行聚類,多簇類中的代表序列構成訓練集;然后將訓練集和單簇類利用BLAST-N[32]軟件設置截斷值為10處理,訓練集與單簇類有命中的序列被刪除,單簇類中有命中的序列也被刪除;經過這些處理,訓練集剩下的序列作為最終訓練集,單簇類剩下的序列隨機分為驗證集、測試集I和測試II;另外,對2021年4月5日PDB數據庫中所有NMR結構,使用相同方法,去除和訓練集、驗證集、測試集I和測試II的冗余,作為測試集III.數據集的長度和二級結構分布信息如表1所列.

表1 訓練集、驗證集和3個測試集的長度和二級結構信息(百分數是數據集不同配對類型的核苷酸數目占比)Table 1.Length and secondary-structure information of training,validation and test sets.The number mentioned along with the base pairing type is the percentage of total nucleotides in the region.
模型的輸入為核苷酸序列特征,大小為L×4的one-hot編碼,四個核苷酸(A,U,G和C)分別用(1,0,0,0),(0,1,0,0),(0,0,1,0)和(0,0,0,1)表示,L為序列長度,序列長度最長為512,長度不夠的補0.數據集中最長序列為414,常規做法是將所有序列用0補齊到最長序列長度.在預測時,模型預測的目標序列長度應不大于最長序列長度.這里取512是借鑒很多蛋白質模型中取值512,又觀察到所有序列長度補齊到414和512的預測結果類似,故為了模型能預測更長的序列,取值512.在訓練中測試過將所有序列補0區域采用mask機制,補0區域值雖然被計算但不參與下層值的計算,模型性能改善不明顯.輸出具體如圖2(c)所示,有18個節點用于預測9個角的正弦和余弦值,然后利用atan2函數將角度的正弦和余弦值轉化為角度的弧度值,再利用rad2deg函數將角度的弧度值轉化為角度值.這種變換在蛋白質扭轉角預測里也常用.
使用MAE評估整體性能,具體如(1)式,預測角度值和實驗確定的角度值的絕對差,360°和這個絕對差的差值,取兩者的小值:
本文兩個深度學習模型使用上面的訓練集、驗證集和3個獨立的測試集進行訓練、驗證和測試.為了了解模型每個角度在每個測試集的總體表現,表2列出了DRCNN,DHLSTM和SPOT-RNA-1D[21]在驗證集和3個測試集上整體的性能評估.在含有62個RNA的測試集I上,DRCNN預測的β,δ,ζ,χ,η和θ角 的MAE比SPOT-RNA-1D分別減小了5%,28%,17%,16%,24%和20%,α,γ和ε角的MAE比SPOT-RNA-1D分別增大了2%,10%和4%;DHLSTM預測的β,δ,ε,ζ,χ,η和θ角的MAE比SPOT-RNA-1D分別減小了6%,10%,9%,9%,12%,15%和11%,α和γ角的MAE比SPOT-RNA-1D分別增大了10%和13%,這表明在δ,ζ,χ,η和θ角這些角中,每層考慮相鄰核苷酸特征的DRCNN比每層考慮全部核苷酸特征的DHLSTM要好,在β和ε角中,每層考慮全部核苷酸特征的DHLSTM比每層考慮相鄰核苷酸特征的DRCNN要好,在α和γ角中,每層考慮間隔核苷酸的SPOT-RNA-1D比DRCNN和DHLSTM都要好.MAE值越大預測難度越大,在DRCNN中角度預測難度δ,χ,ε,β,η,θ,ζ,γ和α依次遞增,在DHLSTM中角度預測難度δ,χ,β,ε,η,θ,ζ,γ和α依次遞增,在SPOT-RNA-1D中角度預測難度δ,χ,ε,β,η,θ,γ,ζ和α依次遞增,可以看到δ,χ,η,θ和α角在3個模型里預測難度的排序一致,考慮相鄰核苷酸的DRCNN和考慮間隔核苷酸的SPOT-RNA-1D都表明ε比β容易預測,而對于DHLSTM,ε比β難預測,DRCNN和DHLSTM都表明ζ比γ容易預測,而對于SPOTRNA-1D,ζ比γ難預測.這3種方法都認為α是最難預測的,表明3個模型在角度預測難度方面有一定相似性,也各有特點.在測試集II和測試集III觀察到類似的性能趨勢,表明模型對不同類型的測試集具有魯棒性.

表2 DHLSTM,DRCNN和SPOT-RNA-1D在驗證集和3個測試集上的MAETable 2.Performance comparison in terms of MAE on validation sets and three test sets by three models.
為了了解模型在單個序列上的表現,圖5 給出了DRCNN,DHLSTM和SPOT-RNA-1D在3個測試集上單個RNA分子扭轉角預測的MAE分布圖,其中SPOT-RNA-1D繪制每個盒子需要五類值(最大值、最小值、中位數、上下四分位數和異常值),由論文圖形數據獲取工具 WebPlotDigitizer[33]得到.每個模型在3個數據集9個角度的27個MAE最小值上,DRCNN占18次,DHLSTM占3次,SPOT-RNA-1D占6次,而在27個MAE最大值上,DRCNN占4次,DHLSTM占8次,SPOTRNA-1D占15次,表明考慮相鄰核苷酸特征的卷積模型DRCNN最有可能預測到最小的MAE值,DHLSTM次之,SPOT-RNA-1D很難預測相比比較小的MAE值.箱子越窄意味著每次預測MAE變化更小,模型預測更穩定,每個模型在3個測試集9個角度的27個箱子中,DRCNN出現9次,DHLSTM出現15次,SPOT-RNA-1D出現3次,表明預測最穩定的模型是考慮全部核苷酸特征的DHLSTM,且性能中規中矩,其次是DRCNN,對樣本反應比較敏感的是SPOT-RNA-1D.在27個盒子相對較小的中位數上,DRCNN占18次,DHLSTM占2次,SPOT-RNA-1D占7次,表明DRCNN預測的一半數目鏈的總MAE比其他兩個模型值要低.在異常值方面,3個測試集9個角度上,DRCNN,DHLSTM和SPOT-RNA-1D出現的異常值的數目分別為24,21和38,且DRCNN和DHLSTM出現的異常值本身是比較小,同樣表明DHLSTM預測比較穩定.以上說明,考慮相鄰核苷酸特征的DRCNN模型性能整體更強大,考慮全部核苷酸特征的DHLSTM模型預測更穩定.

圖5 DRCNN(黃色)、DHLSTM(綠色)和SPOT-RNA-1D(紫色)在測試集I (a)、測試集II (b)和測試集III (c)上單個RNA鏈的MAE分布圖.每個盒子顯示出一組數據的最大值、最小值、中位數、上下四分位數和異常值Fig.5.Distribution of MAE for individual RNA chains on test set I (a),test set II (b) and test set III (c) by DRCNN predictor (yellow),by DHLSTM (in green) and SPOTRNA-1D (in purple).Each box shows the minimum,the maximum,the sample median,the first and third quartiles and outlier.
另外繪制了角度的實驗值分布,如圖6橙色虛線所示,可以看出每個角度的實驗值的分布是比較陡峭的,大部分角度都集中在跨度在40°左右的角度空間,有少部分角度值分布在跨度在360°的角度空間中,最容易預測的δ角跨度也是最窄的,最難預測的α角分布有3個峰,跨度是最廣的.為了了解本文模型在預測分布上的能力,繪制了DRCNN和DHLSTM在測試集I的預測分布如圖6黃色和綠色虛線所示,DRCNN預測所有的角度分布都比DHLSTM好;在測試集II和測試集III上,DRCNN在β和γ角上預測的分布比DHLSTM要好,兩個模型在預測其他7個角的分布類似.

圖6 測試集I扭轉角的實驗值(橙色)、DHLSTM預測值(黃色)和DRCNN預測值(綠色)分布圖Fig.6.Distribution plots of native (in orange),DHLSTM predicted (in yellow),and DRCNN predicted (in green) nine torsion angles on test set I.
二級結構對RNA建模起著重要角色,根據DSSR軟件[34]輸出的RNA二級結構,可將RNA二級結構分為三種類型,括號(['(',')']),假結(['[',']','{','}','<','>','A','a']),環 區['.'].比較了DRCNN和DHLSTM在測試集III中對3種二級結構類型的整體預測性能(表3),可以看出,對DRCNN和DHLSTM來說括號類型的核苷酸的扭轉角最容易預測的,處于環區的核苷酸的扭轉角是最難預測;還可以觀察到,DRCNN預測3種類型的MAE誤差都比相應的DHLSTM預測的要低;在其他兩個測試集觀察到同樣結果,因此,扭轉角預測的誤差主要來自于環區和假結區域,在預測括號、假結和環區區域的扭轉角上DRCNN都比DHLSTM好.

表3 DHLSTM和DRCNN在測試集III不同配對類型中扭轉角預測的MAETable 3.Performance according to mean absolute error by DHLSTM and DRCNN for nucleotides in different pairing type on test set III.
表1統計了訓練集、驗證集和3個測試集的序列長度分布.由表1可以看出,在訓練集和驗證集中各個長度分布并不均勻,長度在50到100區間的有179個結構,在100到200區間的只有46個.為了了解這種差異是否會導致DRCNN和DHLSTM對長RNA扭轉角預測性能較差,圖7繪制了兩個模型在9個角度上的表現與序列長度的關系.觀察DHLSTM和DRCNN的預測結果,9個角的MAE值在數目少的長度區間[78,94],[155,171]和[171,186]并不大;還觀察到DRCNN在短長度區間[1,47]結果比DHLSTM結果好;因此,雖然訓練集和驗證集對不同長度的RNA數目分布不均勻,但并沒有造成DRCNN和DHLSTM在預測上的長度偏好.

圖7 (a) DHLSTM和 (b) DRCNN分別在3個測試集(147個RNA)的9個扭轉角的MAE與RNA序列長度的函數Fig.7.On 147 RNAs in the three test sets,the MAE is measured as a function of the length for the nine torsion angles by (a) DHLSTM and (b) DRCNN.
和SPOT-RNA-1D方法一樣,為了了解扭轉角之間的相關性,在測試集I上繪制了如圖8所示的扭轉角相關矩陣.一般情況下,相鄰扭轉角之間高度相關,而較遠扭轉角相關性較小,但是矩陣顯示,對于DRCNN和DHLSTM,α和γ角有很強的相關性,兩者也是模型預測難度最大的兩個角,ζ和θ有最強的相關性,兩者預測難度排名也是相鄰的.在其他兩個測試集的結果相同.

圖8 (a) DHLSTM和 (b) DRCNN分別在測試集I上扭轉角的MAE的相關系數(CCs),值越大表示兩個角度越相關Fig.8.Correlation coefficient (CCs) for MAE of between the nine torsion angles of test set I by (a) DHLSTM and (b) DRCNN,the larger the CC value,the more correlated between the two torsions.
觀察一條鏈中預測的每個角度,預測的大部分扭轉角比一些近天然態或者類天然態結構的扭轉角更接近天然態結構扭轉角的值.和SPOT-RNA-1D方法一樣,也測試了DRCNN和DHLSTM這兩種深度學習模型預測的角度和不同RMSD結構的角度之間的差異是否可以用于結構的質量評估.為此,使用3dRNA[3]測試集85個RNA和它們的decoys進行了測試.圖9繪制了DRCNN和DHLSTM在其中一個RNA(PDB ID號1Y69,鏈9)在預測角度與誘餌模型結構角度之間的MAE和結構精度的函數關系,MEA隨RMSD持續增加.在85個數據集中的其余84個RNA中也觀察到類似的趨勢,這表明與模型預測角度的偏差或結合其他參量可用于模型質量評估.

圖9 (a) DRCNN和(b) DHLSTM分別在RNA 1Y69(鏈9)上預測角度與decoys結構角度之間的MAE與RMSD的關系Fig.9.On RNA 1Y69 (chain 9),the MAE is measured as a function of RMSD for the nine torsion angles by (a) DRCNN and(b) DHLSTM.
本文提出了一種預測RNA分子扭轉角的深度學習方法1dRNA,采用了DRCNN和DHLSTM兩個基于時序網絡的模型去預測RNA的7個扭轉角(α,β,γ,δ,ε,ζ和χ)和2個偽角(η和θ),并和現有方法SPOT-RNA-1D進行了比較.結果表明不同網絡在不同角度上各有優勢,當序列長度不超過50時,在預測9個角時,考慮相鄰核苷酸特征的DRCNN比考慮全部核苷酸特征的DHLSTM和考慮間隔核苷酸特征的SPOT-RNA-1D都好;當序列長度超過50,在δ,ζ,χ,η和θ角這些角中,DRCNN預測的結果整體上比DHLSTM和SPOTRNA-1D要好,在β和ε角中,DHLSTM預測的結果整體上比DRCNN和SPOT-RNA-1D要好,在α和γ角中,SPOT-RNA-1D預測的結果整體上比DHLSTM和DRCNN要好;3個模型在9個角度的預測難度上類似,角度的實驗值和預測值分布可以看出角度預測的難度主要在于角度分布的復雜程度,分布越復雜越難預測,DRCNN和SPOTRNA-1D預測出來的角度分布比DHLSTM豐富;序列環區的角度分布比配對區域復雜,角度預測難度也比配對區域大很多;每個模型在鏈長度集中在非長鏈區的訓練集和驗證集上訓練,但在預測時對長鏈預測效果也不錯;在模型預測穩定性上,考慮全鏈核苷酸的DHLSTM比考慮相鄰核苷酸的DRCNN和考慮間隔核苷酸的SPOT-RNA-1D要穩定很多,異常值少;模型的各個結果在3個測試集上表現類似,表明模型性能對不同數據集穩定.從結果來看,面對比較短序列,9個角度都用考慮相鄰核苷酸特征的卷積網絡更好,當序列長時,在預測δ,ζ,χ,η和θ角用考慮相鄰核苷酸特征的卷積網絡更好,預測β和ε用考慮全鏈核苷酸特征的超循環網絡更好,預測α和γ角用考慮間隔核苷酸特征的膨脹卷積網絡更好.在數據集方面,嘗試過加入新發表的RNA結構增大數據集訓練,精度能提高但不明顯;可以設計其他類型的網絡,嘗試使用單純的全連接網絡和Transformer[35]網絡訓練,角度預測整體MAE比DRCNN和DHLSTM更好,但預測的角度分布很差,很難預測出角度分布峰值之外的區域;嘗試過在DRCNN和DHLSTM這個兩個模型上改進,精度能提高但不明顯;在加入新特征方面,加入二級結構特征,能提高精度但也不明顯.在改進角度預測方面,從結果可以看出角度分布決定了預測難度,在預測前如何預先處理這種分布,和如何把這種分布加入損失函數,應該可以很大提高預測精度;另外直接預測角度實值難度大,可以考慮將跨度360°的角度分布分成36個bin去預測.