黃陽玉 陽秀鳳 李昊田 紀曉峰 程洪禮 趙蘊杰郭大川 李 林 劉士勇
(華中科技大學物理學院生物分子物理與模建小組,武漢430074)
蛋白質-RNA相互作用界面預測與設計
黃陽玉 陽秀鳳 李昊田 紀曉峰 程洪禮 趙蘊杰郭大川 李 林 劉士勇*
(華中科技大學物理學院生物分子物理與模建小組,武漢430074)
蛋白質-RNA之間的相互作用是蛋白質在細胞里面行使功能的重要方式之一.結構生物學家利用實驗手段可以得到蛋白質-RNA復合物的三維結構,通過原子水平的晶體結構來解釋蛋白質與RNA的識別過程.但實驗取得蛋白質-RNA的復合物結構非常困難,耗錢、耗時,同時受限于其相互作用強度.因而利用理論的方法對蛋白質-RNA相互作用界面進行預測與設計在生物醫學研究中十分重要.本文主要綜述了近期蛋白質-RNA相互作用界面預測與設計方面的進展,包括以下幾個方面:(1)蛋白質-RNA分子對接算法以及對接前后存在的構象變化的處理;(2)蛋白質-RNA識別機制的研究;(3)基于蛋白質-RNA相互作用界面的分子設計.蛋白質-RNA分子對接算法逐步完善將有助于我們對大量未知功能的蛋白質與RNA進行功能注釋,而基于生物大分子相互作用界面的分子設計將在藥物設計領域中有廣闊的應用前景.
蛋白質-RNA相互作用;分子對接;界面設計;復合物結構預測
蛋白質是細胞中的主要功能分子之一.蛋白質功能主要是通過特異性的以不同的親和力與其他各類分子(比如蛋白質分子、RNA、DNA等)結合形成復合物來實現.隨著RNA的催化功能被發現,諾貝爾化學獎得主沃特·吉爾伯特1提出地球上早期的生命系統中可能存在“RNA世界”,之后才出現DNA.RNA分子同時擁有存儲遺傳信息以及催化功能.與蛋白質類似,RNA在溶液中可以折疊成特定的空間結構.RNA分子可以結合蛋白質形成比較穩定的復合物(比如核糖體)或者瞬時的復合物,這些復合物在基因表達、調控等過程發揮著重要的作用.高分辨率的復合物晶體結構是在原子水平深入理解這些重要生物學過程的基礎.美國科學家Venkatraman Ramakrishnan、Thomas A.Steitz和以色列女科學家Ada E.Yonath因對核糖體的結構和功能的研究分享了2009年諾貝爾化學獎.盡管取得了相當大的進展,但是目前可以得到的RNA-蛋白質復合物結構數目還是相當有限的.因此,從理論方面進行蛋白質-RNA復合物結構預測與界面分子設計是非常重要的基本科學問題.本文將簡明扼要介紹蛋白質-RNA復合物結構預測、基于蛋白質-RNA相互作用界面的分子設計兩個方面的內容.
人類基因組測序完成后人們發現,人類基因組里編碼蛋白質的基因大約不超過30000個,比某些植物還少.最近大量實驗結果表明基因組中的非編碼序列絕大部分可以表達成非編碼RNA.人們發現這些非編碼RNA(比如microRNA,piRNA,siRNA, g-RNA等)參與了許多重要的生物學過程.2-5除了通過RNA-RNA相互作用6來實現非編碼RNA的功能之外,RNA與蛋白質特異性識別形成RNA-蛋白質復合物在基因調控、mRNA降解和翻譯、RNA剪切、RNA代謝、RNA成熟與定位、RNA降解調控等生命過程中也起了關鍵性作用7,8(見表1).現在已經發現了大量的非編碼RNA與蛋白質的相互作用,并收集整理成數據庫.9,10很多結合RNA的蛋白質(RNA-binding proteins,簡稱RBP)由少量的結合RNA的結構域(RNA-binding domain)構成.11常見的結合RNA的結構域12-14有RRM(RNA recognition motif)、KH(K-homology)、dsRBM(double-stranded RNA-binding motif)、PAZ(取名于三個主要的Ago蛋白質:Piwi, Ago和Zwille)、PIWI、Pumilio、鋅指等.這些結構域通過氫鍵、靜電、堆積相互作用等方式結合各種各樣的RNA.與這些蛋白質結合的RNA有單鏈、雙鏈(詳細情況見表115-28).結合雙鏈的dsRBM蛋白質一般有60-70個氨基酸長度,采用αβββα折疊模式,而雙鏈RNA采用A-form的構象,比較剛性,在與蛋白質結合前后構象變化不大.29蛋白質結合RNA有時主要通過靜電相互作用進行識別,這樣的結合沒有序列特異性(比如MRP1/MRP2與g-RNA形成復合物30).
然而要深入理解和進一步認識RNA-蛋白質相互作用所發揮的生物學功能,需要知道它們的單體結構和復合物的結構.對于RNA單體結構預測,目前主流的FARFAR,31iFoldRNA,32RNA2D3D33和MC-Fold/MC-Sym34等方法對于較小或者拓撲結構較為簡單的RNA小分子(<50 nt(nucleotide,核苷酸)可以給出精度較高的結構(均方根偏差(RMSD)為0.4 nm左右),然而對于分子較大或者拓撲結構較為復雜的RNA分子則很難給出較為精確的結果.2011年,Zhao等35開發的方法對于小RNA雙螺旋和發卡精度可以達到0.28 nm,對于較為復雜的RNA分子精度為0.58 nm.這些RNA結構預測工具為基于序列的RNA功能研究與分子設計打下良好的基礎.由于RNA結構復雜性,目前實驗得到的RNA-蛋白復合物結構的數目遠遠少于蛋白質-蛋白質復合物.因此,從理論上預測RNA與蛋白質復合物結構非常必要.

表1 RNA-蛋白質相互作用結構類型與功能Table 1 Structural type and function of RNA-protein interaction
2.1 蛋白質-RNA相互作用的理論與實驗研究
最近,文獻中涌現出大量使用計算方法研究RNA與蛋白質相互作用的理論工作,包括構建RNA-蛋白質相互作用數據庫,10,36,37模擬RNA與蛋白質相互結合的機制,38分析RNA-蛋白質相互作用界面性質,39-43從序列或者結構來預測RNA結合蛋白質(RNA-binding protein)、44RNA與蛋白質共同進化45以及結合位點,46-52模建RNA與蛋白質復合物結構.53-55然而,相對比較成熟的蛋白質-蛋白質復合物結構預測方法,56-61目前還沒有一個完整的RNA-蛋白質復合物結構預測方法.文獻中報道的工作主要是利用蛋白質-蛋白質復合物結構預測程序產生對接構象,并用RNA-蛋白質打分函數進行挑選.62-64蛋白-蛋白復合物結構預測分為兩個主要步驟:第一,產生候選構象;第二,用打分函數對候選構象進行打分排序,挑選近天然的解.產生候選構象的算法主要有基于剛體的對接算法(比如基于表面立方格子和表面法向量匹配算法,65基于快速傅里葉變換(FFT)剛體對接算法56,57,60,61,66,67和基于蒙特卡羅的剛體對接算法58,68)和考慮柔性的對接算法.59,69-73相對蛋白質-蛋白質分子對接而言,RNA-蛋白質分子對接的研究還很少,目前仍然處于初始階段.RNA-蛋白質復合物結構預測研究的這種狀況,一方面是因為近年來人們才重視非編碼RNA的作用,另一方面是RNA本身的復雜性,主要表現在如下幾個方面.
首先,對RNA-蛋白質識別機制的認識是建立RNA-蛋白質分子對接算法的基礎上,但是這方面目前理論和實驗上的研究都還非常少.相對而言,對蛋白質-蛋白質以及蛋白質-DNA相互作用的機制理論74-76和實驗77-81上都有比較多的研究,可以在RNA-蛋白質識別機制研究中借鑒.例如Sanchez等79利用突變實驗研究了E2C-DNA相互識別機制,他們給出了蛋白質與DNA結合途徑:初始擴散,然后形成一些有非天然接觸的過渡態系綜,接著形成了一個動力學陷阱,最后非天然接觸緩慢重排并轉變成近天然的相互作用.Tang等77用順磁弛豫增強實驗技術證實蛋白質-蛋白質在相互識別過程中達到平衡的條件下存在瞬時的、非特異性的構象系綜,一旦由微弱的非特異性靜電相互作用形成非特異性的偶遇復合物(encounter complex),一個蛋白質就可以在另一個蛋白質的表面進行二維搜索,最后掉入一個由互補的范德華相互作用和靜電相互作用決定的狹窄的能量漏斗中.Tang等77以及后來的Kim等76的研究都表明蛋白質與蛋白質在形成特異性與非特異性的相互作用中長程靜電相互作用起到非常重要的作用.另一方面,Fawzi等81利用順磁弛豫增強實驗技術與同位素標記手段研究了酶I的N端結構域(EIN)與含組氨酸的磷酸化載體蛋白質(HPr)的結合機制,結果發現兩個蛋白質在結合位點附近形成偶遇復合物,而這類復合物只需要少許轉動與平動就能變成天然復合物,此外,還觀察到HPr在結合位點背面與天然復合物形成三體偶遇復合物,這類復合物在EIN蛋白質的活性位點被占據的情況下,提供了較高的HPr濃度.這些實驗證據表明,蛋白質的結合過程是先遠距離靜電識別調整方向靠近,之后再由其它相互作用完成對接過程.我們最近提出了一套理論方法研究這個問題.對benchmark 4.082中的170個蛋白質-蛋白質復合物進行基于長程靜電相互作用的結構采樣,發現這種方向預調整過程發生的概率(14.1%)要高于隨機概率(2.8%),而且這種基于長程靜電相互作用的采樣算法同樣可以預測蛋白質-蛋白質相互作用的位點,準確性與目前最好的界面預測算法之一PINUP83相當.
其次,對于RNA-蛋白質相互作用體系,RNA分子主鏈上的每個磷酸基團都帶有一個電子單位的負電荷,所以RNA分子主鏈帶有很強的負電荷.已經有一些研究分析了RNA-蛋白質相互作用界面的殘基出現的偏好性.39,41,43,46,47,49,51Pérez-Cano和Fernandez-Recio51提到統計分析的結果嚴重依賴數據集的大小,因此,我們僅對數據集中復合物數目大于100的研究46,51進行了綜合分析.結果表明最偏好出現在界面的氨基酸是精氨酸(R),賴氨酸(K),組氨酸(H),其次是酪氨酸(Y),色氨酸(W),最不喜歡出現的是天冬氨酸(D),谷氨酸(E),半胱氨酸(C),纈氨酸(V),亮氨酸(L),異亮氨酸(I).從氨基酸的性質來看,R、K是帶正電的,而H在pH值小于6時帶正電,D、E帶負電,C、V、L、I都是疏水氨基酸,H、Y、W具有芳香環.這些結果表明靜電相互作用在RNA和蛋白質識別中應該發揮了重要作用,另外,H、Y、W的芳香環可能與堿基形成π-π堆積作用,40在近距離調整時發揮作用.因此,RNA和蛋白質可能通過長程靜電吸引相互作用預先調整好相互作用方向,進而互相靠近,通過構象調整表面擴散完成結合過程.我們的初步研究表明,RNA和蛋白質確實可以通過靜電相互作用在遠距離識別.84但我們計算長程靜電相互作用能量的方法還需要更加精確,需要考慮到溶液效應等.
由上面分析看見,蛋白質與RNA之間的相互作用類型主要有四種:靜電相互作用(包含鹽橋)、堆積相互作用(stacking interaction)、范德華相互作用(包括立體組裝(steric packing)、氫鍵).這些相互作用除了可以用經典的分子力場項來描述之外,還可以用統計熱力學(statistical thermodynamics)方法來進行描述.統計熱力學是從物質的原子結構出發,統計出在晶體結構數據庫中殘基-殘基(或者原子-原子)相互作用對出現的概率,通過Boltzmann定律導出殘基-殘基(或者原子-原子)之間的相互作用能,其概率π(x)與能量E(x)存在如下關系:85

這里的k和T分別為波爾茲曼常數和絕對溫度,x為某一微觀狀態,依據選取的統計對象不一樣,代表的對象不一樣,可以為某殘基-殘基對,某原子-原子對等.配分函數Z(a)定義如下:

一般而言,Z(a)不太容易計算,可以通過選取某一參考態(E*(x))來計算有效的能量函數:

這里π(x)是微觀狀態x在參考態出現的概率,E*(x)是微觀狀態x對應的能量.對于給定的蛋白質或者蛋白質-RNA復合物體系而言,Z(a)和Z*(a)是一個常數,與x無關.如果我們假定就得到比較常用的形式:

如果考慮微觀狀態x與殘基類型(i,j),以及殘基類型i和殘基類型j之間的距離d之間的關系,上述方程可以寫為:

可見,相互作用能ΔE(i,j;d)主要由參考態的選取來決定,不同的參考態導致不同的相互作用能量函數.純粹的基于距離的統計勢還沒有考慮到兩對相同類型的殘基對在距離相同時的取向問題,在基于距離的統計勢中考慮殘基相互作用對的方向性86,87顯得比較重要.這實際上是微觀態(統計對象)選取的方法問題,有時選取殘基尺度的微觀態,有時選取原子尺度的,有時是粗粒化模型,88有時選取氫鍵給體受體,53,89-92這里不再贅述.從熱力學觀點來看,蛋白質與RNA分子之間的識別和相互作用是一個熱力學平衡過程,其形成的穩定蛋白質-RNA復合物構象是結合自由能最低的構象.在溶液環境下面,蛋白質與RNA的結合自由能ΔG可以估計為:

嚴格按照物理化學基本原理,計算蛋白質與RNA結合的ΔG由于計算量太大在目前的計算條件下不太可行,因此常常用簡化的方法來計算結合自由能,這些簡化的自由能就稱之為打分函數.93傳統的打分函數包括幾何互補項,界面大小,范德華與靜電相互作用,堆積密度,94統計勢等等.本文討論的打分函數主要是以統計勢為主.
2.2 蛋白質-RNA相互作用打分函數構建
在蛋白質-RNA復合物結構預測中,打分函數構建是關鍵.2011年,基于ATTRACT程序,95Setny等63開發了一個粗粒化的蛋白質-RNA打分函數,對于7個自由態對接(unbound docking)體系,僅有1個例子的近天然解通過打分排名后在前100之內.同年,Tuszynska等64發表了兩個基于知識的打分函數,在用GRAMM程序生成的RNA-protein對接候選構象中進行挑選,結果發現8個體系中4個可以找到近天然的復合物結構.同年,Li等62開發了一個基于殘基的豐度勢,他們發現RNA的二級結構狀態對打分函數性能影響較大.總的來說,目前的蛋白質-RNA打分函數的性能還比較差,有較大的提升空間.為了構建有效的蛋白質-RNA相互作用打分函數,可以借鑒在蛋白質-蛋白質分子對接中的構建方法.在蛋白質-蛋白質分子對接中,打分函數主要有基于知識的打分函數,96-98基于經典分子力場優化的打分函數,58或者二者的組合.99單純基于物理的力場(physical-based forcefield)在現階段比基于知識(knowledge-based potential)的打分函數的性能要差,以后可能會更精確.86
對于基于知識的打分函數而言,如何定義參考態是關鍵,目前主要有三類方法定義參考態.第一類就是基于較大距離進行截斷(比如DFIRE100)和體積校正,第二類就是隨機混合殘基或者原子類型(比如KBP101),第三類就是基于錯誤的構象或者decoys (decoys就是用計算機生成的蛋白質構象,少部分構象離天然構象比較接近,稱為近天然構象(nearnative decoys),大部分都不是近天然構象)來定義(比如RAPDF,102PIPER67和DARS103).在基于知識的打分函數DECK104中,我們選擇了蛋白質-蛋白質對接的decoy來定義參考態.考慮長程的殘基-殘基相互作用在蛋白質-蛋白質識別中是相當重要,我們通過考慮殘基類型所處的二級結構狀態來定義殘基類型,從而間接考慮了殘基-殘基的長程相互作用.為了測試這點是否有效,我們把DECK與當時文獻中最好的打分函數DCOMPLEX,105RosettaDock58和 ZRANK99進行了詳細測試比較.在RosettaDock的蛋白質-蛋白質對接decoys中測試結果表明DECK比其它幾個要好.104我們把原子溶劑化參數模型與FFT算法相結合,開發了全新的蛋白質-蛋白質分子對接程序ASPDock,60獲得了比幾何打分更好的效果.ASPDock與打分函數DECK連用,參加CAPRI (Critical Assessment of Prediction of Interactions,蛋白相互作用預測技術評估大賽,每次給定兩個相互作用蛋白質在結合前的結構,預測其復合物結構)的對接比賽,準確預測了T40和T41(見圖1106,107).在CAPRI打分預測比賽中,DECK準確地預測了T32, T40,T41,T50,T53.而王存新小組開發的HPNC-score93,108,109也準確地預測了T35,T37,T40,T41.93
比較好的打分函數主要由基于知識的勢和基于經典分子力場項(范德華相互作用,靜電相互作用等)進行線性擬合得到.58,110,111缺點是基于知識的勢與經典分子力場項的混雜組合沒有明確的物理意義,很難進一步改進.為了彌補這一缺陷,可以利用基于統計勢的方法對基于分子立場項的參數進行確定(fluctuation matching),這樣得到的打分函數的每項具有物理意義,而參數具有統計意義,目前在蛋白質結合前后構象變化研究112,113與蛋白質-RNA相互作用力場63中取得重要進展.該方法可能對蛋白質-蛋白質、蛋白質-RNA相互作用研究有幫助.另一個可能提高打分函數精度的方面是在傳統的基于距離的統計勢中考慮殘基相互作用對的方向性.86,87
2.3 蛋白質-RNA分子對接中的構象變化
RNA-蛋白質分子對接構象采樣遇到了很大的困難,主要原因是RNA分子存在很大的柔性.RNA與蛋白質對接前后,蛋白質構象變化不大,114RNA在結合前后構象變化較大(例如轉錄因子NF-κB二聚體體系.RNA在結合前后的RMSD為0.54 nm51). RNA-蛋白質在識別過程中存在的構象變化,并由此造成對接或者打分函數挑選近天然構象失敗.蛋白質在結合配體過程中的構象變化可以分解為一些正則運動模式.70,112,115-119利用這些相關的正則運動模式的線性組合來生成新的受體構象,也許可以實現蛋白質-RNA的柔性分子對接.
2.4 蛋白質-RNA分子對接與蛋白質-蛋白質分子對接的區別與聯系
RNA與蛋白質相互作用界面特征和蛋白質與蛋白質相互作用界面有很大的不同,不能把蛋白質-蛋白質對接方法直接用于RNA-蛋白質復合物結構預測.Chen等53用Rosetta程序包從5個RNA-蛋白質天然復合物出發進行微擾對接產生候選構象.基于距離的氫鍵相互作用勢53和基于原子的統計勢55都可以很好區分天然復合物與候選構象,但不能有效地從候選構象中挑選近天然的對接構象,而這一點在實際預測問題中更重要.此外,基于天然復合物的微擾對接與具有實際意義的分子對接還有很大距離.2010年,Perez-Cano和Fernandez-Recio51利用蛋白質-蛋白質對接FTDOCK程序66對RNA-蛋白質進行了分子對接的研究,利用基于統計的殘基-核苷酸豐度勢作為打分函數對分子對接結果進行挑選,并用于蛋白質相互作用預測技術評估大賽CAPRI的RNA-蛋白質體系.51,120這個結合豐度勢與FTDOCK對接算法的方法在12個RNA-蛋白質的體系上進行了測試,結果表明FTDOCK能夠在7個系統中產生近天然的復合物結構(RMSD<1 nm),而用基于豐度的勢進行打分排序以后,僅有2個系統的近天然的解排名在10以內.這個結果說明了目前RNA-蛋白質對接方法還有很大局限性,直接把蛋白質-蛋白質對接方法FTDOCK應用到RNA-蛋白質體系存在一些問題,另外,基于統計的殘基-核苷酸豐度勢具有一定的挑選能力,但其有效性還不令人滿意,需要進一步提高.這些結果表明幾何互補性在蛋白質與RNA或蛋白質與蛋白質相互識別中都起到很重要的作用,但是其具體參數具有顯著性差異.
基于以上分析,我們對蛋白質-蛋白質界面與RNA-蛋白質界面進行了比較,試圖找尋二者之間的異同點以及原因.這樣,我們可以對蛋白質-蛋白質對接方法進行改進,使之適應RNA-蛋白質相互作用系統.相比蛋白質-蛋白質復合物界面,RNA-蛋白質復合物界面有著明顯的不同,即便在界面原子堆積上,也有著不同之處.我們選取我們自己挑選的80個復合物的數據集作為蛋白-RNA復合物的代表,而蛋白質分子對接數據集82作為蛋白質-蛋白質復合物的代表,來分析這兩者之間的界面原子堆積的不同.分析結果表明RNA-蛋白質界面的幾何互補特征與蛋白質-蛋白質界面的幾何互補特征有顯著不同.根據界面特性,我們初步建立了一個新的RNA-蛋白質對接算法RPDock,包括了基于FFT的對接和基于殘基距離的粗粒化打分.在對接中,一方面,針對RNA-蛋白質界面和蛋白質-蛋白質界面的不同,我們優化了幾何參數,使之更適于RNA-蛋白質對接;另一方面,RNA-蛋白質復合物形成過程中靜電的作用非常重要,我們在對接中考慮了靜電項.在粗粒化打分中,根據氨基酸殘基的大小,側鏈偶極矩和不同的二級結構類型,我們將氨基酸殘基分為21類;根據核苷酸的類型和二級結構,我們將核苷酸分為8類.我們在Perez-Cano等121提出的包含有81個RNA-蛋白質復合物體系的測試集中進行了測試.結果表明,RPDock預測1000個構象的對接成功率是66%,而FTDock和GRAMM的成功率分別是56%和54%.通過基于殘基距離的粗粒化打分后,RPDock預測1個構象的成功率達到16%,預測10個構象的成功率達到32%.可見,雖然對接的成功率比較高,但是打分函數的性能還不夠好.
為了構建有效的打分函數,近期我們建立了一個蛋白質與RNA反應的結合常數的數據集(http:// biophy.hust.edu.cn/PRD/protein-RNA.html),收集了46個非冗余的蛋白-RNA復合物的平衡解離常數.在這個數據集中,除了給出了結合常數外,我們還給出了各個結合常數的測定方法與條件,并且由結合常數推出了在反應過程中的吉布斯自由能的變化值.這些數據可以用于蛋白質-RNA對接打分函數的構建.在我們的結合常數數據集文章投稿過程中,兩個小組發表了2個非冗余的蛋白質-RNA分子對接測試數據集,121,122這兩個數據集為大家評估蛋白質-RNA分子對接方法提供了方便.
2.5 蛋白質-RNA分子對接的解決方案
綜上所述,RNA-蛋白分子結合機制與復合物結構預測研究中存在的主要問題以及解決方案有三點:其一,RNA與蛋白質在長程靜電相互作用的約束下,RNA-蛋白質對接方向和對接界面不清楚.而我們在蛋白質-蛋白質相互作用體系里面開發了快速有效的研究長程靜電相互作用的方法,可以用在這里給出RNA-蛋白質對接方向和對接界面;
其二,如何考慮RNA-蛋白質相互作用存在的構象變化?在分子對接形成初步的復合物構象時,我們可以對其進行分子動力學模擬,觀察其構象變化.
其三,如何利用機制研究的結果改進RNA-蛋白質分子對接算法?機制研究可以得到大致的對接方向和位點信息,可以把這些信息整合到我們已有的對接算法RPDock中.以上三點的具體細節我們將在以后的研究中逐步展開.
10多年前,Hermann123總結了一些基于RNA-蛋白質復合物的藥物設計策略.受限于對RNA-蛋白質相互作用的理解,這個領域發展緩慢.2011年, Mackay等124提出既然識別雙螺旋DNA的蛋白質已經商業化,那么顯然就可以考慮一個類似的問題:能否設計一個蛋白質可以特異性識別RNA尾端序列?最近,兩篇對蛋白質-RNA相互作用進行設計的文章125,126回答了這一重要問題并引起廣泛的注意,Chen和Varani127專門為此寫了評論.兩個小組使用類似的酵母三雜交系統的實驗方案找到了PUF蛋白質(Pumilio and FBF[fem-3 binding factor])的突變體(見圖2),該突變體可以特異性地識別胞嘧啶,而在此之前發現的PUF蛋白質以及突變體都不能識別胞嘧啶.128這一發現使得研究人員可以人工設計出能夠結合任意給定的RNA序列的PUF突變體.該新技術為人們研究生物學問題提供了一個很好的機會,比如Cooke等129馬上利用該技術應用于FBF-2/GLD-2融合蛋白的翻譯調控.PUF突變體與RNA之間的詳細研究表明,氫鍵相互作用、范德華相互作用與堆積相互作用128,130決定了二者之間特異性識別,而大量的相關實驗數據(比如蛋白質-RNA復合物晶體結構與結合常數)將快速推動蛋白質-RNA相互作用理論方法的發展.目前實現的例子是蛋白質與單鏈短片段RNA(線性片段)之間的識別,而且是純粹的基于實驗的方法.如果要實現蛋白質與雙鏈RNA或者折疊后的RNA之間的特異性識別與設計,純粹的基于實驗的方法將面臨組合爆炸困難,必然要借助于蛋白質-RNA分子對接工具或者蛋白質-蛋白質界面設計的策略來進行.下面簡單介紹一種蛋白質-蛋白質界面設計的策略.

圖2 設計出能夠結合任意給定的RNA序列的PUF突變體Fig.2 Designed PUF mutant which can bind any given RNAsequence(a)interaction of wild-type PUF(NYxxQ)with U3 RNA(PDB 3BSB);(b)interaction of PUF-R6(SYxxR)with C3 RNA(PDB 2YJY).RNAbase and side chain of the key residues are shown as stick models.Hydrogen bonds are shown as dashed lines.After double mutation,the author126got a mutant PUF-R6,which can bind cytosine,however,the native PUF can not bind cytosine.The picture was plotted by pymol(http://www.pymol.org/).
蛋白質-蛋白質相互作用是蛋白質在細胞內發揮生物學功能的重要形式,因而是一個重要的藥物設計全新靶標,131-135并受到越來越多的關注.促紅細胞生成素(EPO)通過和它的受體(EPOR)相互作用,促進紅細胞的分化和成熟.EPO已廣泛應用于臨床上各種貧血的治療.但是用于生產重組EPO的哺乳動物細胞的培養成本很高,同時表達量不高,因而使用EPO治療是相當昂貴的.利用已建立的一套“蛋白質關鍵殘基嫁接”算法,Lai課題組136設計了具有EPO活性的功能蛋白質.生物測活實驗表明設計的功能蛋白質PLC-δ1 PH結構域突變體具有拮抗EPO生物活性的功能,體外的平衡解離常數(Kd)為20 nmol·L-1,細胞實驗得到的IC50為5.7 μmol·L-1.該PH蛋白質進行突變后與EPO只有幾個功能殘基一樣,卻具有了和EPOR結合的功能,而這種功能在自然界中是不存在的.這個例子驗證了蛋白的疏水核心只起骨架的作用,功能由其局部表面決定的觀點.這是首個將序列上非連續的配體-受體相互作用區嫁接到非同源的骨架蛋白質上的成功的例子.在2011年,華盛頓大學的計算生物學者Baker和他的同事在Science上發表文章,報道了他們通過蛋白質-蛋白質分子對接方法與熱點殘基庫(hotspot library)相結合設計出來的蛋白HB36和HB80,能夠結合到廣泛流行性病毒1918 H1N1蛋白血凝素(HA).137隨同發表在Science上的評論性的文章里, Der和Kuhlman138寫道:“This strategy is reminiscent of a previous approach that involved grafting key residues from a known interaction onto a new protein scaffold to generate a new binding pair.”這說明Baker小組采用了和來魯華課題組已發表的工作(嫁接關鍵殘基)136比較類似的策略.最近,Zhang和Lai139將這一嫁接策略用于酶的活性位點設計.在不久的將來,類似的蛋白質嫁接策略可能會在其它生物功能體系中被成功實現.更復雜精細的策略可能需要在設計中考慮對蛋白質結合與解離的動力學過程有影響的因素.140顯然,這一策略還可以用于蛋白質-RNA相互作用界面的分子設計.
本文總結了蛋白質-RNA分子對接與設計.利用基于知識的統計勢(打分函數)與多尺度的粗粒化模型(構象變化)對蛋白質與RNA的相互作用機制進行分析,有助于我們構建比較好的蛋白質-RNA相互作用計算方法.其次,把“蛋白質關鍵殘基嫁接”算法應用到蛋白質-RNA相互作用體系,可能設計出特定功能的蛋白質或者具有特定功能的RNA分子.這類策略將在以蛋白質-RNA相互作用界面作為“藥物靶標”的研究中具有應用前景.
(1) Gilbert,W.Nature 1986,319,618.
(2) Zhang,W.;Ye,K.Q.Chinese Bulletin of Life Sciences 2010,22, 608. [張 煒,葉克窮.生命科學,2010,22,608.]
(3) Zhao,S.;Liu,M.F.Chinese Bulletin of Life Sciences 2010,22, 623. [趙 爽,劉默芳.生命科學,2010,22,623.]
(4) Shao,W.;Fan,Y.J.;Xu,Y.Z.Chinese Bulletin of Life Sciences 2010,22,711.[邵 偉,樊玉杰,徐永鎮.生命科學,2010,22, 711.]
(5) Chen,R.S.Sci.China Life Sci.2010,22,594. [陳潤生.生命科學,2010,22,594.]
(6) Zheng,L.L.;Qu,L.H.Chinese Bulletin of Life Sciences 2010, 40,294. [鄭凌伶,屈良鵠.中國科學生命科學,2010,40, 294.]
(7) Liu,M.F.;Wang,E.D.Chinese Bulletin of Life Sciences 2008, 20,178. [劉默芳,王恩多.生命科學,2008,20,178.]
(8) Licatalosi,D.D.;Mele,A.;Fak,J.J.;Ule,J.;Kayikci,M.;Chi, S.W.;Clark,T.A.;Schweitzer,A.C.;Blume,J.E.;Wang,X.; Darnell,J.C.;Darnell,R.B.Nature 2008,456,464.doi: 10.1038/nature07488
(9)Yang,J.H.;Li,J.H.;Shao,P.;Zhou,H.;Chen,Y.Q.;Qu,L.H. Nucleic Acids Research 2011,39,D202.
(10) Wu,T.;Wang,J.;Liu,C.;Zhang,Y.;Shi,B.;Zhu,X.;Zhang, Z.;Skogerbo,G.;Chen,L.;Lu,H.;Zhao,Y.;Chen,R.Nucleic Acids Research 2006,34,D150.
(11) Lunde,B.M.;Moore,C.;Varani,G.Nature Reviews.Molecular Cell Biology 2007,8,479.doi:10.1038/nrm2178
(12) Clery,A.;Blatter,M.;Allain,F.H.Current Opinion in Structural Biology 2008,18,290.doi:10.1016/j.sbi.2008.04.002
(13) Maris,C.;Dominguez,C.;Allain,F.H.The FEBS Journal 2005,272,2118.doi:10.1111/j.1742-4658.2005.04653.x
(14) Chen,Y.;Varani,G.The FEBS Journal 2005,272,2088.doi: 10.1111/ejb.2005.272.issue-9
(15)Antson,A.A.;Dodson,E.J.;Dodson,G.;Greaves,R.B.;Chen, X.;Gollnick,P.Nature 1999,401,235.doi:10.1038/45730
(16) Frazao,C.;McVey,C.E.;Amblar,M.;Barbas,A.;Vonrhein,C.; Arraiano,C.M.;Carrondo,M.A.Nature 2006,443,110.doi: 10.1038/nature05080
(17)Hudson,B.P.;Martinez-Yamout,M.A.;Dyson,H.J.;Wright,P. E.Nature Structural&Molecular Biology 2004,11,257.doi: 10.1038/nsmb738
(18) Lewis,H.A.;Musunuru,K.;Jensen,K.B.;Edo,C.;Chen,H.; Darnell,R.B.;Burley,S.K.Cell 2000,100,323.doi:10.1016/ S0092-8674(00)80668-6
(19) Lu,D.;Searles,M.A.;Klug,A.Nature 2003,426,96.doi: 10.1038/nature02088
(20) Ma,J.B.;Ye,K.;Patel,D.J.Nature 2004,429,318.doi: 10.1038/nature02519
(21) Ma,J.B.;Yuan,Y.R.;Meister,G.;Pei,Y.;Tuschl,T.;Patel,D. J.Nature 2005,434,666.doi:10.1038/nature03514
(22) Oberstrass,F.C.;Lee,A.;Stefl,R.;Janis,M.;Chanfreau,G.; Allain,F.H.Nature Structural&Molecular Biology 2006,13, 160.doi:10.1038/nsmb1038
(23) Oubridge,C.;Ito,N.;Evans,P.R.;Teo,C.H.;Nagai,K.Nature 1994,372,432.doi:10.1038/372432a0
(24)Ramos,A.;Grunert,S.;Adams,J.;Micklem,D.R.;Proctor,M. R.;Freund,S.;Bycroft,M.;St Johnston,D.;Varani,G.The EMBO Journal 2000,19,997.doi:10.1093/emboj/19.5.997
(25) Sachs,R.;Max,K.E.;Heinemann,U.;Balbach,J.RNA 2012, 18,65.doi:10.1261/rna.02809212
(26) Schumacher,M.A.;Pearson,R.F.;Moller,T.;Valentin-Hansen, P.;Brennan,R.G.The EMBO Journal 2002,21,3546.doi: 10.1093/emboj/cdf322
(27) Wang,X.;McLachlan,J.;Zamore,P.D.;Hall,T.M.Cell 2002, 110,501.doi:10.1016/S0092-8674(02)00873-5
(28) Cook,K.B.;Kazan,H.;Zuberi,K.;Morris,Q.;Hughes,T.R. Nucleic Acids Research 2011,39,D301.
(29) Tian,B.;Bevilacqua,P.C.;Diegelman-Parente,A.;Mathews, M.B.Nature Reviews.Molecular Cell Biology 2004,5,1013. doi:10.1038/nrm1528
(30) Schumacher,M.A.;Karamooz,E.;Zikova,A.;Trantirek,L.; Lukes,J.Cell 2006,126,701.doi:10.1016/j.cell.2006.06.047
(31) Das,R.;Karanicolas,J.;Baker,D.Nature Methods 2010,7, 291.doi:10.1038/nmeth.1433
(32) Sharma,S.;Ding,F.;Dokholyan,N.V.Bioinformatics 2008,24, 1951.doi:10.1093/bioinformatics/btn328
(33) Martinez,H.M.;Maizel,J.V.,Jr.;Shapiro,B.A.Journal of Biomolecular Structure&Dynamics 2008,25,669.doi: 10.1080/07391102.2008.10531240
(34) Parisien,M.;Major,F.Nature 2008,452,51.doi:10.1038/ nature06684
(35) Zhao,Y.;Gong,Z.;Xiao,Y.Journal of Biomolecular Structure &Dynamics 2011,28,815.doi:10.1080/07391102.2011. 10508609
(36) Shulman-Peleg,A.;Nussinov,R.;Wolfson,H.J.Nucleic Acids Research 2009,37,D369.
(37) Lewis,B.A.;Walia,R.R.;Terribilini,M.;Ferguson,J.;Zheng, C.;Honavar,V.;Dobbs,D.Nucleic Acids Research 2011,39, D277.
(38)Wang,Y.;Li,Y.;Ma,Z.;Yang,W.;Ai,C.PLoS Comput.Biol. 2010,6,e1000866.
(39)Jones,S.;Daley,D.T.;Luscombe,N.M.;Berman,H.M.; Thornton,J.M.Nucleic Acids Research 2001,29,943.doi: 10.1093/nar/29.4.943
(40)Allers,J.;Shamoo,Y.J.Mol.Biol.2001,311,75.doi:10.1006/ jmbi.2001.4857
(41) Ellis,J.J.;Broom,M.;Jones,S.Proteins 2007,66,903.
(42) Chen,Y.C.;Lim,C.Nucleic Acids Research 2008,36,7078. doi:10.1093/nar/gkn868
(43) Bahadur,R.P.;Zacharias,M.;Janin,J.Nucleic Acids Research 2008,36,2705.doi:10.1093/nar/gkn102
(44) Shazman,S.;Mandel-Gutfreund,Y.PLoS Comput.Biol.2008, 4,e1000146.
(45) Brandman,R.;Brandman,Y.;Pande,V.S.PLoS One 2012,7, e30022.
(46) Terribilini,M.;Lee,J.H.;Yan,C.;Jernigan,R.L.;Honavar,V.; Dobbs,D.RNA 2006,12,1450.doi:10.1261/rna.2197306
(47) Kim,O.T.;Yura,K.;Go,N.Nucleic Acids Research 2006,34, 6450.doi:10.1093/nar/gkl819
(48) Chen,Y.C.;Lim,C.Nucleic Acids Research 2008,36,e29.
(49)Kumar,M.;Gromiha,M.M.;Raghava,G.P.Proteins 2008,71, 189.doi:10.1002/prot.v71:1
(50) Zhao,H.;Yang,Y.;Zhou,Y.Nucleic Acids Research 2011,39, 3017.
(51) Perez-Cano,L.;Fernandez-Recio,J.Proteins 2010,78,25.doi: 10.1002/prot.22527
(52) Ma,X.;Guo,J.;Wu,J.;Liu,H.;Yu,J.;Xie,J.;Sun,X.Proteins 2011,79,1230.
(53)Chen,Y.;Kortemme,T.;Robertson,T.;Baker,D.;Varani,G. Nucleic Acids Research 2004,32,5147.doi:10.1093/nar/ gkh785
(54) Zheng,S.;Robertson,T.A.;Varani,G.The FEBS Journal 2007, 274,6378.doi:10.1111/j.1742-4658.2007.06155.x
(55) Perez-Cano,L.;Solernou,A.;Pons,C.;Fernandez-Recio,J. Pac.Symp.Biocomput.2010,293.
(56) Katchalski-Katzir,E.;Shariv,I.;Eisenstein,M.;Friesem,A.A.; Aflalo,C.;Vakser,I.A.Proceedings of the National Academy of Sciences of the United States of America 1992,89,2195.doi: 10.1073/pnas.89.6.2195
(57) Chen,R.;Weng,Z.Proteins 2002,47,281.doi:10.1002/(ISSN) 1097-0134
(58) Gray,J.J.;Moughon,S.;Wang,C.;Schueler-Furman,O.; Kuhlman,B.;Rohl,C.A.;Baker,D.J.Mol.Biol.2003,331, 281.doi:10.1016/S0022-2836(03)00670-3
(59)Dominguez,C.;Boelens,R.;Bonvin,A.M.J.Am.Chem.Soc. 2003,125,1731.doi:10.1021/ja026939x
(60)Li,L.;Guo,D.;Huang,Y.;Liu,S.;Xiao,Y.BMC Bioinformatics 2011,12,36.doi:10.1186/1471-2105-12-36
(61) Zhang,C.;Lai,L.Journal of Computational Chemistry 2011, 32,2598.doi:10.1002/jcc.v32.12
(62)Li,C.H.;Cao,L.B.;Su,J.G.;Yang,Y.X.;Wang,C.X. Proteins 2012,80,14.doi:10.1002/prot.v80.1
(63) Setny,P.;Zacharias,M.Nucleic Acids Research 2011,39,9118. doi:10.1093/nar/gkr636
(64) Tuszynska,I.;Bujnicki,J.M.BMC Bioinformatics 2011,12, 348.doi:10.1186/1471-2105-12-348
(65) Jiang,F.;Kim,S.H.J.Mol.Biol.1991,219,79.doi:10.1016/ 0022-2836(91)90859-5
(66) Gabb,H.A.;Jackson,R.M.;Sternberg,M.J.J.Mol.Biol. 1997,272,106.doi:10.1006/jmbi.1997.1203
(67)Kozakov,D.;Brenke,R.;Comeau,S.R.;Vajda,S.Proteins 2006,65,392.doi:10.1002/prot.21117
(68)Abagyan,R.;Totrov,M.J.Mol.Biol.1994,235,983.doi: 10.1006/jmbi.1994.1052
(69) Wang,C.;Bradley,P.;Baker,D.J.Mol.Biol.2007,373,503. doi:10.1016/j.jmb.2007.07.050
(70) May,A.;Zacharias,M.Proteins 2008,70,794.
(71) Chaudhury,S.;Gray,J.J.J.Mol.Biol.2008,381,1068.doi: 10.1016/j.jmb.2008.05.042
(72) Lesk,V.I.;Sternberg,M.J.Bioinformatics 2008,24,1137.doi: 10.1093/bioinformatics/btn093
(73) Smith,G.R.;Sternberg,M.J.;Bates,P.A.J.Mol.Biol.2005, 347,1077.doi:10.1016/j.jmb.2005.01.058
(74) Huang,Y.;Liu,Z.J.Mol.Biol.2009,393,1143.doi:10.1016/ j.jmb.2009.09.010
(75) Harel,M.;Spaar,A.;Schreiber,G.Biophys.J.2009,96,4237. doi:10.1016/j.bpj.2009.02.054
(76)Kim,Y.C.;Tang,C.;Clore,G.M.;Hummer,G.Proceedings of the National Academy of Sciences of the United States of America 2008,105,12855.doi:10.1073/pnas.0802460105
(77) Tang,C.;Iwahara,J.;Clore,G.M.Nature 2006,444,383.doi: 10.1038/nature05201
(78)Volkov,A.N.;Ubbink,M.;van Nuland,N.A.J.Biomol.NMR 2010,48,225.doi:10.1007/s10858-010-9452-6
(79) Sanchez,I.E.;Ferreiro,D.U.;Dellarole,M.;de Prat-Gay,G. Proceedings of the National Academy of Sciences of the United States of America 2010,107,7751.doi:10.1073/pnas. 0911734107
(80) Harel,M.;Cohen,M.;Schreiber,G.J.Mol.Biol.2007,371, 180.doi:10.1016/j.jmb.2007.05.032
(81) Fawzi,N.L.;Doucleff,M.;Suh,J.Y.;Clore,G.M. Proceedings of the National Academy of Sciences of the United States of America 2010,107,1379.doi:10.1073/ pnas.0909370107
(82) Hwang,H.;Vreven,T.;Janin,J.;Weng,Z.Proteins 2010,78, 3111.doi:10.1002/prot.v78:15
(83) Liang,S.;Zhang,C.;Liu,S.;Zhou,Y.Nucleic Acids Research 2006,34,3698.doi:10.1093/nar/gkl454
(84) Guo,D.;Liu,S.Y.;Huang,Y.Y.;Xiao,Y.Journal of Biomolecular Structure and Dynamics 2012,in press.
(85) Li,X.;Liang,J.Knowledge-Based Energy Functions for Computational Studies of Proteins.In Computational Methods for Protein Structure Prediction and Modeling;Xu,Y.,Xu,D., Liang,J.,Eds.;New York:Springer,2006;Vol.1;p 71.
(86) Zhou,Y.;Duan,Y.;Yang,Y.;Faraggi,E.;Lei,H.Theoretical Chemistry Accounts 2011,128,3.doi:10.1007/s00214-010-0799-2
(87) Zhou,H.;Skolnick,J.Biophys.J.2011,101,2043.doi: 10.1016/j.bpj.2011.09.012
(88) Czaplewski,C.;Liwo,A.;Makowski,M.;Oldziej,S.; Scheraga,H.A.Coarse-Grained Models of Proteins:Theory andApplications.In Multiscale Approaches to Protein Modeling;Kolinski,A.Ed.;Springer,2010;p 35.
(89) Kortemme,T.;Morozov,A.V.;Baker,D.J.Mol.Biol.2003, 326,1239.doi:10.1016/S0022-2836(03)00021-4
(90) Jiang,L.;Kuhlman,B.;Kortemme,T.;Baker,D.Proteins 2005,58,893.doi:10.1002/prot.20347
(91) Jiang,L.;Lai,L.The Journal of Biological Chemistry 2002, 277,37732.doi:10.1074/jbc.M204514200
(92) Jiang,L.;Gao,Y.;Mao,F.;Liu,Z.;Lai,L.Proteins 2002,46, 190.doi:10.1002/(ISSN)1097-0134
(93) Wang,C.X.;Chang,S.;Gong,X.Q.;Yang,F.;Li,C.H.; Chen,W.Z.Acta Phys.-Chim.Sin.2012,28,751. [王存新,常 珊,龔新奇,楊 峰,李春華,陳慰祖.物理化學學報, 2012,28,751.]doi:10.3866/PKU.WHXB201202022
(94) Liu,S.;Li,Q.;Lai,L.Proteins 2006,64,68.doi:10.1002/ prot.20954
(95) Zacharias,M.Protein Science:a Publication of the Protein Society 2003,12,1271.
(96) Liang,S.;Liu,S.;Zhang,C.;Zhou,Y.Proteins 2007,69,244. doi:10.1002/prot.v69:2
(97) Huang,S.Y.;Zou,X.Proteins 2008,72,557.doi:10.1002/ prot.21949
(98) Sun,W.T.Advances in Mechanics 2011,41,60.[孫衛濤.力學進展,2011,41,60.]
(99) Pierce,B.;Weng,Z.Proteins 2007,67,1078.doi:10.1002/ prot.21373
(100) Zhou,H.;Zhou,Y.Protein Science:a Publication of the Protein Society 2002,11,2714.
(101) Lu,H.;Skolnick,J.Proteins 2001,44,223.doi:10.1002/ (ISSN)1097-0134
(102) Samudrala,R.;Moult,J.J.Mol.Biol.1998,275,895.doi: 10.1006/jmbi.1997.1479
(103) Chuang,G.Y.;Kozakov,D.;Brenke,R.;Comeau,S.R.;Vajda, S.Biophys.J.2008,95,4217.doi:10.1529/biophysj. 108.135814
(104) Liu,S.;Vakser,I.A.BMC Bioinformatics 2011,12,280.doi: 10.1186/1471-2105-12-280
(105) Liu,S.;Zhang,C.;Zhou,H.;Zhou,Y.Proteins 2004,56,93. doi:10.1002/prot.20019
(106) Lensink,M.F.;Mendez,R.;Wodak,S.J.Proteins 2007,69, 704.doi:10.1002/prot.21804
(107) Mendez,R.;Leplae,R.;Lensink,M.F.;Wodak,S.J.Proteins 2005,60,150.doi:10.1002/prot.20551
(108) Chang,S.;Jiao,X.;Li,C.H.;Gong,X.Q.;Chen,W.Z.; Wang,C.X.Biophysical Chemistry 2008,134,111.doi: 10.1016/j.bpc.2007.12.005
(109) Li,C.H.;Ma,X.H.;Shen,L.Z.;Chang,S.;Chen,W.Z.; Wang,C.X.Biophysical Chemistry 2007,129,1.doi:10.1016/ j.bpc.2007.04.014
(110) Guerois,R.;Nielsen,J.E.;Serrano,L.J.Mol.Biol.2002,320, 369.doi:10.1016/S0022-2836(02)00442-4
(111)Chen,N.Y.;Su,Z.Y.;Mou,C.Y.Physical Review Letters 2006,96,078103.doi:10.1103/PhysRevLett.96.078103
(112) Korkut,A.;Hendrickson,W.A.Proceedings of the National Academy of Sciences of the United States of America 2009, 106,15673.doi:10.1073/pnas.0907684106
(113) Li,W.;Wolynes,P.G.;Takada,S.Proceedings of the National Academy of Sciences of the United States of America 2011, 108,3504.doi:10.1073/pnas.1018983108
(114) Ellis,J.J.;Jones,S.Proteins 2008,70,1518.
(115) Lindahl,E.;Delarue,M.Nucleic Acids Research 2005,33, 4496.doi:10.1093/nar/gki730
(116) Cavasotto,C.N.;Kovacs,J.A.;Abagyan,R.A.J.Am.Chem. Soc.2005,127,9632.doi:10.1021/ja042260c
(117) Petrone,P.;Pande,V.S.Biophys.J.2006,90,1583.doi: 10.1529/biophysj.105.070045
(118) Korkut,A.;Hendrickson,W.A.Proceedings of the National Academy of Sciences of the United States of America 2009, 106,15667.doi:10.1073/pnas.0907674106
(119) Dobbins,S.E.;Lesk,V.I.;Sternberg,M.J.Proceedings of the National Academy of Sciences of the United States of America 2008,105,10390.doi:10.1073/pnas.0802496105
(120) Pons,C.;Solernou,A.;Perez-Cano,L.;Grosdidier,S.; Fernandez-Recio,J.Proteins 2010,78,3182.doi:10.1002/prot. v78:15
(121) Perez-Cano,L.;Jimenez-Garcia,B.;Fernandez-Recio,J. Proteins 2012,80,1872.
(122) Barik,A.;Nithin,C.;Manasa,P.;Bahadur,R.P.Proteins 2012, 80,1866.
(123) Hermann,T.Angew Chem.Int.Edit.2000,39,1890.doi: 10.1002/(ISSN)1521-3773
(124) Mackay,J.P.;Font,J.;Segal,D.J.Nature Structural& Molecular Biology 2011,18,256.doi:10.1038/nsmb.2005
(125) Filipovska,A.;Razif,M.F.;Nygard,K.K.;Rackham,O. Nature Chemical Biology 2011,7,425.doi:10.1038/ nchembio.577
(126) Dong,S.;Wang,Y.;Cassidy-Amstutz,C.;Lu,G.;Bigler,R.; Jezyk,M.R.;Li,C.;Hall,T.M.;Wang,Z.The Journal of Biological Chemistry 2011,286,26732.doi:10.1074/jbc. M111.244889
(127) Chen,Y.;Varani,G.Chemistry&Biology 2011,18,821.
(128) Lu,G.;Dolgner,S.J.;Hall,T.M.Current Opinion in Structural Biology 2009,19,110.doi:10.1016/ j.sbi.2008.12.009
(129) Cooke,A.;Prigge,A.;Opperman,L.;Wickens,M. Proceedings of the National Academy of Sciences of the United States of America 2011,108,15870.doi:10.1073/ pnas.1105151108
(130) Koh,Y.Y.;Wang,Y.;Qiu,C.;Opperman,L.;Gross,L.;Tanaka Hall,T.M.;Wickens,M.RNA 2011,17,718.doi:10.1261/ rna.2540311
(131) Wells,J.A.;McClendon,C.L.Nature 2007,450,1001.doi: 10.1038/nature06526
(132) Arkin,M.R.;Wells,J.A.Nat.Rev.Drug.Discov.2004,3,301. doi:10.1038/nrd1343
(133)Arkin,M.Curr.Opin.Chem.Biol.2005,9,317.doi:10.1016/ j.cbpa.2005.03.001
(134) Bourgeas,R.;Basse,M.J.;Morelli,X.;Roche,P.PloS One 2010,5,e9598.
(135) Zhang,C.;Lai,L.Biochemical Society Transactions 2011,39, 1382.doi:10.1042/BST0391382
(136) Liu,S.;Zhu,X.;Liang,H.;Cao,A.;Chang,Z.;Lai,L. Proceedings of the National Academy of Sciences of the United States of America 2007,104,5330.doi:10.1073/ pnas.0606198104
(137) Fleishman,S.J.;Whitehead,T.A.;Ekiert,D.C.;Dreyfus,C.; Corn,J.E.;Strauch,E.M.;Wilson,I.A.;Baker,D.Science 2011,332,816.doi:10.1126/science.1202617
(138) Der,B.S.;Kuhlman,B.Science 2011,332,801.doi:10.1126/ science.1207082
(139) Zhang,C.;Lai,L.Proteins 2012,80,1078.doi:10.1002/prot. v80.4
(140) Bai,H.J.;Lai,L.H.Acta Phys.-Chim.Sin.2010,26,1988. [白紅軍,來魯華.物理化學學報,2010,26,1988.]doi: 10.3866/PKU.WHXB20100725
August 23,2012;Revised:September 11,2012;Published on Web:September 11,2012.
Protein-RNA Interaction Interface Prediction and Design
HUANG Yang-Yu YANG Xiu-Feng LI Hao-Tian JI Xiao-Feng CHENG Hong-Li ZHAO Yun-Jie GUO Da-Chuan LI Lin LIU Shi-Yong*
(Biomolecular Physics and Modeling Group,School of Physics,Huazhong University of Science and Technology, Wuhan 430074,P.R.China)
RNA-protein interactions play key roles in many biological processes.The three dimensional (3D)structure of protein-RNA complexes can be determined experimentally by structural biologists.The recognition between protein and RNA can be understood from the 3D atomic structure.However,the structure determination of protein-RNA complexes by experimental methods is often difficult and costly, and limited to the binding strength.Thus,the prediction and design of protein-RNA complex structures is important in biological medical research.In this review,we will discuss the recent progress in protein-RNA interface prediction and design,which includes the following aspects:(1)protein-RNA docking and the conformational change on binding;(2)the recognition mechanism of protein-RNA binding;(3)the molecular design based on the protein-RNA interface.Improvement of the protein-RNA docking algorithm will help us annotate a large number of proteins and RNA with unknown function,and molecular design based on macromolecular interactions will be useful in drug design.
Protein-RNA interaction;Molecular docking;Interface design;Complex structure prediction
10.3866/PKU.WHXB201209111
?Corresponding author.Email:liushiyong@gmail.com;Tel:+86-27-87558335-805.
The project was supported by the National Natural Science Foundation of China(31100522),National High Technology Research and Development Program of China(2012AA020402),Specialized Research Fund for the Doctoral Program of Higher Education,China(20110142120038).
國家自然科學基金(31100522),國家高技術研究發展計劃(2012AA020402),高等學校博士學科點專項科研基金(20110142120038)資助
O641