唐朝 張廣旭 胡鈞 呂軍鴻?
1) (中國科學院上海應用物理研究所, 中國科學院微觀界面物理與探測重點實驗室, 上海 201800)
2) (中國科學院上海高等研究院, 基礎交叉研究中心, 上海 201210)
3) (中國科學院大學, 北京 100049)
腫瘤抑制蛋白p53是一種轉錄因子, 在細胞周期停滯、衰老和凋亡調控中發揮重要作用, 其突變導致的功能喪失與癌癥敏感性高度相關[1].迄今為止, p53是癌癥中突變頻率最高的蛋白[2], 使p53恢復其野生型構象和功能以觸發腫瘤細胞凋亡是開發p53靶向藥物的主要策略[3,4].由393個殘基構成的人p53蛋白分子自氮端起依次為反式激活結構域(殘基序列1-61), 脯氨酸富集區域(殘基序列64-94), 中央DNA結合域(殘基序列95-292, 也稱為p53蛋白核心結構域, p53C), 四聚化結構域和碳末端[5].其中, p53C區域及其與DNA分子結合的結構信息已被多個研究解析[6,7], 如圖1所示,p53C的DNA結合域包括兩部分: DNA主溝結合的L1環和H2螺旋區域, DNA小溝結合的由Zn2+穩定的L2環和L3環區域[8].p53C極性基團中氫鍵對于全長p53蛋白的穩定性具有重要作用.其中, R249殘基與相鄰基團相互作用, 具有穩定p53C的功能[9,10].R249突變作為p53蛋白最常發生的殘基錯義突變之一, 會破壞相鄰殘基的配位及氫鍵結構(圖1(c)), 從而影響蛋白的穩定性, 進而顯著影響p53蛋白活性[11].
研究發現, 蛋白中的多個突變或者小分子結合能夠恢復p53的活性[5].最新報道顯示, 三價砷(As)與包括R249S在內的多種p53突變型的結合具有恢復蛋白分子活性的變構調節作用[12](圖1(a)和圖1(b)).變構作用引發的動力學性質的差異可能是砷(III)結合恢復p53蛋白活性的關鍵, 其中的分子動力學等物理機制尚不清楚.分子動力學模擬是探索蛋白質動力學特征的強大計算工具, 可以為蛋白-配體相互作用引起的結構變化提供理論見解[13].基于主成分分析的理論研究表明, 蛋白質的構象波動中存在高度集中的太赫茲頻率群體運動模式[14].太赫茲光譜技術的發展使得測量生物分子在太赫茲頻率的低頻振動成為可能,為研究蛋白-配體相互作用提供了重要手段[15-17].基于彈性網絡模型的正則模式分析有效地闡明了蛋白分子的低頻集體振動[18,19], 以解釋配體結合引起的低頻振動變化[20].從太赫茲生物物理的角度揭示砷(III)對p53蛋白活性的恢復拯救機制, 有利于深入理解蛋白分子功能與太赫茲頻率集體運動的關系.
本文對一系列蛋白分子的集體振動進行了分析, 計算了蛋白分子的低頻率振動模式, 以研究砷(III)結合引起的R249S突變型p53C蛋白DNA結合域的低頻振動模式恢復.此外, 通過原子骨架波動和太赫茲頻率振動模態統計分析了p53蛋白分子活性恢復的運動特征.本研究為配體結合誘導的蛋白分子活性功能恢復提供了一種可能的物理機制闡釋, 為蛋白分子的太赫茲頻率運動與DNA結合活性之間的動力學關系提供了新的視角.
從蛋白質數據庫(PDB)[21]中獲得了未結合DNA的自由狀態p53核心區域(p53C)的結構,其中包括野生型p53 (PDB: 1TSR A), R249S突變體 (PDB: 3D06), 砷(III)結合的R249S突變體(PDB: 7DHZ), 截取其中核心區域, 即97—287殘基用于模擬.在計算前, 用Modeler軟件(版本9.24)[22]補全原始結構中缺失的殘基, 并用Pdb-Viewer軟件(版本4.1)[23]補全其余缺失原子.原始結構中缺失的殘基不包含本文中特殊標記出的殘基.
首先評估了不同p53結構導致低頻振動的差異.通常, 正則模式分析需要通過對從PDB中獲得的p53結構進行扭曲, 使用能量最小化的初始結構.我們使用了彈性網絡模型, 該模型允許使用PDB中獲得的原始結構作為初始結構.為了更精確地展示特定殘基中可能存在的重原子間相互作用, 采用了Yao等[24]開發的全原子彈性網絡模型(all-atom elastic network model, AAENM).與其他粗粒度方法相比, AAENM模型包括了所有的重原子.這一基于全原子模型的結果與基于全經驗力場計算得到的正則模式有較好的一致性.所有正則模式計算的步驟均使用基于R語言的Bio3D軟件包[25]實現.
本文中所有可視化分析使用PyMOL軟件繪制, 其中, 用α碳原子的軌跡表示各殘基的軌跡.為了更好地可視化p53的運動軌跡, 各運動模態的特征向量被放大了2.5倍.
原子波動統計了所有正則振動模式, 并按照下式計算[26]:

其中: 下角標k對應于原子在x,y,z方向上的運動分量; 下角標i為正則模式序數;T為溫度;kB為溫度為T時的玻爾茲曼常數;u,M和ω分別表示特征向量、對角質量矩陣和正則模式頻率.
這里按照Kaynak和Doruker[27]的方法分析了正則模式頻率的移動.結構a相對于結構b的第i個正則振動模式的頻率偏移百分數fs(i)按下式計算:

其中,ωia和ωib分別為結構a和結構b第i個太赫茲振動模式的頻率.具體到本研究中, 結構a為R249S突變體(R249S)或砷(III)結合的R249S突變體(R249S-As), 結構b即為野生型p53C.
為比較R249S和R249S-As的頻率偏移百分數, 這里定義第i個正則振動模式的頻率恢復比例fr(i), 按下式計算:

所有正則振動模式的原子運動的動力學相關性可基于(4)式計算[28]:

其中,cij為殘基i和j間的皮爾遜相關系數, [σij](3)為殘基i和j間的3 × 3協方差矩陣的交叉子矩陣, tr(·)表示矩陣的跡.
我們使用基于ENM的計算展示了平衡位置附近的野生型p53C (Wild type, WT), R249S和R249S-As的最低頻率集體振動模式.如圖2(a)所示, 野生型p53C的DNA結合域總體具有較小的振動幅度, L1環和H2螺旋區域幾乎在最低振動頻率保持剛性, L2環和L3環的振動特征值與整個p53C結構相比較小.這種太赫茲頻段的最低頻率振動模式或許有助于p53C的DNA結合域與DNA結構分子對接的拓撲結構, 使其可以延伸到DNA的結合溝槽中.由于R249的突變會破壞與相鄰殘基的氫鍵和配位結構, R249S的最低頻率振動模式表現出顯著的變化(圖2(b)): L1環顯示了較大的擺動運動幅度, 而H2螺旋的振動在R249S中很明顯.相比之下, L2環和L3環在振動幅度上的增加較小.總之, R249S突變使p53C的DNA結合域最低頻率振動幅度總體增加, 意味著突變導致了蛋白分子內部的太赫茲頻率運動模式的變化,蛋白分子的柔性構象變化反映了DNA結合能力的下降.

圖2 砷(III)對p53C突變體R249S的低頻振動模式恢復 (a) 野生型p53C (wild type,WT) 、(b) R249S突變型p53C (R249S)、(c) 砷(III)結合的R249S突變型p53C的最低頻率集體振動模式軌跡; (d)野生型p53C (wild type,WT) 、(e) R249S突變型p53C(R249S)、(f) 砷(III)結合的R249S突變型p53C的次低頻率集體振動模式軌跡; 灰色箭頭表示對應頻率蛋白分子骨架的振動方向, 箭頭長度代表相對振幅大小Fig.2.The trajectory of the lowest-frequency vibrations of (a) wild type (WT), (b) R249S, (c) R249S-As.The trajectory of the second lowest-frequency vibrations of (d) wild type (WT), (e) R249S, (f) R249S-As.Arrows represent the direction of motion of each residue from the initial position, with length of arrows indicating vibration amplitude, relatively.
隨后, 我們檢驗了R249S-As的最低頻率振動模式.在最近關于三氧化二砷(III)恢復p53突變蛋白活性的研究中, 認為砷(III)是通過對相鄰殘基的變構作用在結構上穩定p53C來恢復蛋白活性功能的[12].為此, 我們研究了砷(III)結合的R249S突變型p53C (R249S-As)的最低頻率運動特征, 以探索小分子結合恢復蛋白功能的物理機制.盡管R249S-As的整體最低頻率運動模式與WT相比有所變化, 但其運動軌跡顯示砷(III)極大地穩定了R249S的L1環區域的向外擺動運動,使DNA主溝結合殘基序列的局部運動狀態得以恢復(圖2(c)).換句話說, R249S-As整體最低頻率振動模式相比WT發生了轉換, 但其DNA結合域的運動顯著恢復了.
此外, 在次低頻振動模式中, 可觀察到砷(III)結合對R249S突變體的DNA結合域運動的明顯恢復作用(圖2(d)—(f)).其中, 野生型p53C結構的L1環和H2螺旋具有相對于p53C蛋白中心位置鉸鏈開合的運動特征, 在R249S突變體中這一振動模式被抑制了, 而在砷(III)結合后, 這一鉸鏈運動模式得到恢復; 從DNA結合域的振動特征模式方面看, 同樣觀察到R249S-As的運動更類似于野生型的振動模式.可見, p53C蛋白中心最低頻率的兩個振動模式都顯示蛋白的活性與太赫茲頻率集體振動有關.
通過統計所有正則振動模式的原子波動, 可以獲得蛋白分子骨架的整體波動情況.原子波動參數用以描述p53C野生型、突變結構和活性恢復結構之間的蛋白分子內部運動的特定差異[29].如圖3所示, WT, R249S和R249S-As的原子波動在非DNA結合區域的趨勢一致, 反映了p53C蛋白分子整體柔性和形變能較為穩定, 其總體趨勢取決于蛋白分子骨架構成及二級結構.我們注意到,R249S突變蛋白在L1環和L2環區域具有較高水平的原子波動, 這可能是R249S不利于DNA結合的原因之一; R249S-As在L1環和L2環區域的原子波動恢復到了與野生型一致的水平, 而R249SAs的L3環原子波動幅度相比野生型有所增加.綜合最低頻率軌跡和原子波動分析結果, 可以發現砷(III)結合明顯改變L1環區域的低頻運動, 意味著L1環區域的運動對DNA結合活性至關重要.

圖3 (a) p53C野生型、R249S突變型和砷(III)結合的R249S突變型p53C的原子波動分析(沿X軸的灰色條代表序列, 其中用四種不同顏色分別標記4個區域); (b) L1環區域(殘基序列112—124)的局部原子波動分析; (c) L2環區域(殘基序列163—195)的局部原子波動分析Fig.3.(a) Atomic fluctuation analysis of the DNA binding domain of the WT, R249S, and R249S-As.The gray bar above the X axis represents the sequence, where four regions are marked with four colors.(b) The details of the yellow (L1, residues 112—124)dotted areas.(c) The details of the blue (L2, residues 163—195) dotted areas.
蛋白分子的欠阻尼振動的頻率決定了運動發生的時間尺度.對蛋白分子自由狀態和結合狀態的模擬研究表明, 配體的結合會造成頻率向高頻方向偏移[30], 頻率參數可能在反映蛋白-配體相互作用中有重要意義.基于ENM獲取的振動模式譜顯示, p53C自最低頻率振動模式的200個太赫茲振動模式處于0—1 THz的頻率范圍內, 并且野生型、突變體和砷(III)結合突變體振動模式可以根據頻率分布區分(圖4(a)).因此, 我們統計了突變體和砷(III)結合突變體前200個太赫茲振動模式相對野生型p53C的頻率偏移.如圖4(b)所示, 在這一范圍內, R249S突變均造成了頻率的負偏移,而除了第7振動模式(即最低頻率振動模式)外,砷(III)結合的突變體對所有振動模式的頻率展示出了明顯的恢復作用.圖4(b)中插圖展示了砷(III)結合對R249S突變體頻率變化的恢復效果, 部分振動模式的恢復效果可達60%.此外, 這里專門研究了特定頻率太赫茲振動模式的偏移, 如圖4(c)所示.在0.3—1.3 THz范圍內, R249S突變均造成了頻率的負偏移, 偏移程度隨頻率升高而變小.這暗示突變對太赫茲振動模式的影響可能主要體現在較低頻段.與之對應, 砷(III)結合對頻率的恢復效果也主要體現在較低區域(0.3—0.8 THz), 而在更高頻段恢復效果較弱.砷(III)結合對p53C突變體振動頻率的恢復, 進一步表明蛋白活性的恢復與其太赫茲頻率振動屬性相關.

圖4 (a) 0—1.0 THz內的野生型p53C (WT), 突變體(R249S)和砷(III)結合突變體(R249S-As)的振動譜; (b) 突變體(R249S)和砷(III)結合突變體(R249S-As)相對于野生型p53 C的前200個振動模式的太赫茲振動頻率偏移百分數, 插圖為砷(III)結合后突變體的頻率恢復比例; (c) R249S和R249S-As在野生型p53C特定頻率處對應振動模式的頻率偏移百分數Fig.4.(a) Mode index spectra of wild-type p53C (WT), mutant (R249S) and As-bound mutant (R249S-As) in 0—1.0 THz; (b) the frequency shift (%) of the R249S and the R249S-As mutant from the WT in first 200 collective vibration modes, and the insert shows the proportion of frequency recovery for the As-bound R249S mutants; (c) the frequency shift (%) of corresponding mode of the R249S and the R249S-As at certain frequencies of WT.
我們引入了動力學相關矩陣來解釋突變和砷(III)結合對太赫茲振動的破壞和恢復.如圖5所示, 動力學正相關區域用黑色線框標出, 與DNA直接接觸的4個殘基和直接與砷(III)結合的4個殘基在橫軸上分別用綠色和黃色虛線標出.動力學相關矩陣顯示, L1, L2, L3和H2這4個區域是彼此動力學正相關的.這意味著, 某一區域因突變而造成的動力學變化可以通過這種相關性網絡傳遞到其他區域.此外, 砷(III)結合的L1區域與本區域的K120殘基, 以及H2區域的R273和R280殘基都具備明顯的運動相關性, 尤其是兩個DNA結合殘基(R273和R280)的運動與3個砷(III)結合殘基(C124, M133, M135)直接正相關.這種動力學相關性網絡可能是砷(III)結合作為一種有效的p53蛋白活性恢復策略的生物物理基礎.

圖5 野生型p53C的動力學相關矩陣.每個點根據它在X軸和Y軸上的兩個殘基的Cab值(殘基a與b之間的相關性)來著色.Cab值根據所得太赫茲振動模態計算, 其中Cab為1, —1和0, 分別表示完全相關、完全負相關和不相關.橫軸上用綠色虛線標出了4個與DNA作用的殘基, 縱軸上用黃色虛線標出了4個與砷(III)結合的殘基.黑色虛線框標出了4個正相關區域, 其中L1與H2相關區域被專門表示在右邊, 并與R249S突變體, 砷(III)結合R249S突變體動力學相關矩陣的對應區域比較Fig.5.Residue-residue motion correlation map of the DNA binding domain of the wild type p53C, where each point is colored according to its Cab (correlation between residues a and b) of the two residues on the X axis and Y axis.The Cab are calculated by all modes, where Cab = 1, —1, 0 means completely correlation, completely anticorrelation and no correlation, respectively.The four DNA-contact residues are marked in dark green dash curves on the X axis, and the four As-bound residues are marked in yellow dash curves on the Y axis.The black dashed boxes mark the four positively correlated regions, where the correlated regions between L1 and H2 are specifically represented on the right and compared with the corresponding regions of the correlation map of the R249S and the As-bound R249S mutant.
我們進一步具體闡釋了砷(III)結合對L1-H2動力學相關網絡的調控作用.不同結構區域間運動的正相關性意味著在大多數太赫茲振動模式中, 兩區域的運動是一個方向的, 這種協同振動具有重要的功能意義.對野生型p53C, 兩區域間殘基的運動顯示出了廣泛的正相關性, 尤其是兩個DNA結合殘基(K120和R280)之間展示出了運動相關性,這可能與DNA結合過程中的協同運動有關.這種相關性在R249S突變體中被顯著削弱, 而在砷(III)結合后得以恢復.綜上, 動力學相關性分析顯示砷(III)的結合具有跨區域的運動耦合相關性影響,使砷(III)結合區域(L1)的殘基與H2區域的運動耦合恢復至野生型p53C狀態.
本文采用分子動力學模擬的方法描述了p53C蛋白, 其R249S突變蛋白和砷(III)結合的R249S突變蛋白結構的低頻運動.基于全原子彈性網絡模型的正則模式分析, 砷(III)結合對p53C突變蛋白的DNA結合域的太赫茲頻率運動有恢復作用,主要體現在L1環區域的最低頻率振動模式和DNA結合域的次低頻振動模式的恢復.同時, 所有正則模式振動的統計結果表明砷(III)的結合影響了R249S突變蛋白DNA結合域的原子波動,使L1和L2環的原子波動恢復至野生型p53C的水平.除了砷(III)對DNA結合域的低頻運動有恢復作用外, 振動頻移還反映出p53C太赫茲振動態分布的恢復.基于殘基動力學相關矩陣進一步解釋了砷(III)結合導致的結構變化與太赫茲運動恢復之間的關聯機理.本研究從太赫茲生物物理的角度分析了小分子配體對蛋白活性恢復的動力學過程, 為理解蛋白的功能和集體低頻振動的關系提供了一個新的證據, 有望啟發p53蛋白相關的癌癥發病機理和精準治療研究.