999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于氨基酸序列和模擬結(jié)構(gòu)預測蛋白質(zhì)穩(wěn)定性的研究進展

2017-05-19 09:39:49易華偉唐曉峰
生物技術(shù)通報 2017年4期
關(guān)鍵詞:利用結(jié)構(gòu)

易華偉 唐曉峰

(武漢大學生命科學學院,武漢 430072)

基于氨基酸序列和模擬結(jié)構(gòu)預測蛋白質(zhì)穩(wěn)定性的研究進展

易華偉 唐曉峰

(武漢大學生命科學學院,武漢 430072)

穩(wěn)定性是蛋白質(zhì)重要性質(zhì)之一,工業(yè)用蛋白質(zhì)需要良好的穩(wěn)定性,進化過程中蛋白質(zhì)新功能的衍生也依賴于蛋白質(zhì)的穩(wěn)定性。提高蛋白質(zhì)的穩(wěn)定性,尤其是提高未知結(jié)構(gòu)蛋白質(zhì)的穩(wěn)定性是一項非常具有挑戰(zhàn)性的工作——傳統(tǒng)的蛋白質(zhì)改造方法如定向進化費時費力,傳統(tǒng)的理性設(shè)計則難以被其他研究者復制。雖然目前有很多蛋白質(zhì)穩(wěn)定性預測工具,但這些預測工具大多都需要預先測定蛋白質(zhì)的三維結(jié)構(gòu),因此結(jié)構(gòu)未知的蛋白質(zhì)的穩(wěn)定性預測受到了限制。近年來,人們開發(fā)了一些利用蛋白質(zhì)的氨基酸序列和模擬結(jié)構(gòu)來預測突變對結(jié)構(gòu)未知蛋白質(zhì)穩(wěn)定性影響的預測工具。介紹該方面的研究進展,以期為蛋白質(zhì)工程研究提供參考。

蛋白質(zhì)穩(wěn)定性;預測工具;氨基酸序列;蛋白質(zhì)結(jié)構(gòu)模擬

蛋白質(zhì)包括各種酶,在食品、清潔劑、造紙、冶金、生物燃料等工業(yè)生產(chǎn)和應(yīng)用中發(fā)揮著重要的作用[1],而良好的穩(wěn)定性是蛋白質(zhì)在應(yīng)用中必須具備的重要性質(zhì)。結(jié)構(gòu)的穩(wěn)定往往意味著蛋白質(zhì)能夠在不利條件下依然具備優(yōu)良的性能[2]。例如,嗜熱蛋白酶由于其結(jié)構(gòu)剛性較強,因此其除熱穩(wěn)定性較嗜溫蛋白酶好外,在含有變性劑的條件下嗜熱蛋白酶也比嗜溫蛋白酶更具穩(wěn)定性,具有更高的活性。在蛋白質(zhì)工程研究中,穩(wěn)定性好的蛋白質(zhì)更適合蛋白質(zhì)功能方面的改造,因為和穩(wěn)定性較差的蛋白質(zhì)相比,具有良好穩(wěn)定性的蛋白質(zhì)更能耐受大量的氨基酸突變[3]。此外,在進化過程中,蛋白質(zhì)是通過氨基酸序列的修飾(包括替換、刪除和插入氨基酸殘基)從一個共同的祖先演化而來的[4],很多學者認為,當?shù)鞍踪|(zhì)突變增加新功能的時候其穩(wěn)定性會降低[5],所以蛋白質(zhì)的穩(wěn)定性在蛋白質(zhì)進化過程中也發(fā)揮著重要的作用。

在傳統(tǒng)的蛋白質(zhì)工程研究中,主要有定向進化和理性設(shè)計兩種方法來獲得更穩(wěn)定的蛋白質(zhì)。通過定向進化[6]提高蛋白質(zhì)的穩(wěn)定性是指在蛋白質(zhì)的氨基酸序列中引入隨機突變,構(gòu)建一個突變體庫,然后在這個突變體庫中篩選出穩(wěn)定性提高的突變體。定向進化是提高蛋白質(zhì)穩(wěn)定性很有效的方法,但也有不足之處——為了得到合適的突變體往往需要建立很大的突變體庫,然后從成千上萬個突變體中篩選出合適的突變體,這是一個耗時、費力并且價格昂貴的過程,當缺乏合適的高通量篩選方法時,定向進化就顯得不夠高效。通過理性設(shè)計來獲得更穩(wěn)定的蛋白質(zhì)是一種完全不同于定向進化的方法,傳統(tǒng)的理性設(shè)計需要研究者在非常了解目的蛋白結(jié)構(gòu)與功能之間關(guān)系的前提下,在特定的位點引入突變。和定向進化相比,理性設(shè)計不需要構(gòu)建大量的突變體,但其結(jié)果極大地取決于研究者的專業(yè)知識,而且整個過程難以被其他的研究者復制[7]。

通過生物信息學的方法預測突變對蛋白質(zhì)穩(wěn)定性的影響是目前研究的熱點之一,預測的方法主要分為4類[8]:(1)物理勢能方法;(2)統(tǒng)計勢能方法;(3)經(jīng)驗勢能方法;(4)機器學習方法。人們利用以上方法開發(fā)了一系列與蛋白質(zhì)穩(wěn)定性預測相關(guān)的軟件/服務(wù)器,然而這些軟件/服務(wù)器絕大多數(shù)都是根據(jù)蛋白質(zhì)結(jié)構(gòu)來進行預測的。隨著高通量測序技術(shù)的發(fā)展,蛋白質(zhì)序列的數(shù)量和蛋白質(zhì)實驗解析結(jié)構(gòu)的數(shù)量之間的差距正在被進一步拉大[9],蛋白質(zhì)結(jié)構(gòu)未知極大地限制了這些預測軟件/服務(wù)器的使用,而僅依賴蛋白質(zhì)的氨基酸序列或模擬結(jié)構(gòu)來預測蛋白質(zhì)穩(wěn)定性的軟件就能解決這一難題。下面分別對目前常用的基于氨基酸序列和基于模擬結(jié)構(gòu)預測蛋白質(zhì)穩(wěn)定性的生物信息學方法進行介紹。

1 基于氨基酸序列預測蛋白質(zhì)穩(wěn)定性

隨著ProTherm(Thermodynamic Database for Proteins and Mutants,http://www.abren.net/protherm/)等數(shù)據(jù)庫中收錄的越來越多的關(guān)于蛋白質(zhì)及其突變體穩(wěn)定性的實驗數(shù)據(jù),通過機器學習的手段來預測蛋白質(zhì)穩(wěn)定性的方法應(yīng)運而生[10]。機器學習的方法可以分為基于氨基酸序列預測和基于蛋白質(zhì)結(jié)構(gòu)預測兩種方式,首先介紹基于氨基酸序列預測蛋白質(zhì)穩(wěn)定性的機器學習方法。

1.1 預測過程及原理

機器學習方法通常是利用蛋白質(zhì)的序列、結(jié)構(gòu)特征直接從數(shù)據(jù)入手建立計算模型,從而進行預測[11]。主要過程如下:給出待測蛋白質(zhì)的氨基酸序列和氨基酸替換信息,其主要目的是預測該替換能否改變蛋白質(zhì)的穩(wěn)定性。通過利用現(xiàn)有的實驗研究數(shù)據(jù)構(gòu)建一個分類器來預測氨基酸替換能否使蛋白質(zhì)穩(wěn)定性發(fā)生變化,即通過自由能的改變(ΔΔG)以及改變的方向預測穩(wěn)定性的變化——當ΔΔG > 0時,穩(wěn)定性提高;當ΔΔG < 0時,穩(wěn)定性降低[12]。機器學習方法利用的蛋白質(zhì)實驗數(shù)據(jù)主要包括突變信息(野生型和突變體殘基)、殘基的位置(根據(jù)二級結(jié)構(gòu)和溶劑可及性的預測結(jié)果)[13,14]、實驗的條件、鄰近的殘基信息、氨基酸性質(zhì)[12,15]和進化信息[10,16]等。

1.2 相關(guān)軟件介紹

人們已經(jīng)開發(fā)出不少基于氨基酸序列的蛋白質(zhì)穩(wěn)定性預測軟件/服務(wù)器,目前應(yīng)用較多、已獲得一定認可的有以下幾種:

I-Mutant2.0[17]。I-Mutant2.0是在2005年開發(fā)的第一款可以利用氨基酸序列來預測點突變對蛋白質(zhì)穩(wěn)定性影響的軟件,該軟件也可以利用蛋白質(zhì)的三維結(jié)構(gòu)預測蛋白質(zhì)穩(wěn)定性。I-Mutant2.0既可以作為一個分類器來預測點突變對蛋白質(zhì)穩(wěn)定性的改變方向,也可以用來估算相關(guān)的自由能變化值。從交叉驗證的結(jié)果可知,該軟件利用結(jié)構(gòu)信息和序列信息預測的結(jié)果與實驗數(shù)據(jù)的結(jié)果相比準確率分別為80%和77%。

Mupro。Mupro是Cheng等在[8]2006年開發(fā)的一款利用支持向量機預測蛋白質(zhì)穩(wěn)定性的在線服務(wù)器,該服務(wù)器只需要知道蛋白質(zhì)的序列信息,直接將序列信息作為輸入信號,然后利用機器學習的方法提取對蛋白質(zhì)穩(wěn)定性起關(guān)鍵作用的序列元件。該服務(wù)器也可以通過蛋白質(zhì)三維結(jié)構(gòu)信息獲得更準確的預測結(jié)果,但Cheng認為僅僅依賴于氨基酸序列的預測精度已經(jīng)達到了和依賴于蛋白質(zhì)結(jié)構(gòu)預測相近的程度,預測的準確率分別為84.1%和84.5%。

INPS。Fariselli等[18]在2015年開發(fā)的軟件INPS是利用支持向量機回歸的方法,通過預測蛋白質(zhì)單點突變后熱力學自由能的變化來預測突變對蛋白質(zhì)穩(wěn)定性的影響。該軟件只需利用蛋白質(zhì)序列信息,并不需要蛋白質(zhì)三維結(jié)構(gòu)。在非冗余數(shù)據(jù)集上進行交叉驗證和在含有大量腫瘤抑制蛋白質(zhì)p53突變體數(shù)據(jù)庫中測試結(jié)果表明,INPS和最好的基于結(jié)構(gòu)的預測方法,如mCSM、PoPMuSiC和Duet(見后)預測精度非常接近。

EASE-MM。Folkman[13]團隊在近幾年發(fā)表了一系列關(guān)于基于氨基酸序列預測蛋白質(zhì)穩(wěn)定性的文章[13,14,16],并開發(fā)了一款基于序列的預測軟件EASE-MM,該軟件包含了5種專業(yè)的支持向量機模型,先利用氨基酸序列預測出突變氨基酸殘基位點附近的二級結(jié)構(gòu)和溶劑可及表面區(qū)域,然后將這些信息作為預測的依據(jù)。EASE-MM在10倍交叉驗證和獨立測試中皮爾遜相關(guān)系數(shù)達到了0.53-0.59,這一結(jié)果優(yōu)于其他的預測軟件,如I-Mutant2.0、Mupro、FoldX、PoPMuSiC2.1等(見后),這些軟件在測試中皮爾遜相關(guān)系數(shù)為0.32-0.57[13]。

MuStab。MuStab[12]通過支持向量機利用自由能的變化來預測突變對蛋白質(zhì)穩(wěn)定性的影響。為了準確預測蛋白質(zhì)的穩(wěn)定性,其通過利用不同的序列特征來預測氨基酸替換導致的蛋白質(zhì)穩(wěn)定性變化,這些序列特征可以分為生物化學特征、結(jié)構(gòu)特征、經(jīng)驗特征和其他生物學特征4類,該軟件預測的準確率高達84.59%。

Scpred[19]。Scpred是一款蛋白質(zhì)穩(wěn)定中心(stability centers)分析軟件,所謂穩(wěn)定中心即對蛋白質(zhì)穩(wěn)定性起關(guān)鍵作用的氨基酸殘基,發(fā)生在穩(wěn)定中心的氨基酸突變會降低蛋白質(zhì)的穩(wěn)定性。Scpred只需要利用蛋白質(zhì)序列信息,通過神經(jīng)網(wǎng)絡(luò)方法預測起穩(wěn)定作用的氨基酸殘基。

1.3 準確率分析

過去人們普遍認為基于氨基酸序列要比基于蛋白質(zhì)三維結(jié)構(gòu)的預測軟件準確率低[8],但是Khan等[20]在2010年系統(tǒng)地分析了11種與蛋白質(zhì)穩(wěn)定性預測有關(guān)的軟件,其中包含了3種基于氨基酸序列的預測軟件,分別是I-Mutant2.0、Mupro和Scpred[19](前兩個軟件也可以利用結(jié)構(gòu)信息)。結(jié)果表明,在預測的準確率上,這3款基于氨基酸序列的軟件和其他8款基于蛋白質(zhì)結(jié)構(gòu)的預測軟件沒有太大差別,這幾款基于氨基酸序列和基于蛋白質(zhì)結(jié)構(gòu)預測軟件的準確率分別是37%-49%和44%-64%,近兩年有些研究者更是聲稱其開發(fā)的基于序列的預測軟件如INPS和EASE-MM等有著和基于蛋白質(zhì)結(jié)構(gòu)預測軟件相近甚至更好的表現(xiàn)。

2 基于模擬結(jié)構(gòu)預測蛋白質(zhì)穩(wěn)定性

目前大多數(shù)和蛋白質(zhì)穩(wěn)定性預測有關(guān)的軟件都是基于蛋白質(zhì)的三維結(jié)構(gòu),對那些未知結(jié)構(gòu)的蛋白質(zhì)來說,可以先利用相關(guān)軟件模擬出蛋白質(zhì)的三維結(jié)構(gòu),然后將模擬出的三維結(jié)構(gòu)用于基于結(jié)構(gòu)預測穩(wěn)定性的軟件。

2.1 蛋白質(zhì)三維結(jié)構(gòu)模擬

目前蛋白三維結(jié)構(gòu)模擬的依據(jù)是基于以下兩點:(1)在進化過程中,蛋白質(zhì)的結(jié)構(gòu)比序列更加保守;(2)有證據(jù)表明,現(xiàn)在已知的蛋白質(zhì)折疊方式是有限的,數(shù)量約1 000-10 000[21]。蛋白質(zhì)三維結(jié)構(gòu)預測經(jīng)過30多年的發(fā)展,目前預測的方法主要有:利用基于能量或者經(jīng)驗的能量函數(shù)模擬折疊法;從已知結(jié)構(gòu)的小片段構(gòu)建模型;利用類似能量函數(shù)的線串法;依賴模板的模擬法[21]。目前被廣泛使用的蛋白質(zhì)三維結(jié)構(gòu)模擬網(wǎng)絡(luò)服務(wù)器有Phyre2[21]、i-TASSER[22]、SWISS-MODEL[23]、HHpred[24]、PSIPRED[25]、Robetta[26]、Modeller[27]和Raptor[28]等,從蛋白質(zhì)結(jié)構(gòu)預測標準評估法[29](Critical assessment of methods of protein structure prediction,CASP)的結(jié)果可知,這些預測軟件的準確率沒有很大的差別,但是對那些模擬難度較高的蛋白質(zhì)來說,i-TASSER會有更好的表現(xiàn)[21]。在最新的CASP11[30]中,這些模擬的結(jié)構(gòu)不僅精度很高而且能用于解答相關(guān)的生物學問題,如研究者不但準確模擬出人的類異戊二烯合成酶(human isoprenoid synthase)結(jié)構(gòu),而且還利用該模擬結(jié)構(gòu)準確預測該酶結(jié)構(gòu)域內(nèi)部的突變會導致單基因遺傳疾病。

2.2 基于結(jié)構(gòu)預測蛋白質(zhì)穩(wěn)定性的方法

蛋白質(zhì)的三維結(jié)構(gòu)能有效用于蛋白質(zhì)穩(wěn)定性預測,從結(jié)構(gòu)信息中可以獲得各種不同的能量函數(shù)和勢能,如接觸勢能、距離和扭轉(zhuǎn)勢能、經(jīng)驗能量函數(shù)等,利用這些能量函數(shù)和勢能可以預測蛋白質(zhì)的穩(wěn)定性[31]。目前被廣泛使用的基于結(jié)構(gòu)預測蛋白質(zhì)穩(wěn)定性的軟件主要有CUPSAT[32]、FoldX[33]、I-Mutant2.0、mCSM[34]、PoPMuSiC[35]、Duet[36]、iStable[37]、Eris[38]等。

2.3 相關(guān)實例

將模擬結(jié)構(gòu)用于依賴于三維結(jié)構(gòu)的蛋白質(zhì)穩(wěn)定性預測軟件來獲得更穩(wěn)定的蛋白質(zhì)已經(jīng)有一些成功的案例。Khan等[39]通過計算機預測了一個和直腸癌相關(guān)的nsSNPs突變體(Lys25Arg)的生物學功能和結(jié)構(gòu)意義,他們將該突變體中和直腸癌相關(guān)的區(qū)域稱為CRAPD,利用i-TASSER服務(wù)器[22]模擬了CRAPD的三維結(jié)構(gòu),并用基于結(jié)構(gòu)的預測軟件PoPMuSiC2.1預測出該點突變(Lys25Arg)降低了CRAPD的穩(wěn)定性,Khan認為CRAPD的穩(wěn)定性降低和直腸癌存在一定的聯(lián)系。Berliner等[40]開發(fā)了一種新的機器學習方法來預測突變對蛋白質(zhì)穩(wěn)定性和與其他蛋白質(zhì)親和力的影響。Mosca等[41]的研究發(fā)現(xiàn),很多人體蛋白結(jié)構(gòu)可以利用PDB數(shù)據(jù)庫中的同源蛋白的結(jié)構(gòu)為模板從而被大范圍地模擬,即使在模板與目的序列的一致性很低的情況下也可以模擬,所以Berliner等為了在整個蛋白質(zhì)組水平進行預測,采取了同源模建方式模擬了人體蛋白質(zhì)的三維結(jié)構(gòu),發(fā)現(xiàn)基于這些模擬結(jié)構(gòu)可以預測蛋白質(zhì)穩(wěn)定性以及該蛋白與其他蛋白質(zhì)的親和力,雖然基于模擬結(jié)構(gòu)的預測準確率略低于基于實驗結(jié)構(gòu)預測的準確率,但是作者認為通過提高模擬技術(shù)和優(yōu)化模擬結(jié)構(gòu)可以進一步提高準確率。一些蛋白質(zhì)結(jié)構(gòu)評估軟件如ProSa[42]和VADAR[43]等,常常被學者們[39,44]用來評估模擬出來的結(jié)構(gòu)是否可靠。

2.4 可行性分析

就目前的蛋白質(zhì)結(jié)構(gòu)模擬過程來說,在模擬過程中難免引入結(jié)構(gòu)上的偏差,那么這些結(jié)構(gòu)上的偏差對蛋白質(zhì)穩(wěn)定性預測會造成什么樣的影響,以及低質(zhì)量的模擬結(jié)構(gòu)能否用于蛋白質(zhì)穩(wěn)定性的預測呢?Gonnelli等[1]在這方面進行了比較系統(tǒng)的研究,一般來說,在蛋白質(zhì)同源模建的過程中,被模擬的蛋白質(zhì)序列與模板的序列一致性越高,那么該模擬結(jié)構(gòu)越可靠,所以作者選取與目的蛋白具有不同序列一致性(20%-100%)的且結(jié)構(gòu)已經(jīng)解析的蛋白質(zhì)作為結(jié)構(gòu)模擬的模板(值得注意的是:這些被模擬的蛋白質(zhì)本身結(jié)構(gòu)也已經(jīng)解析了),然后用Modeller軟 件(http://salilab.org/modeller/)共模擬出了391個蛋白質(zhì)結(jié)構(gòu),并通過計算模擬結(jié)構(gòu)和實驗結(jié)構(gòu)Cα坐標的均方根偏差(rmsd)來衡量模擬結(jié)構(gòu)的質(zhì)量,在391個模擬結(jié)構(gòu)中,絕大部分模擬結(jié)構(gòu)都有很高的質(zhì)量(rmsd:1.65?-5.52?),并且這些模擬結(jié)構(gòu)的質(zhì)量和序列一致性成正相關(guān)。最后用這些模擬出來的結(jié)構(gòu)以及利用蛋白質(zhì)穩(wěn)定性預測軟件PoPMuSiC2.1來計算氨基酸突變所導致的折疊自由能的改變(ΔΔG),并將這些結(jié)果與利用實驗解析結(jié)果得出的ΔΔG值進行比較,兩者ΔΔG值的差異為0.01-0.05 kcal/mol,結(jié)果表明:利用高質(zhì)量的模擬結(jié)構(gòu)能夠與利用蛋白質(zhì)實驗解析結(jié)構(gòu)達到相同的預測準確率,并且即使是利用低質(zhì)量的模擬結(jié)構(gòu),預測的表現(xiàn)也沒有明顯地減弱。此外,作者將利用模擬結(jié)構(gòu)的預測表現(xiàn)與基于序列的預測軟件(I-Mutant2.0、Mupro等)的預測結(jié)果作比較,結(jié)果表明:基于模擬結(jié)構(gòu)的預測結(jié)果要好于基于氨基酸序列的預測結(jié)果。

常用的蛋白質(zhì)穩(wěn)定性預測軟件/服務(wù)器總結(jié),見表1。

3 結(jié)語

隨著人們對基于氨基酸序列預測蛋白質(zhì)結(jié)構(gòu)穩(wěn)定性軟件的逐漸重視和預測方法的不斷優(yōu)化,目前基于氨基酸序列預測軟件的準確率已經(jīng)和基于蛋白質(zhì)結(jié)構(gòu)的預測軟件沒有明顯差距,有些研究者甚至聲稱其開發(fā)的基于氨基酸序列的預測軟件具有更好的表現(xiàn);而基于模擬結(jié)構(gòu)預測蛋白質(zhì)的穩(wěn)定性是先通過氨基酸序列模擬出蛋白質(zhì)的三維結(jié)構(gòu),然后再將模擬的結(jié)構(gòu)應(yīng)用于預測蛋白質(zhì)穩(wěn)定性的軟件。隨著蛋白質(zhì)結(jié)構(gòu)模擬技術(shù)的不斷發(fā)展,模擬結(jié)構(gòu)與蛋白質(zhì)實際結(jié)構(gòu)的差距正在不斷縮小,而且即使是利用低質(zhì)量的模擬結(jié)構(gòu),預測蛋白質(zhì)穩(wěn)定性的準確率和利用實驗解析結(jié)構(gòu)的準確率相比也沒有明顯的差異。因此基于模擬結(jié)構(gòu)的預測方法目前已被很多科學家所認可。

利用生物信息學的方法預測氨基酸突變對蛋白質(zhì)穩(wěn)定性的影響是當前生物信息學研究的熱點之一,而隨著后基因組時代的到來,已知的蛋白質(zhì)序列越來越多,但就目前的實驗技術(shù)水平來說,解析蛋白質(zhì)的結(jié)構(gòu)仍舊存在一定的困難,蛋白質(zhì)結(jié)構(gòu)解析的速度遠遠比不上蛋白質(zhì)氨基酸序列增加的速度,這將進一步拉大蛋白質(zhì)序列的數(shù)量和蛋白質(zhì)結(jié)構(gòu)的數(shù)量之間的差距,所以基于氨基酸序列來預測氨基酸突變對蛋白質(zhì)穩(wěn)定性的影響具有更大的使用范圍和更好的發(fā)展前景。

表1 蛋白質(zhì)穩(wěn)定性預測軟件/在線服務(wù)器

[1]Gonnelli G, Rooman M, Dehouck Y. Structure-based mutant stability predictions on proteins of unknown structure[J]. Journal of Biotechnology, 2012, 161(3):287-293.

[2]Wijma HJ, Floor RJ, Janssen DB. Structure- and sequence-analysis inspired engineering of proteins for enhanced thermostability[J]. Current Opinion in Structural Biology, 2013, 23(4):588-594.

[3] Tokuriki N, Tawfik DS. Stability effects of mutations and protein evolvability[J]. Current Opinion in Structural Biology, 2009, 19(5):596-604.

[4]Todd AE, Orengo CA, Thornton JM. Evolution of function in protein superfamilies, from a structural perspective[J]. Journal of Molecular Biology, 2001, 307(4):1113-1143.

[5]Tokuriki N, Stricher F, Serrano L, et al. How protein stability and new functions trade off[J]. PLoS Computational Biology, 2008, 4(2):e1000002.

[6]Lanio T, Jeltsch A, Pingoud A. Towards the design of rare cutting restriction endonucleases:using directed evolution to generate variants of EcoRV differing in their substrate specificity by two orders of magnitude[J]. Journal of Molecular Biology, 1998, 283(1):59-69.

[7]Suplatov D, Voevodin V, Svedas V. Robust enzyme design:bioinformatic tools for improved protein stability[J]. Biotechnology Journal, 2015, 10(3):344-355.

[8]Cheng J, Randall A, Baldi P. Prediction of protein stability changes for single-site mutations using support vector machines[J]. Proteins, 2006, 62(4):1125-1132.

[9]劉建國, 劉建榮, 劉明, 等. 基于進化信息改進蛋白質(zhì)定點突變穩(wěn)定性預測準確率[J]. 生物物理學報, 2009, 25(5):343-348.

[10]Folkman L, Stantic B, Sattar A. Towards sequence-based prediction of mutation-induced stability changes in unseen non-homologous proteins[J]. BMC Genomics, 2014, 15(Suppl. 1):1-12.

[11]歐陽玉梅, 方若森. 氨基酸突變對蛋白質(zhì)穩(wěn)定性的影響預測及其在線工具[J]. 免疫學雜志, 2013(11):997-1001.

[12]Teng S, Srivastava AK, Wang L. Sequence feature-based prediction of protein stability changes upon amino acid substitutions[J]. BMC Genomics, 2010, 11(Suppl. 2):S5-12.

[13]Folkman L, Stantic B, Sattar A, et al. EASE-MM:Sequence-based prediction of mutation-induced stability changes with feature-based multiple models[J]. Journal of Molecular Biology, 2016, 428(6):1394-1405.

[14]Folkman L, Stantic B, Sattar A. Feature-based multiple models improve classification of mutation-induced stability changes[J]. BMC Genomics, 2014, 15(Suppl. 4):S6-S16.

[15]Liu J, Kang X. Grading amino acid properties increased accuracies of single point mutation on protein stability prediction[J]. BMC Bioinformatics, 2012, 13(1):44-54.

[16]Folkman L, Stantic B, Sattar A. Sequence-only evolutionary and predicted structural features for the prediction of stability changes in protein mutants[J]. BMC Bioinformatics, 2013, 14(Suppl. 2):S6-14.

[17]Capriotti E, Fariselli P, Casadio R. I-Mutant2. 0:predicting stability changes upon mutation from the protein sequence or structure[J]. Nucleic Acids Research, 2005, 33(Web Server issue):W306-W310.

[18]Fariselli P, Martelli PL, Savojardo C, et al. INPS:predicting the impact of non-synonymous variations on protein stability from sequence[J]. Bioinformatics, 2015, 31(17):2816-2821.

[19]Dosztanyi Z, Fiser A, Simon I. Stabilization centers in proteins:identification, characterization and predictions[J]. Journal of Molecular Biology, 1997, 272(4):597-612.

[20] Khan S, Vihinen M. Performance of protein stability predictors[J]. Human Mutation, 2010, 31(6):675-684.

[21]Kelley LA, Mezulis S, Yates CM, et al. The Phyre2 web portal for protein modeling, prediction and analysis[J]. Nature Protocols, 2015, 10(6):845-858.

[22]Yang J, Yan R, Roy A, et al. The I-TASSER Suite:protein structure and function prediction[J]. Nature Methods, 2015, 12(1):7-8.

[23]Biasini M, Bienert S, Waterhouse A, et al. SWISS-MODEL:modelling protein tertiary and quaternary structure using evolutionary information[J]. Nucleic Acids Research, 2014, 42(Web Server issue):W252-258.

[24]S?ding J, Biegert A, Lupas AN. The HHpred interactive server for protein homology detection and structure prediction[J]. Nucleic Acids Research, 2005, 33(Web Server issue):W244-248.

[25]McGuffin LJ, Bryson K, Jones DT. The PSIPRED protein structure prediction server[J]. Bioinformatics, 2000, 16(4):404-405.

[26]Kim DE, Chivian D, Baker D. Protein structure prediction and analysis using the Robetta server[J]. Nucleic Acids Research, 2004, 32(Web Server issue):W526-531.

[27]Webb B, Sali A. Comparative protein structure modeling using Modeller[M]// John E, Ben M, David W, et al. Current protocols in bioinformatics. New York:John Wiley & Sons Press, 2006, Chapter 5:Unit 5. 6.

[28]Kallberg M, Wang H, Wang S, et al. Template-based protein structure modeling using the RaptorX web server[J]. Nature Protocols, 2012, 7(8):1511-1522.

[29]Moult J, Fidelis K, Kryshtafovych A, et al. Critical assessment of methods of protein structure prediction(CASP)--round x[J]. Proteins, 2014, 82(Suppl. 2):1-6.

[30]Moult J, Fidelis K, Kryshtafovych A, et al. Critical assessment of methods of protein structure prediction(CASP)- progress and new directions in Round XI[J]. Proteins, 2016, doi:10. 1002/prot. 25064.

[31]Gromiha MM, Anoosha P, Huang LT. Applications of protein thermodynamic database for understanding protein mutant stability and designing stable mutants[M]// Carugo O, Eisenhaber F. Date mining techniques for the life sciences. 2nd ed. New York:Humana Press, 2016:71-89.

[32]Parthiban V, Gromiha MM, Schomburg D. CUPSAT:prediction of protein stability upon point mutations[J]. Nucleic Acids Research, 2006, 34(Web Server issue):W239-242.

[33]Guerois R, Nielsen JE, Serrano L. Predicting changes in the stability of proteins and protein complexes:a study of more than 1000 mutations[J]. Journal of Molecular Biology, 2002, 320(2):369-387.

[34]Pires DEV, Ascher DB, Blundell TL. mCSM:predicting the effects of mutations in proteins using graph-based signatures[J]. Bioinformatics, 2014, 30(3):335-342.

[35]Dehouck Y, Kwasigroch JM, Gilis D, et al. PoPMuSiC 2. 1:a web server for the estimation of protein stability changes upon mutation and sequence optimality[J]. BMC Bioinformatics, 2011, 12(1):151-162.

[36]Pires DE, Ascher DB, Blundell TL. DUET:a server for predicting effects of mutations on protein stability using an integrated computational approach[J]. Nucleic Acids Research, 2014, 42(Web Server issue):W314-W319.

[37]Chen CW, Lin J, Chu YW. iStable:off-the-shelf predictor integration for predicting protein stability changes[J]. BMC Bioinformatics, 2013, 14(Suppl 2):S5-18.

[38]Yin S, Ding F, Dokholyan NV. Eris:an automated estimator of protein stability[J]. Nature Methods, 2007, 4(6):466-467.

[39]Khan W, Abduljaleel Z, Alanazi M, et al. Evidence of colorectal cancer risk associated variant Lys25Ser in the proximity of human bone morphogenetic protein 2[J]. Gene, 2013, 522(1):75-83.

[40]Berliner N, Teyra J, Colak R, et al. Combining structural modeling with ensemble machine learning to accurately predict protein fold stability and binding affinity effects upon mutation[J]. PLoS One, 2014, 9(9):e107353-107364.

[41]Mosca R, Ceol A, Aloy P. Interactome3D:adding structural details to protein networks[J]. Nature Methods, 2013, 10(1):47-53.

[42]Wiederstein M, Sippl MJ. ProSA-web:interactive web service for the recognition of errors in three-dimensional structures of proteins[J]. Nucleic Acids Research, 2007, 35(Web Server issue):W407-410.

[43]Willard L, Ranjan A, Zhang H, et al. VADAR:a web server for quantitative evaluation of protein structure quality[J]. Nucleic Acids Research, 2003, 31(13):3316-3319.

[44]Yang J, Li L, Xiao Y, et al. Identification and thermoadaptation engineering of thermostability conferring residue of deep sea bacterial α-amylase AMY121[J]. Journal of Molecular Catalysis B:Enzymatic, 2016, 126:56-63.

[45]Tian JA, Wu NF, Chu XY, et al. Predicting changes in protein thermostability brought about by single- or multi-site mutations[J]. BMC Bioinformatics, 2010, 11(1):370-378.

[46]Benedix A, Becker CM, de Groot BL, et al. Predicting free energy changes using structural ensembles[J]. Nature Methods, 2009, 6(1):3-4.

(責任編輯 狄艷紅)

Research Progress on the Prediction of Protein Stability Based on Amino Acid Sequence and Simulated Structure

YI Hua-Wei TANG Xiao-Feng
(College of Life Sciences,Wuhan University,Wuhan 430072)

Stability is one of the important properties of protein. Protein’s stability is not only demanded in industry,but also the prerequisite for its deriving new functions in protein evolution. Improving the stability of protein,especially protein of unknown structure,is a very challenging task,i.e.,traditional protein modification methods such as directed evolution are time-consuming and laborious,while rational design is difficult to replicate by other researchers. At present,there are many reported predictors for protein stability. However,the majority of these tools require the pre-measurement of three-dimensional structure of protein,which restricts the stability prediction of protein in unknown structure. Recently,a number of tools to predict the effects of mutations on the stability of unknown proteins have been developed using amino acid sequences and simulated structures of proteins,here we introduce the research progress on them,aiming at providing guidance for protein engineering.

protein stability;predictors;amino acid sequence;protein structure simulation

10.13560/j.cnki.biotech.bull.1985.2017.04.011

2016-09-20

國家自然科學基金面上項目(31570062)

易華偉,男,碩士,研究方向:微生物生理生化;E-mail:2014202040024@whu.edu.cn

唐曉峰,女,博士,教授,研究方向:微生物生理生化;E-mail:tangxf@whu.edu.cn

猜你喜歡
利用結(jié)構(gòu)
利用min{a,b}的積分表示解決一類絕對值不等式
利用倒推破難點
《形而上學》△卷的結(jié)構(gòu)和位置
哲學評論(2021年2期)2021-08-22 01:53:34
利用一半進行移多補少
論結(jié)構(gòu)
中華詩詞(2019年7期)2019-11-25 01:43:04
新型平衡塊結(jié)構(gòu)的應(yīng)用
模具制造(2019年3期)2019-06-06 02:10:54
利用數(shù)的分解來思考
Roommate is necessary when far away from home
利用
論《日出》的結(jié)構(gòu)
主站蜘蛛池模板: 久久人人97超碰人人澡爱香蕉| 欧洲精品视频在线观看| 55夜色66夜色国产精品视频| 久久免费观看视频| 久久精品丝袜| 无码日韩精品91超碰| 日本午夜精品一本在线观看| 亚洲一级无毛片无码在线免费视频 | 亚洲人人视频| 又粗又硬又大又爽免费视频播放| 女人18毛片一级毛片在线 | 亚洲成在人线av品善网好看| 强奷白丝美女在线观看| 久久亚洲AⅤ无码精品午夜麻豆| 在线欧美一区| 五月婷婷欧美| 国产99视频精品免费视频7| 99精品免费欧美成人小视频| 无码'专区第一页| 人妻91无码色偷偷色噜噜噜| 麻豆精选在线| 亚洲V日韩V无码一区二区| 福利一区三区| 丰满人妻一区二区三区视频| 美女被操91视频| 亚洲一区二区视频在线观看| 高清无码不卡视频| 亚洲AV无码乱码在线观看代蜜桃| 综合网久久| 欧洲亚洲一区| 91亚洲免费| 亚洲无线一二三四区男男| 久久综合国产乱子免费| 国内精自视频品线一二区| 中文字幕乱妇无码AV在线| 国产麻豆精品久久一二三| 精品久久蜜桃| 亚洲二三区| 中文字幕一区二区视频| 最新国产午夜精品视频成人| 天天干天天色综合网| 精品视频免费在线| 亚洲欧美不卡视频| 国产精品国产三级国产专业不 | 精品视频一区在线观看| 日韩中文无码av超清 | 亚洲欧美在线精品一区二区| 国产成人久久综合777777麻豆| 久久国产av麻豆| 欧美 国产 人人视频| 欧美第二区| 亚洲无码精品在线播放| 国产一区二区丝袜高跟鞋| 视频一区亚洲| 91在线国内在线播放老师| 欧美啪啪一区| 婷婷激情五月网| 亚洲精品波多野结衣| 91久久精品国产| 亚洲欧美另类日本| 成人免费黄色小视频| 尤物视频一区| 亚洲一级毛片免费看| 男女猛烈无遮挡午夜视频| 18禁黄无遮挡免费动漫网站| 国产香蕉国产精品偷在线观看 | 欧美国产精品不卡在线观看 | 情侣午夜国产在线一区无码| 欧美精品xx| 国外欧美一区另类中文字幕| 久热re国产手机在线观看| 红杏AV在线无码| 精品无码一区二区三区电影| 日本妇乱子伦视频| 亚洲精品自在线拍| 亚洲一区二区成人| 国产精品2| 天堂在线视频精品| 一级成人a做片免费| 色欲不卡无码一区二区| 久久精品电影| 日本午夜在线视频|