999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

同源模建及其分析工具的研究進展

2015-04-29 00:00:00顏思奇劉冠軍李娟等
醫學信息 2015年27期

摘要:蛋白質的三級結構預測可通過同源模建、折疊識別、從頭預測等方法進行,但同源模建應用最廣泛,且最成熟。文章詳述了同源模建的原理、方法步驟、常用工具,并對其應用前景進行了分析和討論。

關鍵詞:蛋白質結構預測;同源模建;分析工具

Abstract:Tertiary structure of proteins can be predicted by comparative modeling, fold recognition, de novo prediction methods, but comparative modeling is the most widely used and most matured methods. This paper describes the principles, process steps and common tools of comparative modeling, also its prospects are analyzed and discussed.

Key words:Protein structure prediction;Comparative modeling;Analysis tools

隨著“人類基因組計劃”的順利完成,多種模式動植物基因序列的測定以及蛋白質工程技術的不斷發展帶來了大量的蛋白質一級結構的數據。而傳統的蛋白質結構研究的手段主要是X射線晶體衍射、核磁共振等,使用這些技術進行蛋白質三級結構的測定不僅成本較高,效率還相當低下,而且由于技術發展的局限,實驗中還有許多問題沒有解決。截至2014年10月,TrEMBL中收錄的蛋白質序列達到83955074條,SwissProt中經過手工修正的序列達546439條(http://www.uniprot.org/)[1]。相比而言,PDB蛋白結構數據庫 (http://www.rcsb.org/pdb/home/home.do)[2]的結構數據只有103921個,相差巨大。為了充分地理解蛋白是如何執行功能以及根據蛋白結構設計出更合理的藥物,能否獲得蛋白的結構甚至預測其結構就顯得尤為重要,這些都使從理論上對一個已知序列的蛋白質的空間結構進行預測的問題變得日益緊迫和重要。

目前,常用的蛋白結構預測方法分為三類:①針對高相似序列的同源模建(homology modeling,也稱比較建模);②針對較低序列相似性的折疊識別(fold recognition,也稱穿線法);③不依賴于模板而利用物理學原理直接進行從頭計算(ab initio)。其中第一種方法完全依賴模板,第二類方法適合于無法準確找到模板,但存在相同折疊的情況。現今,第一種和第二種方法的分類逐漸模糊。第三類方法則完全依賴分子動力學計算來預測,不需要模板。如今,同源模建已完全成熟到自動化,可以為科研工作者提供可靠的模型。

2同源模建

同源模建通過挑選與目標序列具有同源性的且結構已知的蛋白質作為模板來建立其三維結構。同源是指一些蛋白質從相同的祖先進化而來,而并不是指序列相似或者結構相似,雖然同源蛋白質在某種程度上具有相似的序列和結構。同源模建主要有4個步驟:模板搜尋、序列比對、目標模型的創建和結構優化。盡管每一步都可能造成錯誤而影響結果的準確性,但是模板搜尋和序列比對是影響模型最終質量的最顯著決定因素。通常,在同源模建的過程中,模板搜尋也提供了序列-結構比對。在下面的討論中,我們將模板搜索和序列-結構比對放在一起。同源模建的局限性在于蛋白序列和已解析的蛋白的序列一致性(identify)大于30%時,所得的結果才會比較可靠。最近的方法將模板搜尋和序列比對進行了優化,同時提高了搜索的靈敏度和比對的準確性,正在逐漸克服這些局限。

2.1 模板搜尋和序列比對 同源模建的第一步就是確定一個或者多個模板結構。通過將目標序列作為查詢序列,掃描結構數據庫(如PDB、SCOP、DALI和CATH等),搜索與目標蛋白具有相似性的模板。檢測到的相似性通常用序列一致性或其他的統計方法計算,如E值或Z值。

序列-結構的關系被劃分為3種不同的層次:①序列一致性>30%,易檢測到同源性;②序列一致性在10%~30%之間;③統計學上無顯著的序列相似性。

當序列一致性大于30%~40%時,用各種方法所產生的比對基本上都是正確的。在這種情況下,最快的選擇合適模板的方法是簡單的雙序列比對法(sequence–sequence法),例如SSEARCH、BLAST和FASTA。Brenner[3]等人發現,當序列一致性在30%~40%時,此方法可以檢測到90%的同源對。

當蛋白質的一致性在10%~30%之間時,蛋白質搜索的敏感性和比對的準確性會降低很多,Gribskov[4]等人報道的sequence-profile法在這個方面有了顯著提高。目標序列的序列譜(profile)來自于多序列比對,接著多序列比對被處理成位置特異性得分矩陣(position-specific scoring matrix,PSSM)或者隱馬爾可夫模型(hidden Markov model,HMM)。為了進一步尋找合適的模板進行同源模建,將目標序列的序列譜(profile)搜索模板序列數據庫。在序列一致性在10~30%時, sequence-profile法比雙序列比對更為敏感。在序列一致性小于40%時,他檢測到了大約兩倍數目的同源蛋白,由此生成的sequence-profile比對正確的對齊了大約43%~48%的殘基,這個數目也幾乎是用雙序列比對時的兩倍。常用的sequence-profile比對程序有PSI-BLAST、SAM、HMMER、HHsearch、HHBlits和BUILD_PROFILE。

profile-profile方法是profile-sequence比對方法的自然延伸,用靶序列的序列譜搜尋模板結構的序列譜,這個方法已經證明包含了至今最敏感和準確的模板搜尋和序列比對。profile-profile方法比 profile-sequences多搜索出大約28%的蛋白,并且比對準確度提高了15%~20%。有很多profile-profile法的變體出現,主要區別在于打分函數的不同。一些分析表明,這些方法的總體性能是相當的。常用的程序有FFAS、SP3、SALIGN、 HHBlits、HHsearch和PPSCAN。

2.2目標模型的創建 目標模型的創建包括模建結構保守區、預測及模建結構可變區(包括N末端、C末端氨基酸的插入、缺失等)、模建側鏈等。

主鏈結構的建模,主要有以下幾種方法:一種是剛體裝配法,即在同源蛋白質保守區的相應各片段中,選取與目標蛋白質保守區序列相似度最高的片段作為目標結構進行模建;用此種方法進行模建的程序有COMPOSER、3D-JIGSAW、RosettaCM和SWISS-MODEL。另一種是片段匹配法,依賴于保守原子的片段匹配,從模板計算其他原子的坐標,常用這種方法建模的程序有SegMod。第三種方法是空間限制法,是用幾何或者優化技術,通過滿足空間約束建模,MODELLER即這種方法。

接著進行結構變異區的主鏈建模,結構變異區即非保守區。非保守區主鏈結構較難預測,目前主要采用的有數據庫查詢和構象搜索。數據庫查詢方法搜索所有已知的蛋白質結構數據庫,找到合適的模板,此法快速方便,但不能保證數據庫中有合適的片段可供選擇;系統搜索方法不依賴數據庫,但隨著序列數目增加,構象數目急劇增加,計算比較費時。一般來說,當變異區的序列長度長于10~12個殘基時,非保守區建模仍然是一個挑戰。

有兩個簡化原則在側鏈建模中經常使用:①氨基酸殘基替代時,蛋白質的骨架基本不變,因此在尋找側鏈構象時,可以先固定蛋白質骨架;②大多數高分辨率的側鏈晶體符合立體和能量約束。因此側鏈的建模通常采用經驗數據, 先用目標序列的片段搜索旋轉異構體數據庫得到相似的片段, 再從數據庫中提取側鏈的空間取向, 構建片段的側鏈結構。最后利用立體和能量約束進行優化, 使目標蛋白質的側鏈基團處于能量最小的位置, 即具有穩定的構象。

2.3結構優化 同源建模得到的目標模型結構只是最初的蛋白質結構模型,一般情況下存在很多預測錯誤,例如氨基酸的組成原子之間的位置沖突,相鄰氨基酸之間所構成的二面角、化學鍵的長度和角度等不合理。在該步驟中需要用分子力學、分子動力學和模擬退火等對蛋白質結構模型進行優化。

3同源模建的工具

經過20年的發展,同源建模技術已經完全成熟到自動化,有很多軟件和在線工具可供使用,可以給科研工作者提供可靠的模型。圖1搜集了同源模建的預測工具,下文將簡要介紹幾個常用的模建工具。

圖1 同源模建常用的工具

3.1 Swiss-Model在線服務器 Swiss-Model是第一個完全自動化的蛋白質結構同源模建在線服務器,此服務器的目的是向全世界的生物化學和分子生物學學者提供蛋白質三維建模服務。它開創了自動建模的先河,由于其自動化的操作、用戶友好的界面且不需要復雜的軟件包和下載大型數據庫等優點,成為迄今為止應用最廣泛的免費服務器之一。同時,Swiss-Model也在不斷的更新。

Swiss-Model的工作模式分為三種:①自動模式:用戶可直接通過web界面提交氨基酸序列或者Swiss-Prot/TrEMBL的編目號,服務器會全自動地為目標序列建立模型。這種模式只能進行大于30個殘基的單鏈蛋白質三維結構預測;②比對模式:用戶可以通過Swiss-Model比對界面上傳以FASTA、CLUSTALW、PFAM、MSF和SELEX格式的多重序列比對結果。當然,此序列中必須至少包含一條目標序列和一條來自于Expasy Protein Database(ExPdb)的模板序列;③DeepView項目模式:用戶可將經過手工優化的請求提交給服務器。

3.2 MODELLER MODELLER軟件是近年來由Andrej Sali等人發展的蛋白質比較建模方法[12],是基于python語言開發應用的計算機軟件,并不斷推出新的版本。MODELLER基于一個已知模板結構,采用適當的約束條件來創建目標蛋白的理論結構模型。首先,從模板結構中提取原子-原子間距離和二面角形式的空間約束并將其運用到目標蛋白結構中。將這些與蛋白結構的一般性規律(如鍵長、鍵角取值規律)綜合起來使用。序列比對用來確定目標蛋白與模板之間等同的殘基。最后,不斷優化目標蛋白模型直到獲得一個最符合約束條件的模型。一般來說,MODELLER輸出的是一個盡可能多地滿足一系列約束條件的蛋白質三級結構。

該軟件有兩個主要的優點:①對于缺口區的片段結構, 可以根據一個條件概率密度函數從蛋白質片段庫中選擇模板, 并且可以通過空間約束條件以及charmm能量項來確保模型的立體化學構象的合理性;②模型優化采用的是共扼梯度能量最小化以及模擬退火法相結合,可以使模型得到最大限度的優化[13]。

3.3 Model Archive模型存檔器 自2006年以來,只有通過理論產生的模型不能存入PDB數據庫,因此許多模擬出的理論模型并不能被應用,這使得讀者無法驗證結果是否可以被實驗驗證。為了緩解這一狀況,一個公共的大分子結構存檔Model Archive(http://modelarchive.org)已經被建立,成為Protein Model Portal的一部分。該模型存檔器對于每一個蛋白給予一個獨特的代碼,可以直接引用。除了實際的模型坐標,模型存檔還包含充足的詳細信息,包括模擬中的參數和限制信息。用戶可以下載和存儲蛋白模型,進行進一步的研究,用于增加更多的實驗條件或應用當時還不存在的先進模擬方法。截止至2014年10月,已經有1380個模型存儲在modelarchive.org上。

4同源模建的應用和展望

藥物的合理開發日益依賴于基于結構的方法,用以識別和選擇低分子量的化合物。同源模建在基于結構的虛擬篩選中的有效性,已在不同種類的蛋白中證明有效[14,15]。同時G蛋白偶聯受體也引起了科學家的關注,實驗結構的新進展使得受體的同源模建成為可能[16,17]。除了蛋白質結構預測外,評估模型的準確性對于蛋白質-配體的相互作用的可靠性也至關重要[18]。同源模建不僅可以支持新藥的發展,還可以預測結合位點附近的氨基酸序列的變異,例如突變可以改變結合位點導致耐藥性,因此可預測性的計算技術有望成為藥物開發和治療的有用工具。

參考文獻:

[1]UniProt Consortium. Update on activities at the Universal Protein Resource (UniProt) in 2013[J]. Nucleic acids research, 2013, 41(D1): D43-D47.

[2]Berman H M, Westbrook J, Feng Z, et al. The protein data bank[J]. Nucleic acids research, 2000, 28(1): 235-242.

[3] Brenner S E, Chothia C, Hubbard T J P. Assessing sequence comparison methods with reliable structurally identified distant evolutionary relationships[J]. Proceedings of the National Academy of Sciences, 1998, 95(11): 6073-6078.

[4] Altschul S F, Madden T L, Sch?ffer A A, et al. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs[J]. Nucleic acids research, 1997, 25(17): 3389-3402.

[5] Arnold K, Kiefer F, Kopp J, et al. The protein model portal[J]. Journal of structural and functional genomics, 2009, 10(1): 1-8.

[6] Hildebrand A, Remmert M, Biegert A, et al. Fast and accurate automatic structure prediction with HHpred[J]. Proteins: Structure, Function, and Bioinformatics, 2009, 77(S9): 128-132.

[7] Russel D, Lasker K, Webb B, et al. Putting the pieces together: integrative modeling platform software for structure determination of macromolecular assemblies[J]. PLoS biology, 2012, 10(1): e1001244.

[8]Zhang Y. Interplay of I-TASSER and QUARK for template-based and ab initio protein structure prediction in CASP10[J]. Proteins: Structure, Function, and Bioinformatics, 2014, 82(S2): 175-187.

[9] Pieper U, Eswar N, Davis F P, et al. MODBASE: a database of annotated comparative protein structure models and associated resources[J]. Nucleic acids research, 2006, 34(suppl 1): D291-D295.

[10] Biasini M, Bienert S, Waterhouse A, et al. SWISS-MODEL: modelling protein tertiary and quaternary structure using evolutionary information[J]. Nucleic acids research, 2014: 340.

[11]Kelley L A, Sternberg M J E. Protein structure prediction on the Web: a case study using the Phyre server[J]. Nature protocols, 2009, 4(3): 363-371.

[12] Webb B, Sali A. Comparative protein structure modeling using Modeller[J]. Current protocols in bioinformatics, 2014: 561-563.

[13] 齊崴, 何志敏. 牛血清白蛋白的同源模建與結構解析[J]. 計算機與應用化學, 2006, 23(9): 821-824.

[14]Costanzi S. Modeling G protein-coupled receptors and their interactions with ligands[J]. Current opinion in structural biology, 2013, 23(2): 185-190.

[15]Skolnick J, Zhou H, Gao M. Are predicted protein structures of any value for binding site prediction and virtual ligand screening?[J]. Current opinion in structural biology, 2013, 23(2): 191-197.

[16]Carlsson J, Coleman R G, Setola V, et al. Ligand discovery from a dopamine D3 receptor homology model and crystal structure[J]. Nature chemical biology, 2011, 7(11): 769-778.

[17]Kobilka B, Schertler G F X. New G-protein-coupled receptor crystal structures: insights and limitations[J]. Trends in pharmacological sciences, 2008, 29(2): 79-83.

[18] Damm-Ganamet K L, Smith R D, Dunbar Jr J B, et al. CSAR benchmark exercise 2011–2012: evaluation of results from docking and relative ranking of blinded congeneric series[J]. Journal of chemical information and modeling, 2013, 53(8): 1853-1870.

編輯/馮焱

主站蜘蛛池模板: 全午夜免费一级毛片| 亚洲成网777777国产精品| 一本综合久久| 免费国产小视频在线观看| 亚洲无码高清视频在线观看| 看av免费毛片手机播放| 国产资源免费观看| 蜜臀AV在线播放| 99在线观看国产| 午夜视频日本| 69视频国产| 99久久国产自偷自偷免费一区| 国产不卡国语在线| 丁香六月综合网| 四虎在线高清无码| 美女无遮挡免费视频网站| 中文字幕第4页| 无码日韩人妻精品久久蜜桃| 久久这里只精品热免费99| 精品国产91爱| a毛片在线免费观看| 欧美一区二区精品久久久| 色婷婷狠狠干| 最新精品久久精品| 黄色网址免费在线| 99视频在线精品免费观看6| 手机在线免费毛片| 福利在线免费视频| 亚洲91在线精品| 日韩 欧美 国产 精品 综合| 国产一级小视频| 欧美日韩va| 国产精品网址你懂的| 国产久操视频| 午夜天堂视频| 美女一区二区在线观看| 亚洲一区第一页| 国产精品免费入口视频| 成人福利在线观看| 精品三级在线| 91久草视频| 亚洲另类第一页| 国产在线专区| 91亚瑟视频| 制服丝袜国产精品| 国产九九精品视频| 国产精品漂亮美女在线观看| 在线观看视频一区二区| 狂欢视频在线观看不卡| 亚洲精品在线影院| 在线精品亚洲一区二区古装| 亚洲欧美成人| 久久青草免费91观看| 国产免费久久精品99re丫丫一| 亚洲欧洲免费视频| 国产va在线观看| 成年人福利视频| 国产在线八区| 天天摸夜夜操| 国产成人综合久久精品下载| 精品無碼一區在線觀看 | 无码啪啪精品天堂浪潮av| 成人综合久久综合| 黑人巨大精品欧美一区二区区| 欧美日本视频在线观看| 午夜福利亚洲精品| 国产精品成人第一区| 欧美亚洲网| 女人18毛片一级毛片在线 | 欧美a在线看| 欧美一区二区三区欧美日韩亚洲| 波多野结衣国产精品| 欧美激情,国产精品| 在线观看无码a∨| 精品伊人久久大香线蕉网站| 国产成人亚洲毛片| 久久久无码人妻精品无码| 911亚洲精品| 国产欧美亚洲精品第3页在线| 欧美日一级片| 日韩国产综合精选| 又污又黄又无遮挡网站|