李墨野 趙慧 姜洋 劉笑平 林永紅 李開隆
摘要 [目的]用生物信息學手段分析、預測毛白楊PLC2基因/蛋白質的結構與特征,為該基因的克隆及功能研究提供理論參考。[方法]以PLC2基因及對應蛋白質為研究對象,利用各種網上數據庫及生物信息學分析軟件對其進行相關分析、預測。[結果]PLC2基因的GenBank登錄號為JX424764.1,ORF長957bp,編碼318個氨基酸,對應蛋白質PLC2的分子量35 999.1D,理論等電點7.07;PLC2與毛果楊(XP_002313726.1)的同源性較高;PLC2屬于PIPLCc_GDPD_SF超家族,無O糖基化位點,無二硫鍵,無跨膜區和信號肽,有16個磷酸化位點。[結論]對PLC2基因/蛋白的各級結構及功能進行預測,為下一步試驗奠定基礎。
關鍵詞 毛白楊;磷酸肌醇特異性磷脂酶C;生物信息學
中圖分類號 S188 文獻標識碼 A 文章編號 0517-6611(2014)31-10867-06
Bioinformatics Analysis of Populus tomentosa cultivar BJHR01 Phosphoinositidespecific phospholipase C (PLC2) Gene
LI Moye, ZHAO Hui, JIANG Yang, LI Kailong et al
(State Key Laboratory of Tree Genetics and Breeding, Northeast Forestry University, Harbin, Heilongjiang 150040)
Abstract [Objective] To analyze and predict the structure and feature of Populus tomentosa PLC2 gene/protein through bioinformatics method, and provide theoretical foundation for gene cloning and function research. [Method] Utilize various online databases and bioinformatics software to predict PLC2 gene and its corresponding protein. [Result] The GenBank accession number of PLC2 is JX424764.1, ORF is 957bp in length, encoding 318aa; the molecular weight of PLC2 is 35 999.1D, theoretical isoelectric point is 7.07; PLC2 has a higher homology with XP_002313726.1, belonging to PIPLCc_GDPD_SF superfamily, has no Oglycosylation site, no disulfide bond, no transmembrane domain or signal peptide, but 16 phosphorylation sites. [Conclusion] This study has predicted the structure and function of PLC2 gene/protein and paved the way for the following experiments.
Key words Populus tomentosa; Phosphoinositidespecific phospholipase C; Bioinformatics
毛白楊(Populus tomentosa)是以黃河中、下游流域為中心而廣泛分布的楊柳科落葉喬木,該樹種適應能力較強,是速生用材林,為防護林和行道河渠綠化的理想選擇[1]。磷酸肌醇特異性磷脂酶C是真核生物胞內酶,在細胞信號轉導過程中起著重要作用[2]。它能催化1磷脂酶D肌醇肌糖4,5二磷酸水解成第二信使物質甘油二脂、肌糖1,4,5三磷酸的反應,這個催化作用還受到可逆磷酸化反應以及調節蛋白質的調控[3-5]。筆者通過生物信息學手段對毛白楊(BJHR01種)磷酸肌醇特異性磷脂酶C(phosphoinositidespecific phospholipase C,PLC2)基因的核酸/蛋白質序列的分子特征、一級結構、二級結構以及三維結構進行了預測,并對該蛋白進行了系統進化分析,從而為下一步的分子生物學試驗提供理論依據。
1 材料與方法
1.1 材料
所選材料為毛白楊(BJHR01種)磷酸肌醇特異性磷脂酶C基因,GenBank登錄號:JX424764.1。
1.2 方法
利用BioEditClustalW軟件對11個物種的磷酸肌醇特異性磷脂酶氨基酸序列進行多序列比對;應用MEGA5軟件構建系統進化樹;利用ExPASy中的ProtParam工具(http://www.expasy.org/tools/protparam.html)對蛋白質的理化性質進行在線分析;通過NetOGlyc(http://www.cbs.dtu.dk/services/NetOGlyc/)進行糖基化位點的預測;通過NetPhos(http://www.cbs.dtu.dk/services/NetPhos/)對PLC 2的磷酸化位點進行預測;利用在線工具COILS預測PLC2的卷曲螺旋結構;利用PredictProtein和psipred預測PLC2蛋白的二級結構;利用PROSITE(http://prosite.expasy.org/)確定出PLC 2的活性部位;利用在線工具PredictProtein(http://www.Predictprotein.org/)和 TMpred(http://www.ch.embnet.org/software/TMPRED_form.html)方法預測PLC2氨基酸序列可能的跨膜區;應用SignalP在線預測毛白楊磷酸肌醇特異性磷脂酶C的信號肽;利用SWISS MODEL(http://swissmodel.expasy.org)預測PLC2蛋白質的三級結構;用Raswin和spdbiew軟件查看三級結構預測結果。
2 結果與分析
2.1 PLC2基因及相應氨基酸序列的一級結構
2.1.1 plc2基因的開放讀碼框及翻譯。
首先檢索NCBI中的GenBank獲得PLC2基因的完整cds,再利用ORF Finder查找其開放讀碼框,獲得一條長957 bp的完整ORF,利用SMS在線翻譯(+1框)該核酸序列,結果見圖1。
2.1.2 plc2基因的染色體定位。
利用NCBI中的工具MapViewer初步檢索毛果楊基因組,使用普通檢索和高級檢索,均未找到與之匹配的結果。于JGI數據庫進行BLAT Search,結果發現在毛果楊的第9號和第4號染色體上的得分最高,分別為1 583.0、1 825.0,相似程度分別為90.6%、98.7%(圖2)。由于毛果楊與毛白楊親緣關系較近,因此推測PLC2基因可能位于毛白楊栽培種BJHR01的第4或第9號染色體上。
2.1.3 氨基酸序列分析。
經過ExPASy在線軟件分析,得出PLC2氨基酸數目為318,相對分子質量為35 999.1 D,理論等電點(pI)為7.07。在PLC2中,亮氨酸(Leu)、賴氨酸(Lys)和纈氨酸(Val)3種氨基酸含量最高,均為7.5%。甲硫氨酸含量最低(Met),僅為1.3%(圖3)。PLC2蛋白原子組成為C∶H∶N∶O∶S=1 603∶2 530∶440∶478∶12,即分子式為C1603H2530N440O478S12,原子總數為5 063。不穩定系數為38.26。
2.1.4 PLC2的親疏水性分析。
利用ProtScale軟件繪制毛白楊磷酸肌醇特異性磷脂酶C親疏水性列譜,以預測其折疊情況。使用Hphob./Kyte&Doolittle算法進行預測,見圖4。結果發現,該蛋白質僅存在1個高分值峰(Score>1.5),分布在第300~310位殘基之間;而3個低分值(Score<0)的峰分別位于第40~50、150~160、190~200氨基酸殘基位點附近,可初步推測這3個位置為蛋白質的卷曲結構部位。
3 討論
該研究通過生物信息學的方法對PLC2基因的DNA序列、蛋白質序列進行了分析,并預測了相應蛋白質的結構與功能。利用PROSITE預測出該蛋白的保守結構域為PIPLC_X_DOMAIN,位于第57~185位氨基酸殘基之間,其中以2個組氨酸(H)為活性中心位點,即為該酶的催化活性中心。序列比對表明,PLC2的PIPLC_X_DOMAIN結構域在不同物種中具有很高的保守型。蛋白質的結構分析顯示該酶無卷曲結構,無二硫鍵,無明顯的跨膜區,且未預測出信號肽。筆者還利用SWISS MODEL(Automated Mode)預測了PLC2的三維構型,結果表明,QMEAN Z-Score=-6.19,與模板蛋白序列比對的一致性也非常低(14.92%),說明預測結果可信度不高,原因可能是該蛋白質本身不穩定或是所選靶標蛋白不當,下一步通過Robetta BETA從頭預測PLC2蛋白的三級結構。
另外,筆者通過研究發現,使用不同的分析工具對同一條序列進行分析,可能會得到不同的結果,這可能是因為不同的軟件所應用的計算方法各異。因此,該研究對PLC2/PLC2的所有預測結果僅能作為參考,具體功能研究還需要經過大量嚴謹的試驗進行驗證。
參考文獻
[1]
張美霞,馬海燕.毛白楊栽培技術及應用[J].現代農業科技.2014(3):45
[2] MELDRUM E,PARKER P J,CAROZZI A.The PtdInsPLC superfamily and signal transduction[J].Biochim Biophys Acta,1991,1092(1):49-71.
[3] RHEE S G,CHOI K D.Multiple forms of phospholipase C isozymes and their activation mechanisms[J].Adv Second Messenger Phosphoprotein Res,1992,26:35-61.
[4] RHEE S G,CHOI K D.Regulation of inositol phospholipidspecific phospholipase C isozymes[J].J Biol Chem,1992,267(18):12393-12396.
[5] STERNWEIS P C,SMRCKA A V.Regulation of phospholipase C by G proteins[J].Trends Biochem Sci,1992,17(12):502-506.
[6] 朱琍燕,吳士良.蛋白質的糖基化作用分類及相關數據庫[J].生命的化學,2007(2):108-111.
[7] RHEE S G,BAE Y S.Regulation of phosphoinositidespecific phospholipase C isozymes[J].J Biol Chem,1997,272(24):15045-15048.
[8] REBECCHI M J,PENTYALA S N.Structure,function,and control of phosphoinositidespecific phospholipase C[J].Physiol Rev,2000,80(4):1291-1335.
[9] MCGUFFIN L J,BRYSON K,JONES D T.The PSIPRED protein structure prediction server[J].Bioinformatics,2000,16(4):404-405.