馬思潔,朱天生,2,何 璐,楊叔青,2
(1.塔里木大學農學院,新疆阿拉爾 843300;2. 南疆農業有害生物綜合治理兵團重點實驗室,新疆阿拉爾 843300)
【研究意義】辣椒(CapsicumannuumL.)為茄科辣椒屬植物[1],其果實含有豐富的營養成分[2]。我國辣椒總產量高達6 400×104t[3]。辣椒抗逆品種的選育是保證辣椒產業健康可持續發展經濟有效途徑,其中挖掘辣椒的抗逆元件是抗逆育種的基礎。【前人研究進展】小G蛋白可以參與調控真核生物中細胞信號的轉導[4],其中植物含有一類特有的亞家族Rho GTPases ROP(Rho-related GTPases of plants)[5]。ROP蛋白作為信號傳導中一類重要的調節因子,它既可以參與植物的生長發育,也可調控植物適應外部環境的刺激[6-7]。ROP蛋白還可參與響應植物抵抗干旱、高鹽、低溫、病蟲等多種逆境脅迫[8],AtROP1負向調控植物防衛反應的建立過程,在馬鈴薯中超表達失活型的AtROP1蛋白可以抑制馬鈴薯致病疫霉的生長[9]; AtROP2通過與MAP18互作進而調控植物根毛的伸長[10],AtROP2還可通過抑制下游效應因子RIC1參與調控植物抵抗鹽脅迫[11];AtROP11通過抑制植物激素ABA信號的轉導進而促進植物抵抗干旱脅迫[12]。ROP蛋白在參與植物生長發育和響應植物抵抗逆境脅迫的過程中具有重要作用。【本研究切入點】前期研究以擬南芥中的11個ROP蛋白的氨基酸序列為模板,對茄科基因組數據庫中6種茄科植物的ROP蛋白進行了全基因組篩查等工作,共篩查到66個ROP蛋白,其中有9個ROP蛋白來自辣椒(CaROP)[13],需對辣椒中小G蛋白CaROP進行生物信息學分析。【擬解決的關鍵問題】研究辣椒內小G蛋白CaROP的生物學功能、蛋白理化性質、蛋白結構及系統發育關系,為分析辣椒小G蛋白CaROP參與調控辣椒生長發育及響應、不同逆境脅迫的功能及分子機理奠定理論基礎。
1.1 材 料
9個CaROP蛋白的基因代碼分別為CA01g27430、CA03g28070、CA02g04310、CA00g84620、CA02g05500、CA02g21300、CA04g05500、CA08g19280和CA00g82910,其氨基酸及核苷酸序列自數據庫solgenomics(https://solgenomics.net/)中所獲得。
1.2 方 法
1.2.1 CaROP蛋白的Rho功能域、開放閱讀框及氨基酸序列相似度預測
運用SMARTS在線軟件(http://smart.embl-heidelberg.de/)對9個CaROP蛋白的Rho功能域進行預測分析,其次使用在線軟件ORF finder(ORFfinder Home - NCBI(nih.gov))預測9個CaROP核苷酸序列的開放閱讀框長度,使用DNAMAN軟件對9個CaROP蛋白氨基酸序列進行相似度比較分析[9]。
1.2.2 CaROP蛋白基本理化性質
使用Expasy數據庫內ProtParam軟件(http://www.exPasy.org/tools/)對9個CaROP蛋白的理化性質進行預測分析,包括氨基酸數量、分子式、分子量、原子總數、帶正(負)電荷氨基酸殘基及理論等電點等[12]。
1.2.3 CaROP蛋白親水性、疏水性
使用Expasy數據庫內ProtScale軟件(https://web.expasy.org/protscale/)對9個CaROP蛋白的親水性、疏水性進行預測分析[11]。
1.2.4 CaROP蛋白信號肽預測和跨膜結構域
利用SignalP5.0軟件(http://www.cbs.dtu.dk/)對9個CaROP蛋白的信號肽進行預測分析;利用TMHMM在線軟件(http://www.cbs.dtu.dk/services/TMHMM/)對9個CaROP蛋白的跨膜結構域進行預測分析[13]。
1.2.5 CaROP蛋白磷酸化位點和糖基化位點
利用NetPhos3.1在線軟件(http://www.cbs.dtu.dk/services/NetPhos/)對9個CaROP蛋白的磷酸化位點進行預測分析[14];利用NetCGlyc1.0在線軟件(http://www.cbs.dtu.dk/services/NetCGlyc/)對9個CaROP蛋白的糖基化位點進行預測分析[15]。
1.2.6 CaROP蛋白二級、三級結構預測
利用SOPMA在線軟件(https://www.expasy.ch/)對9個CaROP蛋白的二級結構進行預測分析[16];利用SWISS-MODEL軟件(https://swissmodel.expasy.org/)對9個CaROP蛋白的三級結構進行預測分析[17]。
1.2.7 CaROP蛋白系統發育關系
利用MEGA11軟件并選用最大似然法(Maximum Likelihood)的計算方法對辣椒9個CaROP和擬南芥11個AtROP的氨基酸序列構建系統進化樹,其中重復次數(Bootstrap-Replications)設置為1 000次。圖1

圖 1 系統進化樹參數設置
2.1 9個CaROP的Rho功能域、開放閱讀框及氨基酸序列相似度預測
研究表明,9個CaROP蛋白均存在1個Rho功能域,均屬于Rho家族。CA01g27430開放閱讀框長度為633 bp,CA03g28070開放閱讀框長度為525 bp,CA02g04310開放閱讀框長度為594 bp, CA00g84620開放閱讀框長度為594 bp,CA02g05500開放閱讀框長度為594 bp,CA02g21300開放閱讀框長度為594 bp,CA04g05500開放閱讀框長度為633 bp,CA08g19280開放閱讀框長度為597 bp,CA00g82910開放閱讀框長度為675 bp。9個CaROP蛋白氨基酸序列相似度高達73.02%。圖2

圖 2 9個CaROP蛋白氨基酸序列 相似度的比較
2.2 9個CaROP蛋白理化性質
研究表明,CA01g27430蛋白由210個氨基酸組成,分子式為C1037H1648N282O309S6,分子量為23 202.56,原子總數為3282,帶正電荷的氨基酸殘基(Asp + Glu)為19個,帶負電荷的氨基酸殘基(Arg + Lys)為28個,理論等電點(pI)為9.33;CA03g28070蛋白由174個氨基酸組成,分子式為C861H1333N225O256S6,分子量為19 124.77,原子總數為2 681,帶正電荷的氨基酸殘基(Asp + Glu)為17個,帶負電荷的氨基酸殘基(Arg + Lys)為16個,理論等電點(pI)為6.28;CA02g04310蛋白由197個氨基酸組成,分子式為C986H1575N263O286S7,分子量為21 914.36,原子總數為3 117,帶正電荷的氨基酸殘基(Asp + Glu)為18個,帶負電荷的氨基酸殘基(Arg + Lys)為26個,理論等電點(pI)為9.32;CA00g84620蛋白由197個氨基酸組成,分子式為C971H1543N255O283S5,分子量為21 477.77,原子總數為3 057,帶正電荷的氨基酸殘基(Asp + Glu)為17個,帶負電荷的氨基酸殘基(Arg + Lys)為25個,理論等電點(pI)為9.3;CA02g05500蛋白由197個氨基酸組成,分子式為C969H1538N256O284S5,分子量為21 478.72,原子總數為3 052,帶正電荷的氨基酸殘基(Asp + Glu)為18個,帶負電荷的氨基酸殘基(Arg + Lys)為25個,理論等電點(pI)為9.21;CA02g21300蛋白由197個氨基酸組成,分子式為C973H1546N256O284S5,分子量為21 534.82,原子總數為3 064,帶正電荷的氨基酸殘基(Asp + Glu)為17個,帶負電荷的氨基酸殘基(Arg + Lys)為25個,理論等電點(pI)為9.3;CA04g05500蛋白由210個氨基酸組成,分子式為C1050H1649N271O301S5,分子量為23 045.58,原子總數為3 276,帶正電荷的氨基酸殘基(Asp + Glu)為18個,帶負電荷的氨基酸殘基(Arg + Lys)為25個,理論等電點(pI)為9.17;CA08g19280蛋白由198個氨基酸組成,分子式為C982H1566N262O283S5,分子量為21 731.12,原子總數為3 098,帶正電荷的氨基酸殘基(Asp + Glu)為18個,帶負電荷的氨基酸殘基(Arg + Lys)為27個,理論等電點(pI)為9.39;CA00g82910蛋白由224個氨基酸組成,分子式為C1130H1775N305O324S13,分子量為25 234.15,原子總數為3 547,帶正電荷的氨基酸殘基(Asp + Glu)為21個,帶負電荷的氨基酸殘基(Arg + Lys)為28個,理論等電點(pI)為9.04。表1

表1 9個CaROP蛋白的理化特性相關信息
2.3 9個CaROP蛋白親水性及疏水性
研究表明,CA01g27430蛋白的不穩定指數為47.19,脂肪系數為82.14,親水性平均系數為-0.277,屬不穩定的親水蛋白;CA03g28070蛋白的不穩定指數為43.18,脂肪系數為85.69,親水性平均系數為-0.04,屬不穩定的親水蛋白;CA02g04310蛋白的不穩定指數為38.96,脂肪系數為90.56,親水性平均系數為-0.138,屬穩定的親水蛋白;CA00g84620蛋白的不穩定指數為33.45,脂肪系數為88.53,親水性平均系數為-0.096,屬穩定的親水蛋白;CA02g05500蛋白的不穩定指數為36.01,脂肪系數為87.56,親水性平均系數為-0.121,屬穩定的親水蛋白;CA02g21300蛋白的不穩定指數為37.31,脂肪系數為88.53,親水性平均系數為-0.122,屬穩定的親水蛋白;CA04g05500蛋白的不穩定指數為29.96,脂肪系數為91.43,親水性平均系數為-0.029,屬穩定的親水蛋白;CA08g19280蛋白的不穩定指數為42.05,脂肪系數為90.61,親水性平均系數為-0.12,屬不穩定的親水蛋白;CA00g82910蛋白的不穩定指數為33.89,脂肪系數為33.89,親水性平均系數為-0.054,屬穩定的親水蛋白。表2,圖3

表2 9個CaROP蛋白的親疏水性參數信息

圖 3 9個CaROP蛋白的親水性和疏水性
2.4 9個CaROP蛋白的信號肽及跨膜結構域預測
研究表明,9個CaROP蛋白均無信號肽,均非分泌蛋白。圖4
9個CaROP蛋白均跨膜結構域,均非跨膜蛋白。圖5
2.5 9個CaROP蛋白磷酸化位點和糖基化位點的預測
研究表明,CA01g27430蛋白含有11個絲氨酸,5個蘇氨酸,2個絡氨酸;CA03g28070蛋白含有5個絲氨酸,4個蘇氨酸,4個絡氨酸;CA02g04310蛋白含有8個絲氨酸,6個蘇氨酸,6個絡氨酸;CA00g84620蛋白含有9個絲氨酸,4個蘇氨酸,4個絡氨酸;CA02g05500蛋白含有11個絲氨酸,5個蘇氨酸,4個絡氨酸;CA02g21300蛋白含有10個絲氨酸,3個蘇氨酸,4個絡氨酸;CA04g05500蛋白含有10個絲氨酸,4個蘇氨酸,3個絡氨酸;CA08g19280蛋白含有10個絲氨酸,2個蘇氨酸,4個絡氨酸;CA00g82910蛋白含有9個絲氨酸,5個蘇氨酸,5個絡氨酸。9個CaROP蛋白均不存在糖基化位點。表3,圖6

表3 9個CaROP蛋白磷酸化位點相關信息

圖 6 9個CaROP蛋白磷酸化位點的預測
2.6 9個CaROP蛋白二級、三級結構的預測
研究表明,CA01g27430蛋白含有77個α-螺旋(Hh),占比36.67%;含40個β-折疊(Ee),占比19.05%;10個β-轉角(Tt),占比4.76%;含83個無規則卷曲,占比39.52%。CA03g28070蛋白含有68個α-螺旋(Hh),占比39.08%;含35個β-折疊(Ee),占比20.11%;12個β-轉角(Tt),占比6.90%;含59個無規則卷曲,占比33.91%。CA02g04310蛋白含有66個α-螺旋(Hh),占比33.50%;含41個β-折疊(Ee),占比20.81%;12個β-轉角(Tt),占比6.09%;含78個無規則卷曲,占比39.59%。CA00g84620蛋白含有69個α-螺旋(Hh),占比35.03%;含42個β-折疊(Ee),占比21.32%;13個β-轉角(Tt),占比6.60%;含73個無規則卷曲,占比37.06%。CA02g05500蛋白含有72個α-螺旋(Hh),占比36.55%;含40個β-折疊(Ee),占比20.30%;11個β-轉角(Tt),占比5.58%;含74個無規則卷曲,占比37.56%。CA02g21300蛋白含有72個α-螺旋(Hh),占比36.55%;含40個β-折疊(Ee),占比20.30%;11個β-轉角(Tt),占比5.58%;含74個無規則卷曲,占比37.56%。CA04g05500蛋白含有75個α-螺旋(Hh),占比35.71%;含43個β-折疊(Ee),占比20.48%;11個β-轉角(Tt),占比5.24%;含81個無規則卷曲,占比38.57%。CA08g19280蛋白含有67個α-螺旋(Hh),占比33.84%;含40個β-折疊(Ee),占比20.20%;12個β-轉角(Tt),占比6.06%;含79個無規則卷曲,占比39.90%。CA00g82910蛋白含有82個α-螺旋(Hh),占比36.61%;含56個β-折疊(Ee),占比25.00%;11個β-轉角(Tt),占比4.91%;含75個無規則卷曲,占比33.48%。表4,圖7

表4 9個CaROP蛋白二級結構的參數信息

圖 7 9個CaROP蛋白的二級結構
CA01g27430蛋白的全局模型質量評估(GMQE)為0.77,QMEAN評分為0.82;CA03g28070蛋白的GMQE評分為0.85,QMEAN評分為0.82;CA02g04310蛋白的GMQE評分為0.81,QMEAN評分為0.82;CA00g84620蛋白的GMQE評分為0.81,QMEAN評分為0.83;CA02g05500蛋白的GMQE評分為0.81,QMEAN評分為0.84;CA02g21300蛋白的GMQE評分為0.81,QMEAN評分為0.84;CA04g05500蛋白的GMQE評分為0.76,QMEAN評分為0.79;CA08g19280蛋白GMQE評分為0.81,QMEAN評分為0.83;CA00g82910蛋白的GMQE評分為0.72,QMEAN評分為0.72。GMQE和QMEAN的整體模型質量測量值范圍在0~1,數字越高表示預期質量越高,9個CaROP蛋白的全局模型質量評估(GMQE)和QMEAN評分均大于0.7,結果表明9個CaROP蛋白的三級建模預期均比較可靠,但CA00g82910蛋白與其他8個CaROP蛋白三級結構相比差異較大,推測可能與其脂肪系數有關。圖8

圖 8 9個CaROP蛋白的三級結構
2.7 9個CaROP蛋白系統發育關系
研究表明,20個ROP蛋白聚為4個分支,不同顏色代表不同分支,紅色代表分支Ⅰ,橙色代表分支Ⅱ,綠色代表分支Ⅲ,藍色代表分支Ⅳ,其中CA01g27430和CA02g04310分別聚于分支Ⅰ和分支Ⅲ中,CA00g82910和CA03g28070聚于分支Ⅱ中,剩余5個CaROP(CA00g84620、CA04g05500、CA02g05500、CA02g21300及CA08g19280)均聚于分支Ⅳ中。圖9
3.1蛋白的親水性可以保持結構及水分的穩定也可預測跨膜區,蛋白的脂肪系數越高蛋白相對越穩定,蛋白的穩定性可使蛋白在不良條件下仍然具備優良的理化性能[18-22]。運用生物信息學手段預測分析蛋白質的親水性、穩定系數等理化特性及蛋白結構,可為后續深入研究蛋白的功能奠定理論基礎,并且可減少試驗中的盲目及失敗[23]。研究蛋白預測分析結果顯示,9個CaROP蛋白氨基酸序列相似度高達73.02%,其均具有磷酸化位點,均為非分泌性蛋白。9個CaROP蛋白親水值均小于0,其均為親水蛋白;9個CaROP蛋白其均無跨膜結構域和信號肽,表明均為非跨膜蛋白。9個CaROP蛋白的主要二級結構原件為無規則卷曲和α-螺旋,其次是β-折疊,最后是β-轉角,其三級結構建模的預測評分均高于0.7,結果都較為可靠,但CA00g82910蛋白相比其他8個CaROP蛋白的三級結構模型差異較大。

圖 9 辣椒和擬南芥ROP蛋白的 系統發育關系
3.2系統發育關系分析結果表明,9個CaROP蛋白共聚為4個分支,其中CA01g27430和CA02g04310分別聚于分支Ⅰ和分支Ⅲ中,CA00g82910和CA03g28070聚于分支Ⅱ中,剩余5個CaROP(CA00g84620、CA04g05500、CA02g05500、CA02g21300及CA08g19280)均聚于分支Ⅳ中。Yang Z等人將擬南芥中的11個AtROP蛋白劃分為4個進化分支[24],研究將辣椒中的9個CaROP和擬南芥中的11個AtROP也劃分為4個進化分支,分支結果與Yang Z等[25]的研究結果一致。Yang S等將6種茄科物種中的66個ROP蛋白和11個擬南芥AtROP蛋白劃分為5個進化分支,Yang Z等[24]的研究中,第IV分支具有2個明顯的亞分支,但是隨著Yang S等[25]將植物物種數增加后,第IV分支徹底分為2個分支,即新的分支II和分支V。研究中的第IV分支也具有明顯的2個亞分支,其中CA08g19280單獨聚為一個亞分支,其他3個CaROP蛋白的聚于另一個亞分支,預示其生物學功能可能也不盡相同。
9個CaROP蛋白具有完整的Rho功能域,均為非分泌性親水蛋白,其中6個ROP蛋白CA02g04310、CA00g84620、CA02g05500、CA02g 21300、CA04g05500和CA00g82910為穩定的親水蛋白。9個CaROP蛋白在系統進化樹中共聚為了4個分支,其三級結構建模的預測結果也均較為理想,9個CaROP蛋白結構較穩定。