李 蒙
(西安文理學院 生物與環境工程學院,陜西 西安 710065)
半胱氨酸蛋白酶(Cysteine Protease, CP, EC3.4.22)是一類重要的蛋白水解酶,廣泛參與植物機體各種生理過程[1],如種子萌發與生長、組織分化與衰老、應激反應等[2-3]。近年來發現,不同植物中半胱氨酸蛋白酶分屬于五大類的不同家族,在植物生長過程中起著重要的作用[4]。
在多種植物中研究發現蛋白的貯藏與降解、對非生物與生物脅迫的響應、自然衰老和脅迫誘導的衰老過程等與CP基因的表達相關[5]。目前在GenBank數據庫中登錄的植物CP基因序列有1萬多條。有關學者已對擬南芥[6]、煙草[7]、水稻[8]等植物中的CP基因進行了大量的研究,發現:在水稻種子發芽期間CP基因REP-1參與種子儲存蛋白的降解,以供種子萌發之需[9];在逆境脅迫下,水稻CP基因OsMC5表達量的增加明顯增強了抗曲霉感染的能力,當感染牛肉粘蟲受傷后,CP基因OsMC6的表達量增加[10];在衰老期間,煙草不同組織器官中CP基因NTCP-23的轉錄水平都有提高,表明CP在植物衰老過程中參與調控作用[11]。目前在多種植物中發現了半胱氨酸蛋白酶抑制劑CPI,如水稻、擬南芥、馬鈴薯、番茄等[12];在植物體內CPI與CP催化位點相互作用,它們之間維持動態平衡,調節機體的各種生理生化反應[13]。因此,探討CP基因及酶的結構功能對明確植物參與逆境應答、細胞程序化死亡等生理過程具有重要的科學意義。
隨著越來越多的CP基因被鑒定出來[14],在后續基因的表達調控機理研究中,將進一步探究CP酶的理化性質對植物生長發育的影響。本文通過生物信息學方法,對不同植物CP基因及其蛋白質的組成、結構與特征進行了預測分析,有助于發揮CP的功能,從而為農業大規模生產中改良作物開辟新途徑。
在NCBI中查詢10種不同植物的半胱氨酸蛋白酶的核酸序列及其對應的氨基酸序列,即以擬南芥(NM_120069.5)、草莓(JN979371.1)、葡萄(EU280160.1)、番茄(AJ841791.1)、小麥(AY841792.2)、煙草(EU429306.1)、菠菜(AB377534.1)、豌豆(Z68291.1)、馬鈴薯(AJ245924.1)、水稻(X80876.1)作為研究對象。
采用DNAStar、Clustal X2和Genedoc軟件對10種植物CP的核酸序列和氨基酸序列進行分析與比對。采用ProtParam (http://web.expasy.org/protparam/)分析蛋白質的分子量、等電點、半衰期和穩定性等理化性質。采用TargetP (http://www. cbs.dtu.dk/services/TargetP/)、SignalP 4.1 (http://www.cbs.dtu.dk/services/Sig nalP/)進行蛋白質亞細胞定位、分泌信號肽分析等。采用SOPMA (https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)分析預測蛋白質的二級結構。采用NetNGlyc (http://www.cbs.dtu.dk/services/NetN Glyc/)在線分析蛋白質糖基化。采用MotifScan (https://myhits.isb- sib.ch/cgi-bin/motif_scan)在線分析蛋白質脂酰化、磷酸化、cAMP和cGMP依賴蛋白激酶磷酸化位點。采用ClustalX 2.0和TreeView進行多重序列全局比對和系統發育樹構建。
利用DNAStar軟件和ProParam進行在線分析,結果如表1所示。10種植物半胱氨酸蛋白酶基因的ORF全長在1053~1443 bp,GC含量適中(除小麥和水稻略高外),氨基酸數目在350~480,分子量大小在38.58~52.99 kD,pI值在5.13~6.75,說明CP呈酸性,與蛋白序列中酸堿氨基酸比例結果一致。對氨基酸序列的組成進行分析,發現:氨基酸Ser和Gly在所有植物CP中含量較高,分別為6.8%~11.2%和7.2%~11.6%;還有部分氨基酸如Ala、Leu在大多數植物CP中含量也較高;而氨基酸Met和Trp在所有植物CP中含量較低,分別在1.3%~2.9%和1.3%~2.3%;還有部分氨基酸如Gln和Cys在大多數植物CP中含量也較低。所有植物CP蛋白質中負電荷氨基酸殘基總數高于正電荷氨基酸殘基總數,疏水性氨基酸的比例高于酸性、堿性和極性氨基酸的比例;在溶液中CP的不穩定指數為26.60~44.87,除番茄和馬鈴薯外均低于閥值(<40為穩定蛋白),推測絕大多數植物的CP為穩定蛋白。脂肪系數為62.04~80.27,親水性平均系數為-0.578~0.195,說明CP蛋白質總體親水性較低。

表1 植物CP的核苷酸及氨基酸序列組成和理化性質
經ClustalX 2.0和Genedoc軟件比對,發現不同植物CP的氨基酸序列具有同源性,普遍具有4個活性位點相關氨基酸殘基Gln-Cys-His-Asn/Asp,以及半胱氨酸蛋白酶特有的保守結構域:ERFNIN基序、GNFD基序和GCDGG基序(圖1)。說明不同植物半胱氨酸蛋白酶在進化過程中在功能區域具有較好的保守性。
NetNGLyc在線分析結果(如表2)表明,除了草莓和水稻外,擬南芥(253NFSD)、葡萄(263NFSV)、番茄(136NKTA和322NYTY)、小麥(259NFSV)、煙草(115NGTF)、菠菜(447NASK)、豌豆(117NCSA、177NISL和246NITL)、馬鈴薯(125NKSD)的CP蛋白含有不同的糖基化位點。MotifScan在線分析結果(如表2)表明:所有植物CP蛋白都具有酪蛋白激酶Ⅱ磷酸化修飾位點和N端肉豆蔻?;揎椢稽c;蛋白激酶C磷酸化修飾位點普遍存在于不同植物成熟的CP蛋白中(除煙草外);酪氨酸激酶磷酸化位點的修飾唯有擬南芥、葡萄、小麥、馬鈴薯CP蛋白含有; cAMP和cGMP依賴蛋白激酶磷酸化唯有番茄(283KKRT)、煙草(226KRNS)、菠菜(117RKKS和442RKGT)、豌豆(88RRLS)、馬鈴薯(120RKLS和462KKSS)蛋白序列位點修飾。

黑色和灰色分別表示氨基酸的相似性;紅色方框標明催化位點;黃色方框標明保守結構域。AtCP:擬南芥(Arabidopsis thaliana)CP; FaCP:草莓(Fragaria xananassa)CP; VvCP:葡萄(Vitis vinifera)CP; LeCP:番茄(Lycopersicon esculentum)CP; TaCP:小麥(Triticum aestivum)CP; NtCP:煙草(Nicotiana tabacum)CP; SoCP:菠菜(Spinacia oleracea)CP; PsCP:豌豆(Pisum sativum)CP; StCP:馬鈴薯(Solanum tuberosum)CP; OsCP:水稻(Oryza sativa)CP。
10種植物CP蛋白經TargetP在線分析,結果如表3所示,信號肽預測分值為0.768~0.994, cutoff值為0.430,說明存在信號肽。此結果與Signal P 4.0預測的信號肽結果相符,且Signal P 4.0預測10種植物CP蛋白序列在N端的19~25位氨基酸是信號肽的切割位點。亞細胞定位分析表明,線粒體定位預測值為0.008~0.145,定位于其他位置的預測值為0.005~0.158。采用SOPMA對CP蛋白進行二級結構預測,結果表明在不同植物CP蛋白的二級結構中α螺旋占23.64%~45.00%,β折疊占8.46%~16.58%,無規則卷曲占29.58%~45.06%,延伸鏈占12.47%~24.46%,說明CP蛋白的二級結構以α螺旋和無規則卷曲為主。
利用ClustalX 2.0和TreeView進行分析,結果(如圖2)表明:不同植物CP在進化過程中,豆科豌豆和茄科番茄的CP與其他科植物距離較遠,親緣性較遠;十字花科的擬南芥、葡萄科的葡萄和禾本科的小麥聚為一個分支,說明它們親緣性較近;而薔薇科的草莓、藜科的菠菜、茄科的馬鈴薯、茄科的煙草和禾本科的水稻聚為一個分支,說明其親緣性較近。說明植物CP在進化過程中同一科植物也有較大的差距。

表2 植物CP翻譯后修飾和結構特征性序列分析結果
注:N-端糖基化位點的Threshold等于0.5。
植物半胱氨酸蛋白酶主要分為Papain(木瓜蛋白酶家族,C1)、Legumain(豆類天冬氨酸蛋白內切酶,C13)、Caspase(天冬氨酸特異性的半胱氨酸蛋白酶,C14)、Calpain(鈣依賴半胱氨酸蛋白酶,C2)和其他半胱氨酸蛋白酶家族,目前對其中Papain的研究最為詳盡[15],其氨基酸序列從N端到C端分為信號肽序列、前體肽序列和成熟酶序列[16],信號肽引導新生蛋白轉移,前體肽序列在酶發揮活性時被切除[17],其中保守結構域就可能發揮至關重要的作用。本文通過生物信息學方法對蛋白質序列進行分析,發現了不同植物中CP的保守結構域:ERFNIN基序、GNFD基序和GCDGG基序。在CP酶發揮活性時,與4個活性位點相關的氨基酸殘基Gln-Cys-His-Asn/Asp共同決定CP的功能特異性。在保守結構域與活性位點中個別氨基酸的替換可能決定了不同植物CP的活性差異,這為應用半胱氨酸蛋白酶在植物育種中提供了理論依據。

表3 植物CP蛋白的亞細胞定位及二級結構預測與分析結果
注:信號肽預測分值、線粒體位置預測值以及定位于其他位置預測值的specificity均大于0.95。

圖2 不同植物CP的系統進化樹
隨著轉錄組測序在不同植物中開展,生物信息學為功能基因研究提供了便利的手段。本文通過生物信息學方法對影響10種植物生長的半胱氨酸蛋白酶進行分析,發現CP蛋白分子大小相差不大,GC含量適中(除小麥和水稻略高外),這些會影響植物組織中CP的轉錄和翻譯,也會影響基因在體外(簡單原核和真核細胞中)的表達[18],進而影響其功能。蛋白質的理化性質會影響其結構和生理功能;糖基化是蛋白質的主要修飾手段,影響其在組織或細胞中的定位與活性,疾病的發生與其相關位點的變異有關[19];蛋白質磷酸化修飾能夠調節細胞之間的信號傳導,在機體中影響細胞的再生和分化[20];酶的二級或空間結構直接決定了其底物的特異性,為酶學性質的研究提供了依據和理論參考[21]。
大量研究已證明,CP在植物生長過程中參與了抵抗生物脅迫及非生物脅迫等過程。因此,深入探索CP在轉錄和翻譯水平上的調控機制,可以為今后采用基因手段改良農作物的性狀和提高農作物的產量提供重要的理論依據。