李欣宇,徐啟宇,衛宇翔,王景雪
(山西大學 生命科學學院,山西 太原 030006)
高粱(Sorghum bicolor)是僅次于玉米、小麥、水稻和大麥的全球第五大谷類作物。高粱具有突出的抗旱、高產、耐鹽堿等特性,其籽粒中除了含有大量碳水化合物外,富含B族維生素和微量元素[1-2]。但是高粱籽粒中缺乏賴氨酸[3],賴氨酸是谷物中的第一限制性必需氨基酸,在人體生長發育和免疫方面發揮重要作用[4]。對以食用高粱為主的人或動物,缺乏賴氨酸,會導致營養不均衡。提高高粱籽粒中賴氨酸的含量可以提高對蛋白質的利用率,改善高粱的營養價值,對于食用高粱和飼用高粱具有重要的價值。因此,研究賴氨酸合成降解途徑中的關鍵酶基因,對于利用生物技術提高高粱籽粒賴氨酸含量、改善營養品質具有重要意義。
在植物中,賴氨酸的合成依賴天冬氨酸代謝途徑,主要受天冬氨酸激酶(Aspartate kinase,AK)和二氫吡啶羧酸合酶(Dihydrodipicolinate synthase,DHPS)2種關鍵酶調控。它們具有相同的表達模式,在種子中的表達高于其他組織部位如根、莖、葉、花,并且基因表達受非生物脅迫和與光合作用相關的信號調節分子等調控[5]。而酵母氨酸途徑是植物賴氨酸降解的主要代謝途徑。酵母氨酸途徑的關鍵步驟是由賴氨酸酮戊二酸還原酶(Lysineketoglutarate reductase,LKR)和酵母氨酸脫氫酶(Saccharopine dehydrogenase,SDH)催 化 完 成。LKR將賴氨酸和α-酮戊二酸還原成酵母氨酸,然后被SDH轉化為α-氨基己二酸半醛和谷氨酸[6]。
賴氨酸酮戊二酸還原酶/酵母氨酸脫氫酶(LKR/SDH)是連接在單個多肽鏈上的一對雙功能酶,在賴氨酸降解的起始、中間步驟中起催化作用,在賴氨酸代謝過程中具有十分重要的作用[7-8]。LKR/SDH基因主要在植物種子中表達,單、雙子葉植物的表達模式有差異,已在一些物種如雙子葉植物大豆[9]、菜豆[10]及單子葉植物玉米[11]、水稻[12]中分離純化,表征了分子特征。該基因的表達受發育、激素水平和應激相關轉錄因子等的復合調控,例如在鹽和滲透脅迫下,發現LKR/SDH基因表達增加[13]。運用代謝工程技術,提高植物籽粒賴氨酸含量已經在禾本科作物的大麥、水稻和玉米等植物中取得了成功。REYES等[14]在抑制玉米胚乳中LKR/SDH酶活性的轉基因植株中,發現胚乳中游離賴氨酸含量增加,并在授粉后32 d時含量最高;ZHU等[15]在擬南芥中敲除LKR基因且轉入DHPS基因,種子中賴氨酸含量增加了約80倍;LONG等[16]在水稻中構建干擾LKR及SDH基因的雙元載體,發現轉基因植物的游離賴氨酸在種子中增加約60倍。
本研究利用生物信息學軟件對高粱LKR基因的基本理化性質、蛋白質結構特征等進行分析,同時利用qRT-PCR分析高梁種子發育時期的基因表達模式,為進一步研究高粱LKR基因的功能和調控機制奠定基礎。
供試材料為高粱品種BTX623,由山西農業大學高粱研究所提供,種植于山西農業大學高粱研究所試驗田。
1.2.1 生物信息學分析本研究中所有物種的LKR基因與蛋白序列均從NCBI(https://www.ncbi.nlm.nih.gov/)獲取,包括:小麥(ADJ19186.1)、高 粱(XP002452934.1)、谷 子(XP004954151.1)、水 稻(BAJ25847.1)、玉 米(NP001104873.1)等。利用Pfam在 線 網 站(http://www.pfam.xfam.org/)對LKR蛋白保守結構域進行分析[17],NetSurfP-2.0(http://www.cbs.dtu.dk/services/NetSurfP/)預測高粱LKR蛋白的二級結構[18];利用SWISS-MODEL(https://www.swissmodel.expasy.org/)預測高粱LKR蛋白的三級結構[19];利用Protparam(https://web.expasy.org/protparam/)分析高粱LKR蛋白的理化性質[20];利用ProtScale(https://web.expasy.org/protscale/)分析高粱LKR蛋白的親疏水性[21];利用SignalP5.0(http://www.cbs.dtu.dk/services/Sig‐nalP/)預 測 高 粱LKR蛋 白 的 信 號 肽[22];利 用TMHMM Server.2.0(http://www.cbs.dtu.dk/ser‐vices/TMHMM/)軟件分析高粱LKR蛋白的跨膜結構[23];利用NetPhos3.1(http://www.cbs.dtu.dk/services/NetPhos/)對蛋白質磷酸化位點進行分析[24]。利用在線分析軟件PSORTII Prediction(https://psort.hgc.jp/form2.html)對LKR蛋白進行亞細胞定位預測[25];利用在線軟件MapGene2 Chrom web v2(http://mg2c.iask.in/mg2c_v2.0/)進行染色體定位圖譜的繪制[26];利用MEGA 7.0軟件對所有LKR蛋白進行多序列比對,并采用鄰接法構建系統進化樹,進化樹bootstrap重復值設置為1 000,采用Evolview v3(https://www.evolgenius.info/)進行圖片處理[27]。
1.2.2LKR基因的表達分析使用Trizol法[28]提取高粱授粉后5、10、15、20、25 d時種子總RNA并反轉錄成cDNA,作為熒光實時定量PCR的模板DNA。反轉錄按照Prime Script TM RT reagent Kit with gDNA Eraser反轉錄試劑盒說明書進行操作,一般為20.0μL體系,退火溫度53℃,反應30 s,進行40個循環。以高粱肌動蛋白基因(Actin)為內參基因,所用引物序列如表1所示,定量PCR數據的分析采用2-??Ct法,各反應設置3個重復。

表1 用于qRT-PCR的所有引物Tab.1 All primers for qRT-PCR
所有熒光實時定量PCR試驗數據采用SPSS 17.0軟件處理,結果以平均值±標準誤表示。通過單因素方差分析和t檢驗進行組間差異顯著性比較。
在EnsemblPlants中得到基因的ID為SORBI-3004G321800,LKR基因定位在高粱10條單倍染色體的第4條染色體上(4:65684804-65695905),正義鏈。通過分析發現,高粱LKR蛋白含有AlaDh PNT-N、Saccharop dh-N、Sacchrp dh-NADP、Sacchrp dh-C等4個保守域;有2個轉錄物,分別為KXG31271和EES05910,這2個 轉 錄 物 都 有25個外顯子和20個結構域,并且都有4個Pfam(登錄號分 別 為PF05222、PF04455、PF03435、PF16653)。本研究選擇序列號為EES05910作分析對象。AlaDh PNT-N結構域位于基因的19~156 bp處,屬于CL0325家族,是丙氨酸脫氫酶N-末端結構域;Saccharop dh-N結構域位于基因的477~574 bp處,是LOR/SDH雙功能酶的保守區域;Sacchrp dh-NADP結構域位于583~711 bp處,屬于CL0063家族,是酵母氨酸脫氫酶NADP結合域;Sacchrp dh-C結構域位于基因的715~1 053 bp處,屬于CL0139家族,是酵母氨酸脫氫酶C-末端結構域(圖1)。

圖1 高粱與水稻、玉米、谷子、小麥LKR蛋白的保守結構域Fig.1 Conserved domains of LKR proteins in sorghum,rice,corn,millet,and wheat
對高粱LKR蛋白的二級結構、三級結構進行預測,結果如圖2所示。

圖2 高粱LKR蛋白二級和三級結構模型Fig.2 Secondary and tertiary structural models of sorghum LKR protein
結果顯示,該蛋白由大量α-螺旋、無規卷曲、β-折疊片和少量β-轉角組成,其中,421個氨基酸參與α-螺旋的形成,占氨基酸總數的39.72%;406個氨基酸參與無規卷曲的形成,占比為38.3%;166個氨基酸參與β-折疊片的形成,占比為15.66%;67個氨基酸參與β-轉角的形成,占氨基酸總數的6.32%。圖2-B為根據同源建模法利用SWISSMODEL預測LKR/SDH蛋白三級結構,得出3個模型,LKR/SDH蛋白與模型1的相似性為67.44%,比其余2個模型更可靠。根據GMQE值越接近1,建模質量越好的原則,選取建模質量最好的模型1,圖2-B展示了3個不同角度下LKR/SDH蛋白的折疊情況,為α-β結構類型,這種結構使LKR/SDH蛋白結構較穩定。
通過Protparam分析可知,高粱LKR蛋白由1 060個氨基酸組成,相對分子量為116 026.54,其中含量較多的3種氨基酸分別為:Leu(112個)占10.6%,Ala(89個)占8.4%,Gly(82個)占7.7%;含量較少的3種氨基酸分別為Trp(3個)占0.3%,Cys(23個)占2.2%,Met(24個)占2.3%。該蛋白不穩定系數為40.89,屬于不穩定蛋白質。脂肪族氨基酸系數為92.32,說明編碼該蛋白的氨基酸多為脂肪族氨基酸。該蛋白理論等電點為5.58,屬于酸性蛋白。
圖3-A結果顯示,該蛋白的親水性氨基酸稍多于疏水性氨基酸,為親水蛋白。由圖3-B可知,高粱LKR蛋白上具有94個磷酸化位點,其中,磷酸化位點最多的是絲氨酸(45個),其余是蘇氨酸(37個)和酪氨酸(12個)。同時預測出LKR蛋白上有14種蛋白激酶位點,分別是:ATM、CKI、CKII、DNAPK、EGFR、GSK3、INSR、PKA、PKC、PKG、SRC、cds、cdk5和p38MAPK。高粱LKR蛋白以結合絲氨酸和蘇氨酸磷酸化的PKA和PKC位點為主。根據圖3-C得知,該蛋白是非跨膜蛋白。圖3-D顯示,高粱LKR蛋白沒有信號肽,所以,屬于非分泌蛋白。

圖3 高粱LKR蛋白理化性質預測Fig.3 Prediction of physical and chemical properties of sorghum LKR protein
根據PSORTII Prediction對高粱、水稻、玉米、谷子和小麥LKR蛋白進行亞細胞定位預測,由表2可知,高粱LKR蛋白主要定位在細胞質膜(占比34.8%),其次是內質網(占比30.4%)、液泡(占比17.4%)。水稻LKR蛋白主要定位在細胞質膜(占比22.2%)、內質網(占比22.2%)和液泡(占比22.2%)。玉米LKR蛋白主要定位在內質網(占比44.4%)。谷子LKR蛋白主要定位在內質網(占比33.3%),其次是細胞質膜(占比22.2%),在高爾基體、細胞質、液泡和線粒體中分布一樣多(均占比11.1%)。小麥LKR蛋白主要定位在細胞質(占比26.1%),此外也預測分布在囊泡(占比17.4%)、細胞核(占比13.0%)、線粒體(占比13.0%)等中。

表2 高粱與水稻、玉米、谷子、小麥LKR蛋白的亞細胞定位Tab.2 Subcellular localization of LKR protein in sorghum,rice,corn,millet,and wheat %
高粱LKR基因定位在高粱4號染色體上,起始于65 684 895 bp,終止于65 695 917 bp(圖4)。小麥LKR基因分別定位在A、B、D染色體組的第6號染色體上。谷子LKR基因定位在1號染色體上,起始于39 932 924 bp,終止于39 945 100 bp。水稻LKR基因定位在水稻第2號染色體上,起始于33 260 120 bp,終止于33 264 235 bp。玉米LKR基因定位在4號染色體上,起始于180 805 091 bp,終止于180 816 424 bp。

圖4 高粱與小麥、谷子、水稻、玉米LKR基因染色體定位Fig.4 Chromosome location of LKR gene in sorghum,wheat,millet,rice,and corn
在NCBI的蛋白數據庫中下載高等植物LKR基因序列,用MEGA 7.0鄰接法構建系統發育進化樹。與LKR基因親緣關系最近的是玉米(94.33%)和谷子(90.2%),其次是水稻(83.51%)和小麥(83.03%)。已有11個物種LKR基因被報道,如水稻、小麥、玉米、大麥、黃花蒿、木豆、苜蓿、可可樹、美洲棉、甜杏仁等。這些物種被聚為三大類,分別為單子葉植物中的禾本科、雙子葉植物中的菊科和薔薇科(圖5)。

圖5 不同植物的LKR蛋白系統進化發育樹分析Fig.5 Phylogenetic tree analysis of LKR protein in different plants
取高粱生長至抽穗開花期,在授粉后5、10、15、20、25 d采集的 種子,通過qRT-PCR測定了高粱LKR基因的相對表達量(圖6)。結果表明,LKR基因在種子發育的不同時期呈現先上升后下降的趨勢,在授粉20 d時的表達量最高,且與其他發育時期差異顯著。

圖6 LKR基因在種子發育不同時期表達量分析Fig.6 Analysis of LKR gene expression at different stages of seed development
賴氨酸酮戊二酸脫氫酶(LKR)是賴氨酸降解的關鍵酶[6]。通過對高粱LKR蛋白的保守結構域和系統進化的分析,得出高粱LKR蛋白與禾本科植物水稻的保守結構域非常相似,說明這些禾本科植物的LKR基因進化也同樣保守。通過分析得知,高粱LKR蛋白是一種親水且不跨膜的非分泌蛋白,并具有較多的絲氨酸和蘇氨酸的磷酸化位點。到目前為止,從單子葉植物玉米[29-30]、水稻[31]以及雙子葉植物大豆[9]、菜豆[10]中純化和鑒定了LKR/SDH蛋白,并在擬南芥[32-33]、玉米[34-35]等植物中探究了其在賴氨酸分解代謝途徑方面的作用,證實酵母氨酸途徑中賴氨酸先分解為酵母氨酸再分解為2-氨基己二酸的步驟是由LKR/SDH蛋白催化完成的,并且能夠影響種子中賴氨酸積累的效率[36-37]。
在模式植物擬南芥中,通過Southern Blot分析與原位雜交,結果顯示,LKR/SDH基因在不同器官組織中如幼苗、花、葉、莖和根中表達模式不同,在花和發育的種子的胚中表達顯著上調[38]。用玉米授粉20 d后的根、葉、胚和胚乳中的總RNA與ZmLKR/SDH特異性探針雜交,結果顯示,ZmLKR/SDH主要在內胚層中表達,根、莖和葉中少量表達[39]。用抗ZmLKR/SDH抗體進行Western Blot分析發現,LKR/SDH蛋白主要在種子中表達,根、莖、葉、花或愈傷組織不表達[40]。在水稻中的研究表明,OsLKR/SDH在開花后表達量依次是14 d>21 d>28 d>7 d。通過Western Blot測定了玉米F1授粉18、25、32、40、48、56 d后,LKR/SDH蛋白在胚和胚乳中的積累。結果顯示,LKR/SDH蛋白的表達受父母本遺傳影響,主要在成熟后期(32 d)表達[41]。本試驗采用qRT-PCR檢測高粱籽粒授粉后25 d內不同發育時期LKR基因的表達量,結果表明,LKR基因的表達量依次為:20 d>25 d>5 d>10 d>15 d。這與玉米、水稻中的研究結果相似。本研究為利用基因工程調控高粱LKR/SDH蛋白的表達來提高種子賴氨酸含量提供了理論基礎。