陳 恒,劉迎春,劉育秀,田仁美,周新穎,于利偉,謝彥周,高 欣
(西北農林科技大學農學院,陜西楊凌 712100)
在植物體內,羥基化氨基酸可用來治療抑郁癥、糖尿病、癌癥等疾病[1-5]。目前主要有三種途徑獲?。簭暮辛u基化氨基酸的物種中提取、化學合成和生物催化法。其中,提取和化學合成過程繁瑣、效率低下[6]。與之相比,生物催化法不僅高效快速,而且具有高對映選擇性,因此,發掘和利用高效穩定的羥基化酶尤為重要[4]。
Clavaminate Synthase-Like(CSL)家族是一類非血紅素鐵和α-酮戊二酸依賴的氧化還原酶家族,可催化氨基酸羥基化[7]。該家族的VioC、MppO和AsoN酶在抗生素紫霉素、甘露霉素、達托霉素的合成中,可催化L-精氨酸、L-天冬酰胺的羥基化[8-10]。CSL家族酶類在輔因子Fe2+、α-酮戊二酸和O2的共同作用下,經過復雜的特異位點配位鍵結合、代換和釋放過程,可將氨基酸底物羥基化并釋放出CO2和琥鉑酸[7]。Bastard等[7]研究發現,CSL酶具有高度的區域和立體結構選擇性,以及嚴格的底物特異性。
CSL家族相關基因的研究大多局限于微生物中,在模式植物擬南芥中也僅有初步研究。Bitto等[11]通過研究擬南芥At3g21360基因編碼蛋白的晶體結構,證實該蛋白屬于CSL家族,這是植物中首個被研究報道的CSL基因。異源六倍體小麥由于基因組龐大、基因拷貝數多等問題,基因克隆和功能解析研究工作在很長一段時間內受到制約[12-13]。近幾年來,基因組測序技術的快速發展、小麥全基因組參考序列的發布以及基因組重測序項目的推進,促進了小麥重要功能基因的克隆和重要性狀的分子機制研究等工作[14]。羥基化氨基酸早已被人們認識和使用,但是小麥CSL基因的發掘以及該基因表達特性和生物學功能的研究還未見報道。因此,本研究以中國春為材料,以擬南芥基因At3g21360(GenBank Accession:NC_003074.8)序列為探針,比對小麥全基因組數據庫,對TaCSL1基因進行同源克隆,利用生物信息學分析該基因及其編碼蛋白序列,采用實時定量PCR技術分析該基因的時空表達模式,以期明確該基因的基本結構和表達特征,為進一步研究其生物學功能提供科學依據。
本研究所用小麥材料為中國春,于2018-2019年種植于西北農林科技大學農學院作物標本區試驗地(108°4′E,34°16′N),株距5 cm,行距25 cm,行長1 m,正常肥水管理。在小麥幼苗期取葉片,用于提取DNA。在小麥苗期、拔節期、孕穗期、抽穗期以及開花后9 d和25 d,分別取小麥根、葉片、節間、旗葉鞘、穗下莖、幼穗、穎殼、雌蕊、雄蕊、籽粒等組織樣品,液氮速凍后,保存于 -80 ℃冰箱,用于提取RNA。
采用CTAB法[15]提取小麥葉片全基因組DNA,并用核酸蛋白分析儀(Nano Drop 2000)檢測DNA濃度,根據所測濃度稀釋至100 ng·μL-1作為工作液,-20 ℃保存。使用RNA提取試劑盒Tissue RNA Isolation Kit(諾唯贊,南京)提取小麥不同生長發育階段和不同組織部位的總RNA,-80 ℃保存。使用反轉錄酶試劑盒Hiscrip@Q Select RT SuperMix for qPCR(+gDNA wiper)(諾唯贊,南京)合成cDNA第一鏈,-20 ℃保存。
以擬南芥At3g21360基因的cDNA序列為探針搜索Ensembl Plants小麥基因組數據庫(http://plants.ensembl.org/Triticum_aestivum/Tools/Blast?db=core),得到位于小麥A、B、D三個亞基因組上的三個部分同源基因:TraesCS3A02G108700、TraesCS3B02G127700和TraesCS3D02G110500。這三個基因長度分別為2 310、2 437和2 472 bp,均包含一個長度為 1 005 bp的編碼區。比對這三個同源基因的序列,使用Primer Premier 5在這三條序列的兩端差異部分分別設計用于克隆基因全長和基因編碼區的引物(表1)。引物由生工生物工程(上海)股份有限公司合成。
使用La Taq DNA聚合酶試劑盒(TaKaRa,日本)擴增基因全長和和基因編碼區。PCR擴增體系為50 μL,包含100 ng·μL-1的模板1 μL(擴增基因全長模板為全基因組DNA,擴增基因編碼區模板為cDNA),10×Buffer 5 μL,200 μmol·L-1的dNTPs 8 μL,5 U·μL-1的La Taq DNA聚合酶1 μL,10 μmol·L-1的上、下游引物各1 μL,ddH2O補齊至50 μL。PCR擴增程序:94 ℃預變性5 min;94 ℃變性30 s,58 ℃退火30 s,擴增基因全長72 ℃延伸3 min、擴增基因編碼區72 ℃延伸1 min,共35個循環;72 ℃再延伸5 min。
使用1%瓊脂糖凝膠電泳分離PCR擴增產物,使用DNA凝膠回收試劑盒(TaKaRa,日本)純化目的基因。將目的基因連接到pMD18-T載體(TaKaRa,日本)上,然后轉化大腸桿菌DH5α感受態細胞(諾唯贊,南京)。過夜培養后挑取單菌落,使用2×Taq Master Mix DNA聚合酶(諾唯贊,南京)對陽性單克隆進行PCR鑒定,由生工生物工程(上海)股份有限公司進行測序,每個基因測序三個陽性單克隆。使用DNAstar Megalign 5.01進行基因編碼區序列比對。
以TaCSL1-3A蛋白序列為探針,在NCBI(https://www.ncbi.nlm.nih.gov/)搜索不同物種的同源蛋白,使用DNAstar Megalign 5.01進行TaCSL1-3A、TaCSL1-3B、TaCSL1-3D和擬南芥At3g21360(XP_002883301.1)蛋白序列的多重比對。使用MEGA 7.0構建基于neighbor-joining的系統發育樹。運用在線工具ExPASy-ProtParam(https://web.expasy.org/protparam/)和InterPro Scan(http://www.ebi.ac.uk/interpro/search/sequence/)分別預測TaCSL1基因編碼蛋白的理化性質和保守結構域。
使用Primer Premier 5在TaCSL1-3A、TaCSL1-3B和TaCSL1-3D基因編碼區內設計特異性引物(表1)。引物由生工生物工程(上海)股份有限公司合成。使用2×RealStar Green Power Mixture試劑盒(GenStar BioSolution,北京)和StepOnePlus實時熒光定量PCR系統(ABI,美國)進行三個部分同源基因的表達量分析。qRT-PCR擴增體系為20 μL,包含20 ng·μL-1的cDNA模板1 μL,10 μmol·L-1的上、下游引物各0.5 μL,2×RealStar Green Power Mixture 10 μL,ROX Reference Dye 0.4 μL,ddH2O補齊至20 μL。PCR反應程序:95 ℃預變性10 min; 95 ℃變性15 s,60 ℃退火/延伸1 min,共40個循環。每個樣品設置3個生物學重復。目的基因相對表達量的計算采用2-△△Ct法[16],用Excel 2010分析數據并作圖。

表1 本研究所用的引物
以中國春全基因組DNA為模板,用三對引物TaCSL1-3A-gF/R、TaCSL1-3B-gF/R和TaCSL1-3D-gF/R分別進行PCR擴增,得到全基因組目的產物(圖1A);以中國春總cDNA第一鏈為模板,用三對引物TaCSL1-3A-cF/R、TaCSL1-3B-cF/R和TaCSL1-3D-cF/R分別進行PCR擴增,得到編碼區單一產物(圖1B)。命名該基因為TaCSL1,來自A、B、D三個亞基因組的部分同源基因分別命名為TaCSL1-3A、TaCSL1-3B和TaCSL1-3D。經測序與序列比對,發現TaCSL1-3A、TaCSL1-3B、TaCSL1-3D與TraesCS3A02G108700、TraesCS3B02G127700、TraesCS3D02G110500的編碼區序列一致。三個部分同源基因均包含3個外顯子和2個內含子,3個外顯子長度分別為392 bp、250 bp和363 bp,但內含子長度不同。TaCSL1-3A基因的2個內含子長度分別為338 bp和683 bp;TaCSL1-3B基因的2個內含子長度分別為252 bp和788 bp;TaCSL1-3D基因的2個內含子長度分別為314 bp和812 bp。編碼區序列比對結果表明,三個部分同源基因之間存在43個單核苷酸突變位點,其中有義突變11個,沉默突變32個(圖2)。TaCSL1-3A和TaCSL1-3B基因的核酸序列相似性為95.7%,TaCSL1-3A和TaCSL1-3D基因的核酸序列相似性為96.3%,TaCSL1-3B和TaCSL1-3D基因的核酸序列相似性為96.4%。TaCSL1-3A和TaCSL1-3B蛋白序列相似性為97.3%,TaCSL1-3A和TaCSL1-3D蛋白序列相似性為97.6%,TaCSL1-3B和TaCSL1-3D蛋白序列相似性為97.9%,說明該基因在小麥進化過程中十分保守。

A:基因全長電泳圖;B:基因編碼區電泳圖;M1:Maker DL5000;M2:Maker DL2000。箭頭所指為目的條帶。

黃色陰影表示三個部分同源基因 TaCSL1-3A(GenBank Accession: MW725303)、 TaCSL1-3B(GenBank Accession: MW755354)和 TaCSL1-3D(GenBank Accession: MW755355)之間存在的序列多態性。
對TaCSL1基因編碼蛋白的理化性質進行分析,結果表明,TaCSL1-3A、TaCSL1-3B和TaCSL1-3D蛋白氨基酸長度均為334 aa,分子量為36 695.88~36 780.99,理論等電點為 5.48~ 5.59,說明該蛋白屬于中性蛋白;帶負電荷的氨基酸殘基數均為46,帶正電荷的氨基酸殘基數為 39~40,總平均親水性為-0.237~-0.217,表明該蛋白為親水蛋白;穩定性系數為48.33~50.17,表明該蛋白不穩定。因其序列差異很小, 三個部分同源基因所編碼的蛋白理化性質差異也很小。利用在線工具InterProScan預測TaCSL1-3A蛋白的保守結構域,結果(圖3)表明,該蛋白第10~331位氨基酸為典型的CSL家族保守結構域,與該家族的其他蛋白具有相似的結構特征。

圖3 TaCSL1-3A蛋白的保守結構域分析
TaCSL1蛋白與擬南芥CSL蛋白的氨基酸序列比對結果表明,TaCSL1-3A、TaCSL1-3B和TaCSL1-3D蛋白與擬南芥CSL蛋白的相似性分別為69.6%、69.6%和69.0%,蛋白序列C端較N端相對更保守(圖4)。小麥與其他物種CSL蛋白的進化分析結果表明,CSL蛋白被分為兩大類,即單子葉類和雙子葉類。TaCSL1-3D蛋白與粗山羊草CSL蛋白進化關系最近,TaCSL1-3A、TaCSL1-3B與TaCSL1-3D蛋白進化關系也較近,三個蛋白在進化樹上處于同一大分支上(圖5)。

XP_002883301.1為擬南芥CLS蛋白的GenBank登錄號。黃色陰影表示TaCSL1蛋白與擬南芥CSL同源蛋白的序列多態性。

圖5 小麥TaCSL1蛋白與其他物種CSL蛋白的進化分析
在小麥的籽粒、穎殼、雌蕊、雄蕊、穗下莖、旗葉、倒二葉、旗葉鞘、節間、根等組織中均檢測到TaCSL1-3A、TaCSL1-3B、TaCSL1-3D基因的表達,除開花后第9 d的旗葉鞘中TaCSL1-B的表達量較高外,三個基因在各個時期葉中的相對表達量均高于其他組織。比較不同生長發育時期的葉/旗葉組織可知,該基因在幼苗期至孕穗期,相對表達量總體提高,抽穗期明顯降低,開花后再次提高,生育末期降低(表2)。
三個部分同源基因的相對表達量在部分組織中存在顯著差異??偟膩碚f,TaCSL1-3A相對表達量一直處于較低狀態,TaCSL1-3D的相對表達量在孕穗期之前較高,TaCSL1-3B的相對表達量在孕穗期之后較高(表2)。

表2 小麥 TaCSL1在不同發育時期的組織器官中的相對表達量
本研究根據擬南芥CSL基因At3g21360序列,利用同源克隆的方法,首次在小麥中克隆了TaCSL1基因,并獲得了三個部分同源基因TaCSL1-3A、TaCSL1-3B、TaCSL1-3D的全長序列和編碼區序列。與參考序列比對,TaCSL1-3A、TaCSL1-3B和TaCSL1-3D序列與參考序列一致。編碼區序列比對結果表明,三個部分同源基因之間存在43個單核苷酸突變位點,其中有義突變11個,沉默突變32個。說明該基因在小麥進化過程中十分保守。通過與擬南芥的同源基因進行序列比對,發現TaCSL1-3A蛋白序列與擬南芥At3g21360蛋白序列相似度為69.6%,說明該蛋白序列在植物中相對保守[18]。根據進化樹分析可知,小麥TaCSL1基因編碼的蛋白與其祖先粗山羊草進化關系較近,其次是其他單子葉草本植物,而與雙子葉植物進化關系較遠。這說明該基因可能在單、雙子葉分化之前就已經產生[19]。TaCSL1蛋白理化性質分析表明,該蛋白屬于中性、親水、不穩定蛋白,說明該蛋白作為一種酶,參與酶促反應之后容易分解[20]。
實時熒光定量PCR分析表明,TaCSL1-3A、TaCSL1-3B、TaCSL1-3D在小麥各個生長發育時期和組織部位都有表達,說明三個基因在小麥生長過程中都發揮作用,三者的功能也可能存在冗余[21]。TaCSL1基因在小麥葉片組織中相對表達水平較高,表明該基因主要在小麥葉片中發揮功能。開花后第9 d旗葉鞘中TaCSL1-3B的表達量相對較高,原因可能是異常環境誘導的結果。TaCSL1-3D在小麥孕穗期之前相對表達量較高,而TaCSL1-3B在小麥孕穗期之后相對表達量較高,表明三者的功能存在分化。
Bastard等[7]研究表明,CSL家族酶類具有嚴格的底物特異性,而江 倩[22]研究表明,一種CSL酶可以催化氧化多種底物,并且除了催化產生羥基化產物外,還能產生酰基產物。實時熒光定量PCR分析結果表明,TaCSL1基因在小麥全生育期和所有檢測組織部位中均有表達,說明該基因是一個組成型表達基因[21],可預測該基因參與植物體內重要的生化過程。富含羥脯氨酸糖蛋白是細胞壁的構成部分,脯氨酸羥基化酶基因是一種組成型表達基因[23],TaCSL1基因是否是脯氨酸羥基化酶基因還有待進一步考證。
植物保衛素是植物受到生物或非生物因子侵襲時在體內合成并積累的低分子量抗菌性物質,其種類繁多、結構各異、代謝途徑復雜[23]。(S)-4-羥基苯甘氨酸、(2S,3R)-3-羥基-亮氨酸和(2S,3R)-3-羥基-苯丙氨酸是植物保衛素的構成部分[24-25],因而,推測羥基化氨基酸可能是未被分離出來的植保素或其構成部分。后期可將該基因在小麥體內進行過表達或沉默,通過人工接種病菌,進一步研究該基因是否與植物抗病過程相關。